- 积分
- 8780
- 回帖
- 0
- 西莫币
-
- 贡献
-
- 威望
-
- 存款
-
- 阅读权限
- 70
- 最后登录
- 1970-1-1
签到天数: 105 天 连续签到: 5 天 [LV.6]常住居民II
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
本帖最后由 katawong 于 2024-9-23 16:23 编辑
前几天,有朋友问我这个问题,他觉得,用 AI 设计出满足要求的电机方案是可以理解的,也是可行的。但是,凭什么说,AI 设计出来的方案就是最优方案呢?
相信各位同仁也有相同的问题,在此专门发帖作一个说明。
事实上,所谓的最优方案,是指在当前的技术条件和AI 算法下,找到的最好方案。随着技术的发展,电机原理的进步,可能会有更好的方案。这个不在今天的讨论范围之内。
朋友提出的这个问题,其实是个数学证明问题,要从数学的角度来证明。
假设,我们的 AI 设计过程符合马尔科夫决策过程,以及满足 贝尔曼方程。这是前置条件。在满足这两个条件的基础上,AI 会找到奖励值最大的方案。
这个时候,找到最优解,就变成了找到奖励值最大。
这就需要我们来进行奖励值的设计了。
根据电机行业的特点,我们把最优方案定义为,在满足技术要求的同时,方案所需材料(硅钢片,铜线,铝材)成本最低。
我们现在来设计奖励值,这个很关键。我们把奖励设置为三大类。
第一类是性能奖励值。比如效率奖励,功率因数奖励,电流倍数奖励,等等。只要满足条件要求,奖励值就为 0 ,否则就为 -100 。
第二类是约束奖励。比如齿宽最小不能小于3mm,磁密最大不能大于 2, 等等。同样的,满足约束条件,奖励值为0 , 否则为 -100。
第三类是成本奖励。将电机所消耗的铜 、 铁、 铝重量,分别计算其成本,再给出其成本负值 , 即为成本奖励。成本越低,成本奖励值越高。
很显然,当第一类和第二类奖励值满足要求时,其和为零。相应的,当这两类奖励相加为零时,我们就知道,这个方案是满足技术要求,约束条件或工艺条件的。
这个时候就可以把注意力放在成本奖励了。
如前所述,AI 总是在不断的进行学习和进化,不断的寻找奖励值最大的方案。也就是说,AI 会不断的寻找成本最低的满足技术要求的方案。
总结来说,由于 AI 本身具有不断寻找最高奖励值的能力,那么我们就设计一个奖励值,使得 AI 可以寻找到满足技术要求的同时,最低成本的方案。
=================================我是华丽的分割线=======================================
有同仁要问了,AI为什么会找到奖励值最高的方案呢?
这个就是AI学习过程的设计了。它涉及到两个算法,一个是梯度下降算法,我们有一个AI,它会对设计方案进行打分,梯度下降算法的作用是提高对设计方案的打分准确度,另一个是策略梯度算法,我们还有一个
AI, 它会进行方案更改,而策略梯度算法的作用,是使得更改后的方案的得分更高。此处的“打分或得分”,就是上面所说的获得的奖励值。
================================================================================
不知上述说明,有没有解开同仁心中的疑惑?欢迎提问。
|
|