如何证明 AI 给出的电机设计方案是最优方案?
本帖最后由 katawong 于 2024-9-23 16:23 编辑前几天,有朋友问我这个问题,他觉得,用 AI 设计出满足要求的电机方案是可以理解的,也是可行的。但是,凭什么说,AI 设计出来的方案就是最优方案呢?
相信各位同仁也有相同的问题,在此专门发帖作一个说明。
事实上,所谓的最优方案,是指在当前的技术条件和AI 算法下,找到的最好方案。随着技术的发展,电机原理的进步,可能会有更好的方案。这个不在今天的讨论范围之内。
朋友提出的这个问题,其实是个数学证明问题,要从数学的角度来证明。
假设,我们的 AI 设计过程符合马尔科夫决策过程,以及满足 贝尔曼方程。这是前置条件。在满足这两个条件的基础上,AI 会找到奖励值最大的方案。
这个时候,找到最优解,就变成了找到奖励值最大。
这就需要我们来进行奖励值的设计了。
根据电机行业的特点,我们把最优方案定义为,在满足技术要求的同时,方案所需材料(硅钢片,铜线,铝材)成本最低。
我们现在来设计奖励值,这个很关键。我们把奖励设置为三大类。
第一类是性能奖励值。比如效率奖励,功率因数奖励,电流倍数奖励,等等。只要满足条件要求,奖励值就为 0 ,否则就为 -100 。
第二类是约束奖励。比如齿宽最小不能小于3mm,磁密最大不能大于 2, 等等。同样的,满足约束条件,奖励值为0 , 否则为 -100。
第三类是成本奖励。将电机所消耗的铜 、 铁、 铝重量,分别计算其成本,再给出其成本负值 , 即为成本奖励。成本越低,成本奖励值越高。
很显然,当第一类和第二类奖励值满足要求时,其和为零。相应的,当这两类奖励相加为零时,我们就知道,这个方案是满足技术要求,约束条件或工艺条件的。
这个时候就可以把注意力放在成本奖励了。
如前所述,AI 总是在不断的进行学习和进化,不断的寻找奖励值最大的方案。也就是说,AI 会不断的寻找成本最低的满足技术要求的方案。
总结来说,由于 AI 本身具有不断寻找最高奖励值的能力,那么我们就设计一个奖励值,使得 AI 可以寻找到满足技术要求的同时,最低成本的方案。
=================================我是华丽的分割线=======================================
有同仁要问了,AI为什么会找到奖励值最高的方案呢?
这个就是AI学习过程的设计了。它涉及到两个算法,一个是梯度下降算法,我们有一个AI,它会对设计方案进行打分,梯度下降算法的作用是提高对设计方案的打分准确度,另一个是策略梯度算法,我们还有一个
AI, 它会进行方案更改,而策略梯度算法的作用,是使得更改后的方案的得分更高。此处的“打分或得分”,就是上面所说的获得的奖励值。
================================================================================
不知上述说明,有没有解开同仁心中的疑惑?欢迎提问。
我感觉这个工具的使用,标准还是不太好定。
有一些指标是到达不等式约束范围内就可以接受了,而且无论是大了还是小了都不再影响最终评分。分值的赋予有非线性性质。
再比如对成本的评分,制造商对于不同的甲方可能有不同的标准,对有的甲方那就是成本权重低一点,哪怕不计成本的去做好一台电机,而有的甲方成本权重就会高一些,要以盈利为目的的去做电机。
所以我个人觉得这套工具,最终还是需要人为的去调控权重来使用,甚至对于不等式约束上,也可以调整边界范围,和分值与指标的非线性分值曲线。
并且对各个指标的权重赋予,也需要看公司风格,完全黑箱的话,上手虽然简单了一些,但是可操作性差一些。。 本帖最后由 katawong 于 2024-9-25 11:15 编辑
谢谢您的回复。
您讲得非常对。
事实上,在进行AI训练时,奖励的设计是一件很重要的工作。必须根据不同的需要来设计奖励值。奖励值的设计对AI程序的收敛有很大的影响,对方案的影响也很大。
有些指标,我们确实是给定约束范围的。满足约束范围即可。下图中,您可以看到,转子端环电密实际上小于最小值,转子轭磁密也是如此,但方案是可行的。所以这两个指标我们后来是小于最大值就可。定子电密也是如此。
但我们也在考虑,以定子齿磁密为例,AI应该会努力的使它偏向最大值,因为这样的话,会使得成本最低,而如果值偏向最小值的话,成本其实是会变大的,AI的算法设计会自动将它调大,使得成本变低。
多目标函数的最优求解,权重的分配难。前提还得是电磁、热、NVH的仿真与实测误差(精度)不影响寻优过程,算法加上专家系统的约束是不是能更快地收敛和准确实用? 本帖最后由 katawong 于 2024-9-25 20:29 编辑
Daixx 发表于 2024-9-25 16:07
多目标函数的最优求解,权重的分配难。前提还得是电磁、热、NVH的仿真与实测误差(精度)不影响寻优过程, ...
谢谢您的回复。
以下是我个人的观点,不妥之处还请指正。
我们采用的AI 算法是强化学习算法,与其他的优化算法不同之处在于,强化学习算法是通过奖励机制,自主学习并得到提升的。
因此,对于强化学习,最关键的地方在于以下几点: 1) 奖励的设计 2 )动作的设计 3) 状态的设计。
通过强化学习,训练的最终目标,是一个具备丰富经验的设计工程师。
当给他指定的技术参数时,它立刻知道,应该给出什么样的设计方案。
在我们设计的AI中, 并没有专门刻意给出权重系数,所有的权重都隐含在深度神经网络中,由AI自行算出。
此外,我们设计的这个AI并不是一个仅用于设计电机的AI,事实上,它独立于电机之外,也可用于设计其它产品。当它调用 ansysEM,或者MotorCAD,Speed软件时,可以设计电机产品。当它调用kissSoft软件时,就可以设计齿轮产品。
因此,AI设计的准确度,依赖于ansysEM,MotorCAD或者Speed软件的计算精度和准确性。
另外,我们设计的AI,并没有一个专门的专家系统。当然,可能对专家系统这个名称的理解,我们可能与您的意思有所不同。但是就我们实际经验来说,我们主要是训练AI的学习能力和进化能力,并没有设计专门的专家系统。
从强化学习的角度来说,专家系统也是不必须的。
以齿轮为例,很多人很难理解,问我们说,你们并不是设计齿轮的专业技术人员,为什么可以这么自信,认为能够设计出比有丰富经验的工程师还要好的方案呢? 事实上,只要正确设计了在齿轮设计过程中的奖励,动作,状态,AI就可以开始学习齿轮的设计并不断提升自己设计齿轮的能力和水平,最终设计出超过人类水平的方案。
再次感谢您的回复。
页:
[1]