Maxwell仿真中HPC的讨论
本帖最后由 husttpp 于 2016-9-24 20:56 编辑在做电磁仿真时,我们常苦恼于缓慢的计算速度,尤其当网格数多,仿真点数大的时候,经常一算就是大半天有时甚至是好几天的时间。而在仿真时我们又会发现,我们通常用的是多核的电脑,有条件的用的实验室的工作站,但是通过查看计算机的运行状态可以看到,有时候虽然计算机的配置非常高,但是cpu的利用率很低。这就让我比较困扰,maxwell宣传的HPC(高性能计算)的优势到底体现在哪里。以下是我做的一些设置以及相应的仿真对比:
这是HPC设置,设置任务数以及允许使用的核数:
这是设置任务数为1,核数为1的情况下仿真时的计算机工作状态:
这是结束仿真后的运行状态:
可以看出在实际运行时,虽然只设置了核心数为1,但是这四个核也有时候是同时在跑,不过实际占用cpu比例为百分之25(四核CPU),任然相当于一个核在跑。
接着我把核数改成了4,同一个模型接着跑,下图为运行状态:
可以看到,此时跟设置成1时几乎没有区别,仍旧只能相当于一个核在跑。
然后我对一个参数进行了参数化扫描,进行分布式优化计算,将任务数设成4,核数也设置成4,此时的运行状态:
可以看出此时才是真正的四个核在同时运行。也即只有在做DSO(分布式计算)时,才能真正发挥计算机的性能。
而我看了一位ANSYS公司的工程师关于MAXWELL-HPC的报告(见附件),其中用HPC大大提高了求解速度。这就让我很费解了,难不成真是我的破解License不行?这一点希望有熟悉的高手来解答。谢谢。{:1_551:}
还有就是关于计算机配置的影响,根据上面的观察,对于我们这种对参数化扫描应用不太多的人来说是不是更加应该追求单核性能?{:1_562:}
才发现刚才发的时候图片没有贴成功....不好意思了 好像确实效果不好,我之前也特意试了下,用 多个核心跑一个3D任务,确实 cpu 使用率上去了,但是求解时间只缩短一点点 ,差不读 ,大概是 cpu多用了一般,时间变化不明显。 说一下 我是在tools , maxwell 3d options 里设置的。V16 2013年发布的那个 ,其他高版本也有类似用法 试用过差不多。
另外我感觉maxwell是不是故意的啊 应该有能力实现更高的利用率 。
开并行计算啊,跑一个程序开并行我发现CPU利用率一直稳定在百分之五十左右。所以每次我都跑好几个,能稳定利用到百分之七十以上。说不出来为什么,别的软件一开并行就百分之百了。 个人体会是这样的,17版及其之前的ansoft maxwell,只要处于剖分阶段,CPU就只有一个核或者1个线程在工作,只有过了剖分这个阶段,才可能满核心满线程运转。3D模型,越大、时间越长、剖分越细,满线程运算越明显。2D从来没有实现满核心满线程运算。17版之后的就不知道了,目前用的是来路不明的ANSYS EM 16.1版,先后用过2台HPC,一台12核24线程,一台16核32线程,都实现过满线程满核心运算。 DDG171 发表于 2016-9-27 17:20
个人体会是这样的,17版及其之前的ansoft maxwell,只要处于剖分阶段,CPU就只有一个核或者1个线程在工作, ...
3D的做的很少,主要还是因为计算机跑的太慢,看您的意思是说HPC在3D下效果明显,而在2D下效果差,回头我也去搞个3D的模型算一下{:1_562:} husttpp 发表于 2016-9-28 10:18
3D的做的很少,主要还是因为计算机跑的太慢,看您的意思是说HPC在3D下效果明显,而在2D下效果差,回头我 ...
您可以试试。然后我个人仔细看了一遍您的帖子,如果您主要是算2D,并且很少用参数扫描的话,建议选择CPU的时候选择少核心、高频率的,可以不局限于intel i5/i7系列,至强E5-16XX系列也是可以考虑的。还有如果经济条件许可的话,请上X79/X99这样的4通道内存主板,能充分发挥高端CPU的性能。另外,在算瞬态时请把工程文件和TEMP文件夹都放在SSD上,有一定的加速作用。
DDG171 发表于 2016-9-28 11:38
您可以试试。然后我个人仔细看了一遍您的帖子,如果您主要是算2D,并且很少用参数扫描的话,建议选择CPU ...
恩恩,谢谢您的指导! 我的使用体会也是差不多。
对于只用2d跑单点的人来说,普通的台式机甚至笔记本就足够了,也没有必要追求单核性能。
一般用2d设计足够了,且细致的设计一款产品参数化扫描还是必不可少的,可能多核比高频还是价值高些。
所以,我建议还是买多核的机器比较划算。 对了,楼上诸位,顺便讨论一个现象。我用win7时ansoft在剖分时基本上只是用1个线程,CPU占用一般在5~10%。而用win10时剖分可用所有的线程,虽然不能满负荷运行,但是CPU占用可提高到30%左右,这个是普遍现象还是特例呢? DDG171 发表于 2016-9-29 08:52
对了,楼上诸位,顺便讨论一个现象。我用win7时ansoft在剖分时基本上只是用1个线程,CPU占用一般在5~10%。 ...
哦 ?这么神奇,不知道试过几个 。时间按相应比例缩短吗。
另外关于 cpu占用和计算时间 ,我也用24线程电脑做过 3D 单任务 ,与单线程对比 剖分占用差不多 , 计算时cpu 占用上去了 , 后来看运算时间并缩短不多很少一点点 ,win 7 这个问题值得讨论,感觉2D情况下,多核设置没有缩短计算时间,特别是17里宣传很多的TDM功能,CPU负荷100%,但并没有明显缩短计算时间。 kinglzk2000 发表于 2016-9-30 08:21
哦 ?这么神奇,不知道试过几个 。时间按相应比例缩短吗。
另外关于 cpu占用和计算时间 ,我也用24 ...
额,一直都是开多核算的,很少开单核。时间可能是按比例缩短的,但仅限于矩阵计算那一块,之前的网格剖分都是1个core在算,时间全浪费在这个上面了,不知道R17之后有无改进。 hscqu 发表于 2016-9-30 08:36
这个问题值得讨论,感觉2D情况下,多核设置没有缩短计算时间,特别是17里宣传很多的TDM功能,CPU负荷100%, ...
R17 17.1 17.2没有搞到合适的和谐版本,不做品论。不知道这几个版本里面剖分这块是否能多核进行。 hscqu 发表于 2016-9-30 08:36
这个问题值得讨论,感觉2D情况下,多核设置没有缩短计算时间,特别是17里宣传很多的TDM功能,CPU负荷100%, ...
关于这个TDM功能我作了一个小对比,四核计算机,同样的模型,分了四个时间点进行TDM计算,与没有开TDM计算进行对比。在TDM运算下,CPU使用率上去了,运算时间稍有减小。我的理解是,TDM是一个分时计算功能,他要在最开始对各个等分下来的时间点进行预估计算,再进行并行求解,而这个预估计算是需要时间的,因此在计算一些时间步数少,模型小的一些模型时TDM可能效果不太好。他的优势应该是在算一些大型模型时应该会有比较好的应用效果。不过现在TDM的限制也还是比较多的,希望下个版本有所改进。 DDG171 发表于 2016-9-27 17:20
个人体会是这样的,17版及其之前的ansoft maxwell,只要处于剖分阶段,CPU就只有一个核或者1个线程在工作, ...
能和你交流一下吗?我和你的感觉差不多 个人感觉没有设置好,2D是可以多核心跑同一个参数点的,用的是TDM技术,论坛里有方法,具体帖子自己找一找吧
同一个模型,我的笔记本单核心跑4个小时,学院服务器(24核心,Xeon)用TDM核心开满后只用了13分钟,那些说提升不明显的我就不明白了,可能是模型数据量越大、瞬态时间越长越明显吧、
http://i4.piimg.com/1949/b303ecc8b2db0d4d.png kinglzk2000 发表于 2016-9-27 10:37
说一下 我是在tools , maxwell 3d options 里设置的。V16 2013年发布的那个 ,其他高版本也有类似用法...
大神,解决没,16的到底怎么用,我设置了maxwell 3d options,但是利用率还是上不去 感谢分享,不管实际效果怎么样,可以择优用之
页:
[1]
2