八大类主流工业仿真平台【心累指数】终极评测(上)

有一个神奇的小盒子,
只要把各种参数和设定往里面一扔,
你想要的仿真结果数据就会自动掉落。
——这可能是亿万仿真研发工程师的梦


仿真外包在某种程度上就是这种盒子,但是,建议你先看下这篇:当仿真外包成为过气网红后…


现实让人清醒。
除了操心仿真,研发工程师可能还有好多其他事情要做。


理想情况下,每一个仿真研发工程师身后都站着N个(N不一定是整数,甚至可能N=0)IT工程师……IT搞定一切,研发啥都不用管,关心数据与模型就完事
事实上,研发与IT之间也是有壁的,他们说的是不同世界的语言。而且壁与壁之间还有一段不小的距离,不知道该归谁管,需要懂交叉学科的人才。

仿真工程师们需要一个靠谱帮手来降低工作量,让自己不再心累
为了找到TA,我们考察了市面上几乎所有类型的仿真平台,充分评测了他们究竟能给研发(以及IT)减轻多少工作量,并搭建了一个仿真平台【心累指数】模型

该模型呈金字塔结构,覆盖了目前市面上所有类型的仿真平台产品/解决方案,从金字塔底层到塔尖,心累指数逐渐降低。
简单点说,站得越高,用得越爽。

你可以跳过下文直接扫码获取白皮书阅读完整报告,但看完会获得一个全新的视角,也非常不错。

我们从下往上,来看看在不同解决产品/解决方案中,研发的工作量与心累指数。

先说一下基本设定:
厨房基础设施:偏硬件层的相关工作,包括但不限于机房建设与运维、服务器与存储部署&配置&运维、网络配置等事项,一般属于IT的工作范畴。在少数情况下(比如有些公司没有IT),可能由研发或其他人来负责。
配菜、调料、做饭:偏软件层的相关工作,包括但不限于调度器运维与支持、操作系统兼容性调优、数据保护与灾备、仿真软件部署与调优、仿真软件故障排除等事项。这些工作覆盖的技能面较广,权责不太明确,需要交叉型人才。
点菜、吃饭:研发负责点菜、吃饭,跑仿真任务。

我们先说买机器,相当于在自家厨房。
这里的“自家厨房”指本地硬件设施,单机、工作站、机房都有可能。

在自己家里的都是一家人。
研发大概是需要进厨房帮忙,与IT一起做饭的。如果没有IT,可能厨房搭建也得帮忙。
而有些交叉领域问题,IT可能真不了解,研发也不得不自学大量技能,其中会涉及到大量的跨语种沟通,往往导致厨房里吵吵闹闹,一团乱麻。
自家厨房的容量,理论上没有边界,但扩建工程量相当大。
研发心累指数:100
IT心累指数:100


接着是使用超算中心云厂商的资源两种情况,可以看作租用公共厨房。

到了公共厨房,厨房基础设施就是现成的了。
研发需要自己配菜,并带上调料做饭,然后才能吃,这就很考验研发的水平(和耐心)了。
当然如果自家厨房有IT,也是能叫过来帮帮忙的,不过这取决于IT对公共厨房的熟悉程度和水平,他主要还是在自家厨房里干活。
当然,公共厨房容量肯定是有限的。
超算中心还可能存在一种情况——有时研发正在厨房里忙,突然跑来一个陌生人也进来在旁边做起饭来;甚至突然之间,公共厨房被宣布收回了,把研发赶了出来。。。
研发心累指数:85
IT心累指数:66

金字塔中层的四种平台都可以看作自助餐厅

到了自助餐厅,研发终于可以不用管做饭了,直接拿着菜就吃,这比金字塔底层已经轻松太多了。
但自助餐厅供应的菜品有限,如果自己想吃的恰好没有,那就是真没有。。。。如果遇到问题,自家IT也可以帮忙,但仅限于口头帮忙。
当有很多研发要吃饭的时候,一家自助餐厅的容量也是有限的。
研发心累指数:58
IT心累指数:30

以上情况,自家厨房跟餐厅之间没有任何关系,都是各管各的。
我们属于环球臻选餐厅模式。

这个环球臻选餐厅,后厨可以一键变大变小,如果你自己有一个或多个本地厨房,可以接入后厨统一管理。同时,餐厅还提供专属管家服务,为研发和IT的交叉领域提供专业支持。
研发真正只需要吃饭就行了,再也不用操心厨房相关的事情了。
IT可以通过一个管理系统调用全部厨房设备做饭,自动化程度相当高,大大降低了工作量,比如可以随时无限量采购全球特色食材、根据菜品的成熟度自动开关火、给每个研发设定能吃多少东西(响应光盘行动)。
研发心累指数:0
IT心累指数:0

接下来我们将用4大维度、25个小问题,从金字塔底到塔尖,为你详细对比这些仿真平台如何降低研发和IT的心累指数:

以下为评测篇正文:

01 这究竟是个什么东西?


1.1、付了钱,那么你买到是什么?
底层:
硬件设备:台式机、工作站、服务器等。
超算资源的使用权(因为要优先服务国家级科研项目,可能会被无条件回收)。
云资源的使用权
中层:
硬件资源/超算资源/云资源的使用权
其中超算云的资源同样有被无条件回收的可能性。
塔尖:
一整套即开即用的仿真研发环境,既连接上层应用,对应用本身的运行提供支持和优化;同时连接底层资源,给用户提供更灵活、更高效使用资源的能力。

1.2、兼容性怎么样?能不能跟其他产品/方案混着用?
底层:
均不能混用。
中层:
均不能混用。
塔尖:
fastone云平台的底层资源来自多家公有云厂商,可根据你的情况在多家云厂商之间匹配最合适的云端资源。
fastone云平台也可将本地资源与云资源打通,完美支持混合云,详见问题2.3。

1.3、多久可以开始用这个东西?
底层:
买机器首先得走项目审批采购流程,准备好相应的机器空间、网络环境、风火水电……机器到位之后,还得部署环境、安装软件。
超算中心有一套固定的审批流程,对科研用户较宽松且快捷,企业用户很难申请成功。如果成功申请到了超算资源,系统是安装好的(一般是各种版本的Linux),也会有一部分仿真软件,没有的需要自己搞定。
审批不是唯一的阻碍,由于超算资源总量不多,对外开放的又有限,还经常需要供给国家级科研项目,超算资源一般都需要排队。

云厂商的资源是即开即用的,你可以选择好自己需要的系统和版本,软件需要自己装。
中层:
均支持分钟级开通账号
其中云厂商的仿真平台和软件平台在开通账号后可立即开始使用资源。
硬件厂商的仿真平台使用资源需要申请,平台方电话审核通过后才能开始使用。
超算云的资源则与超算中心一样,同样面临排队的问题。
塔尖:
fastone云平台的账号和资源都是即开即用的,无需审批。


1.4、我用的仿真软件能够支持吗?能支持多少?
底层:
买机器和云厂商均需要自己装软件。
超算中心支持常见的仿真软件,但支持列表更新缓慢,无法针对个人需求调整。
中层:
一部分硬件厂商和云厂商的仿真平台会与软件商有合作关系,但这种合作较为松散,支持的软件数量与程度也极其有限。对于没有合作关系的平台,那就只能自己搞定了。
超算云跟超算中心一样,仅支持常见仿真软件且更新缓慢。
软件平台只支持他们家自己的软件。
塔尖:
作为一个开放的平台,fastone云平台支持市面上绝大部分商业/开源仿真软件和AI框架。所有软件装在一个平台上,使用方便。自编译软件也能安装。

1.5、软件支持深度怎么样?
底层:
买机器和云厂商是完全不管软件的。
超算中心上面说了,支持常见的仿真软件,但这个“支持”仅限于特定版本的软件,无法自由选择。
中层:
硬件厂商和云厂商的仿真平台对软件的支持和管理由软件厂商提供(如果有合作关系的话),一般只涉及到软件使用层面。部分云厂商可能和特定的软件厂商有深入合作,比如Ansys与微软Azure推出的Ansys Cloud,主要支持海外区域。
超算云与超算中心一样,仅限于支持特定版本的软件。
软件平台本身是软件的所有者,其对软件的支持非常灵活,甚至可以达到产品级的修改(当然,这种级别的修改一般不面向用户),不过,依然仅限自家软件。
塔尖:
云平台不仅支持的软件数量多,支持深度也足够。比如优化软件的运行方式,让其可以充分利用云端海量资源的优势并行运算,大幅提升研发效率。

比如跑COMSOL任务,当核数逐渐增加后,由于节点间通信开销指数级上升,性能的提升会随着线程数增长逐渐变缓,使用网络加强型实例可以有效解决该问题,具体戳这里:这样跑COMSOL,是不是就可以发Nature了
原理可戳这里:揭秘20000个VCS任务背后的“搬桌子”系列故事


1.6、资源量够不够?
底层:
买机器的话,理论上你可以一直买买买,直到把自己买成一家公有云厂商。但实际操作中受到资金、人力、空间等各种因素的考量,不可能无限制地购买机器
超算中心的资源量则没有想象中那么“超级”,具体要看它的机器数量和规模。并且由于资源要优先供给国家级科研项目,对外开放的实际可用资源非常少,对单个用户开放的资源还存在上限,而且只提供固定套餐,可以选择的范围很小。

云厂商的资源则取决于其自身机房数量与规模


中层:
总体来说,取决于该厂商/合作资源方的机房数量和规模。
需要指出的是,有些超算云与云厂商存在合作关系,资源总量可能会略高于超算中心。
塔尖:
fastone云平台的全球数据中心能够提供海量计算资源。

1.7、我对机器有要求,比如要新型号的CPU或GPU,有吗?
底层:
买机器的话,钱到位就行了,一般不至于买不到。
超算中心的硬件更新频率较慢,普遍缺少最新款或者某些指定型号的硬件。
不同云厂商之间特定资源的保有量存在很大差异,用户实际能够使用的资源量会受到相应限制。
中层:
与上一个问题一样,厂商/合作资源方的机房数量和规模决定了特定资源能否满足你的需求。
塔尖:
跨云跨区域数据中心不仅意味着资源量大,也能提供类型最丰富和最新型号的计算资源。


1.8、是怎么计费的?
底层:
买机器除了硬件费用,还有网络设备、运维人力、机房空间、风火水电、时间成本等等各种隐形投入。
详情可戳:帮助CXO解惑上云成本的迷思,看这篇就够了
超算中心有排队和预留两种计费模式。前者参与任务排队,按照实际使用的机时支付相关费用;后者单独划给你一块资源使用一段时间并计费。
云厂商则可以提供按需、预留、竞价等灵活的计费模式。
按需:用多少付多少,避免浪费,单位通常为小时,简单易计算,缺点是价格比较高。
预留:针对长期需求(比如包年包月),相当于批发,价格比按需便宜。
竞价:可被抢占实例,相当于秒杀,又称SPOT。手快有手慢无,价格可高可低波动大,随时可能被抢占中断,需要有一定的技术实力才能使用。

中层:
计费模式通常较为灵活,常见的包年、包月、按需都有。
塔尖
按需、预留、竞价均支持。

02 适用场景广泛吗?


2.1、主要服务对象是谁?
底层:
超算中心主要面向高校,对企业基本不开放。
买机器和云厂商对高校和企业均适用。
中层:
所有人。
塔尖:
所有人。

2.2、产品模式是怎样的?
首先科普一下,产品模式包括IaaS、PaaS、SaaS三种。


我们用做披萨来打比方。
你可以从头到尾自己生产披萨,也可以外包一部分工作。
根据外包的程度不同,我们就有了IaaS、PaaS、SaaS三种方案:

IaaS:有人提供厨房、炉子、煤气,你使用这些基础设施,来烤你的披萨。PaaS:除了基础设施,还有人提供披萨饼皮。你只要把自己的配料洒在饼皮上,让他帮你烤出来就行了。
SaaS:有人直接做好了披萨,不用你的介入,到手的就是一个成品,你可以直接开吃。
如果看不懂,欢迎查看《2023仿真宇宙漫游指南——工业仿真从业者必读》白皮书Part 3

底层:
三者均属于IaaS。
中层:
均为SaaS。
相比金字塔底层的IaaS,即开即用的优势十分明显,同时对用户的要求全面降低,硬件和环境完全不用管了,软件也搞定了一部分,用户注册完账号后即可马上使用。
塔尖:
SaaS+PaaS,唯一有PaaS的存在。
云平台的SaaS模式直接提供一整套即开即用的研发环境,而PaaS则增加了IT自动化、多地协同等好用的功能和R&D-IT服务,还能将本地资源一起利用起来。


2.3、可以跟自己本地的机器一起用吗?
这相当于使用各种别人厨房/餐厅的同时,把自家厨房也利用起来。
保留本地的厨房规模和生产模式,充分利用,减少浪费。只是在生产量大的时候使用其他方案。这就是混合云了。

底层:
自己买机器当然可以跟本地机器一起用了。
超算中心与云厂商则均为独立使用的资源,你用你的,我用我的,互不干涉。
中层:
所有平台只能使用该厂商自己(和合作方)的资源,均不支持混合云。
塔尖:
唯一支持混合云的存在。
fastone云平台在获取外部资源的同时,能够将本地的计算资源给充分利用起来。当用户处理日常任务时,可以只在本地运行。
而当本地资源不足以应付时,直接自动连接云端海量资源进行运算,操作相当方便,完全不改变用户的操作习惯。
而通常情况下,本地环境的持续维护需要消耗大量精力。我们的云上运行环境都是自动化配置的,不需要人工干预,用户还可以通过平台进行统一管理和监控,方便易操作。

2.4、可以多地协同使用吗?
有些大型制造企业拥有多个处于不同区域的研发中心,身处不同研发中心的工程师如何协同:
如何保证所有用户体验一致?
如何确保所有用户网络共通?
如何建立统一的身份认证?
如何进行统一的数据管理?
如何建立统一的安全体系?
如何对多区域用户统一管理?
……
我们把这一系列问题统称为多地协同。

底层:
均不支持。
中层:
均不支持。
塔尖:
唯一支持多地协同的存在。
fastone云平台提供了统一且经过优化验证的计算环境,一致性较高,不会由于环境问题导致计算出错,极大提升了多地/远程/海外的协同效率。

本次评测篇上半部分就到这里了,后续即将发布的下半部分将针对研发和IT的日常工作,解答“如何提升研发效率”与“如何降低IT工作量”,敬请关注哦~


欢迎直接扫码获取白皮书阅读完整报告:

目录先睹为快~

关于fastone云平台在各种CAE应用上的表现,可以点击以下应用名称查看: Bladed │ Fluent │ LS-DYNA │ COMSOL


- END -


我们有个CAE仿真研发云平台
集成多种CAE/CFD应用,大量任务多节点并行
应对短时间爆发性需求,连网即用
跑任务快,原来几个月甚至几年,现在只需几小时
5分钟快速上手,拖拉点选可视化界面,无需代码
支持高级用户直接在云端创建集群 


扫码免费试用,送200元体验金,入股不亏~

更多电子书
欢迎扫码关注小F(ID:imfastone)获取

你也许想了解具体的落地场景:
王者带飞LeDock!开箱即用&一键定位分子库+全流程自动化,3.5小时完成20万分子对接
这样跑COMSOL,是不是就可以发Nature了
Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?

1分钟告诉你用MOE模拟200000个分子要花多少钱
LS-DYNA求解效率深度测评 │ 六种规模,本地VS云端5种不同硬件配置
揭秘20000个VCS任务背后的“搬桌子”系列故事
155个GPU!多云场景下的Amber自由能计算
怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?

5000核大规模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina对接2800万个分子

从4天到1.75小时,如何让Bladed仿真效率提升55倍?
从30天到17小时,如何让HSPICE仿真效率提升42倍?


关于为应用定义的云平台:
2023仿真宇宙漫游指南——工业仿真从业者必读
当仿真外包成为过气网红后…
和28家业界大佬排排坐是一种怎样的体验?
这一届科研计算人赶DDL红宝书:学生篇

杨洋组织的“太空营救”中, 那2小时到底发生了什么?
一次搞懂速石科技三大产品:FCC、FCC-E、FCP
Ansys最新CAE调研报告找到阻碍仿真效率提升的“元凶”
国内超算发展近40年,终于遇到了一个像样的对手
帮助CXO解惑上云成本的迷思,看这篇就够了
花费4小时5500美元,速石科技跻身全球超算TOP500

相关推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注

微信扫一扫

微信扫一扫

微信扫一扫,分享到朋友圈

八大类主流工业仿真平台【心累指数】终极评测(上)
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close