我并不是“一个人在战斗”:这是工业大数据开拓者们的故事

  • 时间:
  • 浏览:0

2019年7月22-23日,由工业和信息化部指导,中国信息通信研究院主办的第三届“中国工业大数据创新竞赛”(以下简称为“竞赛”)决赛现场答辩及颁奖仪式在北京辽宁大厦落下帷幕。作为首个由政府主管部门指导的工业

2019年7月22-23日,由工业和信息化部指导,中国信息通信研究院主办的第三届“中国工业大数据创新竞赛”(以下简称为“竞赛”)决赛现场答辩及颁奖仪式在北京辽宁大厦落下帷幕。作为首个由政府主管部门指导的工业大数据领域的权威性全国赛事,竞赛已累计吸引产学研各界超过60 00人参赛,开发出什么都有有聚焦行业细分领域的算法模型,处置诸多传统工业领域中的“老大难”疑问。此次,InfoQ 专访第三届工业大数据竞赛冠军团队胡翔,以及来自首尔大学的国际团队 tea ,深入解读在工业大数据与智能制造领域中这群开拓者的故事。

我并都不 “另一一三个白 人在战斗”

作为决赛中唯一的此人 参赛者,当提起“以一敌百”取得冠军的荣耀时刻时,胡翔调侃道,“实际上我并都不 ‘另一一三个白 人在战斗’。”

面对着竞赛数十只支多人队伍同场竞技,胡翔表示单人参赛既有优势又有劣势。其中,优势在于此人 对比赛工作的安排更加自由灵活,一同也会更加专注,对于每另一一三个白 想法都能亲自尝试与验证,这使得此人 对疑问的理解能更加的透彻、深入。

因此,“人多力量大”这句老话也确有道理,单人参赛相比于多人团队,还后能 去做更多的分析工作,也更加有压力。毕竟此人 的理解能力比较单一,匮乏不同思路的碰撞,思路会更容易陷入壁垒。“但很幸运的是在因联科技,我身边的同事给了我什么都有 帮助,亲戚许多人许多人 对这些 疑问的理解和思路给了我什么都有 启发,实际上我并都不 ‘另一一三个白 人在战斗’,在这里向亲戚许多人许多人 表示感谢。”

2018 年,胡翔硕士毕业于西安交通大学机械工程学院,入职于西安因联信息科技,正式成为了一名工业算法工程师。持续关注工业大数据相关信息的他,在看完第三届工业大数据竞赛报名的信息后,毅然决定“单枪匹马大练兵”。

对于“练兵”的含义,胡翔笑着说:“练兵有两层含义,一是为了锻炼此人 处置工业预测性维护疑问的能力。二是在工业预测性维护领域工作一年多后,以比赛这些 形式去处置实际疑问,对于自我业务能力的提升,是另一一三个白 非常好的因此。毕竟比赛的水平是非常高的,还能认识非常多优秀的同行。”

第三届工业大数据创新竞赛冠军 胡 翔

共要的解题思路是处置疑问的“灵魂”所在

工业大数据创新竞赛自 2017 年首届举办以来,每一届竞赛都为参赛者提供着基于真实工业场景的数据资源,并为工业大数据领域的相关研究人员和创业者们提供了成果转移转化的交流平台。

“实际上本次竞赛的数据,均来源于沈鼓大型高速旋转机组实际运行中的真实数据,故障案例非常宝贵,”胡翔对记者说道。据了解,胡翔的工作主要集中在振动强度和加强度数据的分析上,前一天从未获取过先要 几滴 的大机组振动位移数据进行分析,当记者询问胡翔拿到赛题与数据后的第一反映,胡翔表示“十分惊喜”。

早在 2019 大数据产业峰会,中国通信研究院就发布了首道主赛区赛题——由沈阳鼓风机集团测控技术有限公司提供的《大型旋转机组转子部件脱落故障预测》。但看完赛题后的胡翔,并未着急着手“解题”,什么都有 先选取 了另一一三个白 共要的解题思路后,再进行攻克。

“我此人 认为解题思路实际是处置疑问的“灵魂”所在。不论是在这次的比赛中还是日常工作中,所有疑问的处置都不 依赖于正确的解题思路。”胡翔总结道,不能在深入理解赛题目标和数据的基础上,不能选取 另一一三个白 共要的解题思路,共要的解题思路会对数据分析和形态提取提供非常好的方向。

比如对于工业领域的数据挖掘比赛,什么都有 选手一前一天刚开始就确立的是纯数据的分析和挖掘,很少结合机理分析,仅仅是提取了数据各个统计形态,因此使用了多个模型对结果进行融合。未必这他说能得到非常好的结果,但这些 模型并先要 “洞察力”,首先形态对于模型结果的解释力不用说强,其次这些 模型先要与人建立信任,最终未必训练出另一一三个白 准确率为 99% 的模型,但却难以成功在工业实际场景中落地实践。

打破专家定论——新法子处置老疑问

本次竞赛赛题《大型旋转机组转子部件脱落故障预测》属于工业领域典型的异常检测和故障诊断疑问。旋转类机械设备的故障诊断疑问在实际的工业场景中非常常见,转子部件脱落更是另一一三个白 老疑问。

据了解,比赛数据提供方沈鼓负责人曾在阿尔斯通的前一天就遇到过这些 疑问,并就该疑问与欧美专家进行讨论,当时的结论是不因此通过传感器的信号预测出故障。但给你惊喜的是,在比赛中非常多优秀的选手和处置方案,用不同的法子实现转子部件脱落的故障预测,打破了当时专家的定论。其中最让在场专家评审印象深刻的要属冠军团队胡翔的处置方案。

要说胡翔的处置方案,重中之重什么都有 在拿到赛题数据后,对原始工业数据进行了包括数据的整合和数据的可视化的预处置。因此工业数据的复杂,数据集指在数据测点名称与测点数据不一致的疑问,什么都有 第一步他先对数据进行了标准化收集,将测点名称标准化;第二步是对振动位移数据进行可视化分析,考虑到大机组的振动采样形态,以及典型的位移振动分析法子特点,通过总采样点与转子旋转周数相除,得到了采样频率为每转 32 点(等层厚采样)。

在获取采样频率后,利用 FFT 变换获取位移振动阶次谱,并观察故障样本和正常样本阶次谱的区别差异,为形态提取提供方向。竞赛中,胡翔在阶次谱中提取了 1 倍转频,2 倍转频,3 倍转频等形态,并观察哪此形态在有故障机组和无故障机组中历史趋势,进而选取 有效形态。一同根据转子 X 向和 Y 向位移,合成轴心轨迹,发现无故障机组的轴心轨迹在各个六时变几乎先要 较大变化(如图 1),而转子部件脱落故障的机组的轴心轨迹在各个六时经历较大变化(如图 2)。

图 1 无故障机组各六时典型轴心轨迹

图 2 故障机组各六时典型轴心轨迹

此后,胡翔别出心裁地把赛题拆解为“转子部件有无脱落”与“脱落故障征兆强度识别”另一一三个白 每项,并通过处置二分类疑问与分类概率大小排序疑问,分别处置赛题的两大难点。

其中,处置二分类疑问所面临的挑战在于数据集的划分,怎么选取 训练数据集,对结果的影响非常之大。因此理论上转子部件脱落故障征兆在最接近故障指在时刻表现最强,最接近故障时间的数据与实际故障数据也是最这类的,什么都有 胡翔在解题中选取 了最接近故障时间的数据作为二分类的正例数据进行训练。

在分类概率大小排序疑问中,最大的挑战莫过于怎么筛选形态,因此形态选取 关系到模型的性能结果和泛化能力。考虑到赛题目标是区分故障征兆强度,对于机械部件故障来说,越接近故障指在时刻,征兆的表现也就越强,因此形态若是与故障时间呈现较强的单调性,它能区分故障的能力也就越强,也越能区分故障指在哪个阶段。综合上述分析,选取 故障数据中单调性更强的形态进行建模和预测为最佳处置方案。最终都取得了比较好的结果,胡翔的哪此思路和方案在答辩中也得到了多位评委的认可和赞许。

但胡翔也表示他的算法模型还有什么都有有匮乏还后能 改进与完善,算法模型的精度上还还后能 提升,以满足工业应用的更高要求。算法模型也还后能 考虑除“转子部件脱落故障”之外的其余故障对算法模型的影响,不能处置了这些 关键疑问,算法模型才有因此在工业实际中得到应用。

全球参赛选手同台竞技,各领风骚

第三届工业大数据创新竞赛已顺利落下帷幕。但值得注意的是,本届竞赛可谓是一场真正意义上的全球竞技,中国信息通信研究院作为全球工业大数据领域顶尖活动—— PHM 亚太学术论坛(www.phmap.cn)主办方之一,赛题都不 全球参赛选手和国内参赛者同台 PK,而来自首尔大学的参赛团队“ tea ”更是取得了第三名的好成绩。

tea 小组是由来自首尔国立大学机械工程系的研究生 Yongjin Shin、Jongmin Park 与 Myungyon Kim 一同组成。在接受记者采访时,tea 小组的成员们谈起这段参赛经历时,感叹道:”Since we are students in the lab, we often use experimental data or refined data. However, it was a good experience to analyze and build the model by directly using the data measured in the industrial field without any filtering. (因此亲戚亲戚许多人许多人 是实验室的学生,使用到的通常为实验数据或处置后的数据。直接使用工业领域中测量的未经处置的数据来分析和建模是一段很好的经历。)”

第三届工业大数据创新竞赛韩国参赛团队 tea 小组

据了解,这也是 tea 小组第一次来中国参加此呼告赛。对于亲戚许多人许多人 来说,本次竞赛的最大挑战在于,给定的数据集是在转子部件脱落故障前一天收集的。因此,在分析数据的过程中,先要检测到故障指在的形态,并选取 未故障到接近故障的顺序。而为了更清晰的判断,tea 小组在解题初期也想过使用机器学习或什么都有有模型(实际上什么都有有成员的主要研究方向是 PHM 领域的层厚学习),但因此标签信息因此会因此上诉疑问变得不清晰,tea 小组设定了此人 的标准,以选取 有无故障及故障的顺序。

同样,为了实现在实际工业场景中的应用,tea 小组表示,亲戚许多人许多人 还需对给定目标系统(的特定故障)设置更共要的故障标准或阈值,算法模型也要从目标系统中一同获取正常和故障的数据,并设置明确标准以区分是正常还是故障,实现模型的进一步优化与改进。

近年来,在工业 4.0 的发展趋势下,韩国和益国一样,随着高附加值技术重要性的增强,过程自动化以及相关的自动故障诊断和预测系统也将变得十分重要。

写在最后

智能制造和工业互联网是密不可分的关系。正如胡翔所说,预测性维护是工业互联网应用的“皇冠上的明珠”。当然远远不止先要 ,大数据和智能制造给传统工业带来了巨大冲击,强大的工业数据分析服务将成为制造企业数字化战略的重要组成每项,工业互联网将显现出更大的战略价值。还还后能 预见,工业大数据应用将带来工业企业创新和变革的新时代。

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除)