2019年7月22-23日,由工業(yè)和信息化部指導(dǎo),中國信息通信研究院主辦的第三屆“中國工業(yè)大數(shù)據(jù)創(chuàng)新競賽”(以下簡稱為“競賽”)決賽現(xiàn)場答辯及頒獎儀式在北京遼寧大廈落下帷幕。作為首個由政府主管部門指導(dǎo)的工業(yè)大數(shù)據(jù)領(lǐng)域的權(quán)威性全國賽事,競賽已累計吸引產(chǎn)學(xué)研各界超過6000人參賽,開發(fā)出許多聚焦行業(yè)細(xì)分領(lǐng)域的算法模型,解決諸多傳統(tǒng)工業(yè)領(lǐng)域中的“老大難”問題。此次,InfoQ 專訪第三屆工業(yè)大數(shù)據(jù)競賽冠軍團(tuán)隊胡翔,以及來自首爾大學(xué)的國際團(tuán)隊 tea ,深入解讀在工業(yè)大數(shù)據(jù)與智能制造領(lǐng)域中這群開拓者的故事。
我并不是“一個人在戰(zhàn)斗”
作為決賽中唯一的個人參賽者,當(dāng)提起“以一敵百”取得冠軍的榮耀時刻時,胡翔調(diào)侃道,“實際上我并不是‘一個人在戰(zhàn)斗’。”
面對著競賽數(shù)十只支多人隊伍同場競技,胡翔表示單人參賽既有優(yōu)勢又有劣勢。其中,優(yōu)勢在于個人對比賽工作的安排更加自由靈活,同時也會更加專注,對于每一個想法都能親自嘗試與驗證,這使得自己對問題的理解能更加的透徹、深入。
但是,“人多力量大”這句老話也確有道理,單人參賽相比于多人團(tuán)隊,需要去做更多的分析工作,也更加有壓力。畢竟個人的理解能力比較單一,缺乏不同思路的碰撞,思路會更容易陷入壁壘。“但很幸運的是在因聯(lián)科技,我身邊的同事給了我很多幫助,他們對這個問題的理解和思路給了我很多啟發(fā),實際上我并不是‘一個人在戰(zhàn)斗’,在這里向他們表示感謝。”
2018 年,胡翔碩士畢業(yè)于西安交通大學(xué)機(jī)械工程學(xué)院,入職于西安因聯(lián)信息科技,正式成為了一名工業(yè)算法工程師。持續(xù)關(guān)注工業(yè)大數(shù)據(jù)相關(guān)信息的他,在看到第三屆工業(yè)大數(shù)據(jù)競賽報名的信息后,毅然決定“單槍匹馬大練兵”。
對于“練兵”的含義,胡翔笑著說:“練兵有兩層含義,一是為了鍛煉自己解決工業(yè)預(yù)測性維護(hù)問題的能力。二是在工業(yè)預(yù)測性維護(hù)領(lǐng)域工作一年多后,以比賽這種形式去解決實際問題,對于自我業(yè)務(wù)能力的提升,是一個非常好的機(jī)會。畢竟比賽的水平是非常高的,還能認(rèn)識非常多優(yōu)秀的同行。”
第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競賽冠軍 胡 翔
合適的解題思路是解決問題的“靈魂”所在
工業(yè)大數(shù)據(jù)創(chuàng)新競賽自 2017 年首屆舉辦以來,每一屆競賽都為參賽者提供著基于真實工業(yè)場景的數(shù)據(jù)資源,并為工業(yè)大數(shù)據(jù)領(lǐng)域的相關(guān)研究人員和創(chuàng)業(yè)者們提供了成果轉(zhuǎn)移轉(zhuǎn)化的交流平臺。
“實際上本次競賽的數(shù)據(jù),均來源于沈鼓大型高速旋轉(zhuǎn)機(jī)組實際運行中的真實數(shù)據(jù),故障案例非常寶貴,”胡翔對記者說道。據(jù)了解,胡翔的工作主要集中在振動速度和加速度數(shù)據(jù)的分析上,之前從未獲取過這么大量的大機(jī)組振動位移數(shù)據(jù)進(jìn)行分析,當(dāng)記者詢問胡翔拿到賽題與數(shù)據(jù)后的第一反映,胡翔表示“十分驚喜”。
早在 2019 大數(shù)據(jù)產(chǎn)業(yè)峰會,中國通信研究院就發(fā)布了首道主賽區(qū)賽題——由沈陽鼓風(fēng)機(jī)集團(tuán)測控技術(shù)有限公司提供的《大型旋轉(zhuǎn)機(jī)組轉(zhuǎn)子部件脫落故障預(yù)測》。但看到賽題后的胡翔,并未著急著手“解題”,而是先確定了一個合適的解題思路后,再進(jìn)行攻克。
“我個人認(rèn)為解題思路實際是解決問題的“靈魂”所在。不論是在這次的比賽中還是日常工作中,所有問題的解決都是依賴于正確的解題思路。”胡翔總結(jié)道,只有在深入理解賽題目標(biāo)和數(shù)據(jù)的基礎(chǔ)上,才能確定一個合適的解題思路,合適的解題思路會對數(shù)據(jù)分析和特征提取提供非常好的方向。
比如對于工業(yè)領(lǐng)域的數(shù)據(jù)挖掘比賽,很多選手一開始就確立的是純數(shù)據(jù)的分析和挖掘,很少結(jié)合機(jī)理分析,僅僅是提取了數(shù)據(jù)各個統(tǒng)計特征,并且使用了多個模型對結(jié)果進(jìn)行融合。雖然這也許能得到非常好的結(jié)果,但這種模型并沒有“洞察力”,首先特征對于模型結(jié)果的解釋力并不強(qiáng),其次這種模型很難與人建立信任,最終雖然訓(xùn)練出一個準(zhǔn)確率為 99% 的模型,但卻難以成功在工業(yè)實際場景中落地實踐。
打破專家定論——新方法解決老問題
本次競賽賽題《大型旋轉(zhuǎn)機(jī)組轉(zhuǎn)子部件脫落故障預(yù)測》屬于工業(yè)領(lǐng)域典型的異常檢測和故障診斷問題。旋轉(zhuǎn)類機(jī)械設(shè)備的故障診斷問題在實際的工業(yè)場景中非常常見,轉(zhuǎn)子部件脫落更是一個老問題。
據(jù)了解,比賽數(shù)據(jù)提供方沈鼓負(fù)責(zé)人曾在阿爾斯通的時候就遇到過這個問題,并就該問題與歐美專家進(jìn)行討論,當(dāng)時的結(jié)論是不可能通過傳感器的信號預(yù)測出故障。但讓人驚喜的是,在比賽中非常多優(yōu)秀的選手和解決方案,用不同的方法實現(xiàn)轉(zhuǎn)子部件脫落的故障預(yù)測,打破了當(dāng)時專家的定論。其中最讓在場專家評審印象深刻的要屬冠軍團(tuán)隊胡翔的解決方案。
要說胡翔的解決方案,重中之重就是在拿到賽題數(shù)據(jù)后,對原始工業(yè)數(shù)據(jù)進(jìn)行了包括數(shù)據(jù)的整合和數(shù)據(jù)的可視化的預(yù)處理。由于工業(yè)數(shù)據(jù)的復(fù)雜性,數(shù)據(jù)集存在數(shù)據(jù)測點名稱與測點數(shù)據(jù)不一致的問題,所以第一步他先對數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化整理,將測點名稱標(biāo)準(zhǔn)化;第二步是對振動位移數(shù)據(jù)進(jìn)行可視化分析,考慮到大機(jī)組的振動采樣特性,以及典型的位移振動分析方法特點,通過總采樣點與轉(zhuǎn)子旋轉(zhuǎn)周數(shù)相除,得到了采樣頻率為每轉(zhuǎn) 32 點(等角度采樣)。
在獲取采樣頻率后,利用 FFT 變換獲取位移振動階次譜,并觀察故障樣本和正常樣本階次譜的區(qū)別差異,為特征提取提供方向。競賽中,胡翔在階次譜中提取了 1 倍轉(zhuǎn)頻,2 倍轉(zhuǎn)頻,3 倍轉(zhuǎn)頻等特征,并觀察這些特征在有故障機(jī)組和無故障機(jī)組中歷史趨勢,進(jìn)而選擇有效特征。同時根據(jù)轉(zhuǎn)子 X 向和 Y 向位移,合成軸心軌跡,發(fā)現(xiàn)無故障機(jī)組的軸心軌跡在各個時段變幾乎沒有較大變化(如圖 1),而轉(zhuǎn)子部件脫落故障的機(jī)組的軸心軌跡在各個時段經(jīng)歷較大變化(如圖 2)。
圖 1 無故障機(jī)組各時段典型軸心軌跡
圖 2 故障機(jī)組各時段典型軸心軌跡
此后,胡翔別出心裁地把賽題拆解為“轉(zhuǎn)子部件是否脫落”與“脫落故障征兆強(qiáng)度識別”兩個部分,并通過解決二分類問題與分類概率大小排序問題,分別解決賽題的兩大難點。
其中,解決二分類問題所面臨的挑戰(zhàn)在于數(shù)據(jù)集的劃分,如何選取訓(xùn)練數(shù)據(jù)集,對結(jié)果的影響非常之大。由于理論上轉(zhuǎn)子部件脫落故障征兆在最接近故障發(fā)生時刻表現(xiàn)最強(qiáng),最接近故障時間的數(shù)據(jù)與實際故障數(shù)據(jù)也是最相似的,所以胡翔在解題中選取了最接近故障時間的數(shù)據(jù)作為二分類的正例數(shù)據(jù)進(jìn)行訓(xùn)練。
在分類概率大小排序問題中,最大的挑戰(zhàn)莫過于如何篩選特征,因為特征選擇關(guān)系到模型的性能結(jié)果和泛化能力??紤]到賽題目標(biāo)是區(qū)分故障征兆強(qiáng)度,對于機(jī)械部件故障來說,越接近故障發(fā)生時刻,征兆的表現(xiàn)也就越強(qiáng),因此特征若是與故障時間呈現(xiàn)較強(qiáng)的單調(diào)性,它能區(qū)分故障的能力也就越強(qiáng),也越能區(qū)分故障處于哪個階段。綜合上述分析,選擇故障數(shù)據(jù)中單調(diào)性更強(qiáng)的特征進(jìn)行建模和預(yù)測為最佳解決方案。最終都取得了比較好的結(jié)果,胡翔的這些思路和方案在答辯中也得到了多位評委的認(rèn)可和贊許。
但胡翔也表示他的算法模型還有一些不足需要改進(jìn)與完善,算法模型的精度上還需要提升,以滿足工業(yè)應(yīng)用的更高要求。算法模型也需要考慮除“轉(zhuǎn)子部件脫落故障”之外的其余故障對算法模型的影響,只有解決了這個關(guān)鍵問題,算法模型才有可能在工業(yè)實際中得到應(yīng)用。
全球參賽選手同臺競技,各領(lǐng)風(fēng)騷
第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競賽已順利落下帷幕。但值得注意的是,本屆競賽可謂是一場真正意義上的全球競技,中國信息通信研究院作為全球工業(yè)大數(shù)據(jù)領(lǐng)域頂尖活動—— PHM 亞太學(xué)術(shù)論壇(www.phmap.cn)主辦方之一,賽題也有全球參賽選手和國內(nèi)參賽者同臺 PK,而來自首爾大學(xué)的參賽團(tuán)隊“ tea ”更是取得了第三名的好成績。
tea 小組是由來自首爾國立大學(xué)機(jī)械工程系的研究生 Yongjin Shin、Jongmin Park 與 Yongjin Shin 共同組成。在接受記者采訪時,tea 小組的成員們談起這段參賽經(jīng)歷時,感嘆道:"Since we are students in the lab, we often use experimental data or refined data. However, it was a good experience to analyze and build the model by directly using the data measured in the industrial field without any filtering. (由于我們是實驗室的學(xué)生,使用到的通常為實驗數(shù)據(jù)或處理后的數(shù)據(jù)。直接使用工業(yè)領(lǐng)域中測量的未經(jīng)處理的數(shù)據(jù)來分析和建模是一段很好的經(jīng)歷。)"
第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競賽韓國參賽團(tuán)隊 tea 小組
據(jù)了解,這也是 tea 小組第一次來中國參加此類比賽。對于他們來說,本次競賽的最大挑戰(zhàn)在于,給定的數(shù)據(jù)集是在轉(zhuǎn)子部件脫落故障之前采集的。因此,在分析數(shù)據(jù)的過程中,很難檢測到故障發(fā)生的特征,并確定未故障到接近故障的順序。而為了更清晰的判斷,tea 小組在解題初期也想過使用機(jī)器學(xué)習(xí)或其他模型(實際上一些成員的主要研究方向是 PHM 領(lǐng)域的深度學(xué)習(xí)),但由于標(biāo)簽信息可能會由于上訴問題變得不清晰,tea 小組設(shè)定了自己的標(biāo)準(zhǔn),以確定是否故障及故障的順序。
同樣,為了實現(xiàn)在實際工業(yè)場景中的應(yīng)用,tea 小組表示,他們還需對給定目標(biāo)系統(tǒng)(的特定故障)設(shè)置更合適的故障標(biāo)準(zhǔn)或閾值,算法模型也要從目標(biāo)系統(tǒng)中同時獲取正常和故障的數(shù)據(jù),并設(shè)置明確標(biāo)準(zhǔn)以區(qū)分是正常還是故障,實現(xiàn)模型的進(jìn)一步優(yōu)化與改進(jìn)。
近年來,在工業(yè) 4.0 的發(fā)展趨勢下,韓國和中國一樣,隨著高附加值技術(shù)重要性的增強(qiáng),過程自動化以及相關(guān)的自動故障診斷和預(yù)測系統(tǒng)也將變得十分重要。
寫在最后
智能制造和工業(yè)互聯(lián)網(wǎng)是密不可分的關(guān)系。正如胡翔所說,預(yù)測性維護(hù)是工業(yè)互聯(lián)網(wǎng)應(yīng)用的“皇冠上的明珠”。當(dāng)然遠(yuǎn)遠(yuǎn)不止如此,大數(shù)據(jù)和智能制造給傳統(tǒng)工業(yè)帶來了巨大沖擊,強(qiáng)大的工業(yè)數(shù)據(jù)分析服務(wù)將成為制造企業(yè)數(shù)字化戰(zhàn)略的重要組成部分,工業(yè)互聯(lián)網(wǎng)將顯現(xiàn)出更大的戰(zhàn)略價值??梢灶A(yù)見,工業(yè)大數(shù)據(jù)應(yīng)用將帶來工業(yè)企業(yè)創(chuàng)新和變革的新時代。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2023年5月10日,一場關(guān)于工業(yè)互聯(lián)網(wǎng)的創(chuàng)新發(fā)展方向的盛會在北京隆重召開。我國是制造業(yè)的大國,在從制造業(yè)大國邁向制造業(yè)強(qiáng)國的轉(zhuǎn)型之路上,工業(yè)互聯(lián)網(wǎng)發(fā)揮著助推作用。在新一輪的科技革命洗禮下,物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等信息技術(shù)正在不斷賦能我們的工業(yè)生產(chǎn),從產(chǎn)業(yè)上下游深刻改變著社會的面貌,這些信息技術(shù)也
聚焦工業(yè)互聯(lián)網(wǎng),釋放數(shù)字經(jīng)濟(jì)新動能。我國工業(yè)互聯(lián)網(wǎng)創(chuàng)新發(fā)展持續(xù)邁出堅實步伐,有力推動了制造業(yè)數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型,有力推動了經(jīng)濟(jì)高質(zhì)量發(fā)展,并取得了一系列階段性、標(biāo)志性、引領(lǐng)性成果。為進(jìn)一步促進(jìn)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整和轉(zhuǎn)型升級深入推進(jìn),持續(xù)釋放積極效應(yīng),抓住全球產(chǎn)業(yè)結(jié)構(gòu)和布局調(diào)整過程中孕育的新機(jī)遇。20
工業(yè)互聯(lián),智造未來。5月5日,由中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(下稱:數(shù)博會)組委會主辦,貴州省工業(yè)和信息化廳、貴州省大數(shù)據(jù)發(fā)展管理局、貴陽市人民政府共同支持的2023數(shù)博會工業(yè)互聯(lián)網(wǎng)應(yīng)用場景大賽初篩在貴陽市觀山湖區(qū)國家數(shù)字內(nèi)容產(chǎn)業(yè)園成功舉行。圖|2023數(shù)博會工業(yè)互聯(lián)網(wǎng)應(yīng)用場景大賽初篩預(yù)選活動現(xiàn)場本次大
2023年政府工作報告中指出,支持工業(yè)互聯(lián)網(wǎng)發(fā)展,有力促進(jìn)制造業(yè)數(shù)字化智能化。這是工業(yè)互聯(lián)網(wǎng)連續(xù)六年寫入政府工作報告。工業(yè)互聯(lián)網(wǎng)作為我國新型基礎(chǔ)設(shè)施之一,對推動數(shù)字經(jīng)濟(jì)與實體經(jīng)濟(jì)融合創(chuàng)新,發(fā)揮著日益重要的底座支撐作用。近年來,隨著相關(guān)政策密集出臺并加速落地,工業(yè)互聯(lián)網(wǎng)快速發(fā)展,已全面融入45個國民經(jīng)
3月5日,十四屆全國人大一次會議在京開幕,政府工作報告新鮮出爐,工業(yè)互聯(lián)網(wǎng)連續(xù)6年寫入報告。作為工業(yè)互聯(lián)網(wǎng)平臺運營商,浪潮云洲深入實施工業(yè)互聯(lián)網(wǎng)創(chuàng)新發(fā)展戰(zhàn)略,大力發(fā)展數(shù)字經(jīng)濟(jì),著力提升制造業(yè)高端化、智能化、綠色化水平。2023年政府工作報告報告原文過去五年工作回顧:工業(yè)增加值突破40萬億元;數(shù)字經(jīng)濟(jì)
把脈中國數(shù)據(jù)智能化
2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領(lǐng)袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對
近日,數(shù)字化市場研究咨詢機(jī)構(gòu)愛分析發(fā)布了《2022愛分析·數(shù)據(jù)智能廠商全景報告》,愛分析從技術(shù)研發(fā)能力、服務(wù)客戶數(shù)量、收入規(guī)模等維度對廠商進(jìn)行了全面專業(yè)的評估
2022年11月18日,首個國家級大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新賽事——2022第一屆中國大數(shù)據(jù)大賽圓滿落幕。工業(yè)和信息化部信息技術(shù)發(fā)展司數(shù)字經(jīng)濟(jì)推進(jìn)處處長張建倫,中國電子技術(shù)標(biāo)準(zhǔn)化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業(yè)和信息化局的指導(dǎo)下,以“數(shù)據(jù)確權(quán)”為主題的2022數(shù)據(jù)資產(chǎn)(廈門)論壇在廈門成功舉辦。本次論壇以“數(shù)據(jù)確權(quán)”為主題,由廈門市互聯(lián)網(wǎng)域名應(yīng)用服務(wù)產(chǎn)業(yè)協(xié)會和構(gòu)信網(wǎng)(公信.中國)聯(lián)合主辦
近日,國內(nèi)知名數(shù)字化市場研究咨詢機(jī)構(gòu)愛分析正式發(fā)布《2022愛分析·信創(chuàng)廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業(yè)關(guān)注度、行業(yè)落地進(jìn)展等因素,遴選出在信創(chuàng)市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數(shù)博會執(zhí)委會主辦、數(shù)據(jù)觀(北京)傳媒科技有限公司承辦、貴陽大數(shù)據(jù)交易所協(xié)辦的第四期數(shù)博思享會“實踐先行觀公共數(shù)據(jù)價值與應(yīng)用”活動成功舉辦。
近日,由中國國際數(shù)字經(jīng)濟(jì)博覽會組委會主辦,中國電子技術(shù)標(biāo)準(zhǔn)化研究院、河北省工業(yè)和信息化廳承辦的“第一屆中國大數(shù)據(jù)大賽”(簡稱大數(shù)據(jù)大賽)正式啟動。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標(biāo)準(zhǔn)的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標(biāo)準(zhǔn)的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺