摘要:隨著工業4.0和物聯網時代的來臨,基于經驗和手冊的設備維修方式已不能滿足復雜設備維修的要求;而傳統的設備診斷系統往往只注重從物理傳感器采集數據,缺少引入人的經驗,難以擁有自學習能力;以ZB45煙草包裝機為例,提出一種具有自學習能力的人機共融新型故障診斷系統;系統采用貝葉斯網絡,實現對傳感器數據的自動推理;通過自然語言處理模塊與用戶交互,學習用戶的維修經驗,并用來改進診斷效果;提出了基于凸優化的標簽選擇方法,根據觀察到的現象推薦合適的標簽,以快速確定最可能的故障,實現快速找到報警號碼對應的故障源;生產現場的實測數據表明,所實現的系統可以有效降低萬箱故障次數,有效提高故障診斷精度,降低故障排查時間。
關鍵詞:人機共融;貝葉斯網絡;故障診斷;凸優化;標簽選擇
0引言
常見的設備故障報警方法沒有故障診斷的功能:當傳感器測到某物理量的值出現過大偏差時,系統會顯示報警編號。用戶必須對照手冊,自行診斷導致故障的原因。隨著工業4.0和物聯網時代的來臨,這種基于經驗和手冊的設備維修方式對于簡單的設備有效,但不能滿足對復雜設備的要求。
本文以煙草行業的ZB45型卷包機為研究對象,基于故障樹和貝葉斯推理網絡,旨在提出一種具有不斷自我學習的人機共融的新型故障診斷系統。本文研究方法的關鍵思想是要結合人的因素,進行人機共融(HumanMachineIntegration)[1]的故障診斷,并在3方面嘗試創新的技術方案。
首先,采用自然語言處理的方法,通過歷史工單和維修手冊,自動生成故障診斷用的貝葉斯網絡和故障搜索用的知識圖譜。對數千種故障的復雜系統而言,這樣不但可以大大節省人力,也可以減少人為錯誤的可能,并且可以快速處理新工單,融入知識庫。其次,基于貝葉斯網絡,實現自學習功能。當工人確定故障源后,可以點擊“故障確認”按鈕,通知算法正確的結果。
這樣,算法可以不斷改進診斷精度。最后,引入“人本傳感器”的新概念,讓工人點擊界面上的標簽,輸入工人所觀察到的現象。有效克服傳感器數量遠遠小于故障數量的問題。讓用戶做為傳感器,幫助算法盡量唯一地確定故障源,加速排錯過程。本文提出的人機共融的診斷系統,不但可以在人為工單數據中挖掘信息,還在日常操作中學習工人經驗,同時借助人本傳感器提高診斷效率。通過人機緊密合作,實現了在工業4.0場景下,新型故障診斷系統的范式。
1ZB45型包裝機故障診斷研究現狀
1.1ZB45型包裝機及其故障診斷的必要性
煙草行業的ZB45型包裝機是用于煙支卷接和包裝的設備,具有結構復雜、設備貴重、小故障停機次數多、連鎖質量波動大、次生浪費較多的特點。其內部有約10000個零部件,約2000種故障,約1500個OPC故障報警代碼(OPC代碼)。故障和OPC代碼之間是多對多的對應關系。有約1300種可導致停機的故障沒有對應的OPC故障報警代碼。
ZB45包裝機在高速生產運行過程中,包裝機極易因各類原因產生短時高頻停機,根據對生產環境的統計,單班停機次數平均約為45次,會造成嚴重的生產效率損失。同時,包裝機的頻繁啟停會使多個關鍵工序存在加熱、升溫等不斷調整的狀態,使包裝工藝的質量穩定性變差,同時包裝機在每次重啟后設備都需自動提出固定數量的煙支,會造成原、輔料浪費,產生巨大的成本損失。
1.2傳統故障診斷方法存在的問題
包裝機產生故障的成因很多,往往會在任意時刻、任意部位產生不同類型的故障。以ZB45包裝機的鋁箔紙系統為例,可能產生的故障就有數十種,僅其中“鋁箔紙撕不開”這一種故障,又會有多種因素與其相關。由此可見,對包裝機的準確故障診斷難度極大。
在現階段,包裝機故障主要依靠維修人員的經驗,對故障進行經驗性的診斷,主要技術手段是以手工查找紙版手冊和維修記錄為主,故障診斷存在耗時長、具有主觀性的問題,極大依賴于人員經驗,技術傳承性較差,往往會導致大量故障停機時間。特別是對于一個OPC代碼對應多個可能故障的情況。維修手冊只記錄各種故障可以導致的現象,并且手冊有幾千頁之多。不但查找困難,而且很多故障診斷的經驗沒有書面記錄。
有經驗的工人要根據故障代碼,結合自己的觀察,及歷史故障頻次來判斷最有可能的故障。而這種經驗常常沒有書面記錄,動輒需要五年、十年的經驗積累。隨著制造業信息化進程的推進,卷包機數據采集系統實現了從ZB45包裝機提取大量實時運行數據,包括運行參數、故障統計、臺時產量、物料消耗等信息,同時也建立了基于EAM系統相關的設備故障維修記錄,但是兩個系統獨立運行,缺乏有效的關聯策略來實現數據和信息的融合,需要對獲取的數據進行更深層次的處理和分析,從各系統數據進行關聯挖掘,得出有效、可固化傳承的故障診斷及設備維護類知識,并應用到生產過程中。
1.3相關技術背景
1.3.1常見的故障診斷方法
傳統的復雜設備故障的診斷主要包括如下方法:
1)故障樹:通過故障樹的方法[2][3]建立從傳感器可測的故障現象到故障的自動推理引擎。這種方法也常被稱做專家系統。不同的故障可以通過邏輯與、或、非的方式關聯,共同決定下一級故障發生與否。故障樹方法可以用系統可靠性分析,及單一故障情況下的故障診斷。
2)貝葉斯網絡:另一類方法是通過如貝葉斯網絡[2][4]的統計學的方法,對多個故障及其故障概率進行自動推理。這類方法需要用戶構建由故障和現象為節點的有向無環圖(DAG,DirectedAcyclicGraph),并輸入條件概率表(CPT,conditionalprobabilitytable)和先驗概率以表征不同節點之間的連接關系。如果有足夠歷史數據,條件概率表和先驗概率都可以從數據中得出。這種方法比故障樹的表現力更強。故障樹可以轉換為貝葉斯網絡的形式[2],但反之則不一定成立。
貝葉斯網絡的方法可用于大型生產制造系統[4]、樓宇空調[5]的故障診斷及故障冗余控制系統[6]。基本的樸素貝葉斯網絡假定故障之間獨立出現,即故障出現的概率不會相互影響,同時,故障出現的概率不隨時間而變化。動態貝葉斯網絡擴展了樸素貝葉斯網絡的時間域上的表現力,從而允許出現時變的概率分布。
3)觀測器:如果要通過觀測模擬量來分析故障情況,可以采用觀測器的方法,并通過在線傳感器數據估計系統內部狀態。例如:卡爾曼濾波器(Kalmanfilter)或粒子群濾波器(particlefilter)是常見的基于模型的系統狀態觀測器。對于只有模型結構,但不了解參數的系統,還可以采用在線模式識別的方法,例如在線ARIMA或N4SID的算法等[7]。
4)數字孿生:近年來,數字孿生(digitaltwin)[8][9][10]的概念得到研究者和工業界的重視,并從3D模型延展到在線監測應用。對于大型的工業控制系統,如石化企業的分布控制系統(DCS,distributedcontrolsystem)[10]及暖通空調系統[11],想要手動建立系統的動力學模型是非常困難的。對這類應用,通過組合子系統的數字孿生而構建全系統的動力學模型是個更好的方案。文獻[12]提出了采用在線數字孿生的方法,對暖通空調設備進行在線故障監督和診斷。
1.3.2自然語言處理技術和知識圖譜
近年來,以深度學習為基礎的自然語言處理得到了廣泛的工業應用。對設備故障診斷而言,設備維修工單記錄和維修手冊是故障診斷系統建模和分析的重要數據來源,其描述形式基本上是自然語言。然而,直接通過閱讀自然語言,手工建模的方法成本高,時間長。利用自然語言處理技術是提高故障診斷系統建模的有效手段。
早期的應用主要以針對關鍵詞的統計為主[13]。美國海軍采用了自然語言處理的方法對V-22魚鷹飛機的維護資料進行了系統的分析整理[14]。通過基于Python的NLTK自然語言處理工具包[15]進行分詞,該方法識別了維修記錄中的自然語言記號,并對核心詞進行了統計學分析。在此基礎上,可以對歷史上相似的故障維護工單進行聚類,并通過統計方法分析改進維修的手段。
針對煙草機械維護的自然語言處理應用還很少見。文獻[16]討論了煙草機械維護數據庫的自然語言處理方法,采用常規的TF-IDF及TextRank模型進行數據建模,然后通過權重矩陣比較實際故障記錄與故障數據庫中已有故障記錄的相似程度,由此進行對同類故障記錄的模糊查找,其本身并不直接用于故障診斷。當涉及到具體行業知識時,這種模糊查找方法效果不太理想。知識圖譜[17]是一種描述實體之間語義關系的有向圖結構。傳統的知識圖譜一般存于圖數據庫中,如Neo4J,Dgraph等。
近年來,隨著人工智能和深度學習的興起,出現了神經網絡和知識圖譜相結合的流派。例如,DeepWalk[18]可以通過深度學習來學習網絡的結構。通過深度圖卷積網絡(DGCN,deepgraph convolutionnetwork)學習軸承的振動信號,文獻[19]提出了一種可以進行故障原因診斷的學習系統。開源軟件DeepGraphLibrary(DGL)[20],可以把多種網絡結構的數據向量化,并嵌入到神經網絡中。利用已有的知識圖譜構建技術,我們通過維護手冊和工單數據構建知識圖譜,并由此生成貝葉斯網絡模型,用于故障診斷。
2人機共融的故障診斷系統
2.1人機共融的新型交互方式
人機共融被認為是工業4.0時代的重要場景之一[1]。關于工業機器人的人機共融[21],及離散生產線的人機共融[22]已經有一些成功經驗。但對于故障診斷系統的人機共融方式還未見相關報道。我們以ZB45卷包機為實驗對象,提出一種故障診斷系統,旨在提高故障診斷效率、降低故障停機時間,并對故障的原因、部位與維護策略進行全面分析,進而實現增效、穩質和降本的效果。其核心思想是通過人機共融的有機合作引導工人監督系統不斷學習,解決現有故障建模中缺乏文字描述經驗的難點。
本系統人機共融的特點主要體現在:1)建立基于貝葉斯網絡的可擴展故障診斷架構,可以利用OPC代碼、用戶標簽選擇、傳感器信號等多模態信息,進行自動故障診斷推理;2)通過人機共融的有機合作,向用戶提供標簽,并接收反饋;學習用戶潛在經驗,不斷提高診斷精度;3)通過自然語言處理的方法,分析歷史工單數據,自動構建推理用的貝葉斯網絡,減少手工建模時間。其中,機械設備的傳感器采集信號處理后產生各類報警信號,并利用相關事件檢測算法,觸發事件后傳送給貝葉斯網絡。事件監測算法可以看作與內置的OPC代碼報警相同,都是觸發事件的布爾量。
而維修人員產生歷史工單,經過自然語言處理模塊進行分析,用于生成故障知識圖譜,并用于初始化貝葉斯網絡。工單的信息經過自然語言處理,生成初選標簽,經凸優化過濾后,產生足夠的精選標簽,供維修人員選擇。標簽中一般包括維修人員可以看到或聽到的各種現象。作為對傳感器信號的有效補充,標簽可以看成另一種“人工”的傳感器。它們也可以觸發貝葉斯網絡的事件。
2.2故障樹建模
目前在ZB45包裝機應用中積累了維修工人師傅的大量維修記錄,但是記錄存在標準不一、記錄不全、故障重復等問題。在維修工人師傅經驗的幫助下,從數十萬的維修數據中,清洗整理出1751條完整的故障維修記錄,并將故障現象和機器位置相關聯,形成故障樹,同時對每個故障所對應的故障編碼進行對應,通過這種關聯,實現對故障的推送。
3診斷系統的生產成效
通過對比系統部署前后月份的萬箱故障數據。從中可以看到,系統部署后一個月的故障次數為46次,萬箱故障次數為46/69296.4*10000=6.63,而部署前一個月的故障次數是64,萬箱故障次數為64/66232.2*10000=9.64,同比萬箱故障次數下降31.2%。
4結束語
面向復雜設備的故障診斷問題,本文以ZB45包裝機故障診斷為考察目標,提出了一種實現人機共融的故障診斷系統。系統整合了自然語言處理技術、知識圖譜技術和貝葉斯網絡理論,主要創新點如下:
1)通過對歷史工單的自然語言處理,自動生成知識圖譜和貝葉斯網絡;2)針對故障代碼(OPC代碼)少于故障源的問題,鼓勵用戶通過選擇標簽的方式來提高診斷精度。同時,利用用戶反饋,提高貝葉斯網絡診斷精度;3)結合自然語言處理和凸優化的方法,提供少而精的標簽。通過對歷史工單的自然語言處理,進行標簽初選。隨后采用凸優化算法選擇恰好足夠的標簽給用戶選擇。通過系統實際運行測試,證明該系統能有效降低設備的萬箱故障次數,有效減少故障維修時間,提高了設備故障診斷效率。
參考文獻:
[1]於志文,郭斌.人機共融智能[J].中國計算機學會通訊,2017,13(12):64-67.
[2]王廣彥,馬志軍,胡起偉.基于貝葉斯網絡的故障樹分析[J].系統工程理論與實踐,2004,24(6):78-83.
[3]RUIJTERSE,STOELINGAM.Faulttreeanalysis:asurveyofthestate-of-the-artinmodeling,analysisandtools[J].ComputerScienceReview,2015,15:29-62.
[4]CARBERYCM,WOODSR,MARSHALLAH.ABayesiannetworkbasedlearningsystemformodelingfaultsinlarge-scalemanufacturing[C]//2018IEEEInternationalConferenceonIndustrialTechnology(ICIT),2018:1357-1362.
[5]XIAOF,ZHAOY,WENJ,etal.BayesiannetworkbasedFDDstrategyforvariableairvolumeterminals[J].Automationinconstruction,2014,41:106-118.
[6]VILLEZK,VENKATASUBRAMANIANV,NARASIMHANS.Bayesianinferenceforfault-tolerantcontrol[C]//InternationalSymposiumonResilientControlSystems,IEEE,2009:51-53.
作者:張明琰1宋震2方世杰2
相關閱讀