本站小編為你精心準備了航空維修中數據挖掘的應用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:應用數據挖掘的理論及技術,設計以航空維修為主數據的挖掘系統結構框架,確定數據挖掘的方法,提升航空維修效率和水平。
關鍵詞:數據挖掘;航空維修;數據庫;存儲
引言
數據挖掘是一門新興技術,面對的是大量的、隨機的、不完全的數據,需要從大量、不完全以及隨機的數據中提取人們肉眼無法識別的、隱含的數據信息,并且這些信息又是具有指導性和決策性的信息,對航空維修具有重要意義。數據挖掘技術實現了對數據庫的檢索、查詢、分析等功能,并且還能對航空維修需要的信息進行詳細分析,進一步指導實際問題的解決;能發現數據之間的關系、事件之間的關系以及規律,從而對航空維修事件進行有效分析。
1概念綜述
研究數據挖掘技術在航空維修中的應用之前,首先對此文涉及的理論進行簡要論述,掌握其基本的理論含義,有利于進一步分析研究。因此,首先進行理論概念綜述,更好的認識數據挖掘技術[1]。
1.1數據挖掘
隨著信息產業的發展,成千上萬個數據庫開始應用于各個行業、領域,數據涌現的趨勢不可改變,巨大挑戰是如何處理數據進行數據挖掘,將有用的數據盡快地提取和分析。為解決這一問題,數據挖掘技術應運而生。
1.2數據挖掘產生的背景
數據挖掘的屬性比較特殊,有許多學科交叉的屬性,它與統計學科、數據庫理論、知識工程以及數據可視化等技術密切相關。并且由于其數據能大范圍的使用而引發廣泛的關注,最主要的意義是能夠轉換數據,將其轉變為可用信息。數據挖掘重要的依靠是數據庫,數據庫已經得到了廣泛應用,而數據庫之所以被廣泛的接受,其中最重要的原因是數據庫技術與新型技術的集成使用。隨著數據庫儲存量的增大和數據庫的廣泛使用,與其相關的處理技術也會得到一定的發展,新的需求促使新技術的產生。后續的發現和研討,將為數據挖掘技術提供更多的機遇。
1.3數據挖掘的任務
數據挖掘的任務主要分為兩類。一類做預測任務,就是通過現有的數據及知識屬性,預測特定的屬性值。另一類是描述任務,此任務項目的工作通常是探查性的,并且通常需要進行后期的技術檢驗以及結果的解釋。在航空領域中,數據挖掘工作可以應用于復雜的航空維修工作,因為航空維修工作的細節比較瑣碎、工作內容復雜并且沒有明顯的規律可以遵循,人們通常都是根據經驗進行維修,除此之外很難發現相應的規律。此時,數據挖掘顯現出它的特點和優勢。在航空維修中,數據挖掘的主要任務就是從海量的數據中尋找和捕捉人類肉眼無法獲取的信息和數據,提高航空維修的準確度。因此,數據挖掘技術是航空維修必需的技術,從任務領域中,也可以看出進一步進行數據挖掘在航空維修中的應用研究有著十分重要的作用。
2航空維修數據挖掘系統框架及設計
2.1航空維修數據挖掘系統框架
由于航空維修工作的需要,根據實際情況建造航空維修數輫輵據挖掘系統框架。航空維修數據挖掘系統總體框架由3層結構組成。第一層結構為數據存儲,第二層是數據挖掘,第三層是圖形用戶界面。其中,第一層的數據來源是以往航空維修數據庫的數據資料,但對原始數據進行了集成及轉換處理,然后進入數據挖掘庫。數據庫系統主要存儲航空維修數據中某一類的維修數據,數據挖掘是該結構的核心內容。最后傳輸到用戶界面,輸出模式可以為可視化模式。
2.2航空維修數據挖掘過程
2.2.1問題定義由于研究的模型是基于航空維修數據建立的,屬于特定領域。因此,為了提出一個有意義并且能夠利用現有條件解決的問題,必須掌握一定的航空維修知識。然而,部分學者在研究數據挖掘時,并沒有意識到問題的描述,建立模型時只選擇未知的相關性制定變量[2]。這一步驟要求我們了解該領域知識,現實中這些問題都是通過該領域的專家和數據挖掘專家合作完成,因此一個成功的數據挖掘應用中,專家之間的合作不單單存在于初始階段,也處于整個數據挖掘過程之中。也就是需要明確的定義業務問題,感受領域的相關信息,理解知識,搞清楚用戶的需求。認清問題是數據挖掘最重要的一步,雖然結果不可預測,但是分析的問題要有依據的,不能盲目應用,否則必然失敗。
2.2.2數據準備第一步需要數據,進一步探索和尋找與航空維修有關的資料和數據信息,同時還需要挑選出適合于數據挖掘應用的信息和數據。此階段要確定數據收集方式,一般有兩種收集方式,一種由專家控制的收集,另一種是觀察法收集。觀察法收集時,數據是未知的,取樣分布也是未知的,但可以掌握數據搜集對理論分布的影響。其次要進行數據預處理,這是整個過程之中十分重要的工作。內容包括數據清理、數據集成、數據變化、數據規約。最后是數據轉換,根據具體問題建立模型,隨后確定相應的算法,將數據轉換為適用的形式,此階段的作用是為了適用模型算法,為后續工作提供便利。
2.2.3數據挖掘此階段的工作是明確合適的算法,剩余的工作都可以自動合成。
2.2.4結果分析數據挖掘中得到的系列信息及模型,是否能有效處理航空維修中的問題、挖掘到有價值、有意義的數據信息,都需要進行相關的歸納、研究、評估、分析工作。該階段要注意的問題是結果分析的方法通常根據數據挖掘操作進行處理,可視化技術為主要的技術手段。
2.2.5知識集成知識集成就是把收集到的通過分析得到的知識,整理歸納到業務信息系統中。
3航空維修數據挖掘模型的構建和實現
3.1定義數據源
通常所說的數據源發揮的作用是提供挖掘數據存儲地址,在整個過程中,數據源扮演著一個存儲器的角色,存儲大量分析數據。數據源表示到數據地址的一個鏈接,并且系列定義物理地址的連接字符串等。字符串包含服務器的名稱、安全性、超時值等信息。
3.2數據源視圖
需要生成的包括數據庫對象所使用的模型,包含N個基礎數據源中選定的數據,可以通過N個數據源的生成,包含單獨存在的關系、相應的計算等,客戶無法通過客戶端看到數據[3]。
3.3建立數據挖握結構
挖掘結構定義生成挖掘模型的數據域,數據挖掘結構不包括算法以及算法類型。同一個數據挖掘結構能創建多個數據挖掘模型,并且建立的挖掘模型都由一個數據源發展而成。
3.4創建數據挖掘模型
建設模型是整個過程的重心和重點,簡單的說,可以把數據挖掘模型看作是一個樹狀圖,用來存儲相關信息,數據挖掘模型的任務是存儲數據挖掘模型。創建模型時需要指定列的具體用法,輸入列是識別信息以及學習信息,輸出列則是分析和預測。
3.5生成和訓練模型
模型處理在此階段也可以說為模型訓練,在此模型的數據處理中,數據挖掘算法把處理集中的數據輸入沒有經過處理的模型,把訓練數據輸入后,數據不存到挖掘模型中,只進行分析,從中找到一些規則和模式,再根據模式和利用這規則填充模型。
3.6航空維修數據約簡及相似序列搜索
飛機啟動系統是飛機重要的組成部分,但是在日常工作中,經常因為飛行系統故障造成機器無法正常運行。因此要通過海量的維修數據和信息的分析和處理,使用數據挖掘技術解決飛行系統故障。要對故障進行分析,并且預測下一階段的趨勢,提前準備。其他的維修工作也可以參照,做法是利用粗糙集約簡的方法來解剖和分離出故障的關鍵性原因,然后分析故障數據,研究故障類型,進行時間序列相似性的處理搜索,并且對未來情況進行判斷,做出合理的預測。在處理過程中,要對故障模式以及失效率高數進行分析,該方法可以用到不同系統的飛機數據處理,建立起故障預測模型,對于航空維修決策的制定有著重要意義,可以減少維修成本,保障人員安全[4]。
4結語
目前,航空飛行安全面臨著許多新的特點、新的問題,提升飛行安全最重要的工作就是進行航空維修,航空維修離不開信息的分析及利用。因此,應該建立起一個一體化的系統研究模型,讓決策者以及工作人員能透過大數據準確把握復雜的業務信息,能對信息進行客觀分析,對航空維修保障工作有指導意義,從而提升航空安全管理水平和企業經濟效益。
參考文獻
[1]李衛斌.數據倉庫和數據挖掘在航空維修信息分析中應用研究[D].西安:西安電子科技大學,2010.
[2]馬雁春.基于數據挖掘的航空PHM中預測方法的研究[D].南京:南京航空航天大學,2010.
[3]魏鑫,郭建勝,代旻.OLAP和數據挖掘一體化的航空維修信息分析系統[J].微機發展,2003(Z1):47-49.
[4]史金紅,吳永明.數據倉庫中元數據的管理[J].電子工程師,2010(2):45-46.
作者:杜仲 單位:四川航空股份有限公司重慶分公司