本站小編為你精心準備了油井技術數據庫的建構與運用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
引言
隨著石油工業的發展和信息科學的進步,鉆井信息的應用越來越顯示出它的重要性。鉆井數據資源的管理和應用是否有效,直接影響到鉆井的效果和效益。隨著鉆井工藝技術的復雜多樣、鉆井數量的急劇增加、以及先進測量儀器和手段的引入,鉆井數據資源海量增加,加強對這些數據資源的存儲、管理和應用,提高鉆井信息化建設的水平已成為一項緊迫而又艱巨的任務。數據倉庫是一種信息系統的數據存儲理論,它強調利用某些特殊數據存儲方式,讓所包含的數據,特別有利于分析處理,以產生有價值的信息并依此作決策。
1數據庫理論
1.1數據倉庫
數據倉庫對多個分布式的數據庫提供統一管理,是支持管理決策過程、面向主題的、集成的、相對穩定的、隨時間變化的數據集合。它從多個傳統數據庫中獲取原始數據,先按決策的主題形成當前基礎數據,再按綜合決策要求形成綜合數據,通過數據倉庫訪問工具向用戶提供統一、集成的信息環境,為決策者提供完整、及時而準確的決策信息。數據倉庫的四個主要特性:
(1)面向主題(Subject-Oriented)
有別于一般OLTP(聯機事務處理,on-linetransactionprocessing)系統,數據倉庫的數據模型設計,著重將數據按其意義歸類至相同的主題區(subjectarea),因此稱為主題導向。
(2)集成性(Integrated)
數據來自企業各OLTP系統,在數據倉庫中是集成且一致的。
(3)隨時間變化(Time-Variant)
數據的變動,在數據倉庫中是能夠被記錄以及追蹤變化的,能反映出隨著時間變化的數據軌跡。
(4)相對穩定性(Nonvolatile)
數據一旦確認寫入后是不會被取代或刪除的,即使數據是錯誤的亦同。(i.e.錯誤的后續修正,便可因上述時間差異性的特性而被追蹤)。
1.2數據挖掘(DataMining)
數據挖掘是從海量數據中,提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識的過程。數據挖掘的數據有多種來源,包括數據倉庫、數據庫或其他數據源。所有的數據都需要再次進行選擇,具體的選擇方式與任務相關。挖掘的結果需要進行評價才能最終成為有用的信息,按照評價結果的不同,數據可能需要反饋到不同的階段,重新進行分析計算。
數據挖掘分為描述性和預測性兩類。描述性數據挖掘提供數據的一般規律;預測性數據挖掘產生關于數據的預測。數據倉庫與數據挖掘的關系如圖1所示。
2應用現狀
2.1國外應用現狀
國外鉆井服務商早在20世紀80年代開始就將信息技術應用到生產指揮中,取得了巨大經濟效益。到90年代,開始研究建立集鉆井數據采集、數據信息傳輸、鉆井數據庫、鉆井工程設計、鉆井施工監測和鉆井生產指揮為一體的鉆井信息系統,作用是鉆井參數自動采集,生產信息及時送入現場計算機,通過通訊網絡實時傳送到總部信息中心,經過專家會診做出決策,反饋到鉆井現場進行實時監督,指揮鉆井生產。下面以Schlumberger公司的產品為例,介紹一下國外的應用現狀。
生產數據監測和數據分析軟件,包含了基于數據挖掘的生產優化軟件,以及桌面數據挖掘和數據驅動模型。
ProSource是斯倫貝謝新的信息管理應用軟件,提供信息管理工作流程,具有利用一個易于使用的單一控制臺從多個數據倉庫瀏覽、創建、編輯和刪除數據的能力,它能夠在ArcSDE中創建并管理空間索引,用于對多個內容來源的信息進行直觀聚合和管理。
DrillDB可以簡化數據挖掘任務,支持決策過程并能訪問正在進行的鉆井作業的數字信息。Drill-DB支持SISDrillingOffice以及其它流行的鉆井信息采集系統,可以集成多個鉆井信息系統,使建立公司統一的鉆井信息解決方案成為現實。
2.2國內應用現狀
目前,國內還沒有完整的或在用數據倉庫,也還沒有成型的數據挖掘軟件,因此從期刊發表的情況來說明。表1數據來自《中國學術文獻網絡出版總庫》關鍵詞查詢。
3面向鉆井工程的數據倉庫應用
3.1主題設計
數據倉庫是面向主題的,因此數據倉庫設計的第一步就是確定其主題。主題是在較高層次上將數據歸類的標準,通常反映決策者最關心的問題。根據鉆井決策的實際需求,主題設計如表2所示。
3.3鉆井數據ETL
數據抽取Extraction:建立鉆井數據規則化過濾器,去除潛在的不符合實際的錯誤數據。通過審計規則來確保數據的有效性。
①數據轉換Transformation
通過建立鉆井數據間的映射和轉換關系,使源數據能夠適應新的邏輯模型,統一轉換后的數據名稱和定義。
②數據加載Loading實時加載、快速加載。
3.4鉆井數據統計分析
數據統計分析方法如表4所示。
3.5鉆井數據多維分析處理
維是將一類數據組織到具有明細數據級別的分層結構中的字段。包含OLAP數據的數據結構,按維和數據字段進行組織,則稱為多維數據集。多維數據集是一個數據集合,通常從數據倉庫的子集構造,并組織和匯總成一個由一組維度和度量值定義的多維結構。例如鉆頭噴嘴數據結構,它可以逐級提供越來越詳細的數據,形成井、井眼、鉆頭、噴嘴四個級別,既可以高層匯總又可以關注明細。多維數據查詢流程如圖2所示。
在對多維數據的統計分析中,傳統的SQL查詢語言顯露了其局限性。一般的SQL語句查詢方式,雖然也可以通過GroupBy來進行分組統計,但如果要對多維數據進行處理,形成一個既有小計又用總采用數據透視技術無疑是非常恰當的解決方案。
3.6鉆井數據挖掘模型
①神經網絡(Hopfield網絡、Kohonen網絡、BP網絡、ART1網絡、RBF網絡、貝葉斯網絡)模擬人腦神經元結構,建立三大神經網絡模型即自饋式、反饋式、自組織。神經網絡的知識體現在網絡連接的權值上,屬分布式矩陣結構。通過神經網絡的逐步計算來實現KDD的價值。
②遺傳算法
模擬生物進化過程,由三個“算子”組成,選擇:從舊種群父代選出生命力強的個體,產生新種群后代。交叉:選擇兩個不同個體(如染色體)的一部分(如基因)交換,形成新個體。變異:對個體的某些基因進行變化(如1變0,0變1)。遺傳算法的根本是產生優良的后代。應用于數據挖掘中,是在龐大的數據庫中對知識的發現。目前已取得了顯著的成效。
③可視化法
把數據庫中的數據轉化為可視的各種圖形,對揭示龐大數據的狀況、規律性等作用極大,使用戶對數據“看”得更清晰、直觀。大大拓寬了圖表、文字的功能。
④決策樹
將數據庫中可能具有最大信息量的“字段”作為決策樹的身軀,然后根據不同的“字段”建成樹的分支,由此可建立決策樹。決策樹方法中尤以方法應用效果良好。
⑤關聯規則:經典關聯規則、序列模式、單維關聯規則、多維關聯規則。
⑥模糊聚類
根據模糊是客觀存在的,形成了一整套模糊理論。數據挖掘就能利用此理論對實際問題以模糊研討,直至達到模糊決策。
⑦粗糙集
⑧支持向量機
⑨孤立點分析
根據“數據挖掘”的上述方法可以對應得到數據挖掘的工具如神經網絡工具、可視化工具、“模糊發現”工具、決策樹工具等。實踐證明,這些工具適用于大規模數據挖掘系統和開發環境,也適用于最終用戶和開發人員的數據挖掘系統。面向鉆井工程的數據倉庫與數據挖掘應用過程如圖3所示。
4結束語
因此,面向鉆井工程技術的數據倉庫與數據挖掘系統對實現遠程、智能化的現場作業過程監控和信息化網絡辦公;提高鉆井工程技術人員的工作效率和技術決策水平;最終提高鉆井作業質量和經濟效益、提高企業的工程技術管理水平,增強企業在國內外市場中的生存能力和競爭能力等,都具有十分重要的現實意義和應用價值。