在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網 資料文庫 數據挖掘技術范文

數據挖掘技術范文

本站小編為你精心準備了數據挖掘技術參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

數據挖掘技術

1數據挖掘概念

數據挖掘(DataMining,DM),是隨著數據庫和人工智能發展起來的新興的信息處理技術。數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,其主要特點是對數據庫中的大量數據進行抽取、轉換、分析和其他模型化處理,并從中提取輔助決策的關鍵性數據。它可幫助決策者分析歷史數據及當前數據,并從中發現隱藏的關系和模式,進而預測未來可能發生的行為。數據挖掘是一門涉及面很廣的交叉性新興學科,涉及到數據庫、人工智能、數理統計、可視化、并行計算等領域。

2數據挖掘技術

2.1關聯規則方法

關聯規則是一種簡單,實用的分析規則,描述了一個事物中某些屬性同時出現的規律和模式,是數據挖掘中最成熟的主要技術之一。大多數關聯規則挖掘算法能夠無遺漏發現隱藏在所挖掘數據中的所有關聯關系,所挖掘出的關聯規則量往往非常巨大,但是。并不是所有通過關聯得到的屬性之間的關系都有實際應用價值,對這些關聯規則進行有效的評價。篩選出用戶真正感興趣的。有意義的關聯規則尤為重要。

2.2分類和聚類方法

分類就是假定數據庫中的每個對象屬于一個預先給定的類。從而將數據庫中的數據分配到給定的類中。而聚類分析是根據所選樣本間關聯的標準將其劃分成幾個組,同組內的樣本具有較高的相似度,不同組的則相異。分類和聚類的區別在于分類事先知道類別數和各類的典型特征,而聚類則事先不知道。聚類方法適合于探討樣本間的內部關系,從而對樣本結構做出合理的評價。

2.3數據統計方法

使用這些方法一般首先建立一個數據模型或統計模型,然后根據這種模型提取有關的知識。傳統的統計學為數據挖掘提供了許多判別和回歸分析方法。貝葉斯推理、回歸分析、方差分析等技術是許多挖掘應用中有力的工具之一。

2.4神經網絡方法

神經元網絡,具有非線形映射特性、信息的分布存儲、并行處理和全局集體的作用、高度的自學習、自組織和自適應能力的種種優點。這些優點使得神經元網絡非常適合解決數據挖掘的問題。因此近年來越來越受到人們的關注。典型的神經網絡模型主要分3大類;用于分類、預測和模式識別的前饋式神經網絡模型;用于聯想記憶和優化計算的反饋式神經網絡模型;用于聚類的自組織映射方法。

2.5決策樹方法

決策樹學習是一種通過逼近離散值日標函數的方法,把實例從根結點排列到某個葉子結點來分類實例。葉子結點即為實例所屬的分類,利用信息論中的互信息(信息增益)尋找數據庫中具有最大信息量的字段。建立決策樹的一個結點,再根據字段的不同取值建立樹的分支;在每個分枝子集中,重復建立樹的下層結點和分支的過程,即可建立決策樹。

2.6粗糙集

粗糙集(RoughSet)能夠在缺少關于數據先驗知識的情況下,只以考察數據的分類能力為基礎,解決模糊或不確定數據的分析和處理問題。粗糙集用于從數據庫中發現分類規則的基本思想是將數據庫中的屬性分為條件屬性和結論屬性,對數據庫中的元組根據備個屬性不同的屬性值分成相應的子集,然后對條件屬性劃分的子集與結論屬性劃分的子集之間上下近似關系生成判定規則。粗糙集理論可以應用于數據挖掘中的分類、發現不準確數據或噪聲數據內在的結構聯系。3數據挖掘過程

按工作流程包括以下幾個步驟:

(1)數據準備:一般存儲在數據庫系統中的是長期積累的大量的數據,往往不適合利用這些進行處理,需要做數據準備工作,一般包括數據的選擇、凈化、推測、轉換、數據縮減,通過這些工作生成數據倉庫。數據準備是否做好將影響到數據挖掘的效率和準確度以及最終模式的有效性。

(2)數據挖掘:在前面步驟所獲得的數據集上進行數據挖掘,可以單獨利用也可以綜合利用各種數據挖掘方法對數據進行分析,根據數據挖掘的目的。選定數據挖掘算法,選擇某個特定數據挖掘算法(如匯總、分類、回歸、聚類等)用于搜索數據中的模式。

(3)結果的分析和同化;上面得到的模式模型,有可能是沒有實際意義或沒有使用價值的。因此需要評估,確定哪些是有效的、有用的模式。評估可以根據用戶多年的經驗,有些模式也可以直接用數據來檢驗其準確性。對數據挖掘出的結果進行解釋和評價,轉換成為能夠最終被用戶理解的知識。其具體的挖掘過程如圖1:

4數據挖掘的應用

4.1在金融領域中的應用

多數銀行和金融機構都提供豐富多樣的儲蓄、信用、投資、保險等服務。他們產生的金融數據通常比較完整、可靠,但是數據量是非常巨大的,數據挖掘技術可以將這些龐雜的信息充分利用:如采用多維數據分析來分析這些數據的一般特性,觀察金融市場的變化趨勢;使用數據可視化、分類、聚類分析、序列模式分析等工具偵破洗黑錢和其他金融犯罪行為;對于預防信用卡欺詐行為。可以利用數據挖掘對客戶信譽進行分析。

4.2在零售業中的應用

在零售業中,數據挖掘的運用是比較成功的。由于MIS系統在商業的普遍使用,特別是條碼技術的使用。零售業積累了大量的銷售數據,如顧客購買史記錄、貨物進出、消費與服務記錄等等。零售數據挖掘有助于劃分顧客群體,使用分類技術和聚類技術。可以更精確地挑選出潛在的顧客;識別顧客購買行為,發現顧客購買模式和趨勢,進行關聯分析,以便更好地進行貨架擺設;同時可以為經營管理人員提供正確的決策手段,這樣對促進銷售及提高競爭力是大有幫助

4.3在科學研究中應用

計算科學是現代科學發展的一個重要標志。計算科學工作者主要和數據打交道,每天要分析大量的實驗或觀測數據。隨著先進的科學數據收集工具的使用,如觀測衛量、遙感器、DNA分子技術等,數據量更是龐大,因此必須摒棄傳統的數據分析工具,采用有強大的智能型自動數據分析工具。

主站蜘蛛池模板: 三级五月天 | 婷婷激情五月综合 | 亚洲精品综合网 | 欧美日韩影院 | 久久免费视频精品 | 最新国产一区二区精品久久 | 精品视频一区二区观看 | 永久免费视频 | 欧美日韩无 | 黑人一区二区 | 羞羞动漫网站入口 | 亚洲第一区精品观看 | 亚洲阿v天堂2021在线观看 | 六月丁香婷婷色狠狠久久 | 久久久久久亚洲精品不卡 | 九九在线 | 亚洲国产成人99精品激情在线 | 午夜视频免费在线 | 五月网| 久久免费公开视频 | 性欧美大战久久久久久久野外黑人 | 综合色在线 | 丁香花网| 国产区精品福利在线观看精品 | 激情综合五月天 | 亚洲人成影院午夜网站 | 欧美亚洲自拍偷拍 | 亚州精品永久观看视频 | 亚洲第6页 | 亚洲欧美视频在线观看 | 中国国产成人精品久久 | 亚洲国产成人久久笫一页 | 免费高清a级毛片在线播放 美女隐私羞羞视频在线观看 | 国产精品一区二区久久 | 国产一区亚洲欧美成人 | 最近免费中文完整在线观看 | 午夜精品福利在线 | 久久精品视频国产 | 久久高清一区二区三区 | 欧美视频在线观看一区二区 | 九色精品高清在线播放 |