本站小編為你精心準備了數據挖掘下計算環境的有效性分析參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:
云計算在當前的計算機技術發展中是熱度很高的話題,對于它的具體定義描述,到目前還沒有一個較為權威統一的標準。從它的結構構成來講,它是一種新興的共享基礎架構和方法,它的開展基礎是公開的標準和服務,圍繞互聯網為中心來提供相關服務,它在當前社會的大多數領域都有了廣泛的應用和體現,涉及到諸多的領域,需要在具體應用時進行綜合全面的把握,基于此,本文就在分析云計算開放環境和系統的關鍵研發基礎上,對云計算模式下的數據挖掘平臺原型建立進行了分析,闡述了平臺在實際應用中的擴展性和通用性,可以給相關領域的研究學者提供參考作用。
關鍵詞:
云計算;數據挖掘;應用;有效性
隨著社會發展的不斷進步,對于數據挖掘系統的建立和研發工作也取得了一定的成效,雖然國內外研究學者已經研發出了多種形式的數據挖掘系統,但是都或多或少的存在著一些缺陷和不足,像價格成本高、復雜繁瑣等。在新形勢下,隨著云計算模式的出現,它為大量數據的分析提供了一種快捷低價的應對方案,使數據挖掘平臺的建立有了可行性的趨勢,云計算從實質上來說,它是一種在計算機網絡結構下的超級計算模式,具有存儲能力強、計算能力可彈性明顯等的特點,可以有效的實現大量數據挖掘的工作。
1云計算的綜述
云計算的實質是一種計算服務,它是由計算資源和軟件以及其他各種信息資源共同構成的,它可以在網絡技術的支持下,脫離空間的限制,使用計算機或者是其他相關設備等來進行終端的訪問。云計算中的“云”是一個并行和分布式的系統,它的構成是由互相牽連的虛擬計算機實現的,可以實現被動的部署,最后作為一個或多個統一計算資源來體現,它的服務形式是基于服務運營商和用戶兩者之間進行協商的服務等級協議,并在這個協議下提供服務。此外,從另一層面來說,它還是一個彈性空間很大的資源執行環境,關系到諸多的利益方,并對其提供可以進行計量的服務,筆所講的云屬于是基礎平臺,可以以多種形式在不同的資源上進行執行。
2數據挖掘技術
當前形勢下數據挖掘技術已經得到了實際應用,主要涉及到關聯規則、分類、聚類以及預測和序列模式。
2.1關聯規則它分為兩個類型,一是Apriori算法;二是頻繁模式增長算法。那么任何一種模式的發現都是在同一個交易數據庫中的特定項目和其他項目之間的關系基礎上。
2.2分類它是一種利用數學方法來完成的技術,包括線性規劃、神經網絡等。在進行分類的過程中在軟件作用下可以掌握數據項分組的方法。
2.3聚類聚類技術也對類和類中的對象進行了闡述,在這種技術下,相同類型的數據可以規劃到一起,并有明確的標注,便于查找應用。
2.4預測預測主要用于發現自變量之間及其和因變量之間的關系,那么實際案例中,可以把銷售額作為自變量,利潤為因變量,進而預測到未來的銷售利潤。
2.5序列模式它是一種在事件發生的時間順序上相關的數據挖掘技術,發現的模式主要用于各種不同數據之間關系的深層化分析研究。例如2010年,KawuuW.Lin等所提出的多任務頻繁模式挖掘的策略。
3云計算環境下的數據挖掘優勢分析
在云計算環境下來進行數據的挖掘工作,這在當前形勢發展下是具有重要作用的,這與云計算環境的特性是由很大關系的,那么在云計算環境下來分析數據挖掘工作的優勢就可以從下三方面來闡述:(1)一般來說,數據挖掘是大量的,規模較大,需要從大量的數據中挖掘出理解的知識,這在互聯網數據不斷增長的形勢下,對于其的挖掘任務遠遠超出了搜索任務,有很大的復雜性,這就導致了在進行挖掘的過程中,要具備良好的開發環境和應用環境,那么這種挖掘要求就需要充分的應用到云計算環境。(2)在云計算環境下,可以順利的實現低成本分布式并行計算環境,基于此,就可以大大降低企業的數據處理成本,而且也擺脫了對高性能機器的依賴性。(3)在云計算環境下,進行數據開挖活動時十分的便利,對底層有屏蔽作用。而且在并行化條件下,云計算還可以在原有設備的利用基礎上進一步的提高對大規模數據的處理能力和速度,這樣不僅確保了容錯性,而且還起到了增加結點的作用。
4云計算環境下數據挖掘平臺的分析
4.1賬戶管理子系統賬戶管理的子系統一般是針對于管理用戶對與平臺相關的服務狀況,進行的一個賬戶收支明細的詳細記載,這個系統是平臺的基礎所在。從它的構成結構來看,它主要涉及到四個方面的功能,即支出的明細、收入的明細、賬戶余額以及歷史記錄。這四個方面是相互作用,相互聯系的,其中每一部分的作用是有區別的,支出明細主要是對用戶所使用的平臺中的付費服務和設施的明細賬目進行詳細合理的記錄;收入的明細主要涉及到它的兩項主要來源,一是用戶在這個系統下提供平臺的數據資源,二是以挖掘算法子系統提供給平臺的先進算法的報酬明細;而賬戶的余額主要是支出和收入之間的差額;最后的歷史記錄是指對用戶登錄平臺之后的所有操作行為進行記載,這樣可以給后期的撤銷操作提供條件。
4.2數據管理的子系統這個系統是針對于用戶的數據資源管理來說的,涉及到用戶自己的數據、采購的數據以及賣出的數據。這個子系統是在云計算的DaaS服務模式基礎上出現的,對于用戶來說,可以在這個系統的作用下,通過平臺來獲得自己所需要的數據資源,并且也可以把自己所擁有數據提供給平臺,需要注意的是,這個提供是有償性的。它的功能作用主要包含三個方面,我的數據、采購數據、賣出數據。這三個數據各有各自的優勢,我的數據,它較為清晰的表示了用戶存放在平臺上的全部數據名城;采購數據,它從平臺采購數據,然后在系統的作用下對這些數據所進行存放的數據庫名城按照列表的形式顯示給用戶;賣出數據,它是用戶所賣出的平臺數據的詳細記錄列表進行的顯示。
4.3挖掘算法管理子系統這種系統主要是針對于管理數據挖掘子系統所需要的算法和模型來說的,并且還可以協助完成數據挖掘子系統中的自定義功能的算法獲取作用。從這種系統的結構構成來說,它包含有系統算法、算法歷史記錄以及自定義算法等的基本功能。這個功能之間是相互聯系的作用,各有各自的特點,系統算法,它可以較為清晰明確的列出平臺所擁有的挖掘算法和相關的介紹等;對于算法記錄來說,它可以對用戶所使用的全部算法進行合理的記錄;自定義算法主要是指用戶根據自身需求所創作出的算法,也可以是經過改進創新的算法。
4.4服務器群服務群的存在主要是對用戶提供高效的平臺訪問、數據操作等的一系列服務。這種服務群所采用的虛擬技術以及具體的分布式技術會把平臺所擁有的本地或者是異地服務器資源進行高效的利用,進而提供高質量的服務。在這個平臺的作用下,它可以把服務器直接的租用給客戶,也可以是客戶把自己所具有的閑置服務器已虛擬化等的技術來租用給平臺,這樣可以確保資源的高效配置,通常情況下,這個服務器群涉及到數據庫服務器、數據挖掘服務器以及賬戶管理服務器等方面。
5總結
現代科學技術的發展,使得云計算得到了顯著的普及和應用。云計算自身具有獨特的優勢特點,它在大量數據挖掘方面具有明顯的優勢,而且隨著它的應用領域不斷延伸,人們在加大對其應用的同時,也給云計算環境下的數據開挖提供了很大的便利,而且國家也加大了這方面的政策支持力度,又為云計算環境下的數據開挖實效性注入新的活力。
參考文獻
[1]石杰.云計算環境下的數據挖掘應用[J].微型機與應用,2015,34(05):13-15.
[2]黃章樹,劉晴晴.基于云計算服務模式的數據挖掘應用平臺的構建[J].電信科學,2012,(01):53-57.
[3]鄧蕾蕾,于航.基于云計算的數據挖掘研究及展望[J].計算機與現代化,2012,(05):93-95.
[4]周晏,桑書娟.淺談基于云計算的數據挖掘技術[J].電腦知識與技術,2010,6(34):9681-9683.
[5]蔡興旺,段夢博.云計算及其在數據挖掘上的應用研究[J].電腦知識與技術,2010,6(22):6272-6274.
[6]肖云鵬,劉宴兵.云計算關鍵技術與應用展望[J].數字通信,2010,(03):29-31+36
作者:任海燕 單位:湖南勞動人事職業學院