在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網 資料文庫 研討數據挖掘在軟件工程的運用范文

研討數據挖掘在軟件工程的運用范文

本站小編為你精心準備了研討數據挖掘在軟件工程的運用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

研討數據挖掘在軟件工程的運用

1數據挖掘技術在軟件工程中的應概述

1.1挖掘執行記錄

執行記錄的挖掘,主要對程序執行路徑進行分析,進而找出程序代碼中所具有的關聯關系。其應用的本質是通過跟蹤相應的執行路徑,然后通過逆向建模實現其目的,其作用在于維護、驗證和了解程序。執行記錄挖掘的應用過程,通常是先初步插裝被分析的系統,并對由挖掘軟件對應用編程接口,或是基本的系統和模塊調用的狀態變量進行記錄,最后約簡、聚類和過濾目標跟蹤所得的信息,最終使其成為能夠表征系統功能的模型。

1.2檢測漏洞

軟件漏洞檢測的目的,主要在于及時的找出軟件開發中存在的漏洞或錯誤,確保能夠得到盡快的修復和完善,確保軟件的質量及可靠性。一般數據挖掘技術應用于軟件漏洞的檢測,首先需確定對應的軟件測試項目,并基于用戶的需求,規劃出軟件測試的具體內容,進而決定該用什么樣的方式進行測試,從而制定出對策和計劃;然后收集漏洞庫數據,實施數據的清理和轉換。對所需采集的數據和信息進行分析,選取和軟件缺陷相關聯的數據集,將多余的、不需要的數據清理后,再對丟失的項目采取補充措施,轉換數據屬性為數值表示。其次選取恰當的數據模型,進行驗證和訓練。需結合項目的實際需求,對其挖掘方式進行選擇,促使其成為測試集、訓練機集,進而比較所有的結果,找出最合理和符合需求的方式。同時還需應用上面所提的方法,描述、定位和分類軟件的漏洞,并將漏洞庫數據的收集應用到軟件的數據庫,并將未知漏洞找出,然后結合相應規則描述其漏洞,進一步的分類;并在最后把挖掘出的數據知識用到軟件測試的項目中。

1.3挖掘開源軟件

開源軟件挖掘項目的開發環境具有開放性、全局性和動態性,因此,對于該類軟件的開發管理,需和其他的傳統軟件相區別。通常情況下,比較成熟的開源軟件項目,對于參與其中的錯誤報告、開發者活動和軟件的應用具有較為完整的記錄。參與開發的人員,能夠組成典型的社會網絡,但因為其具有的開放性,致使參與的人員處于不斷的變化當中。同時對于開源軟件中具有的動態性特征的挖掘,可實現開源項目的優質管理。例如,由牛津大學所開發的系統Sima,便可對開源項目的使用者和跟蹤者實施系統性的跟蹤管理。

1.4挖掘版本控制的信息

版本控制系統的應用,主要是為保證項目參與者共同編輯的同一檔案的統一性,以便全局性的更新。當前的軟件工程開發應用中,大部分均會應用版本控制系統實施軟件開發工作的管理和保護。并且挖掘版本信息控制的應用方式,主要是對變更歷史信息的挖掘,其應用可找出不同模塊,以及子系統之間所存在的相互依存的關系,并深化對程序中未來變化和引入方式可能存在漏洞的檢測。這類挖掘技術的應用,能夠有效的將系統后期維護成本降低,避免因為后期變更所產生的漏洞,進而具有對后期的軟件維護、警示作用。

2數據挖掘技術在軟件工程中的應用方法

2.1關聯方法

挖掘技術應用與軟件工程中的關聯方法,其規則在于發現大量數據中所具有的相關聯系及有趣關聯。并且關聯規則具有兩個重要特征,其一為支持度,表示為P(A∪B),表明A、B兩個子集在事物集中出現的概率是相同的;其二為置信度,可表示為P(B|A),說明A在事物集中所具有的概率,同樣B也會出現。

2.2分類方法

分類方式的應用,主要是對離散值和分類標號進行操作,一般情況下,首先需建立起相應的模型,對其概念集和數據類集進行描述,之后應用模型完成分類。常用的分類方法是判定樹法,主要包括神經網絡分類法、貝葉斯法、K-最臨近法和支持向量機法等。其中判定樹法的應用基礎為貪心算法,應用自上至下遞歸的構造方式,對其樹、葉子節點等實施相應的類別標號,并確定最終的分類結果。另外常用的判定樹法為支持向量機和K-最臨近分類法等。K-最臨近分類法應用的基本理為:若某個樣本位于特征空間中時,應有K個最相似樣本的大多數,稱為一個類別,并且其樣本也歸屬于這一類別。這類計算方法對于容量較大的自動分類較為適用,若是用以樣本容量比較的分類,則很容易導致錯誤產生。

2.3聚類方法

聚類方式的應用,顧名思義,便是把對象數據分為多個簇或類,并且保證統一類或簇中的數據的相似度較高,同時不同類或簇中的對象具有明顯的差別。常用的聚類方法主要有劃分方法、基于密度的方法、基于模型的方法、基于網格的方法和層次方法。聚類分析的輸入為一組有序對(X,d)或(X,s),其中X所代表的是一組樣本,d和s表示的是相異度或相似度。聚類系統的輸出為某個分區C={C1,C2,…,Ck},Ci為X子集,也被稱為類。本文就劃分聚類法為例進行分析,其基本的應用理論為根據所給出的n個對象數據集加以應用。其中劃分聚類方法的應用,便為應用構造出k的劃分,并且每一個劃分區域均代表某一個簇,并且需保證k≤n。k個劃分應滿足相關的條件。首先應讓每個簇中均含一個對象;其次,每個對象有且僅屬于某個簇。而給定k的算法,應在結合劃分方法,通過迭代的改變來劃分,確保每一次的迭代后,均優于未迭代之前,劃分最好的標準為統一簇中的對象最為接近,不同簇中的對象差異最明顯。

3結束語

由于軟件工程的復雜化發展,促使軟件的開發更加需要能夠量化且測量精準的工具,數據挖掘的應用可較大的滿足軟件開發者對于這一方面的需求。特別在近年來,數據挖掘技術應用于軟件工程,具有較好的經濟效益,并且其驗證測試,以及開發過程均能為應用者提供可靠的決策信息。因此,應推進數據挖掘技術在軟件工程中的應用,促進其更深層次的發展和應用。

作者:雷蕾單位:南陽理工學院

主站蜘蛛池模板: 欧美亚洲日本视频 | 亚洲精品午夜国产va久久 | 日韩中出 | 自拍偷拍第1页 | 最新电影在线免费完整观看 | 亚洲 欧美 激情 另类 自拍 | 亚洲人成人网毛片在线播放 | 亚洲精品乱码久久久久久v 亚洲国内精品 | 毛片免费在线视频 | 一级电影院 | 亚洲国产夜色在线观看 | 韩国一区二区三区 | 隣の若妻さん波多野结衣 | 国产区欧美 | 亚洲福利视频网站 | 最新国产精品视频 | 五月激情在线 | 亚洲欧美自拍视频 | 国产精品久久久久久久久久98 | 在线观看羞羞视频 | 亚洲成a人片777777久久 | 自拍偷拍亚洲区 | 伊人婷婷涩六月丁香七月 | 黄色污网站在线观看 | 中文字幕在线不卡 | 国产网站免费在线观看 | 伊人国产精品 | 亚洲1234区乱码 | 亚洲精品高清中文字幕完整版 | 在线国产不卡 | 激情五月五月婷婷 | 免费啪视频一区二区三区 | 久久国产精品免费一区二区三区 | 日韩欧美亚洲视频 | 亚洲伦理久久 | 久久国产精品999 | 亚州无吗 | 西西午夜影院 | 亚洲欧美久久精品一区 | 一级 在线播放 | 亚洲人成电影网站国产精品 |