在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網(wǎng) 資料文庫 數(shù)據(jù)挖掘技術的軟件工程論文范文

數(shù)據(jù)挖掘技術的軟件工程論文范文

本站小編為你精心準備了數(shù)據(jù)挖掘技術的軟件工程論文參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

數(shù)據(jù)挖掘技術的軟件工程論文

1數(shù)據(jù)挖掘技術

常見數(shù)據(jù)挖掘技術包括:分類樹技術、關聯(lián)發(fā)現(xiàn)技術、聚類技術、人工神經(jīng)網(wǎng)絡、最優(yōu)集合規(guī)約技術以及可視數(shù)據(jù)挖掘技術等。軟件度量數(shù)據(jù)往往具有多維度、高耦合性,軟件工程數(shù)據(jù)挖掘中會采用一些特殊處理技術,包括統(tǒng)計分析、回歸建模、分類樹以及神經(jīng)網(wǎng)絡等。在具體軟件工程實踐中,選擇何種挖掘技術,其決定性因素為想要達成的目標。

2數(shù)據(jù)挖掘實現(xiàn)過程

通常,數(shù)據(jù)挖掘過程包括4個步驟,即選擇數(shù)據(jù)、預處理、實施挖掘以及吸收數(shù)據(jù)。數(shù)據(jù)挖掘整個過程具有交互性,有時數(shù)據(jù)需要重新選擇,有時也要對數(shù)據(jù)預處理進行改進,也可能出現(xiàn)算法反復被調整現(xiàn)象,基于這種特征,數(shù)據(jù)挖掘時要設置反饋環(huán)。挖掘數(shù)據(jù)第1步是將管理和目標反映到1個(或多個)挖掘任務中,整個過程可主要劃分成為六種:1)評估、預測。評估包括對軟件產(chǎn)品、過程以及資源的屬性進行相應檢查就是整個評估過程,同時也需要根據(jù)這些屬性,賦值給未知屬性,當然這些未知屬性需要進行量化。評估工作完成后,要對屬性值進行預測。2)分類。檢查1個特定實體屬性,根據(jù)結果將其劃分到另1個類別或范疇(事先定義好)中。3)關聯(lián)發(fā)現(xiàn)。關聯(lián)發(fā)現(xiàn)能夠識別出特定內容中互相存在關聯(lián)某些屬性。如,可將找出在軟件開發(fā)屬性和產(chǎn)品屬性相互關聯(lián)的內容找出來。4)聚類。將1個結構不相同的群體劃分到另1個具有相同結構的子群集合中,這個過程叫做聚類,它的劃分依據(jù)是成員之間具有高度相似性。5)數(shù)據(jù)可視化。數(shù)據(jù)可視化是利用可視化描述方法來定義復雜信息。6)可視數(shù)據(jù)探察。可視化數(shù)據(jù)探察是對描述工作的相應拓展,可利用數(shù)據(jù)可視化交互控制來分析和檢視海量數(shù)據(jù)[3]。它應用具有可視化功能和數(shù)據(jù)挖掘技術來對數(shù)據(jù)進行處理。

3挖掘技術在軟件工程中應用

上文提及到軟件工程度量,部分可利用信息已在海量數(shù)據(jù)中被提取出來,但普遍認為更為有效且數(shù)量眾多的數(shù)據(jù)依然在軟件工程相關數(shù)據(jù)庫中隱藏,而沒有被發(fā)現(xiàn)。實際上,數(shù)據(jù)挖掘就是1種被公認為提升軟件工程度量的技術。圖1為數(shù)據(jù)挖掘在軟件工程中的應用。

3.1數(shù)據(jù)挖掘繁榮原因1)計算機硬件系統(tǒng)和軟件系統(tǒng)的基礎設施建立具備發(fā)現(xiàn)驅動、分析數(shù)據(jù)等功能;2)每種技術都在實際應用中不斷得到改進,其使用能力不斷提升。如,模式識別、神經(jīng)網(wǎng)絡等有明顯進步趨勢;3)數(shù)據(jù)存儲、貯藏、集成成本不高,海量數(shù)據(jù)可輕松獲得。數(shù)據(jù)挖掘技術被人們認識,并在實踐中逐漸被重視,同時也給研究和進一步提高數(shù)據(jù)挖掘技術提供了便利條件。

3.2面臨挑戰(zhàn)軟件工程自身存在很多數(shù)據(jù)上的特殊性,給數(shù)據(jù)挖掘領域研究工作帶來制約和影響,主要表現(xiàn)在以下三個方面:1)數(shù)據(jù)復雜。軟件工程數(shù)據(jù)主要分為兩個組成部分,即結構化數(shù)據(jù)、非結構化數(shù)據(jù)。結構化數(shù)據(jù)主要包括缺陷報告、版本信息等內容,而非結構化數(shù)據(jù)則包含數(shù)據(jù)代碼、相應注釋以及文檔等內容。結構化數(shù)據(jù)、非結構化數(shù)據(jù)并不能同時適用一種算法,而且兩種數(shù)據(jù)間還存在對應聯(lián)系。如,1個缺陷報告中往往包括缺陷代碼段。而結構化數(shù)據(jù)里常常涵蓋部分非結構化信息,非結構化數(shù)據(jù)中亦是如此,這也是今后工作中需要重點解決的問題之一。2)非傳統(tǒng)分析存在局限。數(shù)據(jù)挖掘最終想實現(xiàn)的目標就是將轉化而來的信息傳達給用戶,實現(xiàn)信息共享。傳統(tǒng)數(shù)據(jù)挖掘技術在使用過程中,信息手段比較單一,如文字、圖表等表達形式。其實,軟件開發(fā)商對信息的要求很高,1個統(tǒng)計結果根本不能滿足其工作需求。為促進軟件開發(fā)不斷向上發(fā)展,開發(fā)人員需要相關信息作為參考依據(jù),包括開發(fā)實際案例、編程所需模板、系統(tǒng)缺陷定位以及軟件結構設計等。研究數(shù)據(jù)挖掘技術,提升其實際使用功能,需要不斷提交新信息、新知識,并改進相應手方法。3)挖掘結果評價標準不夠具體。軟件工程數(shù)據(jù)挖掘尚未形成完善的結果表示體系,其評價體系也有待加強。人員在軟件開發(fā)過程中需要大量信心,這些信息非常具體且復雜,表示方法不盡相同,互相之間難以做出對比,也很難用定量方法去分析挖掘結果。

4結束語

“數(shù)據(jù)挖掘”是在發(fā)展過程中被人們定義的,但軟件工程中對此類數(shù)據(jù)的研究早就存在。數(shù)據(jù)挖掘技術能夠為研究軟件工程數(shù)據(jù)提供方便,具有重要應用價值。因此,筆者認為將兩者充分結合是計算機信息技術發(fā)展的必然趨勢。若以過程角度來看,軟件工程涉及到數(shù)據(jù)挖掘各個周期、階段,甚至是具體實施步驟;以技術角度看,數(shù)據(jù)挖掘在軟件工程中應用廣泛。數(shù)據(jù)挖掘技術雖然在實踐中取得一定應用效果,但還有更廣闊的空間沒有內充分挖掘出來,為廣大從業(yè)人員提供創(chuàng)新空間。

作者:賀瑋單位:同濟大學軟件學院

主站蜘蛛池模板: 欧美视频一区在线观看 | 亚洲一区二区三区四 | 羞羞视频在线观免费观看 | 国产久热香蕉在线观看 | 亚洲成人一区二区 | 亚洲福利视频网站 | 午夜男人的天堂 | 亚洲精品在看在线观看 | 在线看国产人成www免费看下载 | 亚洲二区在线观看 | 久久精品视 | 日本一区二区三区高清在线观看 | 成 人 黄 色 激 情视频网站 | 亚洲的天堂| 色五五月 | 日本精品久久久久久久 | 五月天激情亚洲婷婷在线 | 亚洲欧美一区二区三区另类 | 久久国产一级毛片一区二区 | 久久国产一级毛片一区二区 | 亚洲精品成人a在线观看 | 婷婷四房综合激情五月性色 | 亚洲aa视频 | 亚洲图片 自拍偷拍 | 一级毛片直播 | 一区二区三区免费视频播放器 | www.五月婷| 亚洲国产成人最新精品资源 | 淫婷婷 | 亚洲人成综合在线播放 | 五月花激情 | 99久热re在线精品99 6热视频 | 久久精品国产在热久久2019 | 正在播放一区二区 | 亚洲天堂国产精品 | 久久久精品久久 | 欧美黑人在线 | 开心色五香五月婷婷 | 第一福利视频网 | 午夜日韩| www.婷婷.com|