本站小編為你精心準備了預測銀行信貸風險論文參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
一、CRISP-DM過程描述
1.商業理解。這一階段的主要任務是確定商業目標,即從商業角度確定項目的目標和所要達到的效果,然后根據這種知識確定數據挖掘的目標。在本文中,該目標就是利用銀行現有的真實數據,采用最合適的任務安排和挖掘算法,為銀行提供一個現成可用的,經過評估的貸款拖欠者預測模板,而不需要用戶自己建立模型就可以解決實際問題。
2.數據理解。數據理解的關鍵是數據源的選擇。本示例為了獲得現有的貸款拖欠數據,需要從名為bankloan.sav的數據文件中把流bayes_bankloan.str選擇出來。然后為數據源添加一個類型節點,我們可以看出,影響default的因素有:年齡、學歷、最近工作的工齡、收入、信用卡債務、其他債務。
3.數據準備。在構建模型時,有些目標字段的值不完整或者是空值,如果不經過數據的處理直接進行數據的使用,可能會導致預測結果的錯誤,為了排除這些觀測值以防止在模型評估中使用,就需要對數據進行處理。在例中,我們為類型節點添加一個選擇節點,并在在“條件”框中,輸入default='$null$',這樣就可以達到對數據進行缺失處理的目的。
4.模型建立。Clementine提供了多種預測算法,如C5.0、神經網絡、Logistic回歸等,本文中我們選用貝葉斯網絡節點建模,具體的操作過程如下所示。Step1:將一個類型節點添加到源節點bankloan.sav,并將default字段的方向設置為輸出,其他所有字段的方向設置為輸入。Step2:由于我們構建了多個不同類型的貝葉斯網絡,要對它們進行比較,從而確定哪個模型具有最好的預測效果。因此我們在選擇節點之后添加三個貝葉斯網絡節點,將模型的名稱分別設置為“TAN”“Markov”“Markov-FS”,其中第三個模型不僅具有馬爾科夫覆蓋結構,而且使用了特征選擇預處理來選擇與目標變量有重大關聯的輸入。Step3:通過運行上述三個貝葉斯網絡節點就可以生成相應模型,在這里我們可以查看它們的詳細信息,如圖1所示??梢钥闯?,左列包含節點網絡圖,可顯示目標與其最重要預測變量之間的關系,以及各預測變量之間的關系;右側顯示變量的重要性,它表示評估模型時每個變量的相對重要性。Step4:將TAN模型塊附加到選擇節點,將Markov模型塊附加到TAN節點,將Markov-FS模型塊附加到Mark-ov節點。Step5:為了避免輸入,要重新命名評估圖形上的模型輸出。將過濾節點附加到Markov-FS模型塊。在右側的字段欄中,將$B-default、$B1-default和$B2-de-fault分別重新命名為TAN、Markov和Markov-FS。Step6:將評估圖形節點附加到過濾節點上,然后使用圖形節點的默認設置來執行它。這樣就可以生成一個收益圖表。圖2顯示,每個模型類型都生成了相似的結果,但是馬爾可夫模型要稍微好一些。但是要檢查每個模型的預測效果,我們更傾向于使用分析節點而不是評估圖形。
二、模型分析
為了從多種模型中選擇最佳預測效果的模型,需要利用預測集的數據來檢驗模型的準確度,對數據流的執行結果進行評估。我們將分析節點附加到過濾節點上,然后使用分析節點的默認設置來執行。在完成模型實施階段之后,數據流設計中的數據流圖如圖x所示。圖3展示了數據挖掘流程的一個完整過程,這些步驟是在數據挖掘工具的指導下一步步自主建立的。完全符合CRISP-DM標準流程,并且將數據挖掘的流程可視化地展示在用戶面前,能夠讓用戶了解并指導數據挖掘的全過程。通過運行分析節點,我們可以得到每個模型的預測效果,具體結果如圖4所示:圖4顯示了依據正確和不正確的預測百分比得出的準確性。就像前面的“評估圖形”一樣,本圖顯示馬爾可夫模型在正確預測方面要稍微好一些,但是,Markov-FS模型僅落后馬爾可夫模型幾個百分點。這可能就意味著使用Markov-FS模型要更為方便一些,因為它計算結果所需的輸入更少,因此節省了數據收集和輸入的時間以及處理時間。
三、總結
首先,本文詳細地介紹了數據挖掘工具在預測銀行貸款拖欠方面的實際需求,通過一個簡單、完整的實例,從商業理解、數據理解、數據準備、模型建立、模型比較到部署實施,將CRISP-DM通過可視化的方式展示出來,最后通過對實際數據的分析結果,得出最準確的預測模型,并且使用戶能夠很容易的掌握數據挖掘的具體操作,具有切實可操作性。其次,貝葉斯網絡建模靈活性,且預測結果不會受個別損壞的歷史數據的影響。這就使得該方法在流程和環境時刻變化、操作風險和損壞數據缺乏的銀行業具有無可替代的優勢。同時,基于貝葉斯網絡強大的演算推理功能,可以精確地預測出各個變量的影響程度,使得銀行在風險控制方面更具主動權。
作者:周森鑫李超吳德成單位:安徽財經大學管理科學與工程學院