本站小編為你精心準備了客戶流失數據挖掘論文參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
1數據挖掘技術
1.1數據挖掘相關技術數據挖掘相關技術介紹如下[6]:(1)決策樹:在表示決策集合或分類時采用樹形結構,在這一過程中發現規律并產生規則,找到數據庫中有著最大信息量的字段,從而可建立起決策樹的人工智能及識別技術。(2)聚類分析:聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。它是一種重要的人類行為。(3)關聯分析:關聯分析又稱關聯挖掘,就是在交易數據、關系數據或其他信息載體中,查找存在于項目集合或對象集合之間的頻繁模式、因果、關聯或相關性結構。也可以說,關聯分析是用來發現有關交易的數據庫中不同商品(項)之間的聯系。(4)神經網絡方法:顧名思義,類似于生物的神經結構,由大量簡單的神經元,通過非常豐富和完善的連接組成自適應的非線性動態系統,具有自適應、自組織、自學習、聯想記憶、分布存儲、大規模并行處理等功能。粗集方法:也就是在數據庫里把行為對象列視為元素,將不同對象在某個(或多個)屬性上取值相同定義為等價關系R。其等價類為滿足R的對象組成的集合[5]。
1.2IBMSPSSModelerIBMSPSSModeler是一個數據挖掘工作臺,用于幫助用戶快速直觀地構建預測模型,而無需進行編程。其精密的數據挖掘技術使用戶能夠對結果進行建模,了解哪些因素會對結果產生影響。它還能可提供數據挖掘相關的數據提取、轉換、分析建模、評估、部署等全過程的功能[3]。通常,SPSSModeler將數據以一條條記錄的形式讀入,然后通過對數據進行一系列操作,最后將其發送至某個地方(可以是模型,或某種格式的數據輸出)[3]。使用SPSSModeler處理數據的三個步驟:(1)將數據讀入SPSSModeler;(2)通過一系列操縱運行數據;(3)將數據發送到目標位置。
2.1數據預處理數據預處理[6],將需要的客戶投保數據按照業務預測分析的要求,將數據抽取到中間數據中,同時對數據清洗和轉換,滿足業務預測分析要求。每日凌晨調用存儲過程將核心業務系統數據提取到中間數據庫,壽險業務數據與其他數據一樣,存在不安全和不一致時,數據清洗與轉換可以幫助提升數據質量,進而提升數據挖掘進程的有效性和準確性。數據清洗主要包括:遺漏數據清洗,錯誤數據處理,垃圾數據處理[1]。
2.2數據選取數據預處理后,可以從中得到投保人的投保信息,包括投保人姓名,投保年齡(有效保單為當前年齡,無效保單為退保年齡),保費,投保年期,保單狀態等。數據如圖1所示。
2.3客戶流失預測模型建立壽險業務按渠道來分可分為個人保險、團體保險、銀行保險、網銷保險、經代保險五類。由于團體保險在壽險公司發展比較緩慢,團險業務基本屬于停滯階段。結合壽險公司的營銷特點,選定個人保單作為分析的對象,通過IBMSPSSModeler預測模型工具[3],使用決策樹預測模型對客戶流失進行預測分析。
2.4結果分析通過使用IBMSPSSModeler決策類預測模型分析某壽險公司2013年個人客戶承保情況來看有以下規則:(1)投保年數在1年以內,首期保費在0~2000元或大于9997.130保費的客戶比較容易流失。(2)保單終止保單中,女性客戶較男性客戶容易流失。(3)投保年數在2年以上,湖北及河北分支機構客戶流失率比較容易流失。(4)分紅壽險相對傳統壽險,健康壽險的客戶比較容易流失[1]。
3總結
本文在IBMSPSSModeler軟件應用的基礎上,根據現有的壽險業務數據信息,利用數據挖掘的決策樹預測模型,對壽險進行流失規則的分析,比較全面的了解了壽險公司客戶流失的原因,并建立客戶流失的決策樹預測模型,便于公司客戶服務部對現有客戶采取合適的措施防止客戶流失,從而達到保留現有客戶的目的。
作者:梁鋒單位:北方工業大學計算機學院