在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網 資料文庫 GA-RS-LR算法下公司財務與個股投資研究范文

GA-RS-LR算法下公司財務與個股投資研究范文

本站小編為你精心準備了GA-RS-LR算法下公司財務與個股投資研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

GA-RS-LR算法下公司財務與個股投資研究

摘要

運用遺傳算法-粗糙集-邏輯回歸方法(GA-RS-LR)探討我國A股上市公司財務與股票收益的關系.運用GA-RS方法獲得財務指標最優約簡;運用LR模型探求兩者關系.最終,經GA-RS約簡,60個財務指標中有17個對股票投資有重要影響;通過LR模型,4個指標具有顯著效應;其中,負債與權益市價比為5.82%負效應,其余為正效應.對2015年股票相對波動進行預測得到70%的準確率,驗證了GA-RS-LR模型對中長期投資的有效性.

關鍵詞

遺傳算法-粗糙集;邏輯回歸;股票收益;公司財務

1引言

股票市場對一個國家和地區的經濟發展動向有前導作用.股票收益受到宏觀經濟現狀、政策、公司財務、投資者情緒等因素影響.研究股票收益問題一直是學術界的研究熱點.目前,學術界對股價與上市公司財務之間關系的探討主要從兩方面入手.一是通過建立計量模型來探求股票與其影響因素的關系,進而對股價進行分析與預測[1,2].然而計量模型對數據平穩性、正態性等有嚴格限定,直接利用很難達到預期結果.股票市場數據體量巨大、類型繁多,故很多學者轉而選用數據挖掘方法來探究其關系.如有不少學者就運用遺傳算法[3]、BP神經網絡[4]等得到了較為理想的結果.粗糙集(RoughSets)理論[5,6]由波蘭數學家PawlakZ于1982年所提出.這是一種用于處理含糊和不確定信息的新型數學工具,具有優越的知識簡化能力.粗糙集理論利用現有知識庫對不精確的知識進行近似描述[7].RS方法不需預先假定概率分布,也不需像模糊集理論一樣假設模糊隸屬函數的結構,而是僅僅利用數據本身提供的信息.目前對粗糙集的研究主要集中于其數學性質,理論的擴展以及與其他智能方法的融合與有效算法等[8].杜婷(2012)將粗糙集運用到了個人信用評估模型之中,并取得了良好的約簡結果[9].王剛、楊善林將粗糙集與支持向量機相結合,以分析網絡商品評論中的情感進行分析,實證表明,RS-SVM方法可以提高網絡用戶情感分析的準確程度[10].邏輯回歸方法由vethulst首次提出.1980年,Ohlson率先將邏輯回歸模型用于財務危機預警,分析樣本公司在破產概率區間上的分布以及兩類錯誤和分割點之間的關系,并得到高預測準確率[11].劉遵雄、黃志強等(2012)在邏輯回歸的基礎上進行完善,提出了基于平滑小編絕對偏離(SCAD)懲罰邏輯回歸模型,運用到財務預警,實驗結果表明SCAD懲罰邏輯回歸模型的分類效果更好[12].因此Logistic回歸法在經濟領域的研究受到了極大關注.基于此,本文提出了遺傳算法-粗糙集-邏輯回歸(GA-RS-LR)數據挖掘技術,用于探究股票投資與上市公司財務指標體系的內在聯系.運用GA-RS模型得到最優財務約簡指標.并在此之上利用逐步回歸法與Logistic回歸模型以探究公司財務與股票收益的確切關系.最終得到上市公司財務指標不同大類之間與個股投資概率之間的正負效應關系及其影響大小.

2GA-RS-LR模型構建

2.1GA-RS約簡模型

粗糙集理論的屬性約簡算法可分為是盲目刪除屬性約簡算法與啟發式算法.遺傳算法作為啟發式算法中的一種,具有全局優化和隱含并行的特點,在解決復雜問題中具有明顯優勢.遺傳算法在屬性約簡問題中需要具體考慮的因素如下:染色體編碼:設條件屬性集合為C={c1,c2,…,cn},則條件屬性空間ΩC可映射為遺傳算法的染色體.每個染色體用n維的{0,1}二進制位串表示,每一位對應一個條件屬性.若染色體上某一位取值為1則表示選擇該條件屬性;若某位取值為0,則表示剔除該條件屬性.由此染色體個體與屬性子集就建立了一一對應關系.適應值函數構造:適應值函數作為評估染色體的優劣指標,其形式直接決定了種群的進化行為[13].在屬性約簡問題中,可將適應值函數定義如式(1).式中,card(x)表示染色體中1的個數.γC(D)(x)表示條件屬性集C的相對依賴度.POSCx(D)表示條件屬性集合Cx的相對正域.f(x)的目標是使x中值為1的個數最少,使屬性集盡可能的約簡.γC(D)(x)的目標是使x的相對依賴度最大.兩者結合正好滿足屬性約簡的原理。選擇概率:選擇指從當前種群中選擇適應值高的優良個體以生成交配池.設種群為G={x1,x2,…,xM},對xi∈G,其被選擇的概率設定為式(2).式中,F(xi)表示xi的適應值.其值越高,被選擇的概率也越大,從而該染色體的優良特性被保留下來的概率也就越大.交叉與變異:交叉運算是指從交配池中隨機選取兩個體進行位串,從而得到新一代基因個體的過程.由于核所包含的屬性必須存在于每一個個體中,因此采用一致交叉運算以保證核所對應基因位的取值為1.變異運算指按照變異概率pm對調某位基因的二進制字符數值的過程.變異可確保種群多樣性,避免陷入局部最優的困境,但變異太頻繁,反而使得種群不穩定.為維持種群穩定性,pm一般設置在0.01~0.2之間.算法終止條件:連續t次迭代之后,若最優個體適應值不再提高,則認為已經近似找到最優染色體,計算終止.GA-RS約簡的具體流程見圖1.

2.2LogitRegression模型

通過GA-RS約簡,條件屬性集與決策屬性集之間的確定關系并沒凸顯出來.因此,在GA-RS約簡后,引入LR模型以探究兩者之間的可度量關系.假設某事件Y滿足:Y=1,事件發生;Y=0,事件不發生;且發生概率為p.若存在k個相互獨立的變量X′=(x1,x2,…,xk)與事件Y相關,且X與事件Y發生概率之間滿足關系式(3),事件Y的發生概率與未發生概率之比取對數便可得到Logistic函數(4):LR模型的理論約束相對寬松,無須對變量進行分布類型、協方差陣等的假定,但LR模型對變量之間的共線性干擾卻相對敏感.而GA-RS約簡只保證屬性集合的重要性,而沒有考慮獨立性.若直接采用LR模型進行擬合,由于個指標之間的共線性影響,模型的擬合效果將受到干擾,甚至出現錯誤的模型.故本文選擇逐步回歸法,通過變量篩選來處理多重共線性問題,最終得到最優LR模型.

3GA-RS-LR模型實證

3.1數據選取與處理

以我國上海交所與深交所上市的A股上市公司為依據,選取2014年下半年內數據完整、具有不同行業分類的非ST、非*ST的上市公司作為樣本.提取公司財務季度指標60個,個股開盤價、收盤價,上證綜合開盤指數、收盤指數等指標,最終得到樣本913個.其中財務指標體系的分布見表1不同指標之間量綱不同,同一指標不同個體之間的差別各異,直接利用原始數據進行分析,不僅會增大模型的復雜度,還會造成結果的不理想.故運用K-均值聚類對各項指標進行逐一聚類,并最終將公司就不同指標分別分為3類.由于公司財務報表的公布具有時滯性,股票數據選取也將延后一個季度.同時,考慮到投資者投資其他領域而非股票所造成的機會成本,本文用上證綜指收益率作為基準收益率:當大盤指數上升時,若個股上升幅度更大,則認為該個股為強勢股,值得投資;反之,投資該個股并非明智之舉.同理,當大盤指數下降時,若個股下降幅度更小,則該個股是抗壓股;反之.基于此將股票分為2類.“好”為具有投資價值的強勢股或者抗壓股;“差”為不值得投資的股票.

3.2GA-RS屬性約簡

在對離散化數據進行GA-RS屬性約簡之前,需要設定遺傳算法的參數.約簡后,影響股價相對收益率的財務指標從60個變量縮減為17個.約簡集合相對決策屬性的依賴度都達到了100%,這表明該約簡結果對決策屬性的解釋度100%.約簡后的指標分布見表3可知,發展能力指標數目最多,共6個指標;其次是償債能力.考慮到時滯性,該17個約簡指標應是股票價格波動的領先指標,對下期的股價相對波動有著顯著的影響.投資者在決策時應重點關注.

3.3Logistic回歸與逐步回歸

通過GA-RS約簡后,財務指標得到了極大的簡化,但是GA-RS屬性約簡只能保證上市公司財務指標屬性集對個股相對波動率的相對重要性,而沒有給出兩者之間更為確切的關系.因而引入LR模型對約簡的財務指標與股票波動的相互關系做更為細致準確的刻畫.同時,對財務指標體系而言,計算過程中所運用的基礎數據有交叉,故指標之間存在很強的相關性.這一缺陷會導致財務指標之間存在比較嚴重的共線性,如果直接使用LR模型將極大減弱模型的擬合效果.因此,在LR模型中使用逐步回歸法進行變量篩選,消除變量之間的共線性,從而精簡模型.通過計算17個約簡指標的VIF值可知,固定資產增長率、銷售費用本增長率的VIF都超過5,說明變量之間存在共線性.利用逐步回歸法得到的LR模型中變量的VIF值見表4.可以發現,此時各變量之間已不存在共線性問題.設樣本中個股為強勢股或者抗壓股的概率為p,則該個股值得投資的概率也就等于p,進而個股投資概率比p/(1-p)與4個財務指標之間的回歸方程為:括號里為相應參數估計的z值,通過z值可知模型已通過檢驗.根據式(5)得到個股為抗壓股的概率p與財務指標之間的關系,即Logistic模型為:可知,負債與權益市價比率對股票投資概率的影響最大.x1每變動1單位,股票為抗壓股的投資概率之比則相應變化-5.819%.由于負債與權益市價比率指標屬于償債能力的指標大類,該指標主要用來衡量負債與權益資金的相對比重.其值愈大,公司自有資金愈少,對債權人的保障愈少.因而,對股價的波動將產生負效應.相比之下,固定資產增長率、存貨周轉率、普通股獲利率對個股投資概率比則為正效應.它們分別反應了公司發展狀況與預期,經營管理能力,以及每股股息的實得利率.其對股票投資價值的影響分別為0.824%、0.12%、1.009%.此外,除了這4個上市公司財務指標之外的其他影響因素對個股投資概率比的綜合影響也表現為負效應,大約為4.056個百分點.為驗證模型有效性,以2014年第4季度財務指標為自變量,2015年第1季度股票投資比為應變量進行模型預測檢驗,得到900個樣本的預測準確度為70%.這表明大約有630個上市公司的個股波動可以通過上一期的GA-RS-LR模型得到準確預測.這對價值型的中長期投資者具有一定的參考意義.

4結論

本文提出了遺傳算法-粗糙集-邏輯回歸方法(GA-RS-LR)探究股價相對收益率與財務指標的關系.利用K-均值聚類進行離散化處理,既解決了數據量綱不一致的問題,又使同一類別相似個體之間的差異被忽略,而不同類別之間的差異被放大.通過選用GA-RS方法以約簡眾多的財務指標.最終得到由17個指標所組成的約簡體系,且RS約簡的相對依賴度為100%.基于約簡指標數據,利用逐步回歸法對LR模型進行變量篩選,解決共線性問題.最終得到上市公司財務指標不同大類之間與個股投資概率比之間的正負效應關系及其影響大小,并得到70%的預測準確度,驗證了GA-RS-LR模型對中長期投資所具有的優勢.

參考文獻

[1]陳玉山,席斌.獨立成分分析方法在股票分析中的應用[J].計算機工程與設計,2007,28(6):1473-1476.

[2]吳榮盛.全流通條件下的股票價格與財務信息的相關性研究-來自我國滬深300指數的實證研究[D].成都:西南財經大學經濟學院,2014.

[3]胡冰,潘福錚,胡清鋒.遺傳算法在股票短期投資決策中的運用[J].系統工程與實踐,2003,23(2):7-13.、

[4]王莎.BP神經網絡在股票預測中的應用研究[D].長沙:中南大學商學院,2008.

[7]董威.粗糙集理論及其數據挖掘應用[M].沈陽:東北大學出版社,2009.

[8]王國胤.Rough集理論在不完備信息系統下的擴充[J].計算機研究與發展,2002,39(10):1238-1243.

[9]杜婷.基于粗糙集支持向量機的個人信用評估模型[J].統計與決策,2012,1(13):94-96.

[10]王剛,楊善林.基于RS-SVM的網絡商品評論情感分析研究[J].計算機科學,2013,40(11):274-277.

[12]劉遵雄,黃志強,孫清,張恒.SCAD懲罰邏輯回歸的財務預警模型[J].統計與信息論壇,2012,27(12):21-26.

作者:瞿尚薇 王斌會 單位:暨南大學

主站蜘蛛池模板: 自拍偷拍亚洲图片 | 两性免费视频 | 亚洲一区二区三区麻豆 | 久久国产视屏 | 一区二区久久 | 自拍视频区 | 久久新网址 | 亚洲六月丁香色婷婷综合久久 | 最新欧美精品一区二区三区 | 亚洲 欧美 自拍 卡通 综合 | 亚洲国产成人精品91久久久 | 一二三区视频 | 宅男视频在线观看免费高清完整 | 性色欧美 | 四虎免费影院ww4164h | 中文字幕精品视频在线观看 | 夜夜天堂| 国产在线视频网 | 国产久 | 亚洲男人的天堂久久无 | 夜精品a一区二区三区 | 国内自拍网 | 国色天香社区视频免费高清在线观看 | 中文字幕日韩欧美 | 日韩亚洲欧美综合 | 亚洲男人天堂色 | 婷婷午夜影院 | 亚洲一区二区三区久久久久 | 羞羞视频在线播放 | 久久久久久久国产视频 | 综合久久99久久99播放 | 日本欧美一区二区三区视频麻豆 | 国产看片网站 | 久久国产精品免费一区二区三区 | 水蜜桃视频在线高清观看 | 久久99久久99基地看电影 | 国产毛片视频网站 | 香蕉在线视频高清在线播放 | 2018av男人天堂 | 亚洲网站视频在线观看 | 欧美成人黑人xx视频免费观看 |