在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網(wǎng) 資料文庫 獨(dú)立性測試與高維數(shù)據(jù)之間的關(guān)系范文

獨(dú)立性測試與高維數(shù)據(jù)之間的關(guān)系范文

本站小編為你精心準(zhǔn)備了獨(dú)立性測試與高維數(shù)據(jù)之間的關(guān)系參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

獨(dú)立性測試與高維數(shù)據(jù)之間的關(guān)系

【摘要】機(jī)器直覺推理與因果模型的研究是AI基礎(chǔ)理論體系的重要組成部分之一。針對目前因果關(guān)系推斷在高維數(shù)據(jù)情況下,傳統(tǒng)的基于條件獨(dú)立性測試出現(xiàn)消耗時(shí)間多和準(zhǔn)確率差等現(xiàn)象。本文對兩種基于條件獨(dú)立性測試的高維數(shù)據(jù)因果關(guān)系推斷算法進(jìn)行比較:一種是通過降低條件集維度的方法、另外一種是構(gòu)建粗糙網(wǎng)絡(luò)及分裂-合并策略方法,每個(gè)算法都有其優(yōu)缺點(diǎn)。通過分析總結(jié),在今后的工作中,可以根據(jù)實(shí)際情況選擇合適的方法來解決高維數(shù)據(jù)因果關(guān)系推斷問題。

【關(guān)鍵詞】高維數(shù)據(jù);因果關(guān)系推斷;維度約簡;網(wǎng)絡(luò)分區(qū)

1研究背景及意義

1.1研究背景隨著人工智能技術(shù)的在全球的迅猛發(fā)展,它的貢獻(xiàn)將深刻影響了人類社會生活模式,把人類社會帶進(jìn)了“第四次工業(yè)革命”。在新的國家人工智能發(fā)展規(guī)劃中,也提到了新一代強(qiáng)AI的基礎(chǔ)理論體系包括“機(jī)器直覺推理與因果模型”。JudeaPearl在近期的國際會議上發(fā)表了前沿的論文“TheoreticalImpedimentstoMachineLearningWithSevenSparksfromtheCausalRevolution”,該論文提出了機(jī)器學(xué)習(xí)(ML)無法成為強(qiáng)AI基礎(chǔ),人工智能研究方向由模仿“人腦”轉(zhuǎn)向“因果推理”[1]。因果推斷跟傳統(tǒng)的關(guān)聯(lián)規(guī)則不一樣的,關(guān)聯(lián)關(guān)系只是簡單地從事物的現(xiàn)象觀察統(tǒng)計(jì)到事物與事物之間存在相關(guān)性,而因果關(guān)系推斷則是透過事物表明,反映了事物內(nèi)部的機(jī)制,而且還決定方向“誰因誰果”,因此因果關(guān)系推斷真是我們要研究的科學(xué)問題以及可以為人工智能等領(lǐng)域提供強(qiáng)有力的理論基礎(chǔ)支撐。在現(xiàn)實(shí)世界里,因果關(guān)系更為復(fù)雜,主要表現(xiàn)是:影響事物的因素眾多,而且因素變量常常是高維的。例如社交網(wǎng)絡(luò)領(lǐng)域、經(jīng)濟(jì)學(xué)領(lǐng)域、基因工程領(lǐng)域等是目前數(shù)據(jù)科學(xué)的研究熱點(diǎn)領(lǐng)域,但是這些領(lǐng)域的特點(diǎn)是數(shù)據(jù)量大、數(shù)據(jù)維度高。雖然這些高維數(shù)據(jù)復(fù)雜難以處理,但是復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)下蘊(yùn)藏了豐富的事物規(guī)則,研究這方面的課題可以產(chǎn)生巨大的經(jīng)濟(jì)價(jià)值和社會價(jià)值。

1.2研究的意義(1)降低高維數(shù)據(jù)因果關(guān)系推斷算法的時(shí)間復(fù)雜度,適用于更多場景;(2)提高因果關(guān)系推斷算法的準(zhǔn)確率,提升該領(lǐng)域的算法的可用性;(3)理論與實(shí)際相結(jié)合,為算法的順利推廣提供良好的基礎(chǔ)。

2兩種高維因果關(guān)系推斷算法的比較

2.1基于條件集維度約簡的因果關(guān)系推斷算法在文獻(xiàn)【】中提出了一種基于條件集維度簡約的快速因果網(wǎng)絡(luò)學(xué)習(xí)方法,通過該算法可以快速的推斷出因果網(wǎng)絡(luò)結(jié)構(gòu)。其算法與傳統(tǒng)算法快速的關(guān)鍵是利用mRMR算法能給找到2個(gè)節(jié)點(diǎn)y、x的候選馬爾科夫毯節(jié)點(diǎn)集的并集P=PcxUPcy。分析該方法與傳統(tǒng)PC算法的區(qū)別是:PC算法在除掉y、x的n-2個(gè)節(jié)點(diǎn)中關(guān)于y、x的條件獨(dú)立測試集合,而基于維度簡約的條件獨(dú)立性測試的條件集規(guī)模比PC算法要小很多,PC算法要在n-2的節(jié)點(diǎn)集里面求任意組合,而維度約簡方法則是在|PAxUPAy|<2m個(gè)節(jié)點(diǎn)求任意組合。特別是高維情況下2m<<(n-2),基于維度約簡的條件獨(dú)立性測試的所表現(xiàn)出來的速度會比PC算法好。不過,在進(jìn)行mRMR算法尋找馬爾科夫毯的過程中,難免存在一些冗余變量,從而導(dǎo)致影響了條件獨(dú)立性測試的準(zhǔn)確率,不過總體來說還是可以接受的。條件集維度約簡算法的流程如下:(1)步驟1:在n維數(shù)據(jù)集X={x1,x2,…,xn},對其節(jié)點(diǎn)集任意尋找一個(gè)節(jié)點(diǎn)xi,設(shè)xi=y,然后對y的父子節(jié)點(diǎn)集初始化為PC(y)={}。(2)步驟2:求出y的一個(gè)父親節(jié)點(diǎn)xi,在節(jié)點(diǎn)集合X\xi中,選取任意節(jié)點(diǎn)xj∈X\xi。(3)步驟3:利用mRMR算法,求出y和xj的得到共同候選父子節(jié)點(diǎn)集Sx,y。(4)步驟4:對節(jié)點(diǎn)集Sx,y的任意子集做條件獨(dú)立測試,如果存在節(jié)點(diǎn)集S’,S’屬于Sx,y,使得xi┴y|S,則xi與y不存在因果節(jié)點(diǎn),選取X\xj,xi,循環(huán)執(zhí)行步驟2~4,如果沒有S’條件集可以使得xi是y能夠D分離,則xi與y是因果節(jié)點(diǎn),將xi加入PC(y)。(5)步驟5:重復(fù)執(zhí)行步驟1~4,直到屬于X的節(jié)點(diǎn)都找到對應(yīng)的因果節(jié)點(diǎn)集PC(y)。(6)步驟6:通過因果節(jié)點(diǎn)集PC(y),把所有的節(jié)點(diǎn)之間的因果關(guān)系連接起來,構(gòu)成完整的因果網(wǎng)絡(luò)圖。

2.2基于低階條件獨(dú)立測試的因果關(guān)系推斷算法在做基于約束的因果關(guān)系推斷方法中,條件獨(dú)立測試是一個(gè)關(guān)鍵的過程,它能夠判斷網(wǎng)絡(luò)中的節(jié)點(diǎn)x,y之間是否獨(dú)立,從而覺得是否給x,y存在邊。然而,隨著維度數(shù)量的增長,條件集的所有組合也呈指數(shù)級增長。目前基于低階的條件獨(dú)立測試方法的總體思想就是首先通過低階的條件獨(dú)立測試,意思就是控制條件獨(dú)立測試集合的數(shù)量,保證算法執(zhí)行的速度,第一階段迅速地生成粗糙的因果網(wǎng)絡(luò)圖。第二階段,網(wǎng)絡(luò)通過分裂成多個(gè)子網(wǎng)絡(luò),再次降低大網(wǎng)絡(luò)的維度,然后對各個(gè)子網(wǎng)絡(luò)進(jìn)行條件獨(dú)立測試以求得因果網(wǎng)絡(luò)子圖。第三階段就是通過子網(wǎng)絡(luò)的整合方法,去掉冗余邊,最終整合成完整的因果網(wǎng)絡(luò)圖。這樣的算法比傳統(tǒng)的分裂-合并方法速度更快,因?yàn)閭鹘y(tǒng)的分裂子網(wǎng)絡(luò)的每個(gè)子網(wǎng)絡(luò)都是完整邊圖,而我們的方法則是相對稀疏的網(wǎng)絡(luò)圖,消耗時(shí)間相對比較少。其算法LCSCD流程描述如下:(1)步驟1:在n維數(shù)據(jù)集V={v1,v2,…,vn},構(gòu)建一個(gè)完整的全連接圖。(2)步驟2:通過網(wǎng)絡(luò)分區(qū)的方法把網(wǎng)絡(luò)V分成(V1,V2,C)。(3)步驟3:如果|V1∪C|≥δ(δ是規(guī)定變量的個(gè)數(shù))是真的,則對|V1∪C|繼續(xù)執(zhí)行LCSCD算法;否則用PC算法對|V1∪C|進(jìn)行因果網(wǎng)絡(luò)學(xué)習(xí)。(4)步驟4:繼續(xù)重復(fù)執(zhí)行步驟4~8,保證所有的子網(wǎng)絡(luò)都進(jìn)行學(xué)習(xí)。(5)步驟5:整合所有子網(wǎng)絡(luò),網(wǎng)絡(luò)邊沖突進(jìn)行重新識別,最終構(gòu)成完整的因果網(wǎng)絡(luò)圖。

3總結(jié)

本文討論了兩種高維網(wǎng)絡(luò)的因果關(guān)系推斷算法,基于條件集維度簡約的快速因果網(wǎng)絡(luò)學(xué)習(xí)方法是通過mRMR算法對條件集進(jìn)行約簡,從而減少條件獨(dú)立測試的次數(shù);而基于低階條件獨(dú)立測試的因果關(guān)系推斷算法是先使得條件集數(shù)量少于m個(gè)進(jìn)行粗糙因果網(wǎng)絡(luò)學(xué)習(xí),然后在進(jìn)行分裂-合并策略把大問題分解成小問題。每種算法各有利弊,在今后的工作中,將對這兩種算法進(jìn)行改進(jìn),爭取能夠把算法的時(shí)間復(fù)雜度降低同時(shí)準(zhǔn)確率提高。

【參考文獻(xiàn)】

[2]金洲.基于約束學(xué)習(xí)的觀測數(shù)據(jù)因果關(guān)系發(fā)現(xiàn)研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2014.]

[5]洪英漢.一種快速因果網(wǎng)絡(luò)骨架學(xué)習(xí)算法.南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版).2016,40(3):315-321.

作者:洪英漢 夏文棟 郭才 單位:廣東工業(yè)大學(xué)計(jì)算學(xué)院 韓山師范學(xué)院物理與電子工程學(xué)院

主站蜘蛛池模板: 亚洲四虎 | 羞羞视频在线观看免费 | 亚洲精品不卡久久久久久 | 亚洲精品视频在线观看视频 | 久久久精品麻豆 | 四虎影视久久久免费 | 亚洲天堂久久精品成人 | 亚洲资源在线观看 | 亚洲福利精品一区二区三区 | 亚洲福利视频一区二区三区 | 青草九九 | 爱瑟瑟精品视频在线播放 | 亚洲网站免费观看 | 中文幕无线码中文字 | 成人区精品一区二区不卡亚洲 | 在线激情网址 | 欧美视频在线播放观看免费福利资源 | 午夜在线免费视频 | 五月婷婷电影 | 五月婷婷六月婷婷 | 亚洲成人自拍网 | 亚洲美女精品视频 | 激情网址在线观看 | 色婷婷激情 | 在线亚洲欧美日韩 | 丁香花在线影院观看在线播放 | 国产羞羞视频在线观看 | 国产精品久久久久久久 | 中文字幕一区二区三区四区五区 | 色五五月 | 自拍偷拍免费视频 | 欧美日韩国产亚洲一区二区 | 电影网站在线观看 | 成人国内精品久久久久影 | 六月色丁香 | 欧美亚洲国产一区二区三区 | 性网站在线 | 亚洲区视频在线观看 | 国产高清自拍视频 | 性欧美老妇人视频 | 亚洲第一看片 |