本站小編為你精心準(zhǔn)備了社會(huì)學(xué)理論下社會(huì)學(xué)網(wǎng)絡(luò)的模型研究參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
摘要:社會(huì)網(wǎng)絡(luò)的發(fā)展使人們的溝通變得越來(lái)越便捷,對(duì)社會(huì)學(xué)網(wǎng)絡(luò)模型的研究不僅具備理論價(jià)值,它還具備極高的應(yīng)用價(jià)值。但是,由于社會(huì)學(xué)網(wǎng)絡(luò)中的數(shù)據(jù)是以稀疏形式存在的,再加上噪音數(shù)據(jù)與數(shù)據(jù)缺失等現(xiàn)象的普遍存在,這使傳統(tǒng)的數(shù)據(jù)處理技術(shù)存在很大弊端與不足。同時(shí),現(xiàn)階段社會(huì)學(xué)網(wǎng)絡(luò)的研究還尚未形成較為完善的社會(huì)學(xué)理論支撐。為此,本文便基于社會(huì)學(xué)理論和稀收學(xué)習(xí)方法對(duì)社會(huì)學(xué)網(wǎng)絡(luò)模型進(jìn)行深入的研究,以此有效處理社會(huì)學(xué)網(wǎng)絡(luò)中所存在的稀疏數(shù)據(jù)之間的內(nèi)在關(guān)系及其交互,為社會(huì)學(xué)網(wǎng)絡(luò)模型提供足夠的社會(huì)學(xué)理論支撐,以此幫助相關(guān)人員克服社會(huì)學(xué)網(wǎng)絡(luò)模型中存在的技術(shù)難點(diǎn)。
關(guān)鍵詞:社會(huì)學(xué)理論;稀疏學(xué)習(xí);社會(huì)學(xué)網(wǎng)絡(luò);模型
一、社會(huì)學(xué)網(wǎng)絡(luò)的主要特征
社會(huì)學(xué)網(wǎng)絡(luò)可以看作是虛擬世界的一種延伸形式,它相比于傳統(tǒng)的信息網(wǎng)絡(luò)來(lái)說(shuō),具備以下幾個(gè)主要特征。首先,社會(huì)學(xué)網(wǎng)絡(luò)具備社會(huì)性,社會(huì)性普遍存在于社會(huì)網(wǎng)絡(luò)環(huán)境當(dāng)中,其是與社會(huì)網(wǎng)絡(luò)呈現(xiàn)共存關(guān)系的,它將社會(huì)網(wǎng)絡(luò)環(huán)境中不同個(gè)體所具備的影響力與權(quán)威性之間的差異作為用戶所自有的社會(huì)性特征。其次,社會(huì)學(xué)網(wǎng)絡(luò)具備多維度特征,它可以從不同側(cè)面對(duì)相同用戶進(jìn)行描述,進(jìn)而使用戶具備明顯的多維度特征,同樣,對(duì)于相同群體來(lái)說(shuō),也同樣具備明顯的多維度特征。再次,社會(huì)學(xué)網(wǎng)絡(luò)具備較強(qiáng)的關(guān)聯(lián)性特征,在社會(huì)網(wǎng)絡(luò)中,用戶與用戶之間的差異使不同用戶在行為上具備一定的聯(lián)系,并借助于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)來(lái)實(shí)現(xiàn)不同用戶之間的相互影響,進(jìn)而使用戶具備了較強(qiáng)的關(guān)聯(lián)性特征。最后,社會(huì)學(xué)網(wǎng)絡(luò)具備演化性特征,在社會(huì)網(wǎng)絡(luò)的發(fā)展中,用戶的狀態(tài)及關(guān)系并不是一成不變的,而是處于不斷更新中,這也使網(wǎng)絡(luò)能夠不斷的產(chǎn)生新的信息,用戶也能夠?qū)€(gè)人狀態(tài)進(jìn)行不斷更新,同時(shí)建立新的社會(huì)關(guān)系,這也使社會(huì)網(wǎng)絡(luò)中的用戶具備了演化性特征。通過(guò)演化過(guò)程,能夠使信息在社會(huì)網(wǎng)絡(luò)中的傳播得到不斷擴(kuò)大,進(jìn)而使其在非常短的時(shí)間內(nèi)就能進(jìn)行大面積傳播。雖然社會(huì)學(xué)網(wǎng)絡(luò)的發(fā)展給人們帶來(lái)了新的商業(yè)機(jī)會(huì)與溝通渠道,但由于社會(huì)網(wǎng)絡(luò)自身所具備的這些特征,也使其在數(shù)據(jù)挖掘方法及分析技術(shù)方面和傳統(tǒng)方式產(chǎn)生很大的不同,并且在社會(huì)網(wǎng)絡(luò)不斷發(fā)展的同時(shí),也給人們帶來(lái)了一系列需要攻克的技術(shù)難題,如符號(hào)網(wǎng)絡(luò)的鏈接預(yù)測(cè)問(wèn)題、短文本的主題識(shí)別問(wèn)題、信任關(guān)系稀疏問(wèn)題等,因此,需要利用新的方法并充分結(jié)合多種理論來(lái)對(duì)社會(huì)學(xué)網(wǎng)絡(luò)模型進(jìn)行深入的分析與研究,克服現(xiàn)有的技術(shù)難關(guān),使其能夠更好的滿足用戶日益增長(zhǎng)所帶來(lái)的社會(huì)需求。
二、稀疏學(xué)習(xí)方法及模型
1.稀疏學(xué)習(xí)方法近些年來(lái),社會(huì)網(wǎng)絡(luò)的發(fā)展與大數(shù)據(jù)的推廣,給傳統(tǒng)的機(jī)器學(xué)習(xí)帶來(lái)了巨大的挑戰(zhàn),例如數(shù)據(jù)缺失、數(shù)據(jù)的規(guī)模龐大、數(shù)據(jù)的稀疏性等。數(shù)據(jù)的稀疏性在各個(gè)研究領(lǐng)域中普遍存在,例如在社交網(wǎng)絡(luò)領(lǐng)域中,雖然用戶是大量存在的,但這些用戶之間的社會(huì)交互與社會(huì)關(guān)系相比于數(shù)據(jù)集合來(lái)說(shuō)仍舊較為稀疏。機(jī)器在學(xué)習(xí)過(guò)程中,由于數(shù)據(jù)所具備的數(shù)據(jù)量大、冗余性、稀疏性等特征,使訓(xùn)練學(xué)習(xí)模型變得越來(lái)越復(fù)雜,并且所耗時(shí)間也越來(lái)越長(zhǎng),這也使其在適用性上越來(lái)越差,因此必須要找出相應(yīng)的方法來(lái)解決上述問(wèn)題。所謂稀疏學(xué)習(xí)方法,是將實(shí)際生活中的應(yīng)用問(wèn)題所具備的數(shù)據(jù)特征利用維度約簡(jiǎn)來(lái)進(jìn)行稀疏表示,進(jìn)而構(gòu)建出解決問(wèn)題的模型,利用稀疏學(xué)習(xí)方法能夠有效提高與改善學(xué)習(xí)模型性能,從而使學(xué)習(xí)模型成為一種更加高效的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)工具。
2.稀疏學(xué)習(xí)模型分析稀疏學(xué)習(xí)模型主要分為三種類型,分別是主成分分析模型、Lasso模型及矩陣分解。主成分分析模型能夠從大量數(shù)據(jù)中對(duì)數(shù)據(jù)冗余及噪音進(jìn)行有效去除,使獲得的原始數(shù)據(jù)能夠?qū)κ挛锾卣鬟M(jìn)行最本質(zhì)的反映,進(jìn)而達(dá)到數(shù)據(jù)的降維處理與壓縮目的。Lasso模型是在上世紀(jì)60年代提出的,它是LeastSquares模型的變體,該模型能夠有效彌補(bǔ)傳統(tǒng)特征選擇方法中存在的不足,它通過(guò)懲罰函數(shù)的構(gòu)造來(lái)建立相應(yīng)的學(xué)習(xí)模型,并利用壓縮系數(shù)對(duì)某些回歸系數(shù)進(jìn)行變小處理,這也使其具備子集選擇與嶺回歸的優(yōu)勢(shì)。矩陣分解能夠使矩陣分解以后變得更容易處理,矩陣分解具備很多性質(zhì),這也使其能夠適用于不同的分解技術(shù)。最常見(jiàn)的矩陣分解技術(shù)主要有非負(fù)矩陣分解技術(shù)、奇異值分解技術(shù)、概率矩陣分解技術(shù)及低秩矩陣分解技術(shù)等。
3.稀疏學(xué)習(xí)算法分析在機(jī)器學(xué)習(xí)領(lǐng)域,除了需要具備能夠?qū)?wèn)題進(jìn)行解決的模型以外,還要具備相應(yīng)的優(yōu)化算法。傳統(tǒng)的優(yōu)化算法能夠使機(jī)器學(xué)習(xí)效果得到顯著提高,但大數(shù)據(jù)時(shí)代的來(lái)臨,使機(jī)器學(xué)習(xí)模型難以對(duì)數(shù)據(jù)稀疏及數(shù)據(jù)規(guī)模大這兩大問(wèn)題予以有效解決,這也使傳統(tǒng)優(yōu)化算法難以針對(duì)大數(shù)據(jù)的特點(diǎn)進(jìn)行有效處理。而稀疏學(xué)習(xí)優(yōu)化算法則是在傳統(tǒng)優(yōu)化算法的基礎(chǔ)上演變出來(lái)的,它針對(duì)損失函數(shù)及正則化項(xiàng)的特殊構(gòu)造含義及其作用,能夠適用于大數(shù)據(jù)的特點(diǎn)來(lái)對(duì)優(yōu)化問(wèn)題進(jìn)行有效解決。
三、基于社會(huì)學(xué)理論和稀疏學(xué)習(xí)方法的社會(huì)學(xué)網(wǎng)絡(luò)的模型研究
1.LASSO稀疏學(xué)習(xí)模型研究在短文本主題識(shí)別方面的問(wèn)題主要存在于短文本的信息量較少、表達(dá)語(yǔ)法不規(guī)范、關(guān)鍵特征較為分散、數(shù)據(jù)量大、更新速度快等問(wèn)題,這也使經(jīng)典機(jī)器學(xué)習(xí)方法難以對(duì)短文本進(jìn)行有效處理。為此,本文通過(guò)構(gòu)建稀疏學(xué)習(xí)模型來(lái)對(duì)噪音文本及短文本的分類問(wèn)題進(jìn)行形式化表示,然后對(duì)社會(huì)學(xué)理論文本關(guān)聯(lián)關(guān)系及文本內(nèi)容進(jìn)行模擬,最終提出對(duì)短文本及噪音文本進(jìn)行主題識(shí)別的相關(guān)解決方案。首先,采用Lasso稀疏學(xué)習(xí)模型中的多類別分類器來(lái)對(duì)多分類問(wèn)題進(jìn)行解決。為了使文本表示能夠更好的應(yīng)用到主題識(shí)別當(dāng)中,應(yīng)對(duì)文本進(jìn)行預(yù)處理,如對(duì)停用詞的移除,提取詞干等。然后通過(guò)文本特征選擇模型來(lái)對(duì)文本內(nèi)容的特征空間進(jìn)行表示。采用的特征空間主要有三個(gè),分別是Unigram模型、TF模型及TF-IDF模型。為了對(duì)稀疏學(xué)習(xí)模型進(jìn)行進(jìn)一步的擴(kuò)展,并通過(guò)社會(huì)情境來(lái)對(duì)主題進(jìn)行識(shí)別,為此采用了兩個(gè)社會(huì)學(xué)理論應(yīng)用到主題識(shí)別當(dāng)中,分別是偏好一致性正則化與社會(huì)感染正則化,并求解這兩個(gè)社會(huì)學(xué)理論的目標(biāo)函數(shù)。按照上述兩個(gè)社會(huì)學(xué)理論的定義來(lái)建立主題識(shí)別的社會(huì)學(xué)框架,進(jìn)而實(shí)現(xiàn)利用社會(huì)學(xué)理論并通過(guò)社會(huì)情景來(lái)對(duì)短文本及噪聲文本進(jìn)行主題識(shí)別的目的。
2.信任預(yù)測(cè)模型研究對(duì)于信任預(yù)測(cè)模型,應(yīng)采用特征向量中心性方法來(lái)對(duì)用戶的社會(huì)等級(jí)進(jìn)行計(jì)算,然后對(duì)用戶的社會(huì)等級(jí)進(jìn)行排序,并根據(jù)社會(huì)等級(jí)理論來(lái)提出相應(yīng)的社會(huì)等級(jí)正則化方法,并最終建立信任關(guān)系預(yù)測(cè)模型sTrust,通過(guò)上述步驟,能夠有效解決社會(huì)網(wǎng)絡(luò)在進(jìn)行信任數(shù)據(jù)預(yù)測(cè)時(shí)所產(chǎn)生的稀疏性問(wèn)題。具體內(nèi)容如下,首先利用矩陣分解技術(shù)將原矩陣分解成三個(gè)低維非負(fù)矩陣,然后重構(gòu)信任關(guān)系網(wǎng)絡(luò)矩陣,即,這時(shí)由于信任關(guān)系網(wǎng)絡(luò)矩陣過(guò)于稀疏,因此需要添加正則化項(xiàng)來(lái)避免出現(xiàn)過(guò)度擬合問(wèn)題,在社會(huì)等級(jí)正則化中,要給出所應(yīng)用的基本符號(hào),并利用低秩矩陣分解方法來(lái)對(duì)用戶與用戶之間的信任關(guān)系建立的可能性進(jìn)行分析,以此找出最小化社會(huì)等級(jí)的懲罰項(xiàng),然后根據(jù)社會(huì)等級(jí)理論進(jìn)行建模。
3.鏈接預(yù)測(cè)模型研究在矩陣符號(hào)網(wǎng)絡(luò)預(yù)測(cè)模型中,需要將符號(hào)網(wǎng)絡(luò)當(dāng)成矩陣,然后采用矩陣分解方法與信任傳播方法來(lái)對(duì)符號(hào)屬性進(jìn)行預(yù)測(cè),該模型是以低秩矩陣分解法,結(jié)合社會(huì)學(xué)理論中的社會(huì)等級(jí)理論、結(jié)構(gòu)平衡理論及交互情感理論來(lái)對(duì)相應(yīng)的符號(hào)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行構(gòu)建,進(jìn)而達(dá)到對(duì)鏈接關(guān)系符號(hào)屬性進(jìn)行預(yù)測(cè)的目的。首先用鄰接矩陣形式對(duì)構(gòu)建符號(hào)網(wǎng)絡(luò)進(jìn)行表示,然后采用矩陣分解方法分析低秩逼近的相關(guān)表達(dá)方法,利用低秩矩陣相乘的方式來(lái)對(duì)符號(hào)網(wǎng)絡(luò)矩陣進(jìn)行重構(gòu),并將原矩陣中的缺失值進(jìn)行補(bǔ)齊,由于這時(shí)的符號(hào)關(guān)系矩陣比較稀疏,因此需要添加正則化項(xiàng)方式來(lái)對(duì)過(guò)度擬合問(wèn)題進(jìn)行避免,進(jìn)而達(dá)到對(duì)鏈接關(guān)系符號(hào)屬性進(jìn)行預(yù)測(cè)的目的。
四、結(jié)語(yǔ)
綜上所述,雖然我國(guó)在社會(huì)網(wǎng)絡(luò)中的情感分類、符號(hào)網(wǎng)絡(luò)、信任關(guān)系預(yù)測(cè)及主題識(shí)別等方面取得了一系列的階段性成果,但在社會(huì)學(xué)網(wǎng)絡(luò)中仍舊存在許多問(wèn)題需要得到進(jìn)一步探討。在未來(lái)的社會(huì)學(xué)網(wǎng)絡(luò)研究工作中,將主要集中在對(duì)多數(shù)據(jù)源融合技術(shù)與垃圾用戶識(shí)別方面,而這也需要眾多學(xué)者的共同努力才能完成。當(dāng)然,本文僅僅只對(duì)基于社會(huì)學(xué)理論和稀疏學(xué)習(xí)方法的社會(huì)學(xué)網(wǎng)絡(luò)模型進(jìn)行了淺要的研究,并沒(méi)有對(duì)有效性進(jìn)行驗(yàn)證,這也需要在后續(xù)的工作中逐步得到完善。
參考文獻(xiàn):
[1]黃立威,劉艷博,李德毅.基于深度學(xué)習(xí)的推薦系統(tǒng)[J/OL].計(jì)算機(jī)學(xué)報(bào),2017:1-29.
[2]趙海燕,韓松,陳慶奎,曹健.考慮社會(huì)關(guān)系影響差異和動(dòng)態(tài)性的社會(huì)化推薦[J/OL].計(jì)算機(jī)應(yīng)用研究,2018(9):1-2.
[3]王鑫,王英,左萬(wàn)利.基于交互意見(jiàn)和地位理論的符號(hào)網(wǎng)絡(luò)鏈接預(yù)測(cè)模型[J].計(jì)算機(jī)研究與發(fā)展,2016,53(4):764-775.
作者:王勤 單位:安徽省合肥市肥東縣委黨校