本站小編為你精心準備了基于大數據的網絡信息論文參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
網絡信息資源是指計算機或信息終端等以通信為手段通過網絡再現出來的集聲音、文字、圖像于一體的各類信息資源的總和,其實質是電子出版的高級形式,大數據的到來構成了網絡信息資源的多個來源,特征如表2所示。由于我國網絡信息資源建設相對較晚,雖著手進行資源調優,但在挖掘有效的網絡信息方面,還存在著諸多問題,如:數據結構的處理不健全、缺乏深層挖掘研究、度量模型的不健全或缺失等。
2相關概念
本節以“文獻”為例,介紹大數據時代下網絡信息資源所呈現的社團模式及其概念。定義1.文獻網絡信息資源(LNIR)LNIR=<ArtID,ArtN,AutN[],Abst,Keys[],Clc,Doc>,其中,ArtID是文獻編號,具有唯一值;ArtN是文獻名字;AutN[]是文獻作者及其相關信息,可具有多個值;Abst為文獻摘要;Keys[]為文獻關鍵詞,可具有多個值;Clc為文獻的中圖分類號;Doc為文獻的標識碼。定義2.作者社團(LNIRAS)設LNIRi與LNIRj組成一個作者社團當且僅當(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.AutN[]∩LNIRj.AutN[]≠NULL)。定義3.關鍵詞社團(LNIRK)設LNIRi與LNIRj組成一個關鍵詞社團當且僅當(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.Keys[]∩LNIRj.Keys≠NULL)。定義4.主題社團(LNIRAN)設LNIRi與LNIRj組成一個主題社團當且僅當(LNIRi.ArtID≠LNIRj.ArtID)∩(Compare(LNIRi.ArtN.getString(),LNIRj.ArtN.getString())≠NULL)。定義5.分類號社團(LNIRCL)設LNIRi與LNIRj組成一個分類號社團當且僅當(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.Clc.trimNums()=LNIRj.Clc.trimNums())。
3網絡信息資源社團及模型
由于大數據時代網絡信息資源的急劇暴增,使得網絡信息資源的價值密度備受關注。將網絡信息資源分類整理,不僅信息量過于龐大,而且由于學科之間的交織或科研需要,各個分類之間也是緊密聯系的。現本文就文獻網絡信息資源所形成的模型做簡要介紹。假設有5篇文獻,根據定義1,設這5篇文獻如圖1所示;可分別形成作者社團(見定義2)、關鍵詞社團(見定義3)、主題社團(見定義4)、分類號社團(見定義5)。本節列舉作者社團與關鍵詞社團,其中,設作者社團的度為1,即可以形成以1個或以上的作者為中心的社團;設關鍵詞的社團為2,即可以形成2個或以上的關鍵詞為中心的社團。圖2列舉了圖1中A1、A2、k1、k2、k3形成的社團如圖2所示。由圖1可得,作者社團有:LNIRAS(A1,A2)={LNIR1,LNIR4};LNIRAS(A1)={LNIR1,LNIR2,LNIR4};LNIRAS(A2)={LNIR1,LNIR3,LNIR4,LNIR5};關鍵詞社團有:LNIRK(k1,k2,k3)={LNIR1};LNIRK(k1,k2)={LNIR1};LNIRK(k2,k3)={LNIR1,LNIR5};LNIRK(k1,k3)={LNIR1,LNIR3}。由此可以清晰得看出各個網絡資源及其之間的關系,為海量數據的挖掘提供了便利。
4結語
本文首先介紹了大數據的概況與網絡信息資源目前的概況,然后提出了本文所描述的相關概念,最后舉例說明了大數據中網絡信息資源的社團模型,為后續對大數據中關聯數據的處理及有效信息的挖掘提供了模型。
作者:馮秋燕單位:河南財經政法大學