在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網(wǎng) 資料文庫(kù) 技術(shù)監(jiān)測(cè)下的電子信息論文范文

技術(shù)監(jiān)測(cè)下的電子信息論文范文

本站小編為你精心準(zhǔn)備了技術(shù)監(jiān)測(cè)下的電子信息論文參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

技術(shù)監(jiān)測(cè)下的電子信息論文

1技術(shù)監(jiān)測(cè)的特點(diǎn)

①科學(xué)性。技術(shù)監(jiān)測(cè)是對(duì)各種數(shù)據(jù)庫(kù)、科技文獻(xiàn)以及互聯(lián)網(wǎng)絡(luò)的信息資源進(jìn)行數(shù)據(jù)挖掘,從而為社會(huì)的決策提供廣泛的數(shù)據(jù)支持,因此技術(shù)監(jiān)測(cè)必要要具有科學(xué)性,不能隨意的對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析與定性;②經(jīng)濟(jì)性。技術(shù)監(jiān)測(cè)可以通過(guò)對(duì)小范圍的數(shù)據(jù)庫(kù)等進(jìn)行發(fā)現(xiàn),就可以獲得我們所需要的科學(xué)數(shù)據(jù),從而避免了傳統(tǒng)信息評(píng)估過(guò)程中高成本運(yùn)作;③獨(dú)立性。技術(shù)監(jiān)測(cè)就是從大量的科技資源數(shù)據(jù)中發(fā)現(xiàn)顯性以及隱性的信息資源的過(guò)程,這一過(guò)程不受任何方面的限制,因此其具有嚴(yán)格意義上的獨(dú)立性。

2基于LDA主題模型的科技檢測(cè)體系

如何在眾多的科技文獻(xiàn)中發(fā)現(xiàn)與抽取文獻(xiàn)中具有隱形的語(yǔ)義結(jié)構(gòu),是當(dāng)前信息領(lǐng)域監(jiān)測(cè)所主要面對(duì)的問(wèn)題,而LDA主題模型文檔建模就是以“主題”為研究對(duì)象,通過(guò)構(gòu)建拓?fù)浣Y(jié)構(gòu)文檔表示空間,以此研究科技文獻(xiàn)中如何進(jìn)行主題挖掘的監(jiān)測(cè)問(wèn)題。

2.1主題的定義

主題在廣義上屬于對(duì)整個(gè)文獻(xiàn)的概述與匯總,是對(duì)文獻(xiàn)思想的升華。在確定“主題”前需要認(rèn)清關(guān)鍵詞、主題詞、主題之間的關(guān)系,根據(jù)文獻(xiàn)的思想觀點(diǎn),主題的內(nèi)涵形式化表達(dá)方式多樣,根據(jù)具體的文獻(xiàn)資料,文獻(xiàn)內(nèi)容特征表示深度排序?yàn)椋褐黝}>主題詞>關(guān)鍵詞。在主題建模表示中,文檔的內(nèi)容一般包括若干個(gè)主題,而文檔中的特定詞匯則可以表現(xiàn)為建模的特定主題,比如我們?cè)诜治鲆黄拔谋就诰颉保话雰?nèi)容屬于自然語(yǔ)言處理、五分之二屬于概率統(tǒng)計(jì),五分之一屬于計(jì)算機(jī),另外五分之一表示其它主題:自然語(yǔ)言處理容易出現(xiàn)的詞匯包括:文本處理、語(yǔ)法、句法分析以及數(shù)據(jù)預(yù)處理;概率統(tǒng)計(jì)容易出現(xiàn)的詞匯:概率、模型、召回率以及準(zhǔn)確率;計(jì)算機(jī)容易出現(xiàn)的詞匯:系統(tǒng)、時(shí)間復(fù)雜度、空間復(fù)雜度。

2.2基于主題模型的科技監(jiān)測(cè)體系結(jié)構(gòu)

2.2.1相關(guān)問(wèn)題分析基于主題模型的科技監(jiān)測(cè)體系結(jié)構(gòu)主要解決以下問(wèn)題:如何從大規(guī)模的領(lǐng)域文本中發(fā)現(xiàn)挖掘隱含的主題?如何對(duì)主題的強(qiáng)度進(jìn)行度量?如何分析主題演化?如何結(jié)合科技監(jiān)測(cè)服務(wù)內(nèi)容以擴(kuò)展基于主題模型的衍生應(yīng)用?2.2.2科技監(jiān)測(cè)體系結(jié)構(gòu)首先將收集的領(lǐng)域文檔集合進(jìn)行時(shí)間片劃分和文檔與處理工作;其次依照LDA主題建模方法對(duì)已處理的文檔集合后形成的特征詞進(jìn)行主題建模,從而挖掘隱含的主題;最后進(jìn)一步挖掘主題模型在科技監(jiān)測(cè)中的深層次應(yīng)用。

3基于主題模型的電子信息技術(shù)檢測(cè)原型系統(tǒng)設(shè)計(jì)

3.1信息技術(shù)監(jiān)測(cè)原理系統(tǒng)設(shè)計(jì)

信息技術(shù)監(jiān)測(cè)就是對(duì)我國(guó)的信息資源進(jìn)行相關(guān)的信息處理預(yù)計(jì)分析,實(shí)現(xiàn)對(duì)我國(guó)電子信息活動(dòng)的評(píng)估與監(jiān)測(cè),根據(jù)主題模型信息監(jiān)測(cè)系統(tǒng)總體分為三層結(jié)構(gòu)模式,即數(shù)據(jù)層、邏輯層以及服務(wù)層。具體設(shè)計(jì)如下:3.1.1數(shù)據(jù)層數(shù)據(jù)層主要是從相關(guān)信息的來(lái)源角度分析,監(jiān)測(cè)的數(shù)據(jù)源主要是來(lái)源于我國(guó)各大文獻(xiàn)數(shù)據(jù)庫(kù):電子信息期刊、電子報(bào)告以及電子產(chǎn)品文獻(xiàn)等,因此這些資源載體是構(gòu)成數(shù)據(jù)層的主要數(shù)據(jù)庫(kù),數(shù)據(jù)需求庫(kù)是儲(chǔ)存電子信息文獻(xiàn)結(jié)構(gòu)化數(shù)據(jù),并且通過(guò)數(shù)據(jù)訪問(wèn)接口與邏輯層進(jìn)行交互。3.1.2邏輯層邏輯層是整個(gè)信息監(jiān)測(cè)系統(tǒng)的核心,也是數(shù)據(jù)層實(shí)現(xiàn)分析建模的過(guò)程,邏輯層設(shè)計(jì)為三層結(jié)構(gòu)的多元化監(jiān)測(cè)模型,第一層為文獻(xiàn)計(jì)量學(xué)層;第二層為社會(huì)網(wǎng)絡(luò)層,它是運(yùn)用社會(huì)網(wǎng)絡(luò)技術(shù)方法從網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)實(shí)現(xiàn)對(duì)中心度測(cè)量的監(jiān)測(cè)指標(biāo);第三層是主體建模層,它主要是通過(guò)建模的方法對(duì)潛在的語(yǔ)義進(jìn)行自動(dòng)化的分析,從而找出主題。3.1.3服務(wù)層服務(wù)層主要分為基礎(chǔ)監(jiān)測(cè)服務(wù)和衍生監(jiān)測(cè)服務(wù)。基礎(chǔ)檢測(cè)服務(wù)就是基于主題模型的方法對(duì)主題監(jiān)測(cè)識(shí)別和追蹤,是該該系統(tǒng)進(jìn)行演示的主要部分。衍生檢測(cè)服務(wù)主要是基于主題模型的拓展應(yīng)用考慮。

3.2實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備

3.2.1實(shí)驗(yàn)數(shù)據(jù)載體對(duì)科技信息的監(jiān)測(cè)主要是建立在科技文獻(xiàn)的載體形式上,通過(guò)對(duì)科技文獻(xiàn)載體的數(shù)據(jù)分析獲得實(shí)驗(yàn)數(shù)據(jù),本文選擇科技報(bào)告作為實(shí)驗(yàn)數(shù)據(jù)載體形式。在對(duì)科技報(bào)告進(jìn)行建模前要對(duì)科技報(bào)告的特征進(jìn)行準(zhǔn)確的分析,以便能夠準(zhǔn)確的反應(yīng)科技信息監(jiān)測(cè)技術(shù)。科技報(bào)告文獻(xiàn)具有以下特征:①蘊(yùn)含明確的學(xué)術(shù)主題。可以說(shuō)每篇科技文獻(xiàn)都具有清晰的研究主題,而且基于科技研究對(duì)象的嚴(yán)謹(jǐn)性,每篇文獻(xiàn)的構(gòu)成詞也具有科學(xué)嚴(yán)謹(jǐn)?shù)奶卣鳎虼丝梢灾苯佑梦墨I(xiàn)中的構(gòu)成詞來(lái)表示主題;②科技報(bào)告都具有較高質(zhì)量的文本內(nèi)容和文檔結(jié)構(gòu)。整個(gè)科技報(bào)告的內(nèi)容都比較完整,噪聲存在的可能性非常少,而且企業(yè)擁有清晰的文檔結(jié)構(gòu),可以根據(jù)不同的研究對(duì)文檔進(jìn)行分割;③科技報(bào)告的題名等能夠準(zhǔn)確的反映全文的內(nèi)容特征。3.2.2數(shù)據(jù)加工本文研究的實(shí)證數(shù)據(jù)來(lái)源于國(guó)家科技圖書文獻(xiàn)信息中心數(shù)據(jù)庫(kù),選擇“微博放大器”和“功率放大器”領(lǐng)域,檢索的條件為題名、關(guān)鍵詞以及文摘,檢索時(shí)間截止到2013年12月30日,經(jīng)過(guò)相關(guān)篩選得出446篇科技報(bào)告文學(xué)。但是由于我國(guó)科技報(bào)告的數(shù)據(jù)庫(kù)功能相對(duì)還有許多不完善的地方,因此無(wú)法直接實(shí)現(xiàn)已經(jīng)分割的特征元數(shù)據(jù),需要人工將下載的文檔數(shù)據(jù)進(jìn)行數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)預(yù)處理以及數(shù)據(jù)格式化。數(shù)據(jù)轉(zhuǎn)換我們都知道就是講下載的文檔轉(zhuǎn)化為模板的數(shù)字形式;數(shù)據(jù)預(yù)處理主要包括:特殊符號(hào)的歸一化處理,比如將文檔中的一些符號(hào)進(jìn)行刪除處理,實(shí)現(xiàn)字符的統(tǒng)一性,比如對(duì)阿拉伯?dāng)?shù)字進(jìn)行刪除保證相關(guān)數(shù)據(jù)被系統(tǒng)認(rèn)可、對(duì)文檔中的一些停用詞進(jìn)行抽取,而對(duì)于抽取的詞匯則用分隔符“;”代替、根據(jù)科技報(bào)告的數(shù)據(jù)將其按照年份進(jìn)行劃分,一般以10年為一跨度的原則進(jìn)行劃分。

3.3實(shí)現(xiàn)工具平臺(tái)

到目前為止,針對(duì)LDA主題模型有了很多版本的軟件,本文主要采取Gildable開(kāi)源工具進(jìn)行主題建模,實(shí)現(xiàn)原型系統(tǒng)。Gildable是一種基于Java的版本,其主要采取Gibbs采樣技術(shù)進(jìn)行參數(shù)估計(jì)與推理。

4結(jié)束語(yǔ)

總之,通過(guò)對(duì)電子信息領(lǐng)域內(nèi)技術(shù)進(jìn)行檢測(cè)可以及時(shí)掌握最新的電子信息技術(shù),從而為電子信息技術(shù)的發(fā)展提供具體的發(fā)展細(xì)節(jié),為電子科技人員提供我國(guó)以及世界上先進(jìn)的電子技術(shù)科研成果,提高電子信息技術(shù)相關(guān)文獻(xiàn)的利用價(jià)值,是對(duì)電子信息領(lǐng)域監(jiān)測(cè)的主要任務(wù)與使命,通過(guò)對(duì)電子信息領(lǐng)域的建模監(jiān)測(cè)技術(shù)可以促進(jìn)我國(guó)電子信息技術(shù)的不斷發(fā)展。

作者:楊虎單位:甘肅工業(yè)職業(yè)技術(shù)學(xué)院

主站蜘蛛池模板: 一区在线免费 | 亚洲二区在线视频 | 婷婷激情丁香 | 日本免费高清一区 | 丁香五六月婷婷 | 中文欧美日韩 | 午夜看片在线 | 中文字幕理论电影 | 亚洲第一页乱 | 在线观看网址你懂的 | 第一福利视频网 | 亚洲欧美在线视频观看 | www亚洲欲色成人久久精品 | 最近高清中文字幕大全免费1 | 羞羞视频在线免费观看 | 色久月 | 成人久久久 | 日日综合 | 操三八男人的天堂 | a级毛片在线免费 | 久久高清一区二区三区 | 欧美一级久久久久久久久大 | 自拍偷拍欧美图片 | www.av视频在线观看 | 看逼影院| 国产福利一区二区在线观看 | 中文字幕在线精品视频入口一区 | 亚洲午夜视频在线 | 国产片欧美片亚洲片久久综合 | 亚洲日本韩国欧美 | 夏娃的诱惑之吻 | 中国精品视频一区二区三区 | 一区二区三区高清在线观看 | 羞羞视频在线免费 | 99视频精品全部免费免费观 | 欧美一级久久久久久久久大 | 国产福利一区在线 | 成人午夜性影院视频 | 国产成人精品日本亚洲直接 | 国产成人精品免费久久久久 | 亚洲国产一区二区三区a毛片 |