本站小編為你精心準備了淺談大數據下的信息資源管理創新參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:【目的/意義】根據大數據環境下信息資源管理的特征,對信息資源管理模式進行創新探索,進一步挖掘信息資源深層次價值,實現更健康有效的信息資源載體的支持。【方法/過程】以大數據背景的信息資源特征為基本研究出發點,挖掘數據科學與信息資源管理的關聯,利用數據挖掘和數據分析以及新興的智慧服務,構建較為系統的信息資源管理模式。【結果/結論】通過本文的研究,構建了大數據背景下信息資源管理三種創新模式:①“物聯網+大數據”創新模式;②“數據挖掘技術+信息資源”融合模式;③“技術框架+用戶核心”的信息服務模式,為大數據時代信息資源管理的可持續發展及研究提供知識參考依據。
關鍵詞:大數據;信息資源管理;管理模式;模式創新;智慧服務;融合模式
1引言
伴隨著科學的不斷進步,技術的不斷發展,大數據處理技術與機器學習技術應運而生。大數據中的信息資源被迅速大量的積累,挖掘隱含在大數據信息資源中的潛在隱含的知識具有重要意義。大數據環境下信息資源管理領域的重點主要集中在知識組織、價值發現和精準信息服務等方面。信息資源指數的增長使得用戶難以對信息資源的來源進行準確、高效的提取與利用,最終會導致網絡資源利用率降低。因此,為達到對信息資源更高效利用、用戶得到更為準確有效的信息資源載體的目標,對大數據環境下信息資源管理特點及問題進行分析并提出相應的對策建議變得尤為重要。大數據時代的到來,尤其是數據科學的出現,為信息資源管理帶來了新的機遇與挑戰。機遇主要體現在包括信息資源在內的大數據重新受到廣泛重視,而挑戰在于信息資源管理模式的創新,因此在大數據時代我們需要改變思考模式和研究范式。本文根據大數據背景下信息資源特征,挖掘數據科學與信息資源管理的關聯,并針對性地提出信息資源管理的創新模式。
2大數據背景下信息資源特征
信息資源管理有狹義和廣義之分。狹義的信息資源管理是指對信息本身即信息內容實施管理的過程。廣義的信息資源管理是指對信息內容及與信息內容相關的資源如設備、設施、技術、投資、信息人員等進行管理的過程。大數據產生和發展的特點可以歸納為“4V”,即Volume(海量)、Velocity(高速)、Variety(多樣)、Value(價值)。
2.1數據量大
進入Web2.0時代后,用戶主導而生成的內容互聯網產品模式成為主流,以此生成以人為本的創新2.0模式在互聯網領域的典型體現,是由專業人員織網到所有用戶參與織網的創新民主化進程的生動注釋,由此生成海量的、復雜的數據集合。與此同時伴隨著各種隨身設備、物聯網和云計算、云存儲等技術的發展,人和物的所有軌跡都可以被記錄,數據因此被大量生產出來。互聯網的核心網絡節點由網頁轉化為用戶,每個用戶都成為數據制造者,短信、微博、照片、錄像都是其數據產品;數據來自無數自動化傳感器、自動記錄設施、生產監測等設備,因此大數據的起始計量單位不僅僅是人們現在熟知的G、T,還可能是P(1P=1024T)、E(1E=1024P)或Z(1Z=1024E)這些數量級。大數據的規模尚是一個不斷變化的指標,單一數據集的規模范圍從幾十TB到數PB不等。
2.2速度快速度快,時效性強
大數據最為顯著的一個特點是可以實時地從不斷變化的動態數據中抽取用戶所需要的信息且創建和移動數據的速度較快。在當代高速發展的網絡環境下,軟件性能優化促使了電腦處理器和服務器的升級,可以實現創建實時數據流的目標。信息資源管理不僅包括數據存儲與檢索的過程,還包括數據快速處理、分析數據并反饋給用戶的過程,以滿足用戶的實時需求。大數據的多層結構使得大數據呈現出具有多種形式和類型的特點。其中,數據資源中的業務數據隨時間的推演具備統一標準的格式,這種結構數據可以被專業的數據分析工具識別和分析。和傳統的業務數據相比,大數據環境下的數據資源具有不規則性和模糊性等特點,如何從多種形式結構的復雜數據中挖掘所需要的資源是一個重要挑戰。
2.3數據類型多種多樣
當下,多種類型的數據源產生豐富多樣的額數據類型和格式,早已不拘泥于傳統意義上的結構化數據。數據類型主要包括結構化、半結構化和非結構化數據,其中,半結構化、非結構化數據逐漸占據了數據的主要部分。結構化數據是以二維表結構來實現邏輯表達的數據,其具有嚴格地數據格式與長度規范,可以使信息資源以更為標準化的形式展示在搜索結果中;結構化數據相較于普通純文本結構性更強,在利用和提取方面,用戶可以得到顯著的便利;非結構化數據,是與結構化數據相反的,包括所有格式的辦公文檔、XML、HTML、各類報表、圖片和咅頻、視頻信息等,在全文檢索和各種多媒體信息處理領域被廣泛應用。由于非結構化數據的非限定結構形式,使得這些數據較為靈活且豐富。因此,綜合看來,在信息資源管理中,針對多樣性的數據要求對數據的分析處理能力的方法也要多元化。22.4數據價值面密度低據價值面密度低,精確性不夠用戶所產生的信息中,有價值的信息數據所占比例很小,具有價值密度的高低與數據總量的大小成反比的趨勢。相比于傳統的信息資源管理模式,創新模式應體現在通過從大量不相關的各種類型的數據信息,挖掘出對未來趨勢與模式預測分析有價值的信息,并利用機器學習、人工智能或數據挖掘等方法進行系統分析,挖掘其中的隱含的規律和知識,并在農業、金融、醫療領域進行廣泛的應用,最終達到提升社會治理能力、提高生產效率、推進科學研究效果的目標。同時,來自不同數據源的社交數據、企業內容、交易與應用等數據逐漸興起,信息資源管理的目標重點逐漸轉向保障信息資源的真實性和安全性等方面。
3數據科學與信息資源管理的關聯
3.1數據科學
1974年,著名計算機科學家、圖靈獎獲得者Peter首次明確提出了數據科學(DataScience)的概念:“數據科學是一門基于數據處理的科學”,并提到了數據科學與數據學(Datal⁃ogy)的區別——前者是解決數據(問題)的科學而后者側重于數據處理及其在教育領域中的應用。從圖1中可以看出,數據科學的各組成部分的成熟度不同:R的成熟度最高,已廣泛應用于生產活動;其次是模擬與仿真、集成學習、視頻與圖像分析、文本分析等,它們正在趨于成熟,即將投入實際應用;基于Hadoop的數據發現可能會消失;語音分析、模型管理、自然語言問答等已經度過了炒作期,正在走向實際應用;公眾數據科學、模型工廠、算法市場經濟、規范分析等正處于高速發展期。
3.2數據科學對信息資源管理模式的影響
3.2.1思想意識的影響云計算、物聯網、移動計算等新技術的興起拓展了人們的數據獲取、存儲和計算能力,促使大數據時代的到來,成為數據學科誕生的必要條件。而新技術的應用意味著數據科學對信息資源管理模式的認識發生了根本性變化——不僅開始接受數據的復雜性,而且信息管理的理念從傳統的完美主義轉向現實主義,“數據在先,模式在后或無模式”的信息資源管理范式、BASE原則以及CAP理論等新理念已成為信息科學的基本共識。其次在大數據時代,數據成為一種重要力量,如何組織、挖掘和利用數據成為現代信息組織的核心競爭力,因此開拓大數據思維模式,意識數據的主動屬性,重視數據的積極作用,形成數據驅動型應用、數據業務化、數據洞察和以數據為中心的思維模式
3.2.2信息技術的影響從知識體系看,信息資源管理主要以統計學、機器學習、數據可視化以及(某一)領域知識為理論基礎,主要研究內容包括數據科學基礎理論、數據加工、數據計算、數據管理、數據分析和數據產品開發,如圖2所示。基礎理論主要包括大數據背景下的信息資源管理的新理念、理論、方法、技術及工具等。數據加工是為了提升數據信息質量、降低數據計算的復雜度、減少數據計算量并提升數據處理的精準度,對原始數據進行一定的加工處理工作包括數據審計、數據清洗、數據變換、數據集成、數據脫敏、數據歸約和數據標注等。在大數據背景下,數據信息的計算模式發生了根本性的變化:從集中式計算、分布式計算、網格計算等傳統計算過渡至云計算。數據管理是在完成“數據加工”和“數據計算”之后,還需要對數據進行管理與維護,以便進行“數據分析”以及數據的再利用和長久存儲。數據分析通常以開源工具為主,與傳統數據分析有著較為顯著的差異。目前,R語言和Python語言已成為數據科學家應用較為普遍的數據分析工具。數據產品開發是數據科學的主要研究使命之一,具有以數據為中心、多樣性、層次性和增值性等特征。
3.2.3主要應用場景的影響傳統信息資源管理是在信息資源比較稀缺的時代背景下產生的,其應用場景是信息資源稀缺且被組織機構,例如政府、企業、圖書館等認為是其主要資源。但是,大數據時代的到來改變了信息資源管理理論的主要應用場景。首先在大數據時代,信息與數據不僅僅是一種“資源”,而是已成為“資產”。因此,信息資源管理應將信息資源作為一種“資產”來管理,而不能僅僅停留在“資源”層次的管理。資產和資源的區別在于,前者具有法律權屬、勞動增值、財物價值和可直接市場交易等屬性。因此,信息資源管理不能脫離于其人文、法律、道德、市場、經濟環境。其次,信息和數據不再處于供給不足狀態,開始進入一種富足供給的應用場景。因此,傳統信息資源管理中重視的信息資源搜索、組織和檢索等問題,已經不再是社會關注的主要問題。相反,如何在信息與數據富足供給時代,從大數據中快速洞見有價值的信息,并將其轉換為行動才是新的關注點。因此,信息資源管理的應用場景已從信息資源的“搜索與檢索”轉向“洞見與增值”。最后,人們的信息需求不再局限于文書、文獻、記錄類數據,已拓展至圖像、多媒體、視頻、音頻、富媒體等不同載體的信息資源。傳統信息資源管理在文獻載體類信息的管理方面取得了較大的成就,但是對其他載體類型的信息資源管理研究并不深入。因此,信息資源管理研究的應用場景已從“文獻信息資源”的管理轉向“大數據信息資源”的管理。
4信息資源管理模式創新
4.1“物聯網+大數據”創新模式
物聯網是面向全球的連接物品的信息基礎設施,它是物與物之間、人與物之間的信息交換網絡。繼互聯網之后,物聯網急速擴展,滲透到人們生活的每一個角落。這一模式是由物聯網和大數據等技術為支撐,以此面向信息服務,同時也是信息資源管理的一個重要組成部分。使用智能化設備替代人工,以及替代人工也不容易完成的工作,通過使用物聯網、互聯網、移動互聯網技術,建立起一個智能化,低人工的智慧平臺。該平臺主要由5個部分組成:基礎設施與感知單元、網絡單元、數據處理單元、平臺單元和應用單元。其中,智慧平臺建設最基礎的內容為基礎設施與感知單元,由兩個方面組成,即基礎設施層和感知層。平臺中產生的所有數據信息實體構成了基礎設施層,而感知層的作用則是對各種數據進行識別、采集、監控,其通過芯片、可穿戴設備、傳感器、攝像頭等手段實現這一目標。所獲取的數據通過網絡層傳入平臺,網絡層主要包括物聯網的承載網絡、廣域互聯網、局域網、移動通信網,網絡設備等。網絡層中獲取到的數據由數據層進行管理。技術支持平臺與外部接入平臺組成了平臺層。技術支持平臺的功能主要包括兩方面,一是實現感知系統的數據管理功能,二是執行業務過程中的引擎功能,三是傳輸、處理、轉換業務應用方面的感知數據。其中,外部接入平臺是電子商務中各種信息服務接口與信息系統對接的場所,其功能為實現各平臺信息資源高效的共享與利用。應用層為基礎設施層、網絡層、數據層、平臺層各個部分實現智慧應用的過程。應用層可以實現為用戶提供輔助決策和決策建議的功能,向用戶提供所需要的決策產物。最終,通過“物聯網+大數據”模式提高信息資源管理的智能化與自動化程度,實現信息生態系統的動態平衡。
4.2“數據挖掘技術+信息資源”融合模式
數據挖掘與數據分析是大數據時代下充分利用信息價值的關鍵步驟。利用數據挖掘和智能分析等技術來提煉信息資源內在隱含的價值,以優化信息服務質量。海量的數據及復雜的數據結構,導致用戶搜尋相關信息的能力受到了前所未有的挑戰,用戶在選擇和利用數據的過程中遇到了知識迷航、信息巨量等問題,因此用戶更希望以更加簡潔高效的工具手段準確獲取信息,這就要求結合數據挖掘、云計算和智能分析等大數據技術,在資源組織整合以及信息提供等方面實現高效化和智能化;數據價值密度低給大數據時代信息資源的輸入端帶來巨大的挑戰,因此需要仔細甄別才能挖掘出有效數據以保證數據的真實可靠性,提升數據的利用價值;用戶量陡增及其對信息資源的需求質量不斷嚴苛是輸出端所面臨的問題,因此信息資源管理需要基于用戶需求進行服務模式的轉型。“數據挖掘技術+信息資源”的融合模式中,數據挖掘技術對于難以數字化的數據進行深度提取,發現隱含價值,通過高效利用數據來實現其最大價值。同時,云計算技術利用多個計算機對信息資源進行數字化組織和整合,使得信息的搜尋效率更高,更精確,最終滿足用戶需求,提升用戶體驗。
4.3“技術框架+用戶核心”的信息服務模式
在信息爆炸的背景下,用戶行為數據具有巨大的潛在價值,分析挖掘這些數據可以確定和劃分用戶的行為特征進而實現準確識別和把握用戶需求的目標。根據不同用戶的個性化需求,向其提供有針對性的需求服務。信息資源服務的核心目標是將大數據資源、技術與用戶需求緊密結合,并采用合適的方式提供給用戶。在新型技術框架和用戶核心相結合的服務模式下,秉承以滿足用戶需求、精準信息推送為目標。技術框架由信息資源的信息服務集成創新技術、基于用戶行為數據的信息服務界面創新方法、基于全網輿情數據的信息服務傳遞創新技術三部分組成。信息服務集成創新技術是歸納共性數據源的一種技術,其在跨模態數據創新服務整合的基礎之上,集成所獲取的核心數據集并對其進行綜合分析,創建一種模型和方法將不同領域、不同結構數據按照同一標準融合集成進而提供針對性服務。基于用戶行為數據的信息服務界面創新方法,這種技術可以構建Web挖掘分析模型,主要包括在線服務用戶需求時空分布模型、需求滿足度模型、頁面點擊行為模型、頁面跳轉行為模型、欄目關聯度模型等,根據用戶的個性化需求對服務內容進行改進、通過不同的用戶行為對服務界面進行改進的方法體系。基于全網輿情數據的信息服務傳遞創新技術。這種技術主要由中文信息處理、社會網絡分析、新事件探測、情感分析等輿情分析方法組成,通過指定方法實現信息傳播中的關鍵節點的識別,高效精準的推送服務信息,提升互聯網信息的推動力和影響力[9]。技術框架及以用戶核心相結合的信息服務模式可以挖掘和識別用戶的真實需求,會推動信息服務中以用戶為中心的個性化信息服務的實現。
5結語
本文以大數據背景的信息資源特征為基本研究出發點,挖掘數據科學與信息資源管理的關聯,并針對性地揭示和分析了大數據背景下信息資源管理的三種創新模式:①“物聯網+大數據”創新模式;②“數據挖掘技術+信息資源”融合模式;③“技術框架+用戶核心”的信息服務模式。在信息資源建設和資源服務方面的基礎性研究相對比較成熟的基礎上,充分利用正處于積極探索時期的數據挖掘和數據分析研究范式,以及正處于萌芽期的智慧服務,構建較為系統的管理模式,為大數據時代信息資源管理的可持續發展及研究提供知識參考依據。
參考文獻
1朝樂門,邢春曉,張勇.數據科學研究的現狀與趨勢[J].計算機科學,2018,45(1):1-13.
2葉鷹,馬費成.數據科學興起及其與信息科學的關聯[J].情報學報,2015,(6):575-580.
3孟廣均.信息資源管理導論[M].北京:科學出版社,2008:89-121.
4朝樂門.信息資源管理理論的繼承與創新:大數據與數據科學視角[J].中國圖書館學報,2019,45(2):26-42.
5黃雙穎.大數據環境下網絡信息資源的管理與利用研究[J].科技情報開發與經濟,2014,24(21):102-104.
7屈芳,郭驊.“物聯網+大數據”視閾下的智慧養老模式研究[J].信息資源管理學報,2017,7(4):51-57.
8趙麗梅,張花.我國大數據時代數字圖書館研究前沿分析——基于共詞分析的視角[J].情報科學,2019,37(3):97-104.
9于施洋,王建冬,童楠楠.大數據環境下的政府信息服務創新:研究現狀與發展對策[J].電子政務,2016,(1):26-32.
10崔金棟,杜文強,宋偉杰.信息生態視角下微博信息傳播機理研究——以里約奧運會中國女排奪冠為例[J].情報理論與實踐,2018,41(8):65-71.
11盧小賓,張淑君.我國信息資源管理專業人才培養模式研究[J].情報科學,2011,29(10):1452-1456.
12趙麗梅,張花.我國大數據時代數字圖書館研究前沿分析——基于共詞分析的視角[J].情報科學,2019,37(3):97-104.
13任全娥.大數據背景下的文獻計量學研究進展與學科融合[J].情報理論與實踐,2019,42(1):48-52.
14蔡明燈,聶小武,譚震,張艷.借鑒新加坡圖書館管理模式促進株洲職教城信息資源共享的策略[J].圖書情報工作,2018,62(S1):44-47.
15李月,董慧梅,侯衛真.動態環境下的跨系統信息資源管理模式研究[J].情報資料工作,2016,(2):51-57.
16李明子,丁其祥,陸太寧.基于卡方分析的圖書館非書信息資源管理模式比較研究[J].現代情報,2013,33(11):52-55.
17劉雅瓊.國外高等教育信息資源共享的模式與運行管理[J].圖書與情報,2013,(2):118-123.
18常永平.華東政法大學圖書館特色文獻信息資源創新管理模式的探索[J].上海高校圖書情報工作研究,2013,23(1):1-3.
作者:韓麗華 魏明珠 單位:吉林大學