本站小編為你精心準備了談免疫原理下紙質資源差異性需求參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:[目的/意義]針對需采集評價體系指標數據進行二次處理的傳統紙質資源評價方法,提出一種基于免疫原理的差異性需求實時提取模型。[方法/過程]對借閱記錄分類號編碼,進行連續位匹配陰性選擇,系統將生存期內達到活化閾值的需求提交確認,得到紙質資源采購需求庫。[結果/結論]經驗證,該方法能及時發現用戶新需求,模型應用較傳統方法實時有效。
關鍵詞:紙質資源;差異性;用戶需求;免疫原理
引言
隨著網絡技術和用戶終端技術的快速發展,網絡承載的信息量不斷擴大,閱讀也呈現泛在化趨勢,但是這并不代表紙質資源可以消亡。紙質資源憑借著對客戶端的零投入、零依賴、隨時隨地,成為圖書館讀者不可取代的資源獲取方式。在高校評估的各種體系指標中,都有對紙質圖書的具體要求。[1]如何采購到讀者需要的紙質資源是一個值得探討的課題。要了解隨著專業建設和熱點不斷變化的紙質圖書使用情況,就需要對用戶群體借閱中新增需求進行實時跟蹤。[2]傳統的資源評價方法通常是通過建立評價指標集,采用直接問卷調查法或模糊綜合評價和層次分析法(AHP)[3]對所采集的評價體系指標數據進行處理。這些方法能夠較好地對資源使用情況進行綜合評價,但是卻無法及時發現用戶的實時需求變化。差異性用戶需求提取就是對新產生的不符合預期需求的用戶特征進行提取,以便分析當前紙質資源使用用戶的新需求。本文提出一種基于免疫原理的紙質資源差異性用戶需求提取的新方法。該方法借鑒自然免疫系統識別“自我”和“非我”的原理,將符合預期的用戶群體特征作為“自我”,不符合預期的新增用戶群體特征作為“非我”,通過圖書分類號非我選擇等機制實現紙質資源差異性用戶需求的快速檢測提取。
1基于免疫原理的差異性用戶需求識別
1.1差異性用戶需求識別中應用的免疫機制
在生物免疫系統中,病原體包括病毒、細菌等對人體有害的物質。面對病原體對人體的入侵,人類進化出了適應的、多樣的、分布的維持生存和健康的機制,這就是免疫系統。免疫系統最為關鍵的機制,在于機體了解病原體特征,能夠識別“自我”和“非我”。目前,我們考慮在紙質資源差異性用戶需求識別中借鑒的免疫原理有[4]:(1)決定簇序列識別機制。生物多樣性由其所構成蛋白分子的結構決定。氨基酸序列的排列組合,構成平面或三維空間的決定簇。決定簇的各種組合表達了正常細胞受體模式。(2)多樣性受體編碼模式?;驇炀幋a重排,生成所有可能的多樣性受體,從而產生對每一種病原體進行特異性識別的受體。這是一種全覆蓋的多樣性模式編碼方法。(3)高度局部化的陰性選擇檢測機制。生物體淋巴細胞針對病原體抗原產生免疫反應,淋巴細胞在識別受體后通過陰性選擇過程,將識別的自身抗原淋巴細胞程序性死亡,保留非自身抗原的識別,并采用局部產生局部處理的分布式即時方式。
1.2編碼設計紙質資源的差異性
用戶需求提取模型,設計了以紙質圖書中圖分類號為分子結構的“抗原庫”。用于差異性特征識別的抗原由ILAS圖書自動管理系統中紙質圖書流通借閱記錄中的分類號編碼組成。中圖分類法第一大類為A~Z,總計22個。按二進制編碼方式,總計長度5位(如表1所示)。在中圖法第二級分類中,一般范圍為0~9,僅T類(工業技術)的二級分類為B~V,最多個數為16個,依次為00001~10000,長度為5位;第三級、第四級分類均為0~9,共10個小類,依次為0001~1010,長度均為4位;第五級、第六級、第七級分類均為1~9,共9個小類,依次為0001~1001,長度均為4位。綜上,在該模型中紙質圖書中圖分類號編碼長度共計30位。[5]
1.3基于免疫原理的差異性
需求提取模型設計在紙質資源差異性用戶需求提取中,我們研究了Forrest,Hofmeyr小組基于免疫機制的入侵檢測模型。[6]紙質資源用戶需求抗原庫為最近T天內借閱記錄中,中圖分類法分類號按上述二進制編碼的定長為l(本模型為30位)的集合S.檢測子與抗原的特異性互補判斷,是以定長l位的連續位匹配函數來模擬。設p是判斷2個二進制位串連續位是否匹配函數,r為最小連續位匹配長度,F為長度為l的所有二進制中圖分類號編碼字符串集合。[7-8]基于免疫原理的差異性需求提取模型結構如圖1所示。設r=30,進行全位匹配。當有紙質資源新需求分類號記錄出現時,就會有通過陰性選擇過程的成熟陰性檢測子{d│d∈F,坌s∈S,p(d,s)=0}生成。將產生的差異性陰性檢測子識別的有效需求模式元記錄放入“記憶需求集”中,并分布于圖書自動化管理系統。我們給“記憶需求集”定義一個生存周期,如果在生存周期中,某個模式元計數達到成熟活化閾值lim時,系統發出識別差異性用戶需求信號,由紙質資源采購人對系統需求信號進行確認后,該差異性用戶圖1基于免疫原理的差異性需求提取模型結構需求模式進入紙質資源采購需求庫,明確為誤報的模式元直接舍棄。若采購人在“記憶需求集”生存周期中,未對模式元進行回應,那么新產生的模式元將取代“記憶需求集”中出現時間最早的記錄。設置動態“記憶需求集”的作用在于發現學科專業建設及技術發展對紙質資源最新持續性遞增的真實需求,排除紙質資源臨時突發的“一次性”需求。
2模型系統搭建及實現
2.1系統結構
基于免疫原理的紙質資源差異性用戶需求提取模型,對流通分類號進行七級分類編碼,通過連續位匹配函數陰性選擇,對生存周期中活化需求進行記錄,最終形成紙質資源采購需求庫。我們在VisualStudio.NET2008環境中,使用C#編程語言,實現了模型主要功能。對分類號編碼模式元均采用字符串類型string,對七級分類編碼表的第一級和第二級由于其特殊性,采用字符串數組進行定義,第三級至第七級為“0”到“9”可通過計算依次遞增編碼。其中第一級和第二級特殊編碼數組定義,如圖2所示。分類編碼中的第一級和第二級長度為5位,第三級至第七級長度為4位。逐位取分類號,通過查找記錄編碼位置,用C#函數Convert.ToString()轉換為對應的二進制編碼,對于位數不足的情況,定義函數privatestringfillZero(stringstr,intlocation),在高位用“0”進行填充。將實時的圖書流通分類號編碼后,與近期流通分類號編碼集合進行字符串比對string.Compare(),有差異的需求進入記憶需求集,對生存周期進行判斷,在生存周期的模式元計數加1,達到活化閾值后提交采購人,確認后的結果放入紙質圖書采購需求庫。
2.2模型應用
在VisualStudio.NET2008環境中,模擬最近120天內紙質圖書借閱記錄集為抗原庫,生存周期為30天,模式元活化閾值為100,進行紙質資源差異性用戶需求提取。在達到設置標準后,模型發出信號,顯示預期的編碼模式元及所屬分類號,提交采購人確認(見圖3),確認后的結果進入采購需求庫(見圖4)。在模型運行期間,正值全國職業院校技能大賽廣東賽區信息安全管理與評估、電子產品芯片級檢測維修與數據恢復和互聯網金融賽項進行階段,其中TP393.08計算機網絡安全、TP309.3數據備份與恢復、F830.49信息化與新技術的應用,是我校參賽項涉及的主要參考紙質資源。根據運行結果,基于免疫原理的紙質資源差異性需求模型能自動識別新產生的不符合預期的階段持續性用戶特征,發現讀者的實時需求變化,形成有效的需求集。
3結語
針對紙質資源需求識別需要采集評價體系指標數據進行二次處理的傳統方法,本文研究了免疫原理中的識別機制、編碼模式和選擇檢測機制,對紙質圖書流通借閱記錄中的分類號進行編碼建模,進行連續位匹配陰性選擇,系統將生存期內達到活化閾值的需求提交確認,得到紙質資源實時采購需求庫。該方法能及時發現用戶紙質資源新需求,無需再次收集分析評價指標數據,提高了紙質資源需求獲取的時效性和文獻采訪的有效性。
參考文獻
[1]趙勇,李晨英.高校圖書館紙質資源建設效率評價方法研究:基于教育部高校圖書館事實數據庫統計指標的實證分析[J].圖書館建設,2012(6):26-30.
[2]朱前東.美國高校圖書館資源發現系統評價實踐與分析:以美國2所高校圖書館為例[J].國家圖書館學刊,2015(1):94-99.
[3]邵然.基于層次分析法的圖書館數字資源服務質量評價體系構建[J].圖書館學刊,2017(3):25-28.
[4]周光炎.免疫學原理[M].3版.北京:科學出版社,2013:14,405.
[5]輯委員會國家圖書館中國圖書館分類法.中國圖書館分類法[M].5版.北京:國家圖書館出版社,2010:18,1019.
[8]趙俊忠,黃厚寬,田盛豐.免疫機制在計算機網絡入侵檢測中的應用研究[J].計算機研究與發展,2003(9):1293-1299.
作者:伍星 張俊威 單位:深圳信息職業技術學院圖書館