本站小編為你精心準備了統(tǒng)計視域下文獻資源的選擇參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
1背景及問題
高等學校中英文圖書數(shù)字化國際合作計劃項目———CADAL項目,是“十五”期間“211工程”公共服務(wù)體系建設(shè)的重要組成部分。該項目由國家投資,同時還得到了美國合作方投入的相當于1000萬美元的軟硬件系統(tǒng)支持,項目的英文名稱因而被確定為China-AmericaDigitalAcademicLibrary,簡稱CADAL。該項目與中國高等教育文獻保障系統(tǒng)(CALIS)一起,共同成為中國高等教育數(shù)字圖書館建設(shè)的重要組成部分。目前正在進行二期項目的建設(shè)準備工作,CADAL美術(shù)資源數(shù)字化項目是CADAL二期項目的分支,是以中國美術(shù)學院圖書館(以下簡稱我館)的美術(shù)資源為基礎(chǔ),聯(lián)合國內(nèi)其他美術(shù)院校圖書館,對涵蓋文字、圖像和影音信息的美術(shù)資源進行大規(guī)模、系統(tǒng)化的數(shù)字化建設(shè),是CADAL二期擬建設(shè)的子項目之一。美術(shù)作品數(shù)據(jù)庫(群)的建設(shè)是其核心內(nèi)容,即將館藏的美術(shù)作品原件、高仿畫、文物、畫冊等視覺資源數(shù)字化,建設(shè)成國畫、油畫、版畫、雕塑、書法、篆刻、建筑等數(shù)據(jù)庫(群),同時,實現(xiàn)數(shù)據(jù)庫(群)的統(tǒng)一檢索。CADAL美術(shù)資源數(shù)字化項目的建設(shè)目的是為美術(shù)專業(yè)教學、科研提供豐富的圖像資源[1]。
建設(shè)美術(shù)資源數(shù)據(jù)庫,需要對美術(shù)資源進行前期的調(diào)研。由于該數(shù)據(jù)庫是針對圖像作品而言,并不是書籍的整合,所以對畫冊中的美術(shù)作品進行選擇、甄別是數(shù)據(jù)庫建設(shè)中的重中之重。但是由于館藏畫冊數(shù)量龐大,每本畫冊所含美術(shù)作品數(shù)量不一,且不同的畫冊會出現(xiàn)交叉的美術(shù)作品,所以影響到美術(shù)作品的統(tǒng)計。
在這一背景下,筆者做了一系列的調(diào)研,發(fā)現(xiàn)同行對這一問題研究甚少,由于這一問題對CADAL的開展極為重要,故筆者試著從統(tǒng)計學的方法來分析、刪選美術(shù)作品。
2利用統(tǒng)計學方法選擇美術(shù)資源
2.1統(tǒng)計學方法及馬太效應(yīng)
統(tǒng)計學是應(yīng)用數(shù)學的一個分支,主要通過利用概率論建立數(shù)學模型,收集所觀察系統(tǒng)的數(shù)據(jù),進行量化的分析、總結(jié),并進而進行推斷和預測,為相關(guān)決策提供依據(jù)和參考。它被廣泛地應(yīng)用在各門學科之上,從物理和社會學科到人文學科,甚至被用到工商業(yè)及政府的情報決策之上[2]。
我們這里應(yīng)用到了統(tǒng)計學的分支———文獻統(tǒng)計分析,運用定性與定量相結(jié)合的方法來選擇美術(shù)畫冊中的美術(shù)作品。由于涉及的文獻樣本是美術(shù)文獻,這里做樣本分析的是外國油畫作品,所以需要對外國油畫作品的畫冊做個分析。
外國油畫作品也遵循了馬太效應(yīng)。馬太效應(yīng)(MatthewEffect),是指好的愈好,壞的愈壞,多的愈多,少的愈少的一種現(xiàn)象。1968年,美國科學史研究者羅伯特·莫頓(RobertK.Merton)提出這個術(shù)語用以概括一種社會心理現(xiàn)象,歸納“馬太效應(yīng)”為:任何個體、群體或地區(qū),一旦在某一個方面(如金錢、名譽、地位等)獲得成功和進步,就會產(chǎn)生一種積累優(yōu)勢,就會有更多的機會取得更大的成功和進步。就外國油畫作品而言,也存在這一現(xiàn)象,即越是著名的畫家,其著名的美術(shù)作品被重復出版的機會就越多,越是不出名的畫家,其美術(shù)作品被重復出版的機會就越少,這樣就出現(xiàn)了同樣的美術(shù)作品被重復出版多次的問題。故對這些美術(shù)作品做一定的刪選,就需要結(jié)合統(tǒng)計學的方法得以解決。
2.2美術(shù)文獻資源的選擇
本文將以我館館藏的外國油畫家作品為例來進行美術(shù)文獻資源的選擇。
2.2.1取得外國油畫家的美術(shù)作品總數(shù)
第一步,求出外國油畫家畫冊(中圖分類號為J233)中所含的美術(shù)作品平均量。按照書籍厚薄、所含美術(shù)作品多少為原則,分別選取10本具有一定代表性的外國油畫家畫冊,統(tǒng)計其美術(shù)作品總數(shù)及每畫冊的平均美術(shù)作品數(shù),其結(jié)果見表1。均每本畫冊所含美術(shù)作品約為98幅。
第二步,查詢館藏外國油畫家畫冊總數(shù)。通過圖書館公共檢索系統(tǒng)得出本館外國油畫家畫冊總數(shù)為3806冊。這里需要注明,本館已經(jīng)把所有的紙質(zhì)畫冊電子化,并且要求復本數(shù)據(jù)合并,即系統(tǒng)所查的每條數(shù)據(jù)就針對一種畫冊,多個重復的復本畫冊,都在一條數(shù)據(jù)中反映。
第三步,求出館藏外國油畫家的美術(shù)作品總數(shù),即把步驟一與步驟二的數(shù)據(jù)相乘得出外國油畫家的美術(shù)作品總數(shù)為372988幅。
2.2.2建立模型
根據(jù)采購記錄、編目記錄及閱覽流通的實際經(jīng)驗,我館館藏外國油畫家畫冊大致可分為3種,且不同類型分別有不同的比例。A類(藏書量大、作品重復次高的著名油畫家畫冊)約占本類別藏書量的60%;B類(藏書量居中、作品重復次中等的油畫家畫冊)約占本類別藏書量的35%;C類(藏書量小、作品重復量低或沒有重復的油畫家畫冊)約占本類別藏書量的5%。
2.2.3求出美術(shù)作品總數(shù)
按照外國油畫家的美術(shù)作品總數(shù)及其外國油畫家的畫冊在館藏中不同比例,可以大致推導出在不排除全部藏書種類中的圖片交叉重復采用的前提下,3種類型的油畫家畫冊中所含的美術(shù)作品總數(shù)如下:A類(藏書量大、作品重復次高的著名油畫家畫冊)的美術(shù)作品總數(shù)為:372988×60%=223792幅;B類(藏書量居中、作品重復次中等的油畫家畫冊)的美術(shù)作品總數(shù)為:372988×35%=130545幅;C類(藏書量小、作品重復量低或沒有重復的油畫家畫冊)的美術(shù)作品總數(shù)為:372988×5%=18649幅。
2.2.4統(tǒng)計不重復的圖片量
首先建立一個假設(shè),即假設(shè)館藏的美術(shù)作品中都有一個外國油畫家作品全集,此全集作品囊括了該畫家的所有油畫作品。故凡是同一個外國油畫家,出現(xiàn)了N次,他的作品都可被認為是重復了N次他的作品全集。建立這個假設(shè)方便進行下面的推導。為排除美術(shù)作品的重復量,我們對3種不同類型的油畫家畫冊分別選取了3個樣本,每個樣本分別選取10位油畫家(見表2),然后在我館的電子資源中查詢油畫家的相關(guān)數(shù)據(jù)數(shù)。以此推導出3種類型美術(shù)作品的平均被重復次數(shù)。
A類的重復次數(shù)為26.9次。B類、C類以同樣的方式取得不同的重復次數(shù),即B類的重復次數(shù)為4.4次,C類的重復次數(shù)為1次。在此基礎(chǔ)上,將3種類型油畫家美術(shù)作品總數(shù)分別除以3個平均重復次數(shù),從而得出3種類型美術(shù)作品量(即沒有重復的美術(shù)作品)為:A類8320幅、B類29669幅、C類18649幅,總幅數(shù)為56638幅。
2.2.5補充其他因素以完備數(shù)據(jù)的真實性
由于以上推導模型是基于理想的模型而產(chǎn)生,故需要補充排除在外的作品圖片量,最終推導出全部藏書中的真實圖片數(shù)。如一些美術(shù)作品不是以個人形式出版,以合集等其他形式出版;還有就是上面的假設(shè)是完全重復,現(xiàn)實中有一些是沒有被完全重復的美術(shù)作品。基于這點,從館藏的實際情況出發(fā),發(fā)現(xiàn)除了C類,由于選定的都是零重復的美術(shù)作品,故不存在遺漏的美術(shù)作品,其他A類和B類都有。這些被忽略的圖片數(shù)根據(jù)不同類型也有不同的比例。其中A類被忽略的大致占圖片總數(shù)(排除重復后)的15%(即1248幅),B類被忽略的大致占圖片總數(shù)的10%(即2967幅)。綜合以上所有數(shù)據(jù),得出外國油畫作品為60853幅,即我館所藏美術(shù)資料中一共包含60853幅美術(shù)作品。
3結(jié)語
從以上推導中,我們可以發(fā)現(xiàn),統(tǒng)計學在美術(shù)文獻資源的選擇中發(fā)揮了很大的作用,這里面應(yīng)用了很多統(tǒng)計學的原理,同時也考慮到馬太效應(yīng)。這一推導模型需要不斷地推導研究才能完善,筆者希望以此拋磚引玉,以求有更好的方法來解決這個問題。