[國內(nèi)機構(gòu)知識庫研究文獻的可視化分析] 機構(gòu)知識庫與文獻管理領(lǐng)導者

        發(fā)布時間:2020-03-10 來源: 日記大全 點擊:

          摘要:利用信息可視化工具CiteSpace對CSSCI數(shù)據(jù)庫收錄的2004-2010年國內(nèi)機構(gòu)知識庫研究文獻進行分析:根據(jù)被引期刊分析確定該領(lǐng)域核心研究期刊,依據(jù)作者一機構(gòu)共現(xiàn)分析尋找該領(lǐng)域主要研究力量并介紹各團隊研究重點;通過對關(guān)鍵點文獻的分析反映知識網(wǎng)絡(luò)形成與演進過程;以關(guān)鍵詞時區(qū)視圖揭示各階段研究熱點及其變化情況,并介紹主要研究成果:
          關(guān)鍵詞:機構(gòu)知識庫 CiteSpace 可視化分析
          分類號:G250
          1、引言
          機構(gòu)知識庫(institutional repositories,簡稱IR),又稱機構(gòu)庫、機構(gòu)倉儲、機構(gòu)典藏庫,是收集、存放由某個或多個學術(shù)機構(gòu)(例如大學、研究所、圖書館、博物館等)專家、教授、學生創(chuàng)造的、可供機構(gòu)內(nèi)外用戶共享的學術(shù)文獻的數(shù)據(jù)庫,最早于2004年出現(xiàn)在國內(nèi)研究文獻中。隨著機構(gòu)知識庫的發(fā)展與文獻數(shù)量的不斷增加,有必要對研究現(xiàn)狀進行歸納總結(jié)。目前已有一些相關(guān)綜述出現(xiàn),但這些研究大都基于傳統(tǒng)的文獻計量方法,沒有結(jié)合一些實用的分析呈現(xiàn)工具,其結(jié)果在可理解性與通俗性方面存在不足。利用信息可視化方法則能彌補這一缺陷。信息可視化是指將大量的數(shù)據(jù)、信息和知識轉(zhuǎn)化為人們可以直觀、形象理解的圖形或圖像,從而可以直觀、形象地表現(xiàn)、解釋、分析、模擬、發(fā)現(xiàn)或揭示隱藏在數(shù)據(jù)和信息內(nèi)部的特征與規(guī)律,提高人類對事物的觀察、記憶和理解能力及整體概念的形成。本文利用CiteSpace可視化分析軟件,結(jié)合當前比較熱門的科學計量學方法對已有研究進行梳理,繪制該領(lǐng)域知識圖譜,力求揭示國內(nèi)機構(gòu)知識庫研究的知識網(wǎng)絡(luò)與研究熱點演進,以供參考。
          2、數(shù)據(jù)來源與研究方法
          以中國社會科學引文數(shù)據(jù)庫(CSSCI)作為來源數(shù)據(jù)庫,分別以“機構(gòu)知識庫”、“機構(gòu)庫”、“機構(gòu)倉儲”、“機構(gòu)典藏”為題名,以2004-2010年為檢索時間段(檢索時間為2011年2月16日,國內(nèi)首篇機構(gòu)知識庫研究文獻發(fā)表于2004年),經(jīng)過查重及不相關(guān)處理后,得到文獻130篇。
          
          分析工具采用陳超美博士開發(fā)的CiteSpacet軟件,并利用劉勝波博士開發(fā)的轉(zhuǎn)換工具將CSSCI數(shù)據(jù)轉(zhuǎn)化為WOS格式。將轉(zhuǎn)換后的數(shù)據(jù)導人CiteSpace,設(shè)置主題詞來源為文獻標題、摘要、關(guān)鍵詞和標識符,“time scaling”為1,即將2004-2010年分為7個時段進行處理。分段處理有利于辨識學科研究的突出拐點和學科前沿的動態(tài)模式,同時提高軟件運行速度和準確度。
          3、可視化分析
          3.1 時間分布
          國內(nèi)機構(gòu)知識庫研究文獻的時間分布曲線見圖1,根據(jù)圖中數(shù)據(jù),可將國內(nèi)機構(gòu)知識庫研究分為三個階段:2004-2005年的引入階段、2006-2007年的探索階段以及2008年之后的快速發(fā)展階段。作為相對較新的一個研究研域,機構(gòu)知識庫在國內(nèi)的發(fā)展勢頭良好,其研究文獻的數(shù)量將繼續(xù)增加。
          3.2 被引期刊分析
          對一個學術(shù)領(lǐng)域做期刊分析能夠確定該學科的核心期刊分布,而對核心期刊的文獻共引頻次的分析則能反映出該期刊所刊登文獻的利用率及其含金量。選擇網(wǎng)絡(luò)節(jié)點類型為“被引期刊(cited journal)”,設(shè)定閾值(1,1,20)、(2,2,20)、(1,1,20),采用最短路徑算法(pathfinder)進行剪裁,生成的被引期刊圖譜如圖2,關(guān)鍵節(jié)點信息如表1所示:
          圖中標簽顯示為“N”的最大節(jié)點代表學位論文,帶有深色邊緣的節(jié)點中心度均大于0.1,是整個網(wǎng)絡(luò)中的關(guān)鍵節(jié)點。通過圖2和表1數(shù)據(jù)可以看出,學位論文在被引頻次和中心度上都居于首位,最具學術(shù)價值。其他期刊按中心度由高到低依次為《圖書情報工作》、《中國圖書館學報》、《數(shù)字圖書館論壇》、《圖書館雜志》和《情報資料工作》;另外《大學圖書館學報》在被引頻次和中心度上也相對較高,這些期刊作為機構(gòu)知識庫領(lǐng)域的核心期刊,刊載文獻具有較高參考性。
          
          3.3 主要研究力量分析
          利用CiteSpace的作者與機構(gòu)統(tǒng)計功能,可以繪制作者、機構(gòu)共現(xiàn)圖譜,進而識別該領(lǐng)域的主要研究力量。節(jié)點類型選擇作者(author)與機構(gòu)(institution),數(shù)據(jù)抽取對象為前30,得到機構(gòu)知識庫領(lǐng)域主要研究力量的圖譜,如圖3所示:
          圖3中包含10個經(jīng)過聚類的簇,每個簇代表一個研究團隊,由合著作者(不區(qū)分第一、二作者)及其所在機構(gòu)節(jié)點構(gòu)成,節(jié)點標簽大小由頻次高低決定?梢钥闯觯壳皣鴥(nèi)機構(gòu)知識庫研究已經(jīng)形成比較核心的研究團隊,中國科學院國家科學圖書館、蘭州分館、中國科學院研究生院等機構(gòu)形成以中國科學院為主體的該領(lǐng)域核心研究力量;另外,吉林大學管理學院、南京大學信息管理系和嘉興學院圖書館、廈門大學圖書館等機構(gòu)也是推動該領(lǐng)域發(fā)展的重要力量。通過對每個團隊發(fā)表的文獻進行分析,可以進一步揭示各團隊研究重點及國內(nèi)機構(gòu)知識庫研究力量的整體分布情況(見表2)。
          3.4 知識網(wǎng)絡(luò)分析
          通過CiteSpace可探測和分析學科研究前沿的變化趨勢以及研究前沿與其知識基礎(chǔ)之間、不同研究前沿之間的相互關(guān)系,能夠較為直觀地識別學科前沿的演進路徑及學科領(lǐng)域的經(jīng)典基礎(chǔ)文獻。選擇網(wǎng)絡(luò)節(jié)點類型為“引文(cited reference)”,使用Jaccard系數(shù)進行度量,數(shù)據(jù)抽取對象為前15,得到文獻共被引網(wǎng)絡(luò),經(jīng)Pathfinder算法修剪后如圖4所示:
          圖4顯示了機構(gòu)知識庫研究知識網(wǎng)絡(luò)中的關(guān)鍵節(jié)點,通過對關(guān)鍵節(jié)點文獻進行分析,可以對該領(lǐng)域的發(fā)展與演變有所了解。各關(guān)鍵點信息如表3所示:
          從圖4及表3中可以看出:
          ?吳建中的《圖書館Vs機構(gòu)庫――圖書館戰(zhàn)略發(fā)展的再思考》一文中心度與被引頻次都居于首位,是國內(nèi)機構(gòu)知識庫領(lǐng)域最重要的一篇文獻。文中介紹了國外機構(gòu)知識庫的起源、發(fā)展、定義及影響,提出圖書館應(yīng)與時俱進,重新確立在知識交流中的核心作用。該文為網(wǎng)絡(luò)環(huán)境下圖書館的發(fā)展指明方向,同時揭開了國內(nèi)機構(gòu)知識庫研究的序幕。
          
          ?姜瑞其的《國外機構(gòu)庫發(fā)展概況》分析了機構(gòu)知識庫的資源內(nèi)容、技術(shù)系統(tǒng)和管理方式,并闡明管理系統(tǒng)和資源內(nèi)容的提交過程。通過對具體案例及軟件平臺的介紹與分析,使讀者對機構(gòu)知識庫的理解更加直觀。
          ?董文鴛的《聚集學術(shù)機構(gòu)知識的中心:機構(gòu)庫(Institutjonal Repositorv)探析》分析了機構(gòu)知識庫的起源與特點,根據(jù)國外案例分析機構(gòu)知識庫經(jīng)費預(yù)算與管理,為國內(nèi)機構(gòu)知識庫發(fā)展提供參考。
          ?郭少友的《機構(gòu)庫建設(shè)的若干問題研究》針對模式選擇問題、法律問題及內(nèi)容建設(shè)問題,借鑒國外已有成功經(jīng)驗,從實際情況出發(fā)提出一些建設(shè)性意見,對于國內(nèi)機構(gòu)知識庫的實際建設(shè)具有很強的針對性與指導性。
          ?郭淑艷的《基于開放獲取的機構(gòu)知識庫的研究》詳細介紹了開放獲取和機構(gòu)知識庫理念,并調(diào)查了科研人員提供開放獲取的現(xiàn)狀。該文是國內(nèi)首篇 研究機構(gòu)知識庫的碩士學位論文,通過對相關(guān)理論進行系統(tǒng)梳理,豐富了國內(nèi)機構(gòu)知識庫研究內(nèi)容。
          ?李廣建的《IR:現(xiàn)狀、體系結(jié)構(gòu)與發(fā)展趨勢》則從技術(shù)角度探討了機構(gòu)知識庫系統(tǒng)的結(jié)構(gòu)、功能等內(nèi)容。文中綜合考慮各專用系統(tǒng)、開源軟件及商業(yè)系統(tǒng),抽象出機構(gòu)知識庫系統(tǒng)模型,具有普適性。另外,其對于機構(gòu)知識庫發(fā)展趨勢的探討也可供借鑒。
          ?其他。還有一些重要文獻,如:常唯的《機構(gòu)知識庫:數(shù)字科研時代一種新的學術(shù)交流與知識共享方式》分析了機構(gòu)知識庫在數(shù)字科研環(huán)境中對知識創(chuàng)造、轉(zhuǎn)化與共享的積極作用;袁順波的《機構(gòu)庫的起源、影響及圖書館的應(yīng)對策略》探討了機構(gòu)知識庫對學術(shù)機構(gòu)、傳統(tǒng)出版模式和學術(shù)交流體系以及圖書館的影I響,提出圖書館應(yīng)對策略。這些文獻與關(guān)鍵點文獻共同為國內(nèi)機構(gòu)知識庫研究奠定了理論基礎(chǔ),通過這些文獻即可對機構(gòu)知識庫研究進行整體了解。同時,文獻共被引分析結(jié)果也顯示,被引文獻中超過一半來自國外,這一方面說明我國機構(gòu)知識庫研究人員比較關(guān)注國外最新成果,能夠緊隨國際趨勢,但另一方面也反映我國機構(gòu)知識庫研究尚未形成自身特點與優(yōu)勢,有待加強。
          3.5 研究熱點分析
          關(guān)鍵詞在一篇文章中所占的篇幅雖然不大,但卻是文章的核心與精髓,是文章主題的高度概括和凝練,因此對文章的關(guān)鍵詞進行分析,頻次高的關(guān)鍵詞常被用來確定一個研究領(lǐng)域的熱點問題。選擇網(wǎng)絡(luò)節(jié)點類型為關(guān)鍵詞(keyword),數(shù)據(jù)抽取對象設(shè)置為前30,將結(jié)果以時區(qū)視圖(tinlezone)顯示,得到圖5。
          3.5.1 研究熱點演進分析
          由圖5可知:
          ?2004年除“機構(gòu)庫”外尚未出現(xiàn)其他關(guān)鍵詞,因為這一年僅有一篇文章《圖書館VS機構(gòu)庫――圖書館戰(zhàn)略發(fā)展的再思考》,但從圖中可以看出,該節(jié)點中心度與頻次都較高,且之后各年研究熱點均與之有連接,是國內(nèi)機構(gòu)知識庫研究的起源。
          ?2005-2006年機構(gòu)知識庫研究文獻數(shù)量有所上升,此時期對機構(gòu)知識庫的研究主要集中在開放獲取運動以及機構(gòu)知識庫在促進學術(shù)交流和知識共享方面的重要意義等方面。而最受人關(guān)注的則是機構(gòu)知識庫對圖書館尤其是高校圖書館和數(shù)字圖書館的影響以及應(yīng)對策略。
          ?2007-2008年是國內(nèi)機構(gòu)知識庫發(fā)展的重要時期,這一階段的研究在數(shù)量以及深度與廣度上都有所突破,機構(gòu)知識庫建設(shè)與應(yīng)用過程中面臨的知識產(chǎn)權(quán)、內(nèi)容收集、質(zhì)量控制以及長期保存等問題成為研究熱點并持續(xù)至今,其研究成果不僅為解決實際問題提供了參考,更推動了這一領(lǐng)域的研究不斷深入。同時,隨著機構(gòu)知識庫的實際建設(shè)工作的逐漸開展,對于各種系統(tǒng)軟件的比較分析以及評估方法也開始受到重視。在構(gòu)建機構(gòu)知識庫的各種商業(yè)軟件及開源軟件中,由美國麻省理工學院圖書館和惠普公司開發(fā)的DSpace系統(tǒng)最受國內(nèi)學者青睞,對該系統(tǒng)功能結(jié)構(gòu)及安裝漢化方法的介紹掀起了另一波研究熱潮,是機構(gòu)知識庫實際建設(shè)中的另一重點。
          ?2009-2010年國內(nèi)對于機構(gòu)知識庫的研究不斷深入,前一階段的研究熱點依然受到人們關(guān)注,同時對臺灣地區(qū)機構(gòu)知識庫建設(shè)以及機構(gòu)知識庫聯(lián)盟的探討也成為這一時期的研究熱點。臺灣地區(qū)機構(gòu)知識庫建設(shè)始于2005年,由臺灣“教育部”委托臺灣大學圖書館進行規(guī)劃,2006年又由臺灣大學圖書館牽頭進行了為期3年的“建置機構(gòu)學術(shù)成果典藏計劃”,經(jīng)過種子學校復制和TAIR聯(lián)盟的建立,臺灣地區(qū)不僅極大地提高了機構(gòu)知識庫數(shù)量,同時增強了學術(shù)研究成果影響力,其機構(gòu)知識庫建設(shè)水平目前處于國際先進水平,其成功經(jīng)驗可以為內(nèi)地提供參考。中國科學院則在機構(gòu)知識庫聯(lián)盟方面進行了豐富的理論研究與實踐。
          3.5.2 研究重點分析通過對國內(nèi)機構(gòu)知識庫研究熱點演進情況的呈現(xiàn)與分析,可以看出版權(quán)問題、內(nèi)容收集和質(zhì)量控制問題最受關(guān)注,同時也是機構(gòu)知識庫研究的難點,下面重點針對這兩個問題進行分析。
          ?版權(quán)問題。機構(gòu)知識庫建設(shè)中面臨的版權(quán)問題主要包括兩個方面:建庫軟件的版權(quán)問題以及收錄資源的版權(quán)問題。前者由于開源軟件的廣泛使用一般不會引起知識產(chǎn)權(quán)糾紛;后者則涉及出版商、作者、機構(gòu)知識庫等多方主體,并根據(jù)收錄資源屬后印本還是預(yù)印本而有所不同。
          對于后印本,由于作品版權(quán)已全部或大部分轉(zhuǎn)屬出版商,版權(quán)問題的處理需從“作者一出版商”和“機構(gòu)知識庫一出版商”兩方面進行。對于前一方面,國外有些組織為作者提供允許其進行自存儲的出版商名錄供其投稿時參考,使文獻發(fā)表后仍可以被收入機構(gòu)知識庫。例如英國諾丁漢大學的ROMEO項目。另外也有學者介紹了能夠在現(xiàn)行出版模式中為作者爭取權(quán)利的“作者補遺模式”。對于后一方面,張曉林提出應(yīng)積極爭取以機構(gòu)名義與本領(lǐng)域主要出版商簽訂保留本機構(gòu)作者存繳與開放傳播權(quán)利的集體協(xié)議,并作為范本供機構(gòu)成員在通過其他出版商發(fā)表論文時使用。中國科學院于2010年10月27日與施普林格科技與商業(yè)媒體集團簽署開放存取合作協(xié)議,允許施普林格所出版期刊的中國科學院作者將所發(fā)表論文的最終審定稿存儲在研究所知識庫中。中國科學院是亞太地區(qū)首家達成這類協(xié)議的機構(gòu)。
          對于預(yù)印本,通常從規(guī)范機構(gòu)知識庫與提交者之間的許可協(xié)議人手。加利福尼亞州立大學圖書館制定的機構(gòu)庫eScholarship Repository協(xié)議被公認為目前最全面的協(xié)議,該協(xié)議規(guī)定了提交人賦予機構(gòu)庫的權(quán)利以及機構(gòu)庫和提交人需要承擔的義務(wù)。有文獻從提交者申明、提交者權(quán)利、機構(gòu)知識庫的權(quán)利和責任以及提交作品的刪除4個方面介紹了機構(gòu)知識庫許可協(xié)議應(yīng)具備的內(nèi)容。創(chuàng)作共用協(xié)議。等開放性協(xié)議的推廣也為解決版權(quán)問題提供了新的途徑。
          ?資源建設(shè)。機構(gòu)知識庫資源建設(shè)由資源收集和質(zhì)量控制兩部分組成。
          ――資源收集。資源收集方式包括分布式、半分布式和集中式三種,從靈活性來看,分布式最優(yōu),集中式最差;從資源收集數(shù)量來看,則集中式最優(yōu),分布式最差。三種方式可以單獨使用,也可以相互結(jié)合。從機構(gòu)知識庫長遠發(fā)展來看,分布式自存儲是最為重要的資源收集方式。影響機構(gòu)知識庫分布式自存儲的因素主要包括:認知度、科研評價、版權(quán)、技術(shù)、政策等因素,解決的策略則可以總結(jié)為:加強宣傳、方便提交、及時溝通、建立科學評價與激勵機制、解決版權(quán)問題、進行質(zhì)量控制以及多方交流合作等。也有學者通過問卷等形式對資源提交者的提交意愿及行為方式進行實證調(diào)查,并提出一些有指導性的意見。文獻運用心理學方法對資源提交者心理進行研究,從新視角探討了機構(gòu)知識庫資源建設(shè)。
          ――質(zhì)量控制。收錄資源的質(zhì)量控制同樣因收集方式而異,半分布式與集中式的質(zhì)量控制相對容易實現(xiàn),而分布式收集資源的質(zhì)量控制則相對較難,也是質(zhì)最控制的主要研究內(nèi)容。文獻提出從元數(shù)據(jù)級和內(nèi)容級進行控制,文獻在此基礎(chǔ)上又加入數(shù)據(jù)訪問質(zhì)量控制,并詳細論述了三個級別的實施策略。文獻則根據(jù)進行質(zhì)量控制的叫機,從預(yù)先控制、過程控制、事后控制三個層次介紹了質(zhì)量控制策略?傮w看來,國內(nèi)對于機十勾知識庫質(zhì)量控制的研究已取得一定成果,但還有待加強。
          4、結(jié)論
          利用信息可視化工具CiteSpace對CSSCI數(shù)據(jù)庫收錄的2004-2010年國內(nèi)機構(gòu)知識庫研究文獻進行分析得到如下結(jié)論:①《圖書情報工作》、《中國圖書館學報》、《數(shù)字圖書館論壇》、《圖書館雜志》、《情報資料工作》以及《大學圖書館學報》6種期刊具有較高中心度及被引頻次,是國內(nèi)機構(gòu)知識庫領(lǐng)域核心研究期刊,刊載文獻具有較高參考價值。同時,相關(guān)的學位論文對于我國機構(gòu)知識庫研究的發(fā)展也起到巨大作川。②中國科學院國家科學圖書館蘭州分館、吉林大學管理學院、中國科學院國家科學圖書館等機構(gòu)的研究團隊構(gòu)成了目前國內(nèi)機構(gòu)知識庫的核心研究力量,且各團隊研究重點有所不同。③《圖書館VS機構(gòu)庫――圖書館戰(zhàn)略發(fā)展的再思考》、《國外機構(gòu)庫發(fā)展慨況》等關(guān)鍵點文獻為機構(gòu)知識庫在國內(nèi)的研究與發(fā)展覽定了,基礎(chǔ),對知識網(wǎng)絡(luò)演進具有重要意義。④機構(gòu)知以庫研究熱點在各個時期有所不同且逐年增多,各熱點的研究成果不斷豐富,推動我國機構(gòu)知識庫研究不斷發(fā)展。但我國機構(gòu)知識庫研究尚未形成自身特點與優(yōu)勢,還有待進一步深入。

        相關(guān)熱詞搜索:可視化 知識庫 文獻 國內(nèi)機構(gòu)知識庫研究文獻的可視化分析 文獻計量可視化分析 文獻可視化分析軟件

        版權(quán)所有 蒲公英文摘 www.zuancaijixie.com
        91啦在线播放,特级一级全黄毛片免费,国产中文一区,亚洲国产一成人久久精品