Folksonomy及其國(guó)外研究進(jìn)展:國(guó)外白發(fā)研究進(jìn)展

        發(fā)布時(shí)間:2020-03-07 來源: 散文精選 點(diǎn)擊:

          〔摘要〕闡述了folksonomy的概念與分類原理,指出了其與傳統(tǒng)分類法的不同。分析了folksonomy在類目結(jié)構(gòu)、信息組織、信息資源揭示等方面的優(yōu)勢(shì)以及在語義表達(dá)、語法控制、語義普遍認(rèn)知方面的劣勢(shì)。從存在價(jià)值、基于tag的定量分析、用戶定量分析、系統(tǒng)設(shè)計(jì)與應(yīng)用、缺陷解決措施以及檢索等六個(gè)方面系統(tǒng)介紹了folksonomy的國(guó)外研究進(jìn)展。
          〔關(guān)鍵詞〕folksonomy 網(wǎng)絡(luò)信息分類法 tag
          〔分類號(hào)〕G254.11 TP393
          
          Folksonomy and Related Research Progress in Some Advanced Countries
          Yu Jinxiang
          School of Economics and Management, South China Normal University, Guangzhou510006
          〔Abstract〕This paper firstly expounds the conception and the classification principles of folksonomy, and points out the differences between folksonomy and the traditional classification methods. Then, it analyzes folksonomy"s advantages on its category structure, information organization, information resources disclosure and disadvantages on semantics expression, grammar controlling and semantics cognition. At last, the paper introduces foreign research progress of folksonomy systematically from the aspects of the value of existing, the quantitative analysis based on tag, user quantitative analysis, system design and application, flaw solution measures and retrieval technologies.
          〔Keywords〕folksonomy internet information classification tag
          
          1引言
          
          Folksonomy是由folks和taxonomy組合而來,folks在英文中是比較口語化的詞,表示一群人、一伙人的意思,taxonomy是指分類法,它是信息架構(gòu)中的重要部分。Folksonomy是指一種社群參與人運(yùn)用自由定義tag(標(biāo)簽)的方式進(jìn)行協(xié)作分類的活動(dòng),主要機(jī)制是基于開放性元數(shù)據(jù)標(biāo)準(zhǔn)和自然語言的社群聚類,現(xiàn)有“分眾分類法”、“通俗分類法”、“大眾分類法”、“民眾分類法”等不同翻譯。分類的原理為向社群參與者提供一種協(xié)同構(gòu)建與共享各自網(wǎng)絡(luò)資源標(biāo)簽的開放式平臺(tái),用戶通過自己制定的分類標(biāo)準(zhǔn)來提交tag,由用戶群體定義tag的頻率來決定信息的組織方式。這種標(biāo)簽包括網(wǎng)絡(luò)內(nèi)容的分類、大意與鏈接地址等,tag對(duì)每個(gè)人都是完全開放的,用戶可以自由查看并修改自己提交的標(biāo)簽。
          Folksonomy與傳統(tǒng)網(wǎng)絡(luò)信息分類法最大的不同在于它并不采用嚴(yán)格的分類標(biāo)準(zhǔn),其分類全部由用戶直接提交,分類的形成過程完全是自發(fā)的。這種分類是平面化的,沒有等級(jí)層次的劃分,雖然它相對(duì)不夠嚴(yán)謹(jǐn),缺乏準(zhǔn)確度,但是在社會(huì)性軟件中,這種平面延伸的分類方法卻在無形之中成為了方便、靈活、不受條件限制地溝通渠道。所以以自定義標(biāo)簽形式的大眾分類在現(xiàn)下流行的社會(huì)性網(wǎng)絡(luò)服務(wù)中得到了廣泛的應(yīng)用,如:Flickr、Furl、Del.icio.us、Frassle、Simpy、Spurl、Technorati、FotoFlix、Simpy、OpenBM等。應(yīng)該說,國(guó)內(nèi)對(duì)于folksonomy的研究還處于初步階段,因此,了解國(guó)外的研究對(duì)于國(guó)內(nèi)的研究和實(shí)踐具有非常重要的意義。
          
          2Folksonomy的優(yōu)劣勢(shì)分析
          
          2.1Folksonomy的優(yōu)勢(shì)
          2.1.1平面化、非等級(jí)結(jié)構(gòu)的類目結(jié)構(gòu)傳統(tǒng)分類法具有嚴(yán)密的等級(jí)結(jié)構(gòu)和邏輯體系,folksonomy則是平面的、非等級(jí)的。一些門戶網(wǎng)站和搜索引擎對(duì)信息的組織一般采用類目細(xì)分的方式來進(jìn)行分類,如果分類體系過多,會(huì)增加網(wǎng)民的認(rèn)識(shí)負(fù)擔(dān)、影響檢索效率;如果分類體系過少,則會(huì)影響分類體系的清晰度,增加網(wǎng)民瀏覽選擇的負(fù)擔(dān)[1]。而folksonomy通過tag的字號(hào)大小以及顏色的不同來表示其“受歡迎”的程度,能夠?qū)崿F(xiàn)快速而自動(dòng)的信息聚類,生成系列加權(quán)列表和標(biāo)簽總圖(TagCloud),具有較強(qiáng)的大眾趨同性,直觀性和易用性強(qiáng)。
          2.1.2低成本的信息組織方式Adam提出網(wǎng)絡(luò)信息資源的組織有三種方式:由圖書館ICP服務(wù)商和其他信息機(jī)構(gòu)提供的檢索目錄、作者創(chuàng)建元數(shù)據(jù)、用戶交流和共享產(chǎn)生的信息描述。folksonomy通過用戶共享元數(shù)據(jù)來實(shí)現(xiàn)合作分類和交流,相對(duì)于前兩種信息組織方式而言,無需預(yù)先編制、維護(hù)和學(xué)習(xí)龐大的分類體系表,也無需掌握專門的圖書館領(lǐng)域?qū)I(yè)技術(shù)方法和專業(yè)培訓(xùn),能夠節(jié)省用戶的時(shí)間和精力[2]。
          2.1.3多維度揭示信息資源 作為folksonomy類目的tag,它既不同于關(guān)鍵詞、也不同于目錄和主題詞。Tag是對(duì)文章概括和理解基礎(chǔ)上產(chǎn)生的,是對(duì)內(nèi)容的個(gè)人理解上的私人標(biāo)注,未必針對(duì)主題,可能是時(shí)間、內(nèi)容或與文章主題無關(guān)的詞匯,因此標(biāo)簽的設(shè)定要比關(guān)鍵詞自由和方便,它可以從多個(gè)維度來揭示信息內(nèi)容。在以目錄為基礎(chǔ)的存儲(chǔ)體系中,目錄結(jié)構(gòu)必須要事前規(guī)劃,而tag可以不考慮目錄結(jié)構(gòu)并以較少的代價(jià)細(xì)化分類。folksonomy的類目是由用戶定義一個(gè)或幾個(gè)tag組成,沒有明確定義tag之間的關(guān)系,各個(gè)tag之間的關(guān)系是平等的,但是又可以根據(jù)相關(guān)性分析,將經(jīng)常一起出現(xiàn)的tag關(guān)聯(lián)起來,而產(chǎn)生一種相關(guān)性的分類,它不像傳統(tǒng)分類法和分類表,有多重明確的關(guān)系。此外,它還能解決傳統(tǒng)分類法更新慢,不能及時(shí)面對(duì)新出現(xiàn)的學(xué)科和專業(yè)術(shù)語的問題。
          2.2Folksonomy的劣勢(shì)研究
          狹義的分類是以嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)邏輯為線索,以學(xué)術(shù)信息的匯集、樹立和查詢?yōu)槟康,以學(xué)術(shù)為軸心,而tag是以個(gè)人的感性邏輯即個(gè)人的知識(shí)、情感、意志、記憶、素養(yǎng)等綜合素質(zhì)的反應(yīng)為線索,以個(gè)人所需信息的匯集、梳理和查詢?yōu)槟康模詡(gè)人的經(jīng)驗(yàn)為基礎(chǔ)[3]。但是,對(duì)于他人或是整個(gè)分類體系而言,folksonomy是模糊的,不精確的,隨意的。此外,同名異義的問題也導(dǎo)致了它的模糊性:①一詞多義產(chǎn)生的意義分歧。②縮略詞產(chǎn)生的問題:例如在一些社會(huì)性書簽網(wǎng)站中,“ANT”是社會(huì)學(xué)領(lǐng)域“Actor Network Theory”的縮寫,但是在del.icio.us中,它卻是Java編程語言中的一種工具。
          Folksonomy缺乏同義詞、英文單復(fù)數(shù)控制以及標(biāo)題、詞語順序等語法控制。同時(shí),folksonomy的中文運(yùn)用問題上還存在著分詞結(jié)構(gòu)模糊;在不同的語言環(huán)境下,對(duì)語義的普遍認(rèn)知存在明顯差異的問題;垃圾標(biāo)簽的出現(xiàn)使宏觀標(biāo)簽總圖的準(zhǔn)確性下降,對(duì)垃圾信息和標(biāo)簽的合理使用還沒有行之有效的解決方法[4]。
          目前,folksonomy的使用范圍有限,這種分類法的組織對(duì)象基本上是非學(xué)術(shù)的、面向生活的、公眾的,目前僅限于blog等社會(huì)性網(wǎng)站的組織和管理,而這部分信息在網(wǎng)絡(luò)信息空間中僅是微量部分。由于受語言、風(fēng)俗習(xí)慣、文化背景等的影響,在跨國(guó)界、跨時(shí)空、跨文化的信息組織和交流中仍然存在很多障礙,作為一種基于自然語言產(chǎn)生的新的網(wǎng)絡(luò)信息組織方式,folksonomy仍然存在許多的問題。
          
          3國(guó)外folksonomy研究進(jìn)展
          
          國(guó)外對(duì)folksonomy理論方面的研究始于2005年,通過對(duì)國(guó)外文獻(xiàn)的閱讀和分析,筆者認(rèn)為國(guó)外對(duì)folksonomy的研究主要集中在以下6個(gè)方面:
          3.1Folksonomy存在價(jià)值的研究
          自由分類法這一概念的產(chǎn)生晚于它的應(yīng)用,最初的討論集中在其存在價(jià)值的研究:Admam認(rèn)為folksonomy將取代以往由專家控制的元數(shù)據(jù)編輯管理;Clay認(rèn)為folksonomy是有勝于無的方案;Shelly認(rèn)為傳統(tǒng)分類法過于復(fù)雜,維護(hù)成本高;Louis認(rèn)為folksonomy缺乏檢索功能、精確性不強(qiáng)。
          3.2基于tag的定量分析
          Lambiotte采用了概率論和數(shù)學(xué)建模的方法對(duì)專業(yè)音樂網(wǎng)站數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)使用tag描述在線合作性分類產(chǎn)成了由不同結(jié)點(diǎn)即用戶、款目和標(biāo)簽構(gòu)成的三重網(wǎng)絡(luò)。其次,通過分析用戶使用款目和tag之間的關(guān)系分析了這三個(gè)要素構(gòu)成的無序網(wǎng)絡(luò)。再次,采用過濾技術(shù)來分析用戶的合作性行為,認(rèn)為網(wǎng)絡(luò)的等級(jí)結(jié)構(gòu)產(chǎn)生了對(duì)用戶類型的統(tǒng)計(jì)定義,提取了合作性過濾和分類之間的直接連接關(guān)系并提出了合作性社群中測(cè)量用戶多樣性的方法[5]。
          Christopher通過對(duì)Technorati中排名前350的tag以及分享同一tag文章的相似性進(jìn)行定量研究,分析了blog標(biāo)簽分類的有效性。發(fā)現(xiàn)tag在粗略的分類體系中是有效的,但是在表明特殊的文章內(nèi)容時(shí)是無效的,tag與自動(dòng)抽詞高度相關(guān),可以高度聚焦分類文章。討論了未來tag成為信息組織和檢索工具更加有效的方法:更具表達(dá)力和簡(jiǎn)潔性、易用tag的形成;用戶對(duì)tag分群,tag間特定關(guān)系的闡釋,tag與特定的人或物相關(guān);產(chǎn)生幫助用戶自動(dòng)形成文章tag的工具;標(biāo)簽發(fā)展為社會(huì)現(xiàn)象的興趣研究等[6]。
          3.3基于用戶的定量分析
          Ciro采用統(tǒng)計(jì)學(xué)和概率論的方法對(duì)del.icio.us和Connotea中的tag進(jìn)行了統(tǒng)計(jì)分析,構(gòu)架了用戶使用合作性標(biāo)簽的隨機(jī)模型,該模型包含兩個(gè)要素:對(duì)于他人標(biāo)記活動(dòng)感知的用戶偏好機(jī)制以及系統(tǒng)中tag的時(shí)效性。盡管用戶個(gè)體的認(rèn)知過程是復(fù)雜的,個(gè)體的分類、標(biāo)記標(biāo)簽的行為是錯(cuò)綜復(fù)雜的,但是在合作性標(biāo)簽系統(tǒng)內(nèi),用戶普遍的標(biāo)記行為卻遵循著簡(jiǎn)單的活動(dòng)模式[7]。
          Scott采用模型和圖表研究了用戶使用合作性標(biāo)簽系統(tǒng)的規(guī)律以及合作性標(biāo)簽系統(tǒng)的結(jié)構(gòu)、使用標(biāo)簽的頻率、各種標(biāo)簽的應(yīng)用、相關(guān)標(biāo)簽使用的穩(wěn)定性的分析,認(rèn)為tag反映了用戶興趣的發(fā)展變化[8]。
          3.4系統(tǒng)的設(shè)計(jì)及應(yīng)用研究
          Cameron建立了基于資源、用戶和標(biāo)簽的網(wǎng)絡(luò)標(biāo)簽?zāi)P,然后?2個(gè)標(biāo)簽系統(tǒng)為例,設(shè)計(jì)了標(biāo)簽系統(tǒng)的模塊和系統(tǒng)屬性,這些模塊為:使用標(biāo)簽的權(quán)限、標(biāo)簽的聚集、標(biāo)簽支持/供給、資源的類型、來源、資源的鏈接、群體在系統(tǒng)中的連通性。分析了用戶添加tag時(shí)的7種動(dòng)機(jī)即未來檢索、貢獻(xiàn)和分享、注意力的吸引、競(jìng)爭(zhēng)、自我表現(xiàn)、觀點(diǎn)表達(dá)等以及這7種動(dòng)機(jī)對(duì)標(biāo)簽系統(tǒng)的不同影響,并在flicker中進(jìn)行了實(shí)驗(yàn)。該標(biāo)簽系統(tǒng)為開發(fā)者和設(shè)計(jì)者提供了基于tag的模型設(shè)計(jì)和基本思路[9]。
          Satoshi Niwa認(rèn)為,由于難以收集用戶偏愛網(wǎng)頁的數(shù)據(jù)、因特網(wǎng)上的網(wǎng)頁數(shù)量龐大,通過協(xié)作性過濾來構(gòu)建網(wǎng)頁評(píng)價(jià)體系的嘗試存在一定困難,提出了通過正在流行的folksonomy和社會(huì)性書簽工具來構(gòu)建覆蓋整個(gè)網(wǎng)絡(luò)網(wǎng)頁評(píng)價(jià)系統(tǒng)的方法[10]。
          多倫多大學(xué)Jennifer和美國(guó)丹佛藝術(shù)博物館Bruce提出博物館的收藏支持社會(huì)性書簽,并且提供基于folksonomy的檢索,這給開放的博物館一種新的闡釋[11]。
          Darlene指出對(duì)于內(nèi)部網(wǎng)而言,通過標(biāo)簽可以自由分享未曾發(fā)現(xiàn)的數(shù)字資源。通過賓夕法尼亞大學(xué)圖書館的Penn Tags的社會(huì)性書簽服務(wù)項(xiàng)目和哈佛大學(xué)Berkman互聯(lián)網(wǎng)社會(huì)研究中心的H20 Playlist項(xiàng)目以及IBM引入folksonomy理念開發(fā)的企業(yè)社會(huì)性書簽工具dogear來說明站點(diǎn)管理員可以試著使用多種社會(huì)性軟件來支持標(biāo)簽活動(dòng)并指出標(biāo)簽活動(dòng)可以消除信息分類者和員工對(duì)信息理解的分歧[12]。
          3.5Folksonomy缺陷解決措施研究
          日本學(xué)者從認(rèn)知學(xué)雙循環(huán)滿意原則即及時(shí)滿意和延時(shí)滿意的角度來解決folksonomy信息質(zhì)量、信息分享問題,并且針對(duì)分類法的非連續(xù)性和同名義意的問題提出了解決辦法,并且提出了基于元數(shù)據(jù)的個(gè)人本體框架[13]。
          Louis提出元數(shù)據(jù)生態(tài)學(xué)的概念,基本思想為:設(shè)計(jì)合理的元數(shù)據(jù),建立可控的、動(dòng)態(tài)發(fā)展的元數(shù)據(jù)詞匯表,同時(shí)鼓勵(lì)作者和用戶創(chuàng)造folksonomy詞匯,并作為受控詞表收詞的備選,與受控詞表一起構(gòu)建和諧的網(wǎng)絡(luò)信息組織環(huán)境[14]。
          3.省略網(wǎng)站和美味書簽中進(jìn)行了URLCount和URLRank、TagCount以及TagRank和UserRank檢索結(jié)果的比較和分析[15]。
          Andreas研究了folksonomy的信息檢索問題,構(gòu)建了folksonomy的模型和FolkRank檢索機(jī)制,并采用這種新的檢索運(yùn)算法則來研究folksonomy的結(jié)構(gòu)。采用FolkRank運(yùn)算法則計(jì)算了特定主題的排序,并且比較了FolkRank和PageRank間的不同[16]。
          Al-KhalifaScott通過測(cè)量folksonomy和yahoo關(guān)鍵詞設(shè)置的重疊率以及索引者主觀評(píng)價(jià)兩種系統(tǒng)產(chǎn)生的關(guān)鍵詞的質(zhì)量,來對(duì)基于相同網(wǎng)站的yahoo API文本語詞抽取技術(shù)和folkson-omy進(jìn)行評(píng)價(jià)[17]。
          
          4結(jié)語
          
          Folksonomy作為一種出現(xiàn)不久的網(wǎng)絡(luò)信息組織方法,缺乏重量級(jí)的應(yīng)用,對(duì)其研究還需進(jìn)一步加強(qiáng)。了解國(guó)外folksonomy的最新研究概況,汲取國(guó)外構(gòu)建各種模型、tag系統(tǒng)時(shí)的經(jīng)驗(yàn)和研究方法,對(duì)促進(jìn)我國(guó)folksonomy的研究將有積極的促進(jìn)意義。
          2005年5月10日國(guó)內(nèi)博客網(wǎng)站blogbus首次推出tag功能并與專業(yè)搜索引擎Technorati整合,標(biāo)志著folksonomy理念進(jìn)入中國(guó)并逐步被采用。雖然目前使用或知道tag的網(wǎng)民還主要限于網(wǎng)上博客,標(biāo)簽軟件的應(yīng)用標(biāo)準(zhǔn)等尚待完善,folksonomy尚需后受控手段與受控語言的融合,但網(wǎng)民卻接受了這種“有勝于無”的方案。在Web2.0時(shí)代,每個(gè)人都有權(quán)自由獲取、組織和使用信息,而folksonomy作為反映草根文化和民間力量的信息組織方式,為用戶提供了一個(gè)契機(jī),它將促進(jìn)全球信息的分享、交流乃至文化融合、世界大同的共有理念的形成。
          
          參考文獻(xiàn):
          [1] 周榮庭,鄭彬.分眾分類:網(wǎng)絡(luò)時(shí)代的新型信息分類法.現(xiàn)代圖書情報(bào)術(shù),2006(3):72-75.
          [2] 梁桂英,李記旭.folksonomy初探.圖書館雜志,2006(4):46-49.
          [3] tag-我分類.[2006-6-25].http://www.省略/maozixi-ansheng/.
          [4] Folksonomy與語言的關(guān)系以及中文應(yīng)用的問題.[2006-06-25].http://blog.省略.
          [5] Lambiotte R, Ausloos M. Collaborative tagging as a tripartite network.[2006-08-15].省略/abs/cs.DS/0512090.
          [6] Brooks C H, Montanez N. An analysis of the effectiveness of tagging in blog.[2006-08-15].http://www.cs.usfca.edu.
          [7] Cattuto C, Loreto V,Pietronero L. Collaborative tagging and semiotic dynamics.[2006-08-15].省略/.
          [8] Golder S A, Huberman B A. The structure of collaborative tagging systems.[2006-08-15].省略/
          [9] Marlow C. Tagging paper, taxonomy, flickr, academic article,to read.[2006-08-15].http://www.省略.
          [10] Niwa S, Doi T, Honiden S. Web page recommender system based on folksonomy mining for ITNG?6 Submissions.[2006-08-15].http://ieeexplore.省略/.
          [11] Trant J, Wyman B. Investigating social tagging and folksonomy in art museums withsteve.museum.[2006-08-15].http://www.省略.
          [12] Fichte D. Intranet applications for tagging and folksonomies.[2006-08-20].http://www.省略.
          [13] Ikki Ohmukai, Masahiro Hamasaki, Hideaki Takeda. A Proposal of Community-based Folk-sonomy with RDF Metadata.[2006-08-15].http://www.ifi.unizh.ch/.
          [14] Rosenfeld L. Folksonomies? How about metadata eco1ogies7.[2006-08-15].http://www.省略.
          [15] Szekely B, Torres E. Ranking bookmarks and bistros:Intelligent community and folksonomy development.[2006-08-15].http:/ /torrez.us/.
          [16] Hotho A, Jaschke R, Schmitz C, et al. Information retrieval in folksonomies:search and ranking.[2006-08-15].http://www.kde.cs.
          [17] Al-Khalifa H S, Davis H C. Folksonomy versus autionmatic keywaord extraction: an empirical study.[2006-08-15].http://eprints.ecs.soton.ac.uk/.
          
          〔作者簡(jiǎn)介〕 余金香,女,1983年生,碩士研究生。

        相關(guān)熱詞搜索:研究進(jìn)展 國(guó)外 Folksonomy Folksonomy及其國(guó)外研究進(jìn)展 國(guó)外自由基研究進(jìn)展 國(guó)外基坑研究新進(jìn)展

        版權(quán)所有 蒲公英文摘 www.zuancaijixie.com
        91啦在线播放,特级一级全黄毛片免费,国产中文一区,亚洲国产一成人久久精品