社會(huì)對(duì)00后的標(biāo)簽_社會(huì)標(biāo)簽進(jìn)展研究概述
發(fā)布時(shí)間:2020-03-10 來(lái)源: 幽默笑話 點(diǎn)擊:
[摘要]近年來(lái),社會(huì)標(biāo)簽的發(fā)展非常迅速,在信息組織和信息構(gòu)建領(lǐng)域有著廣泛的應(yīng)用。社會(huì)標(biāo)簽的進(jìn)展主要?dú)w納為兩個(gè)方面:①在各個(gè)領(lǐng)域中的應(yīng)用進(jìn)展;②與傳統(tǒng)知識(shí)組織體系的關(guān)系探討和融合研究。社會(huì)標(biāo)簽與知識(shí)組織體系的融合模式主要分為三種:①兩者之間直接進(jìn)行映射;②從分類表中抽取上下級(jí)關(guān)系和相關(guān)關(guān)系;③將分面分類的理論與方法移植到社會(huì)標(biāo)簽上,達(dá)到對(duì)標(biāo)簽詞的組織和呈現(xiàn)。
[關(guān)鍵詞]社會(huì)標(biāo)簽 大眾分類 法研究進(jìn)展 信息組織
[分類號(hào)]G250.76
作為Web2.0環(huán)境下的一個(gè)核心構(gòu)件,社會(huì)標(biāo)簽自從產(chǎn)生后就得到了大眾的廣泛關(guān)注。圖書館、博物館等信息組織領(lǐng)域和計(jì)算機(jī)、信息構(gòu)建等信息技術(shù)領(lǐng)域的學(xué)者都對(duì)社會(huì)標(biāo)簽產(chǎn)生了濃厚的興趣。目前,國(guó)內(nèi)外對(duì)社會(huì)標(biāo)簽的概念仍然沒(méi)有一個(gè)統(tǒng)一的定義,國(guó)外社會(huì)標(biāo)簽(social tagging)等同于folksonomy,coHabo-rative tagging,social classification,social indexing。在我國(guó)被稱為大眾分類法、公眾分類法、民俗分類法和合作標(biāo)注等。
1 社會(huì)標(biāo)簽概念、類型
1.1社會(huì)標(biāo)簽的概念
學(xué)者們普遍認(rèn)同社會(huì)標(biāo)簽是由用戶產(chǎn)生的、對(duì)網(wǎng)絡(luò)內(nèi)容進(jìn)行組織和共享的自下而上的組織分類體系。一些學(xué)者側(cè)重對(duì)其分類屬性的認(rèn)識(shí),如Folksonomy詞匯的創(chuàng)造者Thomas Vander Wal認(rèn)為一個(gè)標(biāo)簽既是對(duì)一個(gè)實(shí)體的描述,也是一個(gè)分類的過(guò)程。Halpin和Mathos也持同樣的觀點(diǎn),認(rèn)為社會(huì)標(biāo)簽是一種用來(lái)解決網(wǎng)絡(luò)分類問(wèn)題的新興方法。一些學(xué)者則比較側(cè)重其元數(shù)據(jù)的本質(zhì),Golder,Scott和Huberman,Bemar-do A認(rèn)為社會(huì)標(biāo)簽是用戶以關(guān)鍵詞的形式來(lái)添加元數(shù)據(jù),以達(dá)到共享內(nèi)容的過(guò)程。還有一些學(xué)者將社會(huì)標(biāo)簽作為一種社會(huì)索引方法,認(rèn)為其是對(duì)手工索引的一種復(fù)興,因?yàn)樯鐣?huì)標(biāo)簽系統(tǒng)允許用戶用自由關(guān)鍵詞手工標(biāo)注電子資源,并將社會(huì)標(biāo)簽認(rèn)為是由用戶而非專業(yè)索引者創(chuàng)造的主題標(biāo)目。
1.2社會(huì)標(biāo)簽的類型
通過(guò)對(duì)收集的標(biāo)簽詞進(jìn)行分析,可以總結(jié)出標(biāo)簽的不同分類。Maths在2004年指出,標(biāo)簽的種類包括:技術(shù)、文學(xué)體裁、自組織、地點(diǎn)名、年代、顏色、圖片詞匯和一些對(duì)自我有意義的詞匯。同年,Partington經(jīng)過(guò)分析也給出了他建議的標(biāo)簽類型,如媒體、主題、文學(xué)體裁、名稱和地點(diǎn)。2005年Golder,Scott和Huber-man,Bemardo A也對(duì)社會(huì)標(biāo)簽系統(tǒng)的結(jié)構(gòu)進(jìn)行了探討,歸納了社會(huì)標(biāo)簽的7個(gè)類型,分別是識(shí)別主題內(nèi)容的標(biāo)簽、關(guān)于內(nèi)容載體的標(biāo)簽、確定是誰(shuí)創(chuàng)建的標(biāo)簽、用于分類提煉的標(biāo)簽、確定有內(nèi)容特色的標(biāo)簽、用于自我參考的標(biāo)簽和用戶任務(wù)組織的標(biāo)簽。
2 社會(huì)標(biāo)簽的總體進(jìn)展概述
2.1社會(huì)標(biāo)簽的應(yīng)用進(jìn)展研究
自從2004年社會(huì)標(biāo)簽產(chǎn)生以后,研究社會(huì)標(biāo)簽的文獻(xiàn)幾乎呈指數(shù)型增長(zhǎng)。無(wú)論是在圖書館、計(jì)算機(jī)領(lǐng)域,還是在教育、企業(yè)、商業(yè)和社會(huì)傳媒領(lǐng)域,對(duì)社會(huì)標(biāo)簽的研究和應(yīng)用都備受矚目。Gene Smith將社會(huì)標(biāo)簽定位在三個(gè)重要領(lǐng)域的交叉部分,這三個(gè)領(lǐng)域是:信息構(gòu)建、社會(huì)軟件和個(gè)人信息管理。社會(huì)標(biāo)簽的應(yīng)用研究主要集中在社會(huì)標(biāo)簽在圖書館信息服務(wù)、圖書館編目、博物館、企業(yè)以及教育領(lǐng)域如e-learning中的應(yīng)用情況與分析。應(yīng)用實(shí)例如:賓夕法尼亞大學(xué)開發(fā)了一個(gè)社會(huì)標(biāo)簽工具Penny Tags,用來(lái)方便校園用戶對(duì)感興趣的資源進(jìn)行定位、組織和共享;密歇根州安阿伯地區(qū)圖書館將社會(huì)標(biāo)簽首次引進(jìn)到OPAC中,用戶在其網(wǎng)站注冊(cè)后,便可以進(jìn)行編目,編目時(shí)可以用關(guān)鍵詞的形式對(duì)一些資源對(duì)象賦予標(biāo)簽。
2.2社會(huì)標(biāo)簽與知識(shí)組織體系的融合研究
社會(huì)標(biāo)簽和知識(shí)組織體系的融合集成一直是社會(huì)標(biāo)簽領(lǐng)域的研究熱點(diǎn)和難點(diǎn),如何將社會(huì)標(biāo)簽這種自下而上的組織體系與傳統(tǒng)的自上而下的知識(shí)組織體系進(jìn)行融合,很多學(xué)者對(duì)此進(jìn)行了理論與實(shí)踐的探討,德國(guó)學(xué)者Katrin Weller和Isabella Peters認(rèn)為知識(shí)組織體系和社會(huì)標(biāo)簽之間界限模糊,社會(huì)標(biāo)簽可以采用一些知識(shí)組織體系的指導(dǎo)原則,可以用一些詞匯控制和語(yǔ)義的元素來(lái)進(jìn)行補(bǔ)充豐富。同時(shí),社會(huì)標(biāo)簽還為逐步創(chuàng)建語(yǔ)義豐富的知識(shí)組織體系提供了基礎(chǔ),因?yàn)樗梢跃珶挳?dāng)前的分類表、敘詞表和本體。而為了解決諸如Fliekr這樣的社會(huì)標(biāo)簽系統(tǒng)中標(biāo)簽檢索的問(wèn)題,JosefKolbitsh開發(fā)了WordFlickr,提出了基于使用語(yǔ)義術(shù)語(yǔ)數(shù)據(jù)庫(kù)WordNet來(lái)擴(kuò)展查詢標(biāo)簽的方法,當(dāng)用戶向WordFlickr提交檢索時(shí),可以選擇相關(guān)關(guān)系或上下級(jí)類目關(guān)系用來(lái)擴(kuò)充他們的原始檢索。傳統(tǒng)的知識(shí)組織體系如敘詞表存在著更新不及時(shí)的問(wèn)題,而社會(huì)標(biāo)簽則顯示出其強(qiáng)大的新詞接納能力和無(wú)限的詞匯擴(kuò)展能力,可以作為對(duì)傳統(tǒng)知識(shí)組織體系的一種有力的補(bǔ)充方法。Louis Rosenfeld認(rèn)為社會(huì)標(biāo)簽與詞表、分類法這種傳統(tǒng)的知識(shí)組織體系不是非此即彼的關(guān)系,最好的方法是將兩者結(jié)合使用,共同形成一種和諧的元數(shù)據(jù)生態(tài)。在教育資源領(lǐng)域內(nèi),Vuorikari,Riina也持同樣觀點(diǎn),他認(rèn)為在學(xué)習(xí)資源領(lǐng)域的社會(huì)標(biāo)簽與傳統(tǒng)的學(xué)習(xí)對(duì)象元數(shù)據(jù)(LOM)共同形成了一個(gè)教育資源領(lǐng)域內(nèi)的“元數(shù)據(jù)生態(tài)”(metadata ecology),以此來(lái)形象地表達(dá)社會(huì)標(biāo)簽與傳統(tǒng)KOS之間的相互補(bǔ)充關(guān)系。
2.2.1 社會(huì)標(biāo)簽與詞表的比較研究 對(duì)社會(huì)標(biāo)簽和傳統(tǒng)知識(shí)組織體系的融合進(jìn)行研究時(shí),先要研究它們各自的詞語(yǔ)特點(diǎn);若要兩者進(jìn)行融合,必須先要進(jìn)行比較分析研究。一般的比較方法是從社會(huì)標(biāo)簽系統(tǒng)中抽取一定數(shù)量的用戶標(biāo)簽詞,然后選擇一個(gè)詞表,采取人工或者機(jī)器的方式,將兩者進(jìn)行匹配分析,查看兩者之間的詞匯重疊率。Robert Bruce研究了教育資源信息中心(Education Resources Information Center,ERIC是基于教育研究的,可用于檢索書目引文和文摘的在線索引)中期刊的索引詞和基于社會(huì)標(biāo)簽的網(wǎng)站Citell―Like中的標(biāo)簽詞兩者之間的重疊度,結(jié)果顯示兩者之前有著很低的重疊度。Lin等人比較了分配給有關(guān)醫(yī)學(xué)的期刊文章的受控詞表和社會(huì)標(biāo)簽,受控詞表選用了PubMed的醫(yī)學(xué)主題詞表Mesh,社會(huì)標(biāo)簽選擇了Connotea網(wǎng)站,兩者均有45個(gè)文檔被索引。結(jié)果顯示540個(gè)Cormotea標(biāo)簽詞中有11%與Mesh相匹配。通過(guò)對(duì)社會(huì)標(biāo)簽和詞表的比較分析,既可以發(fā)現(xiàn)標(biāo)簽詞的一些特點(diǎn),如社會(huì)標(biāo)簽詞的分布符合長(zhǎng)尾理論等,也可以為下一步標(biāo)簽和詞表之間的映射做前期準(zhǔn)備。但需要引起注意的是選取不同的社會(huì)標(biāo)簽系統(tǒng)和不同的詞表進(jìn)行比較,比較的結(jié)果可能會(huì)有一些出入。如CiteULike系統(tǒng)的標(biāo)簽詞可以包括字母、數(shù)字、連字符和下劃線,但是不可以包括空格。這樣對(duì)英文短語(yǔ)的 標(biāo)簽詞如social tagging,就只能處理成socialtagging或者是social-tagging,在進(jìn)行詞匯匹配時(shí),這一點(diǎn)要特別注意。也就是說(shuō)對(duì)數(shù)據(jù)處理的方法不同,比較結(jié)果可能會(huì)出現(xiàn)偏差。但總的來(lái)說(shuō),用戶的社會(huì)標(biāo)簽詞與受控詞表之間的匹配度較低,用戶比較傾向于使用自由的、符合自己語(yǔ)言習(xí)慣的詞語(yǔ)來(lái)標(biāo)注資源。
2.2.2社會(huì)標(biāo)簽與詞表的映射研究 經(jīng)歷了社會(huì)標(biāo)簽和詞表的比較研究后,對(duì)社會(huì)標(biāo)簽與傳統(tǒng)知識(shí)組織體系的融合進(jìn)入了正式的實(shí)踐階段。很多研究者都從理論上認(rèn)為社會(huì)標(biāo)簽可以和詞表進(jìn)行融合,詞表可以從社會(huì)標(biāo)簽中得到新詞解決詞表的更新問(wèn)題,而將兩者關(guān)聯(lián)的最直接方法就是建立社會(huì)標(biāo)簽與詞表之間的映射,但對(duì)此問(wèn)題的研究一直停留在理論階段。2009年,美國(guó)肯塔基大學(xué)的Kwan Yi和Lois Mai Chan進(jìn)行了一項(xiàng)探索性研究,用映射的方法將社會(huì)標(biāo)簽和國(guó)會(huì)圖書館的主題詞表相連接。目的是想通過(guò)國(guó)會(huì)圖書館主題詞表(LCSH)為社會(huì)標(biāo)簽帶來(lái)一定的等級(jí)結(jié)構(gòu)關(guān)系,研究基于詞匯匹配的方法來(lái)連接社會(huì)標(biāo)簽這種用戶詞匯和LCSH這種受控詞匯。社會(huì)標(biāo)簽的數(shù)據(jù)樣本來(lái)自于Delicious網(wǎng)站,他們將LCSH轉(zhuǎn)化成樹狀結(jié)構(gòu),成為L(zhǎng)CSH樹,仔細(xì)檢查社會(huì)標(biāo)簽詞的特點(diǎn),用定量的方法檢查社會(huì)標(biāo)簽詞和主題詞之間的重疊度,然后將標(biāo)簽詞分布到LCSH樹上,實(shí)現(xiàn)連接。實(shí)驗(yàn)的結(jié)果顯示匹配主題詞的標(biāo)簽大約占標(biāo)簽樣本總數(shù)的三分之二,剩下標(biāo)簽中10%存在潛在的匹配可能性。此研究有助于有效檢索被標(biāo)注的網(wǎng)絡(luò)資源,并且可以基于這兩種詞匯,整合多個(gè)社會(huì)標(biāo)簽系統(tǒng)和書目數(shù)據(jù)庫(kù)等。這是對(duì)社會(huì)標(biāo)簽和詞表之間進(jìn)行關(guān)聯(lián)的第一次定量化嘗試,對(duì)日后進(jìn)一步的研究有著重要的指導(dǎo)意義。
2.2.3社會(huì)標(biāo)簽與分類表的研究進(jìn)展 社會(huì)標(biāo)簽的非受控性使其具有扁平化結(jié)構(gòu)的特征,而分類表存在著豐富的等級(jí)關(guān)系和相關(guān)關(guān)系,因此從分類表中抽取詞與詞之間的關(guān)系來(lái)補(bǔ)充和強(qiáng)化社會(huì)標(biāo)簽,將更有利于用戶對(duì)社會(huì)標(biāo)簽的組織,加強(qiáng)社會(huì)標(biāo)簽在異質(zhì)系統(tǒng)中的交互能力以及提高用戶對(duì)社會(huì)標(biāo)簽的檢索效率。2007年9月1日啟動(dòng)的EnTag(Enhanced Tagging for Discovery)項(xiàng)目就在這方面進(jìn)行了嘗試。EnTag項(xiàng)目是由設(shè)在英國(guó)巴斯大學(xué)的英國(guó)圖書館網(wǎng)絡(luò)工程事物所(UKLON,UK Office for Library Networking)領(lǐng)導(dǎo)的,格拉摩根大學(xué)、英國(guó)科學(xué)與科技設(shè)施委員會(huì)(Science and Technology Facilities Coundl,STFC)、英國(guó)免費(fèi)教育和科技研究信息門戶Intute、OCLC研究辦公室等合作展開的。其目標(biāo)是研究在倉(cāng)儲(chǔ)和數(shù)字藏品背景下,結(jié)合受控與folksonomy的方法來(lái)達(dá)到語(yǔ)義互操作的效果。具體目標(biāo)包括:①只使用社會(huì)標(biāo)簽和使用社會(huì)標(biāo)簽結(jié)合受控詞表兩種情況下,對(duì)用戶索引面的研究,細(xì)分為對(duì)讀者進(jìn)行的標(biāo)注和著者進(jìn)行的標(biāo)注這兩種不同情況研究;②在檢索時(shí),只使用社會(huì)標(biāo)簽和使用社會(huì)標(biāo)簽結(jié)合受控詞表的檢索效果比較研究。
筆者認(rèn)為EnTag項(xiàng)目是一個(gè)將社會(huì)標(biāo)簽和知識(shí)組織體系進(jìn)行融合的成功嘗試,因?yàn)閷?duì)社會(huì)標(biāo)簽進(jìn)行組織管理的一個(gè)最大問(wèn)題就是標(biāo)簽詞不受控,如果沒(méi)有有效的組織和檢索方法,只會(huì)產(chǎn)生更多的信息垃圾,并且會(huì)與傳統(tǒng)知識(shí)組織體系相分離,不能在異質(zhì)系統(tǒng)之間進(jìn)行交流。從受控詞表中抽取規(guī)范的標(biāo)簽詞,不僅可以增強(qiáng)標(biāo)簽詞的規(guī)范性,還可以為用戶提供更多的檢索入口,有利于用戶將來(lái)的檢索需要。并且,用戶可以根據(jù)規(guī)范詞減少標(biāo)簽詞諸如單詞拼寫、大小寫等問(wèn)題的出現(xiàn)。但由于此項(xiàng)目是一個(gè)試驗(yàn)項(xiàng)目,項(xiàng)目本身的試驗(yàn)數(shù)據(jù)量很小,如Intute演示平臺(tái)的測(cè)試者是28名學(xué)生,而STFC演示平臺(tái)的測(cè)試者是10名研究人員,因此項(xiàng)目的結(jié)論還有待于進(jìn)一步的分析和驗(yàn)證。另外,筆者利用Intute平臺(tái)進(jìn)行了標(biāo)注,感覺(jué)界面的設(shè)計(jì)還不夠友好,簡(jiǎn)單標(biāo)注界面和增強(qiáng)的標(biāo)注界面容易讓用戶產(chǎn)生混亂,筆者建議可以用不同的顏色或者字號(hào)進(jìn)行兩個(gè)界面的區(qū)別。
2.2.4社會(huì)標(biāo)簽與分面分類法的研究進(jìn)展分面分類理論不僅可以應(yīng)用于對(duì)圖書的分類,還可以應(yīng)用在社會(huì)標(biāo)簽中。將標(biāo)簽詞進(jìn)行分面分類,可以實(shí)現(xiàn)標(biāo)簽的多維度瀏覽和檢索。在這方面的進(jìn)展中,信息建筑師Emanuele Quintarelli、Andrea Resmini和Luca Rosati提出了構(gòu)建一個(gè)位于自上而下和自下而上組織結(jié)構(gòu)之間的中間結(jié)構(gòu),使標(biāo)簽既具有等級(jí)結(jié)構(gòu),又具有分面的屬性,實(shí)現(xiàn)用戶的多維瀏覽、導(dǎo)航和檢索。他們選擇了分類研究組(Classification Research Group,CRG)的分面理論,進(jìn)行了FaceTag項(xiàng)目的研究,該項(xiàng)目定義了資源類型、主題、人員、目的、語(yǔ)言和出版時(shí)間6個(gè)分面。FaceTag的最大特點(diǎn)是實(shí)現(xiàn)了檢索和瀏覽的無(wú)縫化連接,既可以在檢索的時(shí)候看到資源內(nèi)容,也可以在瀏覽的時(shí)候,減少其分面,實(shí)現(xiàn)縮檢。FaceTag提供了一個(gè)多維的、語(yǔ)義密集的標(biāo)注空間,是將分面分類應(yīng)用于社會(huì)標(biāo)簽的一個(gè)探索性嘗試;但是系統(tǒng)原型并沒(méi)有對(duì)外開放,也沒(méi)有相應(yīng)的試驗(yàn)數(shù)據(jù),因此對(duì)其應(yīng)用性和組織效率難以進(jìn)行準(zhǔn)確的評(píng)價(jià)。
3 總結(jié)與展望
以上通過(guò)對(duì)社會(huì)標(biāo)簽在應(yīng)用領(lǐng)域和知識(shí)組織體系領(lǐng)域的進(jìn)展,進(jìn)一步了解了其作為一種新的信息組織方式所帶來(lái)的深刻變化。在應(yīng)用領(lǐng)域,社會(huì)標(biāo)簽將進(jìn)一步擴(kuò)大其影響,使更多的用戶熟悉和使用它。社會(huì)標(biāo)簽與知識(shí)組織體系的融合可以總結(jié)為三種模式:①社會(huì)標(biāo)簽與傳統(tǒng)詞表進(jìn)行映射,即直接用映射的方法將兩者進(jìn)行關(guān)聯(lián),目前來(lái)說(shuō),映射的方法都是先將詞表中的詞組織成樹狀結(jié)構(gòu),然后再以字符匹配的方法進(jìn)行映射;②社會(huì)標(biāo)簽向傳統(tǒng)的分類表中抽取詞匯之間的上下類關(guān)系;③將分面分類的方法應(yīng)用移植到社會(huì)標(biāo)簽上,達(dá)到對(duì)標(biāo)簽詞的組織和呈現(xiàn)。
隨著Web2.0的深入發(fā)展,對(duì)社會(huì)標(biāo)簽的研究也將繼續(xù)的深入和持續(xù)。作為一種新的知識(shí)組織方法,社會(huì)標(biāo)簽必將以其社會(huì)性、廣泛性和易操作性得到廣大用戶的喜愛(ài)和關(guān)注,其在各個(gè)應(yīng)用領(lǐng)域的研究深度和廣度也將進(jìn)一步加強(qiáng)。但社會(huì)標(biāo)簽缺乏語(yǔ)義關(guān)系以及自身存在的一詞多義等問(wèn)題并沒(méi)有很好的解決,所以今后這些問(wèn)題仍將是研究的重點(diǎn)和難點(diǎn)。
相關(guān)熱詞搜索:概述 進(jìn)展 標(biāo)簽 社會(huì)標(biāo)簽進(jìn)展研究概述 標(biāo)簽研究報(bào)告 關(guān)聯(lián)數(shù)據(jù)研究進(jìn)展概述
熱點(diǎn)文章閱讀