[認知信息檢索研究的發(fā)展與展望]信息檢索與利用作業(yè)

        發(fā)布時間:2020-03-07 來源: 散文精選 點擊:

          [摘要]剖析認知信息檢索概念和與之相關的幾個重要概念,如認知觀、信息交互、情境、任務、多元表示、相關性;對相關研究模型――Wilson模型、Kuhlthau模型、Vakkari模型、Wang-Soergel模型、Ingwersen模型、Saracevic模型進行評述,并回顧認知信息檢索所取得的成就,展望其未來發(fā)展方向。
          [關鍵詞]信息檢索認知信息檢索信息查尋
          [分類號]G354
          
          1、認知信息檢索的概念
          
          20世紀60一90年代,信息檢索(IR)領域出現(xiàn)了三大方向:系統(tǒng)導向的IR,用戶導向的IR和認知導向的IR。
          認知導向的瓜,通常也被稱為認知信息檢索(cognifiveInformation Retrieval,簡稱CIR),是與傳統(tǒng)系統(tǒng)導向IR相區(qū)別的一種IR研究范式。系統(tǒng)導向IR的研究重點是作者文本、文本表示、提問式與IR技術,而CIR則將信息檢索者的認知和行為表現(xiàn)作為研究的重點。
          在20世紀70年代,CIR的主要特點是面向用戶和中介。隨著90年代在認知上發(fā)生的重大變化和轉折(即:認知革命、相關性革命和交互式革命),CIR觀點又有了新的發(fā)展與變化,從以往注重個體行動者的信息行為及情境的個體主義認知觀,轉變?yōu)殛P注信息傳遞過程中發(fā)生的所有交互過程的整體主義認知觀[1],它更加關注復雜的瓜情景中的人類行動者、任務以及相關性。
          
          2、幾個與認知信息檢索相關的重要概念
          
          2.1 認知觀
          
          認知觀(cognifive Viewpoint):整體主義認知觀的核心觀點是:任何信息處理――無論是感知還是符號的信息處理,都是由一個分類系統(tǒng)或概念體系來介導的。對于信息處理設備而言,這就是它的一個世界模型――無論該設備是人還是機器。依據這種觀點,世界模型是由包括情緒在內的認知結構(或知識結構)所組成,而認知結構是由在社會,組織/文化和系統(tǒng)情境下的個體與社會/集體經驗/教育等等多方面因素決定的。
          CIR框架就是一種以整體主義認知觀為基礎的、用于研究瓜現(xiàn)象的研究框架。其5個核心要素(/組件)是:信息檢索者,界面,社會一組織情境,IT,信息對象。它們之間通過信息交互聯(lián)系在一起。
          
          2.2 信息交互
          
          信息交互(Information Interaction)是指在IR情境中,兩個或更多的認知行動者之間的交流。交互是一個雙向的交流活動,信息交互是CIR框架中5個組成部分之間的核心情境橋梁。在IR中存在三種交互方式:短期的信息交互,基于會話期的信息交互以及長期的、縱向的IR交互。
          交互革命發(fā)生于20世紀90年代,是IR認知轉折的一個重要方面,它強調用戶與系統(tǒng)的交互,認為:①用戶的信息需求和行為不是靜態(tài)的,而是動態(tài)的,會隨時間而發(fā)生變化;②交互發(fā)生在多個層面和多個維度;③交互就是要將用戶帶入一種選擇狀態(tài),以激發(fā)用戶做出某種選擇;④由于在IR交互情境中的學習和認知,相關性評估因此也是動態(tài)的,并且可能發(fā)生在各個維度,所以傳統(tǒng)的以主題性作為相關性測量指標是不夠的。
          
          2.3 情境
          
          情境(Context)是CIR中的另一個重要概念。按照CIR的觀點,與CIR框架中每個要素相關的行動者和對象就成為他們基本認知結構的情境(即對象內部情境),并成為彼此之間的情境(對象之間情境)。而在框架各個要素之間相互作用過程的情境中,這些框架要素自身又成為彼此的情境。在后者,可能會討論社會的、組織的、文化的以及體系的情境。所有的信息查尋、檢索的組成部分和相關活動都處于公共的社會、物理與技術基礎結構以及它們的歷史情境中。
          情境具有歷史性(累積性),由認知行動者在與“使用團體”、同行長期接觸過程中獲得的知識及經驗組成。此外,情境還具有社會、文化或組織特征,與對象、系統(tǒng)、領域以及檢索者的工作和日常任務、情感、動機、喜好等密切相關。歷史情境和實時交互情境(檢索會話)共同構成了當前情境,并直接影響認知行動者對當前狀態(tài)的認識與理解。在每一個要素內部,其組成要素之間(包括最小的符號元素)又互為情境。
          
          2.4 任務
          
          任務(Work Task),是指認知行動者執(zhí)行的工作任務或與工作無關的日常任務或興趣。任務可以是現(xiàn)實生活中自然存在的任務,也可以是模擬情景下分配的工作任務。如果行動者已經對此有所認識但無法立即解決,這個工作任務就會導致不確定狀態(tài)和信息查尋或檢索行為。
          任務是CIR中的一個核心概念,旨在強調任何IR的行為都是發(fā)生在任務的情境之下,是為了完成任務和提高績效而進行的信息行為。工作任務是構成IR和真正信息行為的驅動力。
          
          2.5 多元表示
          
          多元表示(Polyrepresentation,也稱為多元證據)原理起源于lngwersen與Pao,Ingwersen進一步將其作為交互式IR的認知理論成果而提出⑵。多元表示最初是作為一種提高檢索效率的知識組織方法而提出的,不僅意味著以各種形式進行的與文獻內容有關的主題檢索,還意味著對主題之外的文獻內容檢索,例如通過格式、顏色、結構要素、參考文獻或鏈出結構與內容錨點、引用或鏈入以及不同的元數據元素如作者、單位或期刊名稱等等。多元表示意在表明:指向文獻的知識表示在認知和功能上越不同、越多樣,文獻與提問式、信息需求、感知的工作任務情境相關的可能性就越大;通過認知上不同的知識表示所產生的認知重疊,從而發(fā)現(xiàn)文獻應賦予最高的相關性。多元表示是整體主義認知觀中利用不同行動者的詮釋方式和認知結構多樣性的具體表現(xiàn)。
          
          2.6 相關性
          
          相關性概念是IR中的重點和難點。近年來,除了傳統(tǒng)的系統(tǒng)相關和用戶相關類型外,研究者們開展了一些重要的理論研究和實驗研究。研究進一步發(fā)現(xiàn)和闡釋了算法相關、主題相關、需求相關、情景相關與社會認知相關這5個不同的相關性類型及其關系⑴:①算法相關,類似于檢索引擎處理的排序結果,并涉及到請求(或查詢)與檢索目標之間的關系;②主題相關,由人類進行的評估(解釋)方式,主要解決檢索到的文獻內容和請求之間的相關性關系,這種相關不是客觀的,它具有主觀情感和智力的性質;③需求相關,指在給定時點由搜索者感知到的檢索對象的本質和信息需求之間的針對性;④情景相關,指檢索到的對象和個體檢索者感知到的工作任務情景之間的關系;⑤社會認知相關,指領域、情境和集體性情境偏好。它表示由認知行動者進行的情景相關評估和解釋以及這種評估和解釋隨時間的變化。
          
          3、認知IR研究的模型
          
          3.1 Wilson模型
          
          T.D.Wilson于1999年提出了IR信息行為研究模型⑶,揭示了主要概念間的嵌套關系,其核心思想是:IR總是處于信 息查尋過程的情境之中,而信息查尋又是構成整體信息行為的其中一種。如圖1所示:
          
          
          3.2 Kuhlthau的檢索階段與過程模型
          
          CarolC.Kuhlthau開展的一系列長期研究結果表明,學生和圖書館用戶的學習任務與問題解決包括幾個階段⑷。他從研究中總結出一種模型,認為人們檢索與使用信息的差異取決于過程階段(見表1)。
          Kuhlthau的模型也指向瓜的核心情感特性。該模型給同時代的其他研究者帶來了靈感,在不同領域中,他們利用該模型并證實了它的效用。
          
          3.3 Vakkari模型
          
          
          在2001年,Vakkari基于一系列的長期實驗研究⑸提出了一個新的模型。該模型顯示任務執(zhí)行階段和需要檢索的信息、檢索策略,并將檢索到的信息有機聯(lián)系在一起。如圖2所示:
          
          該模型作用:①在與完成任務相關的知識中,領域知識和IR知識之間有著清晰的區(qū)別;②在任務執(zhí)行與解決過程中,信息利用明顯與檢索任務的執(zhí)行區(qū)分開。檢索被視為信息利用的工具,而檢索與相關性評價的結果有助于信息利用。
          
          3.4 Wang―Soergel模型
          
          Wang與Soergel基于長期的實驗研究,于1998年提出了瓜的文獻選擇框架⑹(見圖3)。它也是一個階段模型,比圖2的Vakkari模型更詳細,在決策階段應用了11個相關性標準和5個文獻價值維度對如何選擇檢索到的文獻進行決策。另外,它成功地將標準、價值與決策和所謂的“文獻信息元素”結合起來!拔墨I信息元素”即作者創(chuàng)建的文獻結構、數據元素等重要數據。
          
          3.5 Ingwersen的概念模型
          
          Ingwersen在1992年出版的專著⑺中提出了IR交互模型。該模型包括信息檢索者的社會一組織環(huán)境(情境)(見圖4)。
          
          3.6 Saracevic的概念模型
          
          Saracevic于1996年提出了信息交互層面的分層模型嘲(見圖5)。該模型的特點是:①指向三個通訊層。第一層是表面處理層,負責數據源與基于提問式的接口之間的計算數據處理;第二層是交互式認知溝通層,包含在人一機交互期間的感知與感知到的信息需求相關的信息過程,即檢索者一提問式接口之間的對話;第三層被稱為“情景層”,是指在某一環(huán)境的情景中,與感知到的工作任務有關的信息利用。第一層與信息處理的語言層相關,后兩個層次則與信息處理的語義層和語用層相關。②有利于人們對有關交互IR的相關性類型的修正和更準確地領會。
          
          4、認知信息檢索所取得的主要成就
          
          4.1 模型方面
          
          在實驗研究的基礎上,形成了綜合的研究模型,并應用于實驗研究。在此期間,模型之間有時互相集成或彼此組合。
          4.2理論建構方面
          
          研究者嘗試發(fā)展和應用更加綜合的理論構架,ASK假說、多元表示假說等成為CIR的理論基礎。此外,該階段還提出了其他一些有關工作任務復雜性和工作任務情景的假說。
          
          4.3 IR評價方面
          
          設計了新穎的IR評價模型以處理多維相關狀態(tài)中動態(tài)的信息情景,例如受IR認知觀啟發(fā)而來的交互IR評價包。
          
          4.4 相關性研究方面
          
          研究者成功地發(fā)現(xiàn)了多種相關類型以及可供使用的相關性標準分類;在與搜索者相關的最佳匹配中,相關性研究也取得了突破;在真實環(huán)境中,包括檢索者在內的(間接)相關反饋和查詢修改算法受到了關注。
          
          4.5 分級相關性方面
          
          分級相關性被重新發(fā)現(xiàn),并開展了實驗研究。結果得到了許多新穎的、適用于真實的交互式IR研究評價的性能評價指標,從而搭起了與實驗室IR研究團體溝通的橋梁。
          
          4.6 方法學方面
          
          對IR現(xiàn)象的實驗研究大量增加,并應用了一定的方法學。長期的縱向研究方法也得到了應用。此外,研究的對象也從成人擴展到兒童,并且開始在網絡環(huán)境中進行研究。5認知信息檢索的未來發(fā)展方向[1.9]
          
          5.1 情境方面
          
          CIR將與人類信息行為集成,從而更加全面地理解CIR。在IR研究中,將人類信息行為的情境考慮在內,正是在該情境中,人與IR系統(tǒng)發(fā)生交互作用。
          
          5.2 認知研究方面
          
          在認知研究方面,需要繼續(xù)開展深入研究,以期更多地了解人類-IR系統(tǒng)交互作用的認知動力學。
          
          5.3 社會和組織研究方面
          
          在社會和組織研究方面,需要繼續(xù)展開深入研究,探索人類與IR系統(tǒng)在社會和組織層面上的交互作用。
          
          5.4 相關性和評價研究方面
          
          相關性一直是而且今后仍是CIR研究的重點。
          
          5.5 情境觀和認知觀方面
          
          在情境觀和認知觀的統(tǒng)領下,研究與信息查尋不同的研究路徑和研究陣營,將從以往相互隔離的狀態(tài)逐步走向互動與整合,最終可能形成集成的信息查尋及檢索研究框架。
          
          6、結語
          
          1977-1982年是認知IR觀被確立為一種理論觀點的時期,CIR作為一種獨立的研究范式得以確立和發(fā)展。隨后,與CIR相關的重要概念得到了闡述,有關的理論基礎和假說也得到發(fā)展,建立了相應的研究模型,陸續(xù)展開了一系列的實驗研究,取得了一系列的研究成果。如2005年出版的兩部著作((The Turn:Integration of Information Seeking andRetrieval inContext))m~H((New directions in cognitDe information retrieval))191.對CIR研究進行了系統(tǒng)的總結。
          從長遠來看,CIR為具有圖書館人文傳統(tǒng)的信息查尋與具有情報學技術傳統(tǒng)的信息檢索之間建立起互動與溝通的橋梁,尋求讓兩者在情境中進行有機的集成,從而開創(chuàng)一條新的研究路徑,有望發(fā)展成為一個新的統(tǒng)一、集成的理論體系,并最終改進IR及WEB系統(tǒng)的設計。   [2]De Mey M. The relevance of the cognitive paradigm for information science // Harbo O, Kajberg L. Theory and application of information research: Proceedings of the 2nd International Research Forum on Information Science (IRFIS 2). Copenhagen: Royal School of Librarianship, 1980: 48-61
          [3]Ingwersen P, Ja..rvelin K. The turn: Integration of information seeking and retrieval in context. Dordrecht: Springer, 2005.
          [4]Wilson T D. Review of :Ingwersen P, Jarvelin K. The turn: Integration of information seeking and retrieval in context. [2007-04-30].省略/ir/reviews/revs189.html.
          [5]賴茂生,王琳. 情報檢索發(fā)展路徑的轉向――評丹麥情報學家英格沃森的新著. 情報學報, 2006,25(12):755-760.
          [6]Yazdan M. Book review: The turn: Integration of information seeking and retrieval in context. [2007-05-08]. http://www.webology.ir/2006/v3n3/bookreview4.html.
          [7]Bawden D. Book review: The turn: Integration of information seeking and retrieval in context. Journal of Documentation, 2007, 63(2): 290-292
          [8]James D A. Book review: The turn: Integration of information seeking and retrieval in context. Information Processing and Management, 2007, 43(3): 821-833

        相關熱詞搜索:認知 展望 信息檢索 認知信息檢索研究的發(fā)展與展望 研究與發(fā)展管理 發(fā)展研究

        版權所有 蒲公英文摘 www.zuancaijixie.com
        91啦在线播放,特级一级全黄毛片免费,国产中文一区,亚洲国产一成人久久精品