感恩親情 蒲公英文摘 > 感恩親情 >

多媒體信息檢索系統(tǒng)中的用戶需求集成|培訓需求分析的方法

發(fā)布時間:2020-03-10 來源: 感恩親情點擊：

　　[摘要]為更有效地對多媒體信息進行檢索，在設(shè)計多媒體信息檢索系統(tǒng)時人們開始更加注重用戶的信息需求。本文設(shè)計一種新的檢索方法對用戶信息需求進行集成，即把用戶的信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中。通過使用該方法，可以對多媒體信息檢索中的用戶需求進行更有效的集成。
　　[關(guān)鍵詞]多媒體信息檢索系統(tǒng)　信息需求　語用環(huán)境
　　[分類號]G354
　　
　　1　引言
　　
　　1.1　國內(nèi)外多媒體信息檢索系統(tǒng)開發(fā)現(xiàn)狀
　　多媒體信息檢索包括基于文本的多媒體信息檢索和基于內(nèi)容的多媒體信息檢索。目前，在基于文本的多媒體信息檢索方面，美國康奈爾大學開發(fā)出基于向量空間模型的SMART文本檢索系統(tǒng)，美國馬薩諸塞大學研究出基于概率模型的INQUERY文本檢索系統(tǒng)。在基于內(nèi)容的多媒體信息檢索方面，美國堪薩斯大學開發(fā)出數(shù)字圖書館系統(tǒng)(DVLS)圖像檢索系統(tǒng)，該系統(tǒng)計劃存儲、索引及檢索圖像、聲頻信息，已建立起一個VISION的原型系統(tǒng)及一個數(shù)據(jù)庫；馬里蘭大學開發(fā)出Voice Graph音頻檢索系統(tǒng)，該系統(tǒng)基于內(nèi)容和基于說話人的查詢，檢索已知的說話人和語詞，并設(shè)計音頻圖示查詢接口。
　　
　　
　　
　　我國在基于內(nèi)容的文本檢索方面，清華大學的《中國學術(shù)期刊(光盤版)》、北大方正的MIRS、易寶北信的TRS全文檢索系統(tǒng)都采用了布爾模型。在基于內(nèi)容的音頻檢索系統(tǒng)方面，有ARS系統(tǒng)；中國科學院計算技術(shù)研究所開發(fā)了基于形狀的圖像檢索系統(tǒng)；清華大學研發(fā)的TV－FI(Tsinghua Video Find It)系統(tǒng)是視頻節(jié)目管理系統(tǒng)，提供視頻數(shù)據(jù)入庫、基于內(nèi)容的瀏覽檢索等功能。
　　國內(nèi)外對多媒體信息檢索系統(tǒng)的開發(fā)研究，無論是基于文本的檢索，還是基于內(nèi)容的檢索，其基本思路都是用戶以提問的形式表達信息需求，然后系統(tǒng)對提問進行匹配從而在數(shù)據(jù)庫中找出相關(guān)信息。如清華大學的《中國學術(shù)期刊(光盤版)》，其多媒體信息檢索過程如圖1所示。
　　1.2　存在的問題
　　基于文本的多媒體信息檢索，其檢索純粹是以多媒體信息的外部特征作為檢索入口，無法表達和揭示多媒體信息的實質(zhì)內(nèi)容和語義信息；而基于內(nèi)容的多媒體信息檢索，相對于基于文本的多媒體信息檢索有著明顯的優(yōu)勢，但卻存在以下問題：①系統(tǒng)中對象特征相關(guān)性、通用性不足�，F(xiàn)有大多數(shù)基于內(nèi)容的視頻檢索系統(tǒng)，要么只針對某一具體領(lǐng)域的應(yīng)用，要么只針對媒體的某物理特征或基于物理特征的邏輯關(guān)系開展研究。系統(tǒng)中各媒體特征之間缺乏內(nèi)在的關(guān)聯(lián)性描述，使得系統(tǒng)的檢索效率不高，通用性不好。②對目標描述的研究相對較少，而且主要針對對象的底層內(nèi)容檢索。雖然有些系統(tǒng)能綜合利用媒體的若干特征，但往往局限于媒體特征的外部組合，還沒有深入研究各類媒體特征的內(nèi)在相關(guān)性，更沒有考慮多媒體對象的高層語義。因此，當用戶提交一個檢索特征進行查詢時，系統(tǒng)很難找到用戶真正想要尋找的信息。
　　為解決以上問題，本文提出一種新的檢索方法，在多媒體信息檢索系統(tǒng)中集成用戶的信息需求，在進行信息檢索前，系統(tǒng)就對用戶的信息需求進行集成分析，從而使檢索結(jié)果更加接近用戶真正的需求，系統(tǒng)的查詢效果也得到了提高。
　　
　　2　多媒體信息檢索系統(tǒng)中的用戶信息需求集成
　　
　　所謂“多媒體信息檢索系統(tǒng)的用戶信息需求集成”，是指設(shè)計一種新的檢索方法，即在信息系統(tǒng)的設(shè)計階段就對用戶信息進行描述，把用戶的信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中，以達到滿足用戶需求的目的。通過使用該方法，可以對多媒體信息檢索中的用戶需求進行更有效的集成。
　　
　　2.1　設(shè)計思路
　　2.1.1　設(shè)計階段的用戶信息描述1996年，Chevaliet和Nigy提出了信息需求的準確表達，即它是用戶研究領(lǐng)域的一種知識。用戶信息需求包括對信息客體的需求以及為了滿足這一需求而產(chǎn)生的對信息檢索工具、系統(tǒng)的需求和對信息服務(wù)的需求。
　　設(shè)計階段的用戶信息描述包括：①用戶身份描述(User Identity)：姓名、姓氏、地址、職業(yè)、職稱、學歷、研究方向等；②用戶信息需求描述(Information Needs ofUser)：相當于檢索信息的語用環(huán)境。
　　用戶身份的描述主要包括姓名、地址等基本信息的描述，而用戶信息需求的描述是通過描述檢索結(jié)果的“語用環(huán)境”完成的，因為通過描述“語用環(huán)境”可以確保在系統(tǒng)中有效集成用戶的信息需求。
　　2.1.2　語用環(huán)境所謂語用環(huán)境即語境，是“言語行為過程中對話雙方運用語言表達思想、交流情感或推導、分析理解話語含義時所依賴的各種因素，包括語言知識和語言外知識兩個方面”。
　　在用戶信息需求提出和接收的過程中，服務(wù)人員首先必須具備用戶所用語言的知識，包括所用語言的語法、詞匯、語音的系統(tǒng)及其規(guī)則等，這是理解用戶信息需求必須的最基本的語境知識。其次，服務(wù)人員必須了解用戶表達需求的上下文。因為用戶需求的表達和溝通過程必然是一個動態(tài)的、不斷發(fā)展的過程。在這個過程中，新的話語不斷產(chǎn)生，每一句話都有可能與前面已經(jīng)出現(xiàn)的話語存在聯(lián)系，可能不斷完善或表達著用戶的需求，為了全面、準確地理解用戶的需求，必須了解一段話與上下文的聯(lián)系。
　　下面可以體會一段典型的對話：
　　一位讀者在圖書館對圖書館員問：“同志，請問《霧》、《雨》、《電》在什么地方?”
　　圖書館員回答：“中國文學類，分類號1345.6”，或干脆回答在某個室某個書架上。
　　這種對話在日常交際中極容易引起誤解，但在圖書館這個特定的場所，圖書館員不會產(chǎn)生歧解，便是因為具體的地點、場合及其相關(guān)背景知識起了制約和引導作用。
　　因此，在分析用戶需求時，必須與當時的地點、場合及其相關(guān)背景知識聯(lián)系起來，必須與用戶說話的上下文和用戶當時的心情、情緒聯(lián)系起來，因為這些因素都可能影響用戶的信息需求表達。另外，用戶的身份、思想、職業(yè)、修養(yǎng)、性格等因素，既是決定用戶信息需求的客觀因素，也決定著用戶信息需求的表達，成為用戶與服務(wù)人員交流和溝通的語境。因此，接收和分析用戶的信息需求，必須考慮所有上述因素的影響。
　　2.1.3　用戶信息需求及其集成模型　考慮到不同類型多媒體內(nèi)容的存在，假定用戶對信息的檢索都是基于特定需求的，可以通過信息檢索結(jié)果的語用環(huán)境對用戶進行建模。
　　考慮到用戶信息需求的多樣性以及用戶信息需求集成后檢索結(jié)果的精確性與全面性，在設(shè)計系統(tǒng)時，可直接通過用戶信息描述將多媒體信息檢索系統(tǒng)中的用戶類型及其信息需求的內(nèi)容區(qū)分出來，構(gòu)成用戶信息需求模型，如圖2所示。
　　?對于專業(yè)化用戶來說，其信息需求內(nèi)容相對穩(wěn)定，歸納起來主要有：了解全、新、準的有關(guān)科研的前沿問題；科技查新；學習本專業(yè)領(lǐng)域的最新學科知識；為提高自己的綜合素質(zhì)而廣泛閱讀；解決學習中遇到的難題；完成學業(yè)論文查詢專業(yè)信息；了解社會動向等。　　?對于一般網(wǎng)絡(luò)用戶來說，其信息需求主要內(nèi)容包括以下方面：了解國內(nèi)外有關(guān)新聞和信息；閱讀網(wǎng)上文學、期刊、報紙等；尋求新的學習途徑、遠程教育、出國深造；學習因特網(wǎng)技術(shù)；了解人才市場信息；應(yīng)用BBS或虛擬社區(qū)進行聊天或問題探討；發(fā)送郵件賀卡；網(wǎng)上娛樂等。
　　如今，由于社會的不斷發(fā)展，用戶的信息需求已趨向于社會化、實用化、濃縮化、個性化。因此，在設(shè)計多媒體信息檢索系統(tǒng)時，一定要銘記用戶的信息需求，以便更有效地對用戶的信息需求進行集成；同時在信息系統(tǒng)創(chuàng)建和反饋過程中更精確地集成結(jié)果信息的使用語境，加強更有針對性的用戶需求。
　　通過上述分析，筆者設(shè)計的多媒體信息檢索系統(tǒng)中的用戶信息需求集成模型如圖3所示。
　　從圖3可以看出，信息需求被集成到系統(tǒng)中是通過與用戶和語用環(huán)境相關(guān)的屬性來完成的。這些屬性可被提前定義或由用戶在檢索信息的過程中進行添加。在該應(yīng)用過程中，定義出信息檢索的四個語用環(huán)境：培訓(training)、教學(teaching)、娛樂(entertain－ment)、內(nèi)容(documcntation)。但需要明確的是，這四個語用環(huán)境都是信息檢索過程中最常用到的，實際中并不能預測出所有信息檢索的可能語境，當然也可能是用戶找不到與他相關(guān)的語境。為了彌補這種語境“缺失”的問題，可以建立一種開放式模式來描述多媒體信息。該模式即使是在信息系統(tǒng)開發(fā)之后還允許用戶描述其新的語用環(huán)境，也就是通過標識處理用戶可以詳細說明他們的新語境。這種詳細說明是通過語用環(huán)境的屬性重組表達出來的。此后，不管用戶的信息需求是否相同，這種已被描述的檢索信息語用環(huán)境都可被各種用戶使用。該語用環(huán)境的使用可被看作是一種協(xié)作式信息檢索。依照這種思路在設(shè)計多媒體信息檢索系統(tǒng)時可建立流程圖，該流程圖描述了多媒體信息庫與用戶之間的關(guān)系，如圖4所示。
　　
　　2.2　實例分析――QBIC系統(tǒng)中的用戶需求集成QBIC(Query By Image Content)是IBM Almaden研究中心研制的，是第一個真正的功能齊全的CBR(基于案例的推理)系統(tǒng)，它用到的檢索特征包括顏色、形狀、紋理、對象形狀等，這些特征一般采用半自動的方法抽取出來，系統(tǒng)通過范例、用戶描繪的草圖、選擇的顏色和紋理圖案、攝像機移動、組成物體運動情況等方式來進行數(shù)據(jù)庫查詢。QBIC系統(tǒng)的查詢步驟如下：用戶提出查詢要求，系統(tǒng)按查詢要求將一系列結(jié)果按相似順序排出。查詢要求通過圖形化或示例的方式提出，而結(jié)果是按相似程度順序排列的圖像集合。為完成這一功能，QBIC主要由兩個部分組成：數(shù)據(jù)庫生成部分和數(shù)據(jù)庫查詢部分。在數(shù)據(jù)庫生成時，每一個圖像對象和視頻對象的內(nèi)容特征，包括顏色、紋理、形狀及攝影機和對象的移動等，都被數(shù)據(jù)庫生成部分提取出來并存人數(shù)據(jù)庫中。在數(shù)據(jù)庫查詢時，數(shù)據(jù)庫查詢部分將把用戶用圖形化方法提供的對象特征，與數(shù)據(jù)庫中存儲的對象內(nèi)容特征進行比較匹配，尋找出具有相似特征的圖像和視頻。在QBIC中其數(shù)據(jù)模型分成兩個層次：場景(或圖像)和對象。所謂場景就是一幅圖像或視頗中的單個代表幀。對象是場景的一部分，或者是視頻中的一個運動的實體。特征將從圖像和對象中提取出來，并存人數(shù)據(jù)庫中。QBIC查詢結(jié)構(gòu)圖見圖5。
　　在QBIC系統(tǒng)中進行用戶需求集成，首先要在設(shè)計階段進行用戶信息描述，即用戶身份描述和用戶信息需求描述；然后是用戶信息需求建模(見圖2)；最后是設(shè)計QBIC系統(tǒng)中的用戶信息需求集成模型，如圖6所示。
　　設(shè)計階段對用戶信息的描述，使最終的匹配結(jié)果也將根據(jù)用戶的不同而不同，最終檢索系統(tǒng)將更有針對性地反饋給不同的用戶。這樣不僅提高了檢索的效率，同時也提高了檢索的準確度。3結(jié)語
　　本文的研究目的是對多媒體信息檢索系統(tǒng)中的用戶需求進行集成。該系統(tǒng)的使用用戶是定向的而且它也可以根據(jù)用戶的語用環(huán)境進行恰當?shù)恼{(diào)整。此外，本文提出將用戶信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中，這種方法不僅可以確保用戶和系統(tǒng)之間的有效互動，而且使多媒體信息系統(tǒng)更有助于用戶對檢索信息及其語用環(huán)境進行描述。

相關(guān)熱詞搜索：多媒體信息需求集成多媒體信息檢索系統(tǒng)中的用戶需求集成多媒體信息集成軟件多媒體信息集成工具

熱點文章閱讀

版權(quán)所有 蒲公英文摘 www.zuancaijixie.com

91啦在线播放,特级一级全黄毛片免费,国产中文一区,亚洲国产一成人久久精品