多媒體信息檢索系統(tǒng)中的用戶需求集成|培訓需求分析的方法
發(fā)布時間:2020-03-10 來源: 感恩親情 點擊:
[摘要]為更有效地對多媒體信息進行檢索,在設(shè)計多媒體信息檢索系統(tǒng)時人們開始更加注重用戶的信息需求。本文設(shè)計一種新的檢索方法對用戶信息需求進行集成,即把用戶的信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中。通過使用該方法,可以對多媒體信息檢索中的用戶需求進行更有效的集成。
[關(guān)鍵詞]多媒體信息檢索系統(tǒng) 信息需求 語用環(huán)境
[分類號]G354
1 引言
1.1 國內(nèi)外多媒體信息檢索系統(tǒng)開發(fā)現(xiàn)狀
多媒體信息檢索包括基于文本的多媒體信息檢索和基于內(nèi)容的多媒體信息檢索。目前,在基于文本的多媒體信息檢索方面,美國康奈爾大學開發(fā)出基于向量空間模型的SMART文本檢索系統(tǒng),美國馬薩諸塞大學研究出基于概率模型的INQUERY文本檢索系統(tǒng)。在基于內(nèi)容的多媒體信息檢索方面,美國堪薩斯大學開發(fā)出數(shù)字圖書館系統(tǒng)(DVLS)圖像檢索系統(tǒng),該系統(tǒng)計劃存儲、索引及檢索圖像、聲頻信息,已建立起一個VISION的原型系統(tǒng)及一個數(shù)據(jù)庫;馬里蘭大學開發(fā)出Voice Graph音頻檢索系統(tǒng),該系統(tǒng)基于內(nèi)容和基于說話人的查詢,檢索已知的說話人和語詞,并設(shè)計音頻圖示查詢接口。
我國在基于內(nèi)容的文本檢索方面,清華大學的《中國學術(shù)期刊(光盤版)》、北大方正的MIRS、易寶北信的TRS全文檢索系統(tǒng)都采用了布爾模型。在基于內(nèi)容的音頻檢索系統(tǒng)方面,有ARS系統(tǒng);中國科學院計算技術(shù)研究所開發(fā)了基于形狀的圖像檢索系統(tǒng);清華大學研發(fā)的TV-FI(Tsinghua Video Find It)系統(tǒng)是視頻節(jié)目管理系統(tǒng),提供視頻數(shù)據(jù)入庫、基于內(nèi)容的瀏覽檢索等功能。
國內(nèi)外對多媒體信息檢索系統(tǒng)的開發(fā)研究,無論是基于文本的檢索,還是基于內(nèi)容的檢索,其基本思路都是用戶以提問的形式表達信息需求,然后系統(tǒng)對提問進行匹配從而在數(shù)據(jù)庫中找出相關(guān)信息。如清華大學的《中國學術(shù)期刊(光盤版)》,其多媒體信息檢索過程如圖1所示。
1.2 存在的問題
基于文本的多媒體信息檢索,其檢索純粹是以多媒體信息的外部特征作為檢索入口,無法表達和揭示多媒體信息的實質(zhì)內(nèi)容和語義信息;而基于內(nèi)容的多媒體信息檢索,相對于基于文本的多媒體信息檢索有著明顯的優(yōu)勢,但卻存在以下問題:①系統(tǒng)中對象特征相關(guān)性、通用性不足,F(xiàn)有大多數(shù)基于內(nèi)容的視頻檢索系統(tǒng),要么只針對某一具體領(lǐng)域的應(yīng)用,要么只針對媒體的某物理特征或基于物理特征的邏輯關(guān)系開展研究。系統(tǒng)中各媒體特征之間缺乏內(nèi)在的關(guān)聯(lián)性描述,使得系統(tǒng)的檢索效率不高,通用性不好。②對目標描述的研究相對較少,而且主要針對對象的底層內(nèi)容檢索。雖然有些系統(tǒng)能綜合利用媒體的若干特征,但往往局限于媒體特征的外部組合,還沒有深入研究各類媒體特征的內(nèi)在相關(guān)性,更沒有考慮多媒體對象的高層語義。因此,當用戶提交一個檢索特征進行查詢時,系統(tǒng)很難找到用戶真正想要尋找的信息。
為解決以上問題,本文提出一種新的檢索方法,在多媒體信息檢索系統(tǒng)中集成用戶的信息需求,在進行信息檢索前,系統(tǒng)就對用戶的信息需求進行集成分析,從而使檢索結(jié)果更加接近用戶真正的需求,系統(tǒng)的查詢效果也得到了提高。
2 多媒體信息檢索系統(tǒng)中的用戶信息需求集成
所謂“多媒體信息檢索系統(tǒng)的用戶信息需求集成”,是指設(shè)計一種新的檢索方法,即在信息系統(tǒng)的設(shè)計階段就對用戶信息進行描述,把用戶的信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中,以達到滿足用戶需求的目的。通過使用該方法,可以對多媒體信息檢索中的用戶需求進行更有效的集成。
2.1 設(shè)計思路
2.1.1 設(shè)計階段的用戶信息描述1996年,Chevaliet和Nigy提出了信息需求的準確表達,即它是用戶研究領(lǐng)域的一種知識。用戶信息需求包括對信息客體的需求以及為了滿足這一需求而產(chǎn)生的對信息檢索工具、系統(tǒng)的需求和對信息服務(wù)的需求。
設(shè)計階段的用戶信息描述包括:①用戶身份描述(User Identity):姓名、姓氏、地址、職業(yè)、職稱、學歷、研究方向等;②用戶信息需求描述(Information Needs ofUser):相當于檢索信息的語用環(huán)境。
用戶身份的描述主要包括姓名、地址等基本信息的描述,而用戶信息需求的描述是通過描述檢索結(jié)果的“語用環(huán)境”完成的,因為通過描述“語用環(huán)境”可以確保在系統(tǒng)中有效集成用戶的信息需求。
2.1.2 語用環(huán)境所謂語用環(huán)境即語境,是“言語行為過程中對話雙方運用語言表達思想、交流情感或推導、分析理解話語含義時所依賴的各種因素,包括語言知識和語言外知識兩個方面”。
在用戶信息需求提出和接收的過程中,服務(wù)人員首先必須具備用戶所用語言的知識,包括所用語言的語法、詞匯、語音的系統(tǒng)及其規(guī)則等,這是理解用戶信息需求必須的最基本的語境知識。其次,服務(wù)人員必須了解用戶表達需求的上下文。因為用戶需求的表達和溝通過程必然是一個動態(tài)的、不斷發(fā)展的過程。在這個過程中,新的話語不斷產(chǎn)生,每一句話都有可能與前面已經(jīng)出現(xiàn)的話語存在聯(lián)系,可能不斷完善或表達著用戶的需求,為了全面、準確地理解用戶的需求,必須了解一段話與上下文的聯(lián)系。
下面可以體會一段典型的對話:
一位讀者在圖書館對圖書館員問:“同志,請問《霧》、《雨》、《電》在什么地方?”
圖書館員回答:“中國文學類,分類號1345.6”,或干脆回答在某個室某個書架上。
這種對話在日常交際中極容易引起誤解,但在圖書館這個特定的場所,圖書館員不會產(chǎn)生歧解,便是因為具體的地點、場合及其相關(guān)背景知識起了制約和引導作用。
因此,在分析用戶需求時,必須與當時的地點、場合及其相關(guān)背景知識聯(lián)系起來,必須與用戶說話的上下文和用戶當時的心情、情緒聯(lián)系起來,因為這些因素都可能影響用戶的信息需求表達。另外,用戶的身份、思想、職業(yè)、修養(yǎng)、性格等因素,既是決定用戶信息需求的客觀因素,也決定著用戶信息需求的表達,成為用戶與服務(wù)人員交流和溝通的語境。因此,接收和分析用戶的信息需求,必須考慮所有上述因素的影響。
2.1.3 用戶信息需求及其集成模型 考慮到不同類型多媒體內(nèi)容的存在,假定用戶對信息的檢索都是基于特定需求的,可以通過信息檢索結(jié)果的語用環(huán)境對用戶進行建模。
考慮到用戶信息需求的多樣性以及用戶信息需求集成后檢索結(jié)果的精確性與全面性,在設(shè)計系統(tǒng)時,可直接通過用戶信息描述將多媒體信息檢索系統(tǒng)中的用戶類型及其信息需求的內(nèi)容區(qū)分出來,構(gòu)成用戶信息需求模型,如圖2所示。
?對于專業(yè)化用戶來說,其信息需求內(nèi)容相對穩(wěn)定,歸納起來主要有:了解全、新、準的有關(guān)科研的前沿問題;科技查新;學習本專業(yè)領(lǐng)域的最新學科知識;為提高自己的綜合素質(zhì)而廣泛閱讀;解決學習中遇到的難題;完成學業(yè)論文查詢專業(yè)信息;了解社會動向等。 ?對于一般網(wǎng)絡(luò)用戶來說,其信息需求主要內(nèi)容包括以下方面:了解國內(nèi)外有關(guān)新聞和信息;閱讀網(wǎng)上文學、期刊、報紙等;尋求新的學習途徑、遠程教育、出國深造;學習因特網(wǎng)技術(shù);了解人才市場信息;應(yīng)用BBS或虛擬社區(qū)進行聊天或問題探討;發(fā)送郵件賀卡;網(wǎng)上娛樂等。
如今,由于社會的不斷發(fā)展,用戶的信息需求已趨向于社會化、實用化、濃縮化、個性化。因此,在設(shè)計多媒體信息檢索系統(tǒng)時,一定要銘記用戶的信息需求,以便更有效地對用戶的信息需求進行集成;同時在信息系統(tǒng)創(chuàng)建和反饋過程中更精確地集成結(jié)果信息的使用語境,加強更有針對性的用戶需求。
通過上述分析,筆者設(shè)計的多媒體信息檢索系統(tǒng)中的用戶信息需求集成模型如圖3所示。
從圖3可以看出,信息需求被集成到系統(tǒng)中是通過與用戶和語用環(huán)境相關(guān)的屬性來完成的。這些屬性可被提前定義或由用戶在檢索信息的過程中進行添加。在該應(yīng)用過程中,定義出信息檢索的四個語用環(huán)境:培訓(training)、教學(teaching)、娛樂(entertain-ment)、內(nèi)容(documcntation)。但需要明確的是,這四個語用環(huán)境都是信息檢索過程中最常用到的,實際中并不能預測出所有信息檢索的可能語境,當然也可能是用戶找不到與他相關(guān)的語境。為了彌補這種語境“缺失”的問題,可以建立一種開放式模式來描述多媒體信息。該模式即使是在信息系統(tǒng)開發(fā)之后還允許用戶描述其新的語用環(huán)境,也就是通過標識處理用戶可以詳細說明他們的新語境。這種詳細說明是通過語用環(huán)境的屬性重組表達出來的。此后,不管用戶的信息需求是否相同,這種已被描述的檢索信息語用環(huán)境都可被各種用戶使用。該語用環(huán)境的使用可被看作是一種協(xié)作式信息檢索。依照這種思路在設(shè)計多媒體信息檢索系統(tǒng)時可建立流程圖,該流程圖描述了多媒體信息庫與用戶之間的關(guān)系,如圖4所示。
2.2 實例分析――QBIC系統(tǒng)中的用戶需求集成QBIC(Query By Image Content)是IBM Almaden研究中心研制的,是第一個真正的功能齊全的CBR(基于案例的推理)系統(tǒng),它用到的檢索特征包括顏色、形狀、紋理、對象形狀等,這些特征一般采用半自動的方法抽取出來,系統(tǒng)通過范例、用戶描繪的草圖、選擇的顏色和紋理圖案、攝像機移動、組成物體運動情況等方式來進行數(shù)據(jù)庫查詢。QBIC系統(tǒng)的查詢步驟如下:用戶提出查詢要求,系統(tǒng)按查詢要求將一系列結(jié)果按相似順序排出。查詢要求通過圖形化或示例的方式提出,而結(jié)果是按相似程度順序排列的圖像集合。為完成這一功能,QBIC主要由兩個部分組成:數(shù)據(jù)庫生成部分和數(shù)據(jù)庫查詢部分。在數(shù)據(jù)庫生成時,每一個圖像對象和視頻對象的內(nèi)容特征,包括顏色、紋理、形狀及攝影機和對象的移動等,都被數(shù)據(jù)庫生成部分提取出來并存人數(shù)據(jù)庫中。在數(shù)據(jù)庫查詢時,數(shù)據(jù)庫查詢部分將把用戶用圖形化方法提供的對象特征,與數(shù)據(jù)庫中存儲的對象內(nèi)容特征進行比較匹配,尋找出具有相似特征的圖像和視頻。在QBIC中其數(shù)據(jù)模型分成兩個層次:場景(或圖像)和對象。所謂場景就是一幅圖像或視頗中的單個代表幀。對象是場景的一部分,或者是視頻中的一個運動的實體。特征將從圖像和對象中提取出來,并存人數(shù)據(jù)庫中。QBIC查詢結(jié)構(gòu)圖見圖5。
在QBIC系統(tǒng)中進行用戶需求集成,首先要在設(shè)計階段進行用戶信息描述,即用戶身份描述和用戶信息需求描述;然后是用戶信息需求建模(見圖2);最后是設(shè)計QBIC系統(tǒng)中的用戶信息需求集成模型,如圖6所示。
設(shè)計階段對用戶信息的描述,使最終的匹配結(jié)果也將根據(jù)用戶的不同而不同,最終檢索系統(tǒng)將更有針對性地反饋給不同的用戶。這樣不僅提高了檢索的效率,同時也提高了檢索的準確度。3結(jié)語
本文的研究目的是對多媒體信息檢索系統(tǒng)中的用戶需求進行集成。該系統(tǒng)的使用用戶是定向的而且它也可以根據(jù)用戶的語用環(huán)境進行恰當?shù)恼{(diào)整。此外,本文提出將用戶信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中,這種方法不僅可以確保用戶和系統(tǒng)之間的有效互動,而且使多媒體信息系統(tǒng)更有助于用戶對檢索信息及其語用環(huán)境進行描述。
相關(guān)熱詞搜索:多媒體信息 需求 集成 多媒體信息檢索系統(tǒng)中的用戶需求集成 多媒體信息集成軟件 多媒體信息集成工具
熱點文章閱讀