企業(yè)信息資源集成中的知識(shí)地圖構(gòu)建與工作模型研究 信息資源體系構(gòu)建中的信息產(chǎn)權(quán)問題
發(fā)布時(shí)間:2020-03-10 來源: 散文精選 點(diǎn)擊:
[摘要]分析企業(yè)信息資源集成的關(guān)鍵問題,介紹知識(shí)地圖相關(guān)理論,探討知識(shí)地圖在知識(shí)檢索、個(gè)性化信息推薦和局部本體集成三個(gè)方面對(duì)于改進(jìn)企業(yè)信息資源集成的作用。指出實(shí)現(xiàn)知識(shí)地圖在企業(yè)信息資源集成的三個(gè)方面的應(yīng)用需要構(gòu)建兩種不同類型的知識(shí)地圖,并分別解釋其構(gòu)建流程。在此基礎(chǔ)上,構(gòu)建知識(shí)地圖在企業(yè)信息資源集成中的工作模型。
[關(guān)鍵詞]知識(shí)地圖 信息資源集成 企業(yè) 構(gòu)建流程 工作模型
[分類號(hào)]G350
企業(yè)在長期經(jīng)營過程中,積累了豐富的信息資源,這些信息資源以數(shù)據(jù)庫、文檔等不同形式存在,存儲(chǔ)地點(diǎn)分散,影響了企業(yè)對(duì)信息資源的有效利用。國內(nèi)外學(xué)者提出通過信息資源集成的方法解決這一問題,實(shí)施企業(yè)信息資源集成,可以將企業(yè)原本異構(gòu)、離散、分布的信息資源通過物理或邏輯的方式組織成一個(gè)整體,它能有效的搜集、組織和利用企業(yè)信息。但該方法同樣存在一些關(guān)鍵問題有待改進(jìn),例如實(shí)現(xiàn)信息資源集成后,如何將決策所需信息及時(shí)準(zhǔn)確地推送給決策者,如何提高信息資源檢索質(zhì)量,如何實(shí)現(xiàn)信息資源集成框架內(nèi)多領(lǐng)域本體之間的語義互聯(lián)等。
知識(shí)地圖、知識(shí)庫和知識(shí)社區(qū)是知識(shí)管理系統(tǒng)的三大法寶。知識(shí)地圖為上述問題的解決提供了一種新的思路。本文在分析企業(yè)信息資源集成關(guān)鍵問題的基礎(chǔ)上,探討了知識(shí)地圖在企業(yè)信息資源集成中的應(yīng)用,在此基礎(chǔ)上分析了相關(guān)知識(shí)地圖的構(gòu)建。
1 企業(yè)信息資源集成的關(guān)鍵問題
所謂關(guān)鍵問題是指關(guān)系到企業(yè)信息資源集成質(zhì)量和效果的問題,也是需要重點(diǎn)改進(jìn)的方面。主要有以下幾點(diǎn):
1.1 知識(shí)資源檢索質(zhì)量
在企業(yè)知識(shí)管理系統(tǒng)中,常用的檢索方法是基于關(guān)鍵詞的檢索。這種檢索方法的突出缺點(diǎn)就是缺乏識(shí)別、理解和使用深層語義信息的能力,只檢索出與關(guān)鍵詞匹配的知識(shí),割斷了知識(shí)之間的聯(lián)系,而且用戶通常對(duì)自身知識(shí)需求不明確,無法準(zhǔn)確向檢索系統(tǒng)表達(dá)需求,檢索質(zhì)量不高。而企業(yè)信息資源集成的主要功能是面向半結(jié)構(gòu)化和非結(jié)構(gòu)化問題向用戶提供能夠支持決策的知識(shí),現(xiàn)有檢索方法顯然無法滿足用戶需求。
1.2 個(gè)性化信息推薦質(zhì)量
作為知識(shí)獲取的重要方式,個(gè)性化信息推薦能夠根據(jù)不同用戶的特定需求,主動(dòng)向用戶推送相關(guān)信息資源。目前信息推薦系統(tǒng)采用的主流算法是協(xié)同過濾推薦算法。協(xié)同過濾推薦,也叫基于用戶和用戶關(guān)系(User-to-user Correlation)的推薦,該算法在分析知識(shí)與知識(shí)、知識(shí)與用戶、用戶與用戶之間關(guān)系的基礎(chǔ)上,得出推薦結(jié)果。但在實(shí)際應(yīng)用中,由于知識(shí)與知識(shí)、用戶與用戶之間的關(guān)聯(lián)難以確定,影響了該算法的有效性及個(gè)性化信息推薦的效果。
1.3 局部本體集成
基于本體的信息資源集成方法主要有三種:單本體方法、多本體方法和混合本體方法。單本體方法中,任何信息源的改變都會(huì)引起全局本體的變動(dòng),難以維護(hù);旌媳倔w中,局部本體的構(gòu)建須以全局本體為基礎(chǔ),限制了已有本體的重用。多本體方法能避免兩者的缺點(diǎn),但由于缺乏公共詞匯表使得不同局部本體的比較變得困難。目前常用的解決辦法是在不同局部本體之間定義本體映射。如果存在n個(gè)局部本體,那就需要定義n(n-1)/2個(gè)映射規(guī)則。實(shí)際上,由于各局部本體的構(gòu)建完全獨(dú)立,彼此沒有明顯的語義關(guān)聯(lián),本體映射難以定義。且實(shí)踐中,構(gòu)建本體映射大多還需要領(lǐng)域?qū)<沂止そ槿,自?dòng)化程度達(dá)不到大規(guī)模本體共享與交流的目的。如何突破本體映射的障礙,實(shí)現(xiàn)局部本體集成,關(guān)系到企業(yè)信息資源集成項(xiàng)目的成敗。
2 知識(shí)地圖理論
2.1 知識(shí)地圖的定義
知識(shí)地圖的概念最早由英國情報(bào)學(xué)家B.C.Brookes提出,關(guān)于知識(shí)地圖的定義,國內(nèi)外專家看法不一。李華偉等認(rèn)為,知識(shí)地圖是一種幫助用戶知道在何處能找到知識(shí)的知識(shí)管理工具,企業(yè)知識(shí)地圖將企業(yè)各種資源的入口集成起來,以統(tǒng)一的方式將企業(yè)的知識(shí)資源介紹給用戶。Vail認(rèn)為,知識(shí)地圖是已經(jīng)獲取的知識(shí)以及知識(shí)之間關(guān)系的可視化描述,它可以使不同背景的知識(shí)尋求者在不同的詳細(xì)程度上學(xué)習(xí)知識(shí),并同其他人進(jìn)行交流。雖然各位學(xué)者對(duì)知識(shí)地圖的理解不同,但都存在以下共同點(diǎn):知識(shí)地圖只告訴人們知識(shí)的位置,并不直接指向知識(shí)內(nèi)容,它不僅揭示知識(shí)的存儲(chǔ)地,而且揭示知識(shí)間的關(guān)系,不僅揭示顯性知識(shí),也揭示隱性知識(shí),同時(shí)可視化展現(xiàn)知識(shí)間關(guān)系,有助于發(fā)現(xiàn)新知識(shí)。
2.2 知識(shí)地圖的類型
目前主流的知識(shí)地圖分類標(biāo)準(zhǔn)是Lgona和Caldwen在2000年提出的,他們將知識(shí)地圖劃分為概念型知識(shí)地圖、流程型知識(shí)地圖和能力型知識(shí)地圖三類。概念型知識(shí)地圖依據(jù)主題或概念組織而成,只包含用于描述某個(gè)事實(shí)或概念的靜態(tài)知識(shí)。流程型知識(shí)地圖依據(jù)活動(dòng)流程組織而成,用于將企業(yè)內(nèi)與業(yè)務(wù)流程相關(guān)的知識(shí)或知識(shí)源圖形化表示。能力型知識(shí)地圖,又稱為職能型知識(shí)地圖,主要用于描述企業(yè)員工的知識(shí)、技能及相關(guān)領(lǐng)域的專家。
2.3 知識(shí)地圖的作用
知識(shí)地圖是對(duì)知識(shí)的地圖化描述,幫助人們定位知識(shí),明確知識(shí)的所有權(quán),發(fā)現(xiàn)知識(shí)的價(jià)值并利用知識(shí),增強(qiáng)對(duì)已有知識(shí)的使用。知識(shí)地圖能夠?yàn)橛脩籼峁┢髽I(yè)各種知識(shí)資源庫的集成邏輯視圖,知識(shí)地圖還可用于實(shí)現(xiàn)知識(shí)資源的可視化配置,明確知識(shí)的分布以及分布于不同空間的知識(shí)資源的內(nèi)在聯(lián)系。
3 企業(yè)信息資源集成中知識(shí)地圖的應(yīng)用
如前文所述,企業(yè)信息資源集成系統(tǒng)還存在三個(gè)需要改進(jìn)的方面,知識(shí)地圖技術(shù)為這些問題的解決提供了一種新思路。
3.1 知識(shí)檢索
當(dāng)用戶向檢索系統(tǒng)提出查詢式時(shí),檢索引擎先對(duì)用戶查詢請(qǐng)求進(jìn)行分詞預(yù)處理,然后通過概念分類、聚類算法對(duì)檢索關(guān)鍵詞進(jìn)行擴(kuò)展。具體過程是調(diào)用知識(shí)地圖文件并通過推理機(jī)對(duì)其進(jìn)行解析,找到知識(shí)地圖中節(jié)點(diǎn)間的關(guān)聯(lián)權(quán)值,將關(guān)聯(lián)值較高的知識(shí)概念加入到檢索關(guān)鍵詞中,生成更加接近用戶真實(shí)意圖的查詢式,從而將信息檢索提高到語義檢索的高度。用戶有時(shí)想知道不同類型知識(shí)之間是否有聯(lián)系,這在基于關(guān)鍵詞的檢索中無法實(shí)現(xiàn),但通過知識(shí)地圖可以實(shí)現(xiàn)基于關(guān)聯(lián)的檢索,發(fā)現(xiàn)不同類型知識(shí)與知識(shí)之間存在的關(guān)聯(lián)。
3.2 個(gè)性化信息推薦
如前文所述,由于知識(shí)與知識(shí)、用戶與用戶之間的關(guān)聯(lián)具有不確定性或者難以獲取,影響了協(xié)同過濾推薦算法的有效性。而知識(shí)地圖可以很好地體現(xiàn)知識(shí)、用戶之間的關(guān)系,將知識(shí)地圖和協(xié)同過濾算法結(jié)合起來,有助于算法理解各類知識(shí)及用戶之間的關(guān)聯(lián),提高個(gè)性化信息推薦的精度。因?yàn)橥ㄟ^對(duì)知識(shí)地圖文件的解析,可以獲取兩個(gè)用戶之間更具體的關(guān)聯(lián)關(guān)系,從而加強(qiáng)用戶間的相似度,比如同一部門的兩個(gè)用戶很有可能有相同的信息需求。
3.3 局部本體集成
實(shí)現(xiàn)信息資源集成的關(guān)鍵是定義各局部本體之間的本體映射。但由于缺乏語義基礎(chǔ),本體映射難以定義,且本體映射并不是簡單地一對(duì)一的映射,還需要對(duì) 繼承和推理的一致性進(jìn)行校驗(yàn)和確認(rèn),這使得本已復(fù)雜的本體映射規(guī)則的構(gòu)建變得更加困難。知識(shí)地圖技術(shù)為解決異構(gòu)局部本體集成提供了一個(gè)新思路。知識(shí)地圖在局部本體集成中的應(yīng)用,如圖1所示:
先利用已有局部本體,以XML標(biāo)記語言為數(shù)據(jù),對(duì)各種信息資源進(jìn)行標(biāo)注,使得被標(biāo)注的數(shù)據(jù)具有明確的意義,使機(jī)器可以理解,最終產(chǎn)生知識(shí)庫。不同知識(shí)庫之間需要使用對(duì)方的數(shù)據(jù),這就需要各局部本體之間能相互理解。而在數(shù)字信息資源組織中,利用知識(shí)地圖技術(shù),可以有效地對(duì)領(lǐng)域本體進(jìn)行知識(shí)連接和引導(dǎo)。具體方法是,根據(jù)一定的映射規(guī)則將各局部本體中的類、實(shí)例等映射為知識(shí)地圖中的節(jié)點(diǎn),然后利用人工、自動(dòng)或半自動(dòng)的方法發(fā)現(xiàn)局部本體之間的語義關(guān)系,如繼承關(guān)系、參考關(guān)系、反相關(guān)系等,并將這些語義關(guān)系映射到知識(shí)地圖中,形成一個(gè)既關(guān)聯(lián)、又獨(dú)立的本體知識(shí)地圖,從而將異構(gòu)局部本體鏈接起來。
4 知識(shí)地圖的構(gòu)建
為實(shí)現(xiàn)上述三個(gè)方面的應(yīng)用,需要構(gòu)建相應(yīng)的知識(shí)地圖。其中,應(yīng)用于知識(shí)檢索和個(gè)性化信息推薦的知識(shí)地圖是同一個(gè),稱之為綜合知識(shí)地圖。應(yīng)用于局部本體集成的稱之為本體知識(shí)地圖。
4.1 綜合知識(shí)地圖的構(gòu)建
綜合知識(shí)地圖的作用是提高知識(shí)檢索質(zhì)量和個(gè)性化信息推薦的精度。其構(gòu)建步驟如下:
4.1.1 構(gòu)建流程知識(shí)地圖 企業(yè)內(nèi)的知識(shí)流動(dòng)與業(yè)務(wù)流程密切相關(guān),員工在解決問題時(shí)使用知識(shí),問題解決后又產(chǎn)生和創(chuàng)新知識(shí)。企業(yè)內(nèi)任何一個(gè)知識(shí)都必定和某個(gè)業(yè)務(wù)流程關(guān)聯(lián),為此采用流程型知識(shí)地圖,根據(jù)業(yè)務(wù)流程對(duì)知識(shí)進(jìn)行組織。首先要分解企業(yè)業(yè)務(wù)流程,將單個(gè)業(yè)務(wù)活動(dòng)分離出來,明確各業(yè)務(wù)活動(dòng)之間的邏輯關(guān)系。然后通過管理層對(duì)業(yè)務(wù)活動(dòng)的描述及對(duì)業(yè)務(wù)活動(dòng)相關(guān)人員的調(diào)研,整理出不同業(yè)務(wù)活動(dòng)所需知識(shí)資源,最終以流程知識(shí)地圖的形式展現(xiàn)出來。流程知識(shí)地圖以業(yè)務(wù)活動(dòng)為邏輯單元進(jìn)行知識(shí)組織,向用戶展現(xiàn)一個(gè)集成的、以流程為索引的企業(yè)知識(shí)地圖,使得物理存儲(chǔ)上相互獨(dú)立的各種知識(shí)相對(duì)于用戶是透明的。
4.1.2 構(gòu)建職能知識(shí)地圖 流程知識(shí)地圖中所展示的顯性知識(shí)只是企業(yè)所有知識(shí)資源的冰山一角,更多地是隱藏在冰山下的隱性知識(shí)。學(xué)者秦鐵輝認(rèn)為隱性知識(shí)是構(gòu)筑企業(yè)競爭優(yōu)勢的中堅(jiān)力量,所以綜合知識(shí)地圖中也應(yīng)當(dāng)包含隱性知識(shí)。由于隱性知識(shí)難以收集和表達(dá),我們采用職能型知識(shí)地圖,通過對(duì)作為承載隱性知識(shí)主體的人的組織,實(shí)現(xiàn)對(duì)隱性知識(shí)的間接組織。職能型知識(shí)地圖主要依據(jù)員工的技術(shù)、職位等進(jìn)行組織,實(shí)質(zhì)上是以員工為節(jié)點(diǎn)的知識(shí)網(wǎng)絡(luò),圖中每個(gè)節(jié)點(diǎn)代表一個(gè)員工;另外,我們還要為每個(gè)節(jié)點(diǎn)添加除了員工基本信息之外的其他信息,如該員工的專業(yè)技能、項(xiàng)目經(jīng)歷和聯(lián)系方式等,從而將部門、員工和知識(shí)對(duì)應(yīng)起來。
4.1.3 流程知識(shí)地圖與職能知識(shí)地圖的融合流程知識(shí)地圖中的顯性知識(shí)和職能知識(shí)地圖中的員工信息及其背后的隱性知識(shí)之間是相互關(guān)聯(lián)、密不可分的,甚至是可以相互轉(zhuǎn)化的。流程知識(shí)地圖中的文檔、數(shù)據(jù)都是由企業(yè)員工創(chuàng)作;而員工所具備的技能和經(jīng)驗(yàn)也是通過對(duì)文檔、資料等顯性知識(shí)的學(xué)習(xí)內(nèi)化而來。兩種知識(shí)地圖間的知識(shí)關(guān)聯(lián)如圖2所示:
通過在流程知識(shí)地圖和職能知識(shí)地圖節(jié)點(diǎn)之間構(gòu)建知識(shí)關(guān)聯(lián)的方式可將兩者融合,形成綜合知識(shí)地圖。例如,如果員工甲主持了本企業(yè)供應(yīng)商信用評(píng)價(jià)規(guī)則的制定,我們就可以在員工甲及供應(yīng)商信用評(píng)價(jià)規(guī)則間構(gòu)建知識(shí)鏈接。兩類知識(shí)地圖的融合有助于完善知識(shí)檢索和個(gè)性化信息推薦的結(jié)果。比如當(dāng)企業(yè)決策者要對(duì)某個(gè)新供應(yīng)商進(jìn)行信用評(píng)級(jí),他不僅能檢索到供應(yīng)商信用評(píng)價(jià)規(guī)則的相關(guān)知識(shí),還能檢索出主持過這一評(píng)價(jià)規(guī)則制定的員工甲的相關(guān)信息。決策者再通過與員工甲的交流獲得這一領(lǐng)域的隱性知識(shí),以便對(duì)新供應(yīng)商做出正確的信用評(píng)級(jí)。為使讀者對(duì)綜合知識(shí)地圖有直觀認(rèn)識(shí),筆者采用Inspiration 7.0軟件繪制了一個(gè)簡要的綜合知識(shí)地圖示意圖。如圖3所示:
4.2 本體知識(shí)地圖的構(gòu)建
本體知識(shí)地圖的作用是實(shí)現(xiàn)不同局部本體間的集成。構(gòu)建步驟如下:
4.2.1 發(fā)現(xiàn)局部本體問的語義關(guān)聯(lián) 要使局部本體在知識(shí)地圖中相關(guān)聯(lián),首先要發(fā)現(xiàn)各局部本體之間的語義關(guān)聯(lián)。語義關(guān)聯(lián)可以通過人工的、自動(dòng)的或半自動(dòng)的方法發(fā)現(xiàn);目前常用的方法是通過概念間語義相似度的計(jì)算實(shí)現(xiàn)。
4.2.2 制定映射規(guī)則 本體知識(shí)地圖構(gòu)建的核心是從本體到知識(shí)地圖的映射規(guī)則的制定。利用映射規(guī)則將局部本體中的類、實(shí)例、屬性等映射為知識(shí)地圖中的節(jié)點(diǎn),同時(shí)將局部本體中各節(jié)點(diǎn)間的關(guān)聯(lián)及各本體間的語義關(guān)聯(lián)映射為知識(shí)地圖中的關(guān)系,最終形成本體知識(shí)地圖。這種映射的本質(zhì)是將異構(gòu)資源的語義通過本體顯性地表達(dá)出來,并在本體知識(shí)地圖層完成語義的整合。本體知識(shí)地圖是建立在局部本體之上的,當(dāng)用戶對(duì)局部本體進(jìn)行修改時(shí),這種變動(dòng)會(huì)通過映射反應(yīng)到知識(shí)地圖上,實(shí)現(xiàn)本體知識(shí)地圖的自動(dòng)擴(kuò)展。
5 知識(shí)地圖在企業(yè)信息資源集成中的工作模型
總結(jié)知識(shí)地圖在企業(yè)信息資源集成中三個(gè)方面的應(yīng)用,筆者提出了知識(shí)地圖在企業(yè)信息資源集成中的工作模型。如圖4所示:
此工作模型分為四層:資源層、局部本體集成層、應(yīng)用層和用戶層。資源層包括企業(yè)所有信息資源,如數(shù)字信息資源、傳統(tǒng)文本資源和互聯(lián)網(wǎng)信息資源。局部本體集成層描述的即是前文提到的知識(shí)地圖在局部本體集成中的應(yīng)用,此處不再贅述。應(yīng)用層描述了知識(shí)地圖在知識(shí)檢索和個(gè)性化信息推薦中的應(yīng)用,包括知識(shí)檢索系統(tǒng)、知識(shí)推薦系統(tǒng)、綜合知識(shí)地圖、可視化模塊和日志五個(gè)部分。綜合知識(shí)地圖以知識(shí)地圖文件的形式獨(dú)立存在,目前有幾種比較成熟的知識(shí)地圖描述語言,如Ontolingua Cycle,OIL(Ontology InferenceLayer),OWL等,由于OWL強(qiáng)大的語義表達(dá)能力,一般用它來描述知識(shí)地圖,形成知識(shí)地圖文件。知識(shí)檢索系統(tǒng)通過統(tǒng)一接口調(diào)用知識(shí)地圖,并在其幫助下對(duì)查詢式進(jìn)行語義擴(kuò)展。日志用于保存用戶檢索的歷史記錄。知識(shí)推薦系統(tǒng)包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘和推薦引擎三個(gè)模塊,數(shù)據(jù)預(yù)處理模塊對(duì)日志文件進(jìn)行預(yù)處理,通過對(duì)用戶檢索記錄的分析挖掘出不同用戶的知識(shí)需求,數(shù)據(jù)挖掘模塊用于從知識(shí)庫中識(shí)別潛在的、用戶可能需要的知識(shí),推薦引擎與綜合知識(shí)地圖結(jié)合,提高協(xié)同過濾推薦算法的精度,根據(jù)挖掘出的知識(shí)生成針對(duì)不同用戶的推薦集。知識(shí)檢索和知識(shí)推薦的結(jié)果都通過可視化模塊呈現(xiàn)給用戶。用戶層的角色分為用戶和專家兩類,專家的作用是維護(hù)知識(shí)地圖,搜集企業(yè)運(yùn)行中產(chǎn)生的新知識(shí),保持綜合知識(shí)地圖的動(dòng)態(tài)更新。
6 結(jié)語
本文分析了知識(shí)地圖在企業(yè)信息資源集成中的應(yīng)用能提高知識(shí)檢索和知識(shí)推薦的質(zhì)量,實(shí)現(xiàn)局部本體語義互聯(lián),改進(jìn)信息資源集成的效果。介紹了實(shí)現(xiàn)上述應(yīng)用所需要用到的兩類知識(shí)地圖,即綜合知識(shí)地圖和本體知識(shí)地圖,探討其構(gòu)建流程。最后提出了知識(shí)地圖在企業(yè)信息資源集成中的工作模型,但要實(shí)現(xiàn)這一模型,在實(shí)踐中還有許多問題需要解決,如綜合知識(shí)地圖的自動(dòng)擴(kuò)展、本體到知識(shí)地圖的映射規(guī)則的定義和信息安全與隱私保護(hù)等,這也是我們今后研究的重點(diǎn)。
相關(guān)熱詞搜索:信息資源 構(gòu)建 模型 企業(yè)信息資源集成中的知識(shí)地圖構(gòu)建與工作模型研究 圖書情報(bào) 圖書情報(bào)專業(yè)
熱點(diǎn)文章閱讀