[基于本體論的高校圖書館個(gè)性化書目推送系統(tǒng)]推送

        發(fā)布時(shí)間:2020-03-07 來源: 散文精選 點(diǎn)擊:

          [摘要]針對(duì)高校圖書館個(gè)性化服務(wù)的要求,研究利用本體論技術(shù)實(shí)現(xiàn)高校圖書館個(gè)性化的書目信息推送服務(wù)。對(duì)書目信息本體論、用戶信息本體論和用戶興趣模型的構(gòu)建進(jìn)行介紹,并在此基礎(chǔ)上構(gòu)建一種基于本體論的高校圖書館個(gè)性化書目信息推送系統(tǒng)模型,該模型不但可以為每本書找到它們潛在的讀者,還可以為讀者節(jié)省時(shí)間,使讀者不用到圖書館就可以獲取所需書目信息,為高校圖書館實(shí)現(xiàn)個(gè)性化書目信息推送服務(wù)提供參考。
          [關(guān)鍵詞]本體論 個(gè)性化服務(wù) 書目推送 高校圖書館
          [分類號(hào)]G250
          
          隨著信息化時(shí)代的到來,人們對(duì)信息的實(shí)效性要求越來越高,高校圖書館如何不斷地改進(jìn)服務(wù)質(zhì)量,更好地服務(wù)廣大師生已成為一個(gè)緊迫課題。而如何及時(shí)主動(dòng)地為廣大師生提供個(gè)性化書目推送服務(wù)正是其中的要求之一。主動(dòng)推送的書目信息必須符合用戶需求,需要根據(jù)用戶對(duì)館藏書目檢索和圖書館網(wǎng)絡(luò)的使用情況,收集用戶行為數(shù)據(jù)進(jìn)行分析,從而挖掘出用戶的潛在需求,再相對(duì)應(yīng)地制定推送策略,為廣大師生提供個(gè)性化的書目信息推送服務(wù)。這種個(gè)性化的書目推送服務(wù),體現(xiàn)了阮岡納贊提出的“圖書館五法則”中“每本書有其讀者”,“節(jié)省讀者的時(shí)間”這兩條原則。
          目前,針對(duì)本體論的研究是圖書情報(bào)領(lǐng)域的研究熱點(diǎn),無論是領(lǐng)域本體論的構(gòu)建還是個(gè)性化信息服務(wù)中基于本體論的用戶興趣模型的構(gòu)建,都有很多研究成果報(bào)道,而關(guān)于書目信息推送服務(wù),雖然也有較多的研究成果,如利用RSS信息聚合技術(shù)來實(shí)現(xiàn)圖書信息推送服務(wù),利用郵件及手機(jī)短信進(jìn)行書目信息推送服務(wù)等,但利用本體論技術(shù)進(jìn)行個(gè)性化書目信息推送服務(wù)的研究,還鮮有相關(guān)報(bào)道。本體論作為一種新的知識(shí)表示方式,由于具有良好的概念層次結(jié)構(gòu)和對(duì)邏輯推理的支持,因而在實(shí)現(xiàn)個(gè)性化的書目信息推送服務(wù)中具有很好的應(yīng)用前景。本文擬對(duì)此進(jìn)行相關(guān)研究,為高校圖書館實(shí)現(xiàn)個(gè)性化書目信息推送服務(wù)提供參考。
          
          1、高校圖書館個(gè)性化書目信息推送服務(wù)
          
          高校圖書館個(gè)性化信息服務(wù),是指針對(duì)不同的用戶(學(xué)生或教師),根據(jù)其個(gè)人信息,采取不同的服務(wù)策略,提供不同的服務(wù)內(nèi)容來滿足其對(duì)信息的不同需求。開展個(gè)性化的書目信息推送服務(wù),就是在個(gè)性化書目信息推送系統(tǒng)的環(huán)境下,根據(jù)用戶的特征提供用戶需要的具有針對(duì)性的信息,同時(shí)通過對(duì)用戶專業(yè)特征、研究興趣的智能分析而主動(dòng)地向用戶推薦其可能需要的書目信息,以滿足用戶信息需求多元化的需要,提高圖書館的服務(wù)質(zhì)量和服務(wù)層次。
          高校圖書館提供的個(gè)性化書目信息推送服務(wù)有其自身的特點(diǎn):①服務(wù)對(duì)象明確、層次分明。高校圖書館主要服務(wù)對(duì)象是高校的教學(xué)科研人員、行政管理人員和學(xué)生,就每類服務(wù)對(duì)象而言,又可再進(jìn)行細(xì)分。比如:教師可分為教授、副教授、講師、助教等,學(xué)生可分為博士研究生、碩士研究生、本科生等,這就要求高校圖書館根據(jù)各類對(duì)象對(duì)信息資源需求的側(cè)重點(diǎn)不同而提供個(gè)性化書目信息推送服務(wù)。②服務(wù)對(duì)象知識(shí)化突出、專業(yè)化明顯。高校師生是高校圖書館的主要服務(wù)對(duì)象,他們具有較高的文化水平,對(duì)專業(yè)知識(shí)的掌握比較深入,因而對(duì)信息服務(wù)的質(zhì)量要求比較高,對(duì)書目信息的需求主要集中在相關(guān)專業(yè)及鄰近專業(yè)上。因此,必須針對(duì)不同服務(wù)對(duì)象的不同特點(diǎn)提供書目信息推送,才能充分發(fā)揮個(gè)性化書目信息推送服務(wù)的重要作用。
          
          2、書目信息及用戶信息本體論庫
          
          為了實(shí)現(xiàn)基于本體論的個(gè)性化書目信息推送服務(wù),建立一個(gè)能全面準(zhǔn)確表達(dá)書目資源信息以及用戶信息的本體論庫是關(guān)鍵所在。該本體論庫不但能全面準(zhǔn)確地描繪出書目資源以及用戶特征的標(biāo)志信息,而且可以清晰地建立起書目資源之間、用戶之間以及書目資源與用戶之間的各種聯(lián)系,這也正是基于本體論的個(gè)性化書目信息推送系統(tǒng)的優(yōu)勢(shì)所在。本體庫設(shè)計(jì)如圖1所示:
          從圖1可知,本體論庫中至少要包括書目信息資源類、讀者特征類和知識(shí)庫類等3個(gè)類目。書目信息資源類的屬性包括資源的標(biāo)題、作者、相關(guān)知識(shí)以及相關(guān)讀者等,其中相關(guān)知識(shí)的屬性值域指向知識(shí)庫類,可以建立起書目資源實(shí)例與知識(shí)庫中特定知識(shí)領(lǐng)域?qū)嵗碾`屬關(guān)系;相關(guān)讀者屬性值域?yàn)樽x者特征類,可以建立起特定資源與該資源的目標(biāo)讀者之間的關(guān)聯(lián)。讀者特征類的屬性包括讀者類型、專業(yè)方向、學(xué)位學(xué)歷、興趣愛好以及關(guān)聯(lián)讀者,其中專業(yè)屬性與興趣屬性,其值域指向知識(shí)庫類的實(shí)例,以建立起用戶與知識(shí)庫領(lǐng)域?qū)嶓w的一對(duì)一或一對(duì)多關(guān)系。知識(shí)庫類則以某個(gè)知識(shí)領(lǐng)域通用的概念為描述對(duì)象,建立并描述這些概念之間的關(guān)系。
          
          3、基于本體論的用戶興趣模型
          
          基于本體論的用戶興趣模型可以借助于書目信息本體論以及用戶的個(gè)人信息資料來構(gòu)建,其中的每一個(gè)概念都被賦予一個(gè)初始值為0的概念興趣相關(guān)度。隨著用戶檢索圖書館書目系統(tǒng)以及辦理借閱次數(shù)的不斷增加,通過對(duì)用戶興趣相關(guān)領(lǐng)域概念的提取以及對(duì)概念興趣相關(guān)度的計(jì)算,不斷在用戶興趣模型中累加此概念的興趣相關(guān)度權(quán)重,這樣經(jīng)過一段時(shí)間,用戶興趣模型中概念興趣相關(guān)度非零的概念節(jié)點(diǎn)逐漸趨于穩(wěn)定,即用戶興趣模型逐漸收斂。其中概念興趣相關(guān)度權(quán)重越高的概念表明其與用戶的興趣越相關(guān)。
          3.1 用戶興趣的獲取
          目前各個(gè)圖書館的流通管理系統(tǒng)數(shù)據(jù)庫中都積累了大量的讀者借閱歷史數(shù)據(jù)以及讀者在辦理借書證時(shí)留下的大量個(gè)人信息資料,利用這些信息我們可以挖掘出用戶對(duì)圖書資源的借閱偏好模式以及用戶潛在的需求,獲取用戶的興趣所在。
          ?根據(jù)用戶個(gè)人信息進(jìn)行聚類。雖然每個(gè)用戶都有其個(gè)性化需求,但是在一定條件下,他們的需求會(huì)有相似性,因此可以收集用戶公開的所有個(gè)人信息,將相同屬性的用戶聚類。例如:相同專業(yè)年級(jí)的學(xué)生對(duì)某些課程科目的信息需求是類似的,在館藏書目系統(tǒng)中,他們也許就使用過同一個(gè)主題詞進(jìn)行檢索。同一屬性類的用戶中,某一用戶感興趣的書目,另一用戶也有可能感興趣。
          ?根據(jù)用戶檢索數(shù)據(jù)進(jìn)行分析。用戶在使用書目查詢系統(tǒng)時(shí)輸入的檢索記錄,反映了用戶感興趣的書目信息,我們可以通過分析用戶輸入的檢索詞,包括題名、責(zé)任者、主題詞以及分類號(hào)等,來獲取用戶的興趣概念;在這個(gè)過程中,對(duì)于用戶輸入的責(zé)任者、主題詞等檢索項(xiàng),可以直接提取作為用戶的興趣概念;對(duì)于用戶輸入的題名,則要先通過分詞等技術(shù)抽取出能代表該書目?jī)?nèi)容的特征詞語,然后把這些特征詞語與領(lǐng)域本體論中的概念進(jìn)行匹配,實(shí)現(xiàn)從特征詞語到概念詞語的轉(zhuǎn)換,從而獲取用戶的興趣概念;對(duì)于用戶輸入的分類號(hào),要先把分類號(hào)轉(zhuǎn)換成相應(yīng)的類目概念作為用戶興趣概念。
          ?根據(jù)用戶訪問日志進(jìn)行挖掘。圖書館網(wǎng)站的Web服務(wù)器積累了大量的用戶訪問數(shù)據(jù),這些數(shù)據(jù)是用戶真實(shí)意圖和動(dòng)機(jī)在行為上的表現(xiàn)。通過Web日志文件,我們可以獲取用戶的訪問頁面以及用戶在每頁停留的時(shí)間等數(shù)據(jù)。對(duì)這些數(shù)據(jù)進(jìn)行分析,用戶瀏覽頁面上可能含有用戶所尋找的信息,進(jìn)一步挖掘用戶的隱性需求。
          3.2 概念興趣相關(guān)度的獲取   影響用戶的概念興趣相關(guān)度的主要因素有:①用戶借閱某本書的時(shí)間Length。對(duì)于某本書,用戶借閱時(shí)間越長(zhǎng),則表明用戶對(duì)該書興趣越大;②用戶借閱或檢索某本書距離現(xiàn)在的時(shí)間PassedTime。很明顯,用戶很久以前借閱的某本書和剛剛借閱的相比,后者用戶更感興趣;③用戶的直接反饋Evaluation。用戶對(duì)推送書目的評(píng)價(jià)最能反映用戶對(duì)該書的興趣程度。
          考慮以上幾個(gè)因素,用戶借閱或檢索某本書后,對(duì)該書所對(duì)應(yīng)概念的興趣度變化AI,可以參考如下的計(jì)算公式:
          △I=W1*f1(Time,Length)+W2*f2(PasssedT-ime)+W3*f3(Evaluation)
          (1)
          其中,f1、f2、f3為三個(gè)函數(shù),分別用于計(jì)算上述三個(gè)因素對(duì)該書目對(duì)應(yīng)概念的興趣相關(guān)度的影響。w1、w2、w3分別為這三個(gè)因素在影響概念的興趣相關(guān)度變化量中所占的權(quán)重。
          
          4、一種基于本體論的書目信息推送系統(tǒng)模型
          
          該模型主要由以下幾個(gè)部分組成:用戶界面代理、書目信息推送模塊、本體論服務(wù)器(包括用戶興趣模型、書目信息本體論庫)、書目信息分析模塊、書目信息數(shù)據(jù)庫、個(gè)性化書目信息索引庫等。
          4.1 用戶界面代理
          用戶界面代理在系統(tǒng)中的主要作用表現(xiàn)為:
          ?建立用戶個(gè)人檔案。當(dāng)用戶首次登錄時(shí),用戶界面代理要求用戶通過注冊(cè)建立起自己的個(gè)人檔案,內(nèi)容涉及用戶身份、知識(shí)背景、興趣領(lǐng)域等方面的內(nèi)容。用戶檔案的建立可以使系統(tǒng)構(gòu)建初始的用戶興趣模型。
          ?選擇推送模式。主頁推送、郵件推送或手機(jī)短信方式。
          ?對(duì)用戶行為進(jìn)行動(dòng)態(tài)監(jiān)測(cè)。對(duì)用戶行為的動(dòng)態(tài)監(jiān)測(cè)可以包括:用戶借閱某本書的時(shí)間、用戶借閱或檢索某本書距離現(xiàn)在的時(shí)間、用戶對(duì)推薦書目的評(píng)價(jià)等。用戶界面代理通過以上對(duì)用戶行為的監(jiān)測(cè)分析,將結(jié)果反饋到用戶偏好本體論庫中,使用戶的下一次查詢能夠得到更優(yōu)化的結(jié)果。
          ?獲取用戶反饋信息。用戶界面代理建立了用戶對(duì)推送書目信息的評(píng)價(jià)機(jī)制,鼓勵(lì)用戶對(duì)推送書目信息給出量化的評(píng)價(jià)值,該值通過某種計(jì)算后,用于更新用戶興趣模型的內(nèi)容,并據(jù)此對(duì)個(gè)性化書目信息索引庫中的內(nèi)容進(jìn)行調(diào)整。
          4.2 書目信息本體論庫
          書目信息本體論庫在系統(tǒng)中的作用主要包括:
          ?利用書目信息本體論對(duì)書目信息進(jìn)行語義標(biāo)引。對(duì)于書目信息庫中的每一條信息,書目信息分析模塊首先提取其中的特征詞,然后可以在書目信息本體論的協(xié)助下,將其轉(zhuǎn)換為本體論中的概念詞,并與具體的每一條書目信息建立映射關(guān)系,從而實(shí)現(xiàn)對(duì)書目信息的語義標(biāo)引。
          ?利用書目信息本體論構(gòu)建用戶興趣模型。利用本體論庫構(gòu)建的用戶興趣模型,不僅包含了用戶的興趣概念,還包含了用戶興趣概念之間的各種關(guān)聯(lián),這樣系統(tǒng)可以在用戶興趣概念之間進(jìn)行推理,挖掘出用戶潛在的興趣概念。另外,當(dāng)用戶對(duì)某一興趣概念的概念興趣相關(guān)度發(fā)生變化時(shí),系統(tǒng)可以對(duì)與其相關(guān)聯(lián)的興趣概念的概念興趣相關(guān)度做出相應(yīng)的調(diào)整,從而使用戶的興趣模型更準(zhǔn)確地反映用戶的實(shí)際情況。
          4.3 用戶興趣模型
          在使用推薦系統(tǒng)時(shí),比較突出的一個(gè)問題是客戶信息的獲取,然而在本系統(tǒng)中,由于高校圖書館書目推薦系統(tǒng)用戶和使用環(huán)境的特殊性,系統(tǒng)可以方便地得到較為真實(shí)的用戶偏好、個(gè)人信息等,使這一問題得到較好地解決。讀者信息主要包括:①讀者的基本個(gè)人信息,如所在院系、身份信息(教師還是學(xué)生)、職稱信息、學(xué)生類別等。這些信息不需要讀者自己輸入,可以從學(xué)校管理信息系統(tǒng)獲得;②讀者的顯/隱性輸入信息,如讀者輸入關(guān)鍵字、書名、文獻(xiàn)特征、讀者的瀏覽記錄等;③讀者的歷史借閱記錄數(shù)據(jù);④讀者借閱過某些文獻(xiàn)所給出的評(píng)價(jià)。
          由于用戶的興趣知識(shí)屬于一種隱性知識(shí)和動(dòng)態(tài)知識(shí),很難對(duì)其進(jìn)行直接或明確的說明,因此用戶偏好本體論庫的構(gòu)建也不可能是一勞永逸的,而是要通過系統(tǒng)對(duì)用戶興趣的動(dòng)態(tài)追蹤,不斷深入挖掘,并在此基礎(chǔ)上對(duì)用戶興趣模型的內(nèi)容進(jìn)行不斷修正,才能比較準(zhǔn)確地反映用戶的興趣偏好。
          4.4 書目信息推送模塊
          書目信息推送可以基于以下三種方法:
          ?基于相關(guān)性書目信息的推送:推送系統(tǒng)根據(jù)用戶感興趣的書目信息來推送其它相關(guān)的書目信息,這種方式需要了解客戶當(dāng)前選擇的書目信息。例如某位讀者選擇借閱了有關(guān)“電子商務(wù)”的書籍,推送系統(tǒng)就可以向其推薦其它關(guān)于“電子商務(wù)”圖書的書目信息。
          ?基于相關(guān)性用戶的推送:推送系統(tǒng)根據(jù)目前用戶與其他已經(jīng)借閱了某圖書的其他用戶之間的相關(guān)性進(jìn)行推送。例如推送系統(tǒng)可以對(duì)某計(jì)算機(jī)學(xué)院的讀者推送與其相類似(相同愛好、研究方向等)的其他讀者借閱查看的資料。
          ?基于用戶專業(yè)及興趣的推送:推送系統(tǒng)可以根據(jù)某讀者的歷史借閱數(shù)據(jù)以及用戶的專業(yè)、研究方向等,獲得讀者潛在知識(shí)需求,對(duì)讀者進(jìn)行書目信息推送。
          推送的形式可以根據(jù)用戶的不同情況,由用戶選擇以下三種方式中的一種:
          ?用戶登陸圖書館網(wǎng)站查詢時(shí)自動(dòng)彈出推送書目信息。
          ?通過E-mail發(fā)送到用戶郵箱。
          ?通過短信發(fā)送到用戶的手機(jī)。
          由于本體論具有良好的邏輯推理功能,因此,書目信息推送模塊能夠借助本體論從語義層面根據(jù)讀者特征信息、資源特征信息和知識(shí)庫信息,自動(dòng)推理出與讀者所從事專業(yè)、閱讀興趣等相匹配的書目信息資源。針對(duì)高校的特點(diǎn),每個(gè)讀者的特征類包含了關(guān)聯(lián)讀者屬性,通過該屬性,可在老師與學(xué)生之間、具有相同愛好讀者之間建立聯(lián)系,將資源信息推送給目標(biāo)讀者的同時(shí)推送給關(guān)聯(lián)讀者,實(shí)現(xiàn)點(diǎn)對(duì)面的資源推送。
          4.5 書目信息分析模塊
          書目信息分析模塊的功能主要是對(duì)書目信息進(jìn)行語義概念層次上的分析與過濾,只保留下與用戶相關(guān)的書目信息、過濾掉無關(guān)的。具體來說:①書目信息分析模塊需要對(duì)所收集到的每一條書目信息進(jìn)行特征詞的抽。虎趯(duì)于抽取的這些特征詞,書目信息分析模塊還需要在書目信息本體論的協(xié)助下,將其轉(zhuǎn)換為本體論中的概念詞語;③還要把含有這些轉(zhuǎn)換為本體論中的概念詞語與用戶興趣模型中的概念詞進(jìn)行匹配,只有匹配成功的概念詞語所對(duì)應(yīng)的書目信息資源才是需要保留的。將這些保留下來的書目信息按照某種規(guī)則排序后存入個(gè)性化書目信息索引庫中,由書目信息推送模塊按照某種方式推送給用戶。
          4.6 個(gè)性化書目信息索引庫
          系統(tǒng)自動(dòng)為每個(gè)圖書館的用戶建立個(gè)性化書目信息索引庫,即從書目信息庫中抽取出與用戶相關(guān)的書目信息實(shí)體,濾出無關(guān)信息,滿足了用戶個(gè)性化書目信息需求。
          個(gè)性化書目索引庫中的書目信息是按照用戶興趣概念進(jìn)行存儲(chǔ)的,每個(gè)興趣概念都與用戶興趣模型中的概念相對(duì)應(yīng)。當(dāng)用戶興趣模型中的用戶興趣發(fā)生變化時(shí),個(gè)性化書目信息索引庫相應(yīng)地也會(huì)做出調(diào)整。在這里,我們假定個(gè)性化信息索引庫中包含有一個(gè)對(duì)自身信息進(jìn)行管理的管理服務(wù)器,管理服務(wù)器會(huì)把不符合用戶興趣的興趣概念及其相應(yīng)的書目信息從個(gè)性化書目索引庫中刪去,同時(shí)加進(jìn)用戶新產(chǎn)生的興趣概念等。
          
          5、結(jié)論與展望
          
          基于本體論的個(gè)性化書目信息推送系統(tǒng)不但可以為每本書找到它們潛在的讀者,還可以為讀者節(jié)省時(shí)間,使讀者不用到圖書館就可獲取所需的書目信息。我們相信,隨著信息化、網(wǎng)絡(luò)化、數(shù)字化的進(jìn)一步推進(jìn),基于本體論的個(gè)性化書目信息推送系統(tǒng)在高校圖書館將得到廣泛的重視和應(yīng)用,為讀者提供更人性化、個(gè)性化、智能化的書目信息推送服務(wù),為其節(jié)約大量時(shí)間和精力,使高校數(shù)字圖書館的服務(wù)更令人滿意,使其資源得到更充分的利用。

        相關(guān)熱詞搜索:本體論 推送 書目 基于本體論的高校圖書館個(gè)性化書目推送系統(tǒng) 個(gè)性化推薦系統(tǒng)項(xiàng)目 個(gè)性化推薦系統(tǒng)代碼

        版權(quán)所有 蒲公英文摘 www.zuancaijixie.com
        91啦在线播放,特级一级全黄毛片免费,国产中文一区,亚洲国产一成人久久精品