信息檢索知識(shí)點(diǎn)

        發(fā)布時(shí)間:2020-07-12 來(lái)源: 入黨申請(qǐng) 點(diǎn)擊:

         信息檢索考點(diǎn)整理 1 、信息檢索的概念 廣義的信息檢索就是指將信息按一定的方式組織、存儲(chǔ)起來(lái),并根據(jù)信息用戶的需要找出有關(guān)信息的過程,包括信息的存儲(chǔ)與檢索兩個(gè)過程; 而狹義的信息檢索僅指有序化信息的檢索查找。

         2. 信息檢索的原理 就就是將檢索者的檢索提問標(biāo)識(shí)與存儲(chǔ)在檢索工具中的信息特征標(biāo)識(shí)進(jìn)行相符性比較,凡就是信息特征標(biāo)識(shí)與檢索提問標(biāo)識(shí)相一致或者信息特征標(biāo)識(shí)包含著檢索提問的標(biāo)識(shí),則具有該特征的信息就從檢索工具中輸出,輸出的信息就就是初步命中檢索所需的信息。

         3 、為什么說信息存儲(chǔ)與檢索就是兩個(gè)不可分割的有機(jī)體? 檢索的全過程包括存儲(chǔ)與檢索兩個(gè)過程,存儲(chǔ)與檢索就是相輔相成、不可分割的。存儲(chǔ)過程主要就是利用檢索語(yǔ)言對(duì)文獻(xiàn)進(jìn)行標(biāo)引,形成文獻(xiàn)特征標(biāo)識(shí)并輸入檢索工具,為檢索提供有規(guī)律的檢索途徑;檢索過程主要就是利用檢索語(yǔ)言對(duì)檢索提問進(jìn)行標(biāo)引,形成檢索提問標(biāo)識(shí),再按照存儲(chǔ)所提供的檢索途徑,將檢索提問標(biāo)識(shí)與文獻(xiàn)特征標(biāo)識(shí)進(jìn)行比較。檢索過程就是存儲(chǔ)過程的逆過程。因此,檢索者只有在全面了解存儲(chǔ)者就是怎樣把文獻(xiàn)存入到檢索工具中去以后,才知道怎樣從檢索工具中把所需要的信息檢索出來(lái)。

         4 、信息檢索的方法 (1)順查法 (2)倒查法 (3)抽查法 (4)追溯法 (5)循環(huán)法 5 、信息檢索的途徑 (1)內(nèi)部特征途徑 a) 分類途徑 b) 主題途徑 (2)外部特征途徑 a) 題名途徑 b) 著者途徑 c) 文獻(xiàn)編號(hào)途徑 d) 目錄檢索途徑 e) 機(jī)構(gòu)檢索法 f) 引文檢索途徑 6 、布爾模型的優(yōu)缺點(diǎn) 優(yōu)點(diǎn):(1)簡(jiǎn)單,形式簡(jiǎn)潔,易于理解;

         (2) 可操作性強(qiáng),應(yīng)用廣泛;

         (3) 構(gòu)成的邏輯提問式可以表達(dá)與用戶思維習(xí)慣相一致的查詢要求,提供非常精確的語(yǔ)義概念;

         (4) 能處理結(jié)構(gòu)化提問。

         缺點(diǎn):(1)表達(dá)用戶復(fù)雜需求效果欠佳

         (2)準(zhǔn)確匹配無(wú)法提供定量比較

         (3)匹配標(biāo)準(zhǔn)不盡合理

         (4)檢索結(jié)果不易控制

         7 、概率排序原則: 如果一個(gè)檢索系統(tǒng)對(duì)用戶的每個(gè)檢索提問的反應(yīng)就是以文獻(xiàn)集合中的文獻(xiàn)按相關(guān)性遞減的順序排列的,那么系統(tǒng)的總體效果就是最好的。

         8 、什么就是計(jì)算機(jī)信息檢索? 所謂計(jì)算機(jī)信息檢索,就就是在計(jì)算機(jī)與人的共同作用下,按照一定的方法組織與存儲(chǔ)信息,并通過人機(jī)對(duì)話從計(jì)算機(jī)存儲(chǔ)的大量數(shù)據(jù)中自動(dòng)輸出用戶所需的那部分信息的過程。實(shí)質(zhì)上計(jì)算機(jī)信息系檢索就是利用計(jì)算機(jī)信息檢索系統(tǒng)存儲(chǔ)與查找信息的技術(shù),就是計(jì)算機(jī)硬件資源、系統(tǒng)軟件、檢索軟件與數(shù)據(jù)庫(kù)的綜合。

         9 、計(jì)算機(jī)信息檢索的類型: (1)

         根據(jù)檢索系統(tǒng)的工作方式,可分為: a)、脫機(jī)信息檢索 脫機(jī)信息檢索就是利用單臺(tái)計(jì)算機(jī)的輸入裝置進(jìn)行檢索的系統(tǒng),用磁帶作為存儲(chǔ)介質(zhì),并且為連續(xù)的順序檢索方式,適合大批量的定題信息檢索。

         b)、聯(lián)機(jī)信息檢索 聯(lián)機(jī)信息檢索就是利用計(jì)算機(jī)終端設(shè)備,通過通信線路或網(wǎng)絡(luò),與世界上的信息檢索系統(tǒng)相連,從信息檢索系統(tǒng)的數(shù)據(jù)庫(kù)中進(jìn)行檢索并獲取信息的過程。

         聯(lián)機(jī)檢索模式就是主從式,即為所有的工作都在主機(jī)上進(jìn)行,主機(jī)負(fù)擔(dān)重,一旦主機(jī)癱瘓,整個(gè)系統(tǒng)都將處于癱瘓狀態(tài),因此對(duì)主機(jī)的性能要求極高。

         c)、光盤信息檢索 d)、網(wǎng)絡(luò)信息檢索 (2)

         根據(jù)信息的服務(wù)方式,可分為: a)、定題檢索 定題檢索就是用戶根據(jù)課題的要求,事先編寫出邏輯檢索提問式,并將存儲(chǔ)在計(jì)算機(jī)的存儲(chǔ)器中,每次系統(tǒng)加入新的信息,系統(tǒng)便會(huì)按檢索要求,找出用戶所需的資料,并把結(jié)果分給用戶,用戶能及時(shí)得到最新的文獻(xiàn)信息。具有定期性、新穎性與批處理性的特點(diǎn)。

         b)、回溯檢索

         回溯檢索就是追溯查找過去的信息,讓用戶一次檢索一段時(shí)間內(nèi)與某一課題有關(guān)的信息。也可以查找最新的信息,可以適應(yīng)多數(shù)用戶的查詢需要。

         c)、日常檢索 10. 計(jì)算機(jī)信息檢索技術(shù)初級(jí)檢索 6 個(gè) 1) 布爾邏輯檢索 2) 位置限制檢索 3) 短語(yǔ)檢索 4) 截詞檢索 5) 字段限制檢索 6) 區(qū)分大小寫檢索 11 、計(jì)算機(jī)信息檢索技術(shù)高級(jí)檢索 6 個(gè) 1) 加權(quán)檢索 2) 自然語(yǔ)言檢索 3) 相關(guān)信息反饋(相似檢索) 4) 概念檢索 5) 模糊檢索 6) 聚類檢索

         布爾邏輯檢索 (1)邏輯與

         用 AND 或*表示

         檢索式寫作 A AND B 或 A *B (2)邏輯或

         用“OR”或“+”表示 (3)邏輯非

         用 NOT 或

         — 表示

         A NOT B (A 當(dāng)中除去 B 所剩下的) 字段名稱及縮寫 AB abstract

          TI

         title

          AU author

          JN

         journal name LA language

         PY

         publication year

          SP

         source publication 分類與聚類的異同 相同點(diǎn):基于“類”的思想進(jìn)行檢索。

         不同點(diǎn):(1)分類基于分類法,其類目體系主要就是先組式,有系統(tǒng)性的。類目與文獻(xiàn)之間具有相對(duì)獨(dú)立性。而聚類則先有文獻(xiàn)后聚類,類的性質(zhì)及整體類目體系完全由系統(tǒng)中的文獻(xiàn)決定。(2)從類目形成過程瞧,分類就是總到分,聚類由分到總。

         會(huì)構(gòu)建檢索式( 主要就是積木型) 12 、計(jì)算機(jī)信息檢索策略含義 狹義的計(jì)算機(jī)信息檢索策略就是指檢索提問式的構(gòu)建,即運(yùn)用系統(tǒng)特定的檢索技術(shù),確定檢索詞之間的邏輯關(guān)系,形成表達(dá)用戶信息需求的檢索提問式。

         廣義的計(jì)算機(jī)信息檢索策略就是指在分析檢索課題的實(shí)質(zhì)內(nèi)容與明確檢索目標(biāo)的基礎(chǔ)上,選擇檢索工具,確定檢索途徑與檢索用詞,以及檢索詞之間邏輯關(guān)系與查找步驟最佳方案的一系列科學(xué)安排。

         13 、計(jì)算機(jī)信息檢索策略類型( 即聯(lián)機(jī)檢索五原則) (1)

         最專指面優(yōu)先:從最專指的概念入手 (2)

         最低登錄量面優(yōu)先 (3)

         積木型( 重點(diǎn)掌握, 會(huì)構(gòu)建此檢索式) (4)

         引文珠型增長(zhǎng) (5)

         逐次分餾 14 、網(wǎng)絡(luò)信息資源的評(píng)價(jià)方法: (1)

         定性評(píng)價(jià)法:就是指按照一定的評(píng)價(jià)標(biāo)準(zhǔn)從主觀角度對(duì)網(wǎng)絡(luò)信息資源所做的優(yōu)選與評(píng)估,主要有指標(biāo)體系法與調(diào)查表法。

        。2)

         定量評(píng)價(jià)法:國(guó)內(nèi)外比較典型的定量評(píng)價(jià)方法有信息計(jì)量法、層次分析法與對(duì)應(yīng)分析法等三種。

        。3)

         綜合評(píng)價(jià)法:就是定性評(píng)價(jià)與定量評(píng)價(jià)相結(jié)合的一種方法,有包括分析法、模糊綜合評(píng)價(jià)法等。

        。4)

         分類方法:分為第三方評(píng)價(jià)法、用戶評(píng)價(jià)法與網(wǎng)絡(luò)計(jì)量法。

         15 、搜索引擎的類型: (1)

         按檢索機(jī)制劃分:檢索型、目錄型與混合型檢索工具 (2)

         按檢索內(nèi)容劃分:綜合型、專題型與特殊型檢索工具 (3)

         按包含檢索工具數(shù)量劃分:單獨(dú)型與集合型檢索工具 (4)

         按檢索資料類型分:萬(wàn)維網(wǎng)檢索工具與非萬(wàn)維網(wǎng)檢索工具 16 、元搜索引擎的含義 所謂元搜索引擎,就是對(duì)分布于網(wǎng)絡(luò)的多種檢索工具的全局控制機(jī)制,它通過一個(gè)統(tǒng)一用戶界面幫助用戶在多個(gè)搜索引擎中選擇與利用合適的搜索引擎來(lái)實(shí)現(xiàn)檢索操作。

         17 、元搜索引擎的特點(diǎn): (1)

         虛擬索引數(shù)據(jù)庫(kù) (2)

         查全率高

        。3)

         用戶界面友好 (4)

         適宜二次加工 (5)

         擴(kuò)展性好

         18. 元搜索引擎的工作原理

         輸 入 查詢條件

         19 、實(shí)現(xiàn)跨語(yǔ)言信息檢索的方法: (1)提問式翻譯方法 (2)文獻(xiàn)翻譯方法(唯一結(jié)果就是源語(yǔ)言描述) (3) 提問式 — 文獻(xiàn)翻譯方法( 將查詢語(yǔ)言提問式翻譯成目標(biāo)語(yǔ)言提問式, 與目標(biāo)語(yǔ)言描述的信息庫(kù)進(jìn)行匹配, 檢索相關(guān)信息, 然后再把檢索結(jié)果的全部或部分內(nèi)容翻譯成查詢語(yǔ)言描述的信息。

          檢索結(jié)果一般選擇部分翻譯, 這樣工作量較小, 容易提高翻譯的效率與質(zhì)量, 部分翻譯一般就是對(duì)結(jié)果文本的前兩行、文摘或文本中重要的詞進(jìn)行翻譯, 在重要詞的翻譯中, 如何確定重要詞就是決定這種方法效果的關(guān)鍵。

         (4)中間語(yǔ)種翻譯方法 (5)非翻譯方法 20 、語(yǔ)義網(wǎng)的應(yīng)用 (1)

         Web 服務(wù) (2)

         智能信息檢索 (3)

         基于語(yǔ)義的網(wǎng)頁(yè)搜索引擎 (4)

         企業(yè)數(shù)據(jù)管理 21 、Ei 收錄論文的兩個(gè)層次 (1)

         Compendex 數(shù)據(jù)。數(shù)據(jù)的內(nèi)容全面,主要包括:論文標(biāo)題;作者;作者單位;英文文摘;論文所在期刊名稱;卷,期;論文頁(yè)碼;分類碼;主題詞等等。其中:分類碼;主題詞需要專業(yè)人員單獨(dú)給出。

        。2)

         Page One 數(shù)據(jù):數(shù)據(jù)內(nèi)容主要包括:論文標(biāo)題;作者;作者單位;論文所在期刊名稱;卷,期;論文頁(yè)碼;少數(shù)數(shù)據(jù)帶有英文文摘。不需要任何專業(yè)人員再做工作。

         22 、Compendex 數(shù)據(jù) 與 與 Page One 數(shù)據(jù)的主要區(qū)別在于:數(shù)據(jù)中就是否有分類碼與主題詞;有這兩項(xiàng)內(nèi)容的數(shù)據(jù)就是 Compendex 數(shù)據(jù),反之就是 Page One 數(shù)據(jù)。有沒有主題詞與分類號(hào)就是判斷論文就是否被 Compendex 數(shù)據(jù)正式收錄的唯一標(biāo)志。

         23 、主題指南 按字母順序列出與分類表中類目名稱相關(guān)的主題詞,并注明相關(guān)的分類號(hào),實(shí)際上就是分類表的主題索引,就是從分類途徑檢索文獻(xiàn)的指南。便于不能確定分類號(hào)的讀者實(shí)現(xiàn)從主題查到分類號(hào),再由分類號(hào)查到文獻(xiàn)所在頁(yè)碼。

         24 、SCI( 科學(xué)引文索引) 的編制結(jié)構(gòu)及檢索方法 (1)

         引文索引 (2)

         來(lái)源索引 (3)

         機(jī)構(gòu)索引 (4)

         輪排主題索引 25 、如何決定收錄期刊的數(shù)量與種類? (1)“加菲爾德文獻(xiàn)集中定律”——確定適宜的期刊數(shù)量 選 擇 搜索引擎 提交查詢請(qǐng)求 搜索引擎 1 搜索引擎 2 搜索引擎 3 整理返回結(jié)果 顯示查詢結(jié)果

          該定律認(rèn)為:在幾萬(wàn)種科技期刊中,最重要的期刊(即核心期刊)不過一千種,甚至可能還不足 500。因而,把收錄期刊的范圍定在 3000 種以內(nèi),足以把重要的科技文獻(xiàn)包括在內(nèi)。

         (2)“費(fèi)用—效果原則”——用來(lái)選擇每一種期刊,具體方法就是“引用頻率統(tǒng)計(jì)法”

         先計(jì)算一種期刊在一年內(nèi)被引用的總次數(shù),再計(jì)算其中每篇論文的平均引文章,其她因素對(duì)引文章的影響通過加某些修正系數(shù)來(lái)解決,引用頻率越高,說明該刊質(zhì)量越高。

         通過上述兩個(gè)指標(biāo)決定了收錄期刊的數(shù)量與種類 26 、什么就是專利? 這種受法律保護(hù)的發(fā)明就稱專利。

         含義:專利權(quán)——法律

          受專利法保護(hù)的發(fā)明創(chuàng)造——專利技術(shù)

          專利說明書等專利文獻(xiàn)——文獻(xiàn) 這三層含義的核心就是受專利法保護(hù)的發(fā)明,而專利權(quán)與專利文獻(xiàn)就是專利的具體表現(xiàn)。

         27 、什么就是同族專利? 同族專利指同一個(gè)發(fā)明為了在不同國(guó)家得到保護(hù),而在這些國(guó)家分別申請(qǐng)的一系列內(nèi)容相同或基本相同的專利。由于同族專利或相同專利都具有相同的優(yōu)先權(quán)項(xiàng),所以通過優(yōu)先權(quán)項(xiàng)可以方便、快捷地檢索出有關(guān)同一發(fā)明的全部相同專利或同族專利。

         28 、專利的類型 (1)

         發(fā)明專利 (2)

         實(shí)用新型專利 (3)

         外觀設(shè)計(jì)專利 (4)

         植物性專利 (5)

         防衛(wèi)性專利 知識(shí)產(chǎn)權(quán):工業(yè)產(chǎn)權(quán)與著作產(chǎn)權(quán) 29 、學(xué)位論文的文獻(xiàn)價(jià)值: (1)

         較高價(jià)值的一次文獻(xiàn):寫作不受篇幅限制,論述詳盡:從研究背景、技術(shù)線路、實(shí)驗(yàn)方法到數(shù)據(jù)獲取、分析結(jié)論論述翔實(shí)。

        。2)

         珍貴的信息資源價(jià)值:能集中反映所在單位的科研領(lǐng)域、學(xué)術(shù)活動(dòng)、研究進(jìn)展與最新成果,論文的使用者可以跟蹤名校導(dǎo)師的科研進(jìn)程。

        。3)

         綜述性二次文獻(xiàn):對(duì)相應(yīng)研究領(lǐng)域有系統(tǒng)深入的討論與綜述,擁有詳盡的參考文獻(xiàn),可得到課題研究現(xiàn)狀綜述。

        。4)

         寫作技巧的啟發(fā)藍(lán)本:通過對(duì)學(xué)位論文的閱讀,可大致梳理出作者的寫作思路與研究方法,學(xué)習(xí)學(xué)位論文的寫作方法。

         30 、信息檢索評(píng)價(jià)方法 (1)

         測(cè)試文檔集合法 (2)

         人機(jī)交互 (3)

         用戶體驗(yàn)日志分析法 (4)

         自然觀察法 31 、召回率:R=(檢索出的相關(guān)文獻(xiàn)量 / 數(shù)據(jù)庫(kù)中的全部相關(guān)文獻(xiàn))x100% 準(zhǔn)確率:P=(檢索出的相關(guān)文獻(xiàn)量 / 檢出的文獻(xiàn)總量)x100% 32 、平均準(zhǔn)確率( 并會(huì)計(jì)算) 平均準(zhǔn)確率就是一個(gè)通過所有相關(guān)文獻(xiàn)測(cè)定系統(tǒng)績(jī)效的單值指標(biāo)。如果檢索系統(tǒng)能快速返回所需的相關(guān)文獻(xiàn),并對(duì)被檢文獻(xiàn)進(jìn)行等級(jí)排序,則該系統(tǒng)的性能較好。

         平均準(zhǔn)確率就是求各個(gè)相關(guān)文獻(xiàn)準(zhǔn)確率的平均值。因此平均準(zhǔn)確率的計(jì)算只考慮相關(guān)文獻(xiàn)的數(shù)量,而與檢出文獻(xiàn)的總量無(wú)關(guān)。

        相關(guān)熱詞搜索:知識(shí)點(diǎn) 信息檢索

        版權(quán)所有 蒲公英文摘 www.zuancaijixie.com
        91啦在线播放,特级一级全黄毛片免费,国产中文一区,亚洲国产一成人久久精品