基于內(nèi)容揭示的信息資源控制的演進|信息資源規(guī)劃的內(nèi)容

發(fā)布時間:2020-03-07 來源: 美文摘抄點擊：

　　[摘要]信息資源的內(nèi)容控制是通過信息內(nèi)涵知識的揭示所進行的實質(zhì)性控制，是信息資源控制的主體和核心。語義web技術(shù)在信息資源控制中的應用，使尋求高效化的信息資源控制理論成為可能。信息資源內(nèi)涵的知識描述與揭示成為信息資源控制理論新的生長點。信息資源內(nèi)容控制呈現(xiàn)知識單元化、集成化、多元化和智能化的發(fā)展趨勢。
　　[關鍵詞]知識描述內(nèi)容揭示　信息資源控制
　　[分類號]G203
　　
　　信息資源控制是將無序的信息資源規(guī)范化和有序化的過程，旨在提供可控性的高效信息服務。網(wǎng)絡環(huán)境下，不斷增長的海量文獻信息與人們特定知識需求之間的矛盾日益尖銳。同時，現(xiàn)代計算機技術(shù)、通信技術(shù)和遠程數(shù)據(jù)處理技術(shù)的發(fā)展，為文獻內(nèi)涵信息的全面提取、組織、加工和利用提供技術(shù)支撐。信息資源控制的內(nèi)容與方法基于環(huán)境的變化而不斷深化發(fā)展。
　　
　　1　傳統(tǒng)信息資源控制的不足
　　
　　控制的基本含義不僅僅局限于信息資源客體本身，還包括以信息資源為中心的各種控制，其主要內(nèi)容有：①信息資源客體控制(簡稱信息資源控制)；②信息資源過程控制；③信息系統(tǒng)與工作控制；④信息用戶及其活動控制。其中，對信息資源客體控制是基本的…。在其他信息資源控制中，人們亦采用了類似于文獻信息資源控制的方法。如對信息過程、信息系統(tǒng)和信息用戶等方面的控制，基本也是以書目控制為核心。
　　
　　傳統(tǒng)的文獻控制方式可歸納為外部描述控制和內(nèi)容特征控制兩類�！巴獠棵枋隹刂啤蓖ㄟ^文獻外表特征的揭示將文獻信息有序化，以達到控制文獻的目的，其中描述內(nèi)容包括作者、時間、類型、來源等。理論研究和實際工作的結(jié)果表明，這種描述控制是完全可以實現(xiàn)的�！拔墨I內(nèi)容控制”遠比“外部描述控制”復雜，這是一種通過文獻內(nèi)涵知識信息的揭示所進行的實質(zhì)性控制，是文獻控制的主體和核心。鑒于知識結(jié)構(gòu)和演化過程的復雜性，其基本問題作為傳統(tǒng)目錄學、文獻學和現(xiàn)代知識信息處理理論的中心，是學術(shù)界和實際工作部門長期探討的主要課題。
　　隨著社會信息化發(fā)展，社會對信息資源控制質(zhì)量提出越來越高的要求，信息資源內(nèi)容控制作為信息資源控制的核心環(huán)節(jié)，其傳統(tǒng)方式正受到來自各方面的挑戰(zhàn)。傳統(tǒng)分類法和主題法中知識揭示方式的局限性日益凸顯，表現(xiàn)在：①難以適應科學技術(shù)“微分化”和“積分化”的趨勢；②難以適應對信息內(nèi)涵的全面揭示；③難以適應以知識單元為基礎的計算機智能組織系統(tǒng)的信息控制；④難以適應知識形成和演化過程的控制。事實上，信息資源內(nèi)容控制的工作重心已逐漸轉(zhuǎn)移到高價值的活動，特別是通過對目前未能得到充分利用的信息資源內(nèi)涵知識的揭示，使之為更多用戶獲取，為信息資源提供更高的價值。
　　以上情況表明，研究新的信息資源內(nèi)容控制方式已成為關系信息資源工作全局的關鍵課題之一。同時，網(wǎng)絡技術(shù)的發(fā)展和新的信息處理技術(shù)的出現(xiàn)，使尋求高效化的信息資源控制理論成為可能。其中，信息資源內(nèi)涵的知識描述與揭示成為信息資源控制理論新的生長點。
　　
　　2　信息資源控制中知識描述與揭示的發(fā)展
　　
　　隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展，語義互聯(lián)網(wǎng)(semanticweb)正逐漸將Internet變成一個巨大的全球化知識庫。語義互聯(lián)網(wǎng)環(huán)境下，信息資源的內(nèi)容控制可概括為兩點：①對語詞的規(guī)范化處理；②顯示概念之間的關系。這兩點可通過知識描述與揭示方法來實現(xiàn)。在語義網(wǎng)環(huán)境下，知識描述與揭示的方法主要有可擴展標記語言(XML)、資源描述模型(RDF／RDF Schema)、主題圖(XTM)和知識本體(Ontology)等。這些適合語義Web技術(shù)的知識描述和揭示方法提供了信息內(nèi)容表示的標準化框架，通過標準的語義規(guī)范使計算機自動讀取和處理信息資源，為基于Web服務的智能共享提供基礎。
　　
　　知識描述與揭示方法決定了信息資源內(nèi)容控制的精度和深度，只有根據(jù)求解問題的性質(zhì)和方法靈活地選用合適的知識描述表示方法，才能使信息資源內(nèi)容控制取得較高的效率。表1展示了XML、RDF、XTM、Ontology的技術(shù)根源、數(shù)據(jù)模型、處理信息方式及其應用的主要區(qū)別。事實上，XML、RDF、XTM、Ontology在信息資源的描述與揭示體系中處于不同的層次，對信息資源內(nèi)容控制發(fā)揮不同的作用。
　　與分類法、主題法等傳統(tǒng)知識描述與揭示方法相比，XML、RDF、XTM、本體等知識描述與揭示方法的根本區(qū)別在于系統(tǒng)中的概念、特性、限制條件等內(nèi)容都是計算機可讀(懂)的。同時，在這些知識描述與揭示方法中，概念之間關系的表達要比主題法、分類法更廣更深，這是由于基于語義網(wǎng)的知識描述與揭示主要是為機器增加“智能”進而實現(xiàn)自動處理信息、知識分享和再利用而建立，所以在數(shù)據(jù)模型和表述語言方面，它的結(jié)構(gòu)與數(shù)據(jù)庫很接近，通過簡單的處理即可以將整個系統(tǒng)轉(zhuǎn)成數(shù)據(jù)庫而直接實施到信息系統(tǒng)的開發(fā)和建設中，為知識采集、知識庫建立提供框架平臺，這是傳統(tǒng)圖書館主題法、分類法所不能及的。
　　
　　3　基于內(nèi)容揭示的信息資源控制的深化
　　
　　由于傳統(tǒng)的書目控制理論運用于信息資源內(nèi)容控制存在著局限性，隨著知識描述與揭示技術(shù)的發(fā)展，信息資源控制的技術(shù)、主體、方法都發(fā)生了變化，主要體現(xiàn)在以下方面：
　　
　　3.1控制內(nèi)容的知識單元化發(fā)展
　　文獻信息資源記錄的知識內(nèi)涵豐富，從應用角度和知識產(chǎn)生角度看，它并非如布魯克斯所描述的靜態(tài)結(jié)構(gòu)，而是具有動態(tài)結(jié)構(gòu)的特征。從知識的性質(zhì)上看，文獻單元是相對靜止的，而知識單元是衍變的，一篇文獻不僅包含許多知識單元，體現(xiàn)知識單元之間的各種有機聯(lián)系，而且反映文獻作者對各種知識的處理、加工、思維和推理過程，反映了知識的演化。文獻信息資源所含的這些動態(tài)性信息，對于使用者來說比靜態(tài)知識結(jié)構(gòu)信息(如結(jié)果)更重要。事實上，在現(xiàn)代科學技術(shù)條件下，用戶利用文獻往往不是為了查詢單一的、固定的知識概念，而是為了借鑒文獻并未明確表達的作者思維和創(chuàng)造活動的方法，從中得到啟示，激發(fā)靈感。對于這種知識過程的揭示，任何靜態(tài)控制方式都顯得無能為力，其問題的解決必然求助于新的模式。
　　迅速普及的網(wǎng)絡技術(shù)和數(shù)字技術(shù)使任意層次的任意信息元素、信息單元和信息集合體系正在逐步以計算機可識別和可理解的方式被定義、描述、指向、鏈接、傳遞和動態(tài)組織。信息資源內(nèi)容揭示的對象不僅停留在對信息特征的描述，而且深入到知識單元，信息資源內(nèi)容揭示的深度和廣度得到極大拓展，通過多層次、多方位的描述與揭示控制信息資源，促進信息資源的合理利用�？梢�，當前信息資源內(nèi)容控制的對象已從文獻整體控制向知識單元及其知識組織控制方面延拓，因知識產(chǎn)生、老化和利用周期縮短，知識信息控制已成為信息資源內(nèi)容控制的重點。同時，語義Web技術(shù)的出現(xiàn)及其在信息資源知識組織與控制中的應用，帶來了知識揭示與組織工具的變革并重構(gòu)了知識組織控制體系，知識組織控制從物理層次上的文獻單元上升到認知層次的知識單元，從單純的語法處理(主題法、分類法)轉(zhuǎn)變?yōu)檎Z義處理(如本體等語義網(wǎng)絡表示法)，從語義處理到“模擬個體知識記憶結(jié)構(gòu)”的考慮語境的語用處理方式；基于內(nèi)容揭示的資源控制必將實現(xiàn)“語法－語義－語用”的新跨越發(fā)展。
　　
　　3.2控制方法的集成化發(fā)展
　　在信息資源內(nèi)容控制中，分類法和主題法(包括由此派生的關鍵詞法、敘詞法和元詞法等)是文獻信息資源控制通用的基本方法，其要點是按一定的知識處理法則將文獻有序化。分類法在揭示文獻所含知識方面，雖然具有較強的系統(tǒng)性，但缺乏應有的靈活性和揭示深度；主題法從某種程度上彌補了分類法的缺陷，卻缺乏系統(tǒng)性。當前，科學技術(shù)高度發(fā)展，其知識領域愈分愈細，愈來愈專。與此同時，任何一個狹窄的專門領域又必然涉及多方面的知識門類。這一現(xiàn)實在文獻中的體現(xiàn)便是文獻內(nèi)容(知識)的高度專門化與高度綜合化趨勢的并存�？茖W技術(shù)和其他知識領域?qū)W科發(fā)展中的“微分化”與“積分化”效應是人類知識高速增長、迅速分化和組合的結(jié)果。面對人類知識生產(chǎn)的變化，無論是分類法還是主題法，分別用于控制信息資源的效果必然會愈來愈差。
　　傳統(tǒng)書目控制的局限性表明，在信息資源內(nèi)容控制中必須借助多種方法和手段的集成運用，必須求助于普遍適用的控制理論。信息資源的充分開發(fā)和利用和人類信息實踐的極大豐富，為信息資源內(nèi)容控制理論和方法的發(fā)展和完善奠定了實踐基礎，現(xiàn)代信息技術(shù)和通信技術(shù)的發(fā)展，以及建立在語義網(wǎng)絡技術(shù)基礎上的知識描述與揭示方法的完善，為信息資源的內(nèi)容控制提供了必要的物質(zhì)和技術(shù)條件。
　　在以本體為核心的語義Web技術(shù)的驅(qū)動下，信息資源內(nèi)容控制方法不再僅僅局限于傳統(tǒng)的分類法、敘詞表、編目規(guī)則等，而是出現(xiàn)了能夠更好適應數(shù)字環(huán)境的新型知識組織工具：概念地圖、語義網(wǎng)絡、實用分類法等。語義web技術(shù)在信息資源內(nèi)容控制中的應用，為資源控制提供了新的思維方式和新的理念，基于信息內(nèi)容揭示的資源控制方法隨著信息資源揭示與組織技術(shù)的發(fā)展而不斷深化拓展，網(wǎng)絡環(huán)境下信息資源的內(nèi)容控制必然是多種方法的結(jié)合使用。
　　
　　3.3控制主體的多樣化發(fā)展
　　在信息資源的內(nèi)容控制中，無論是傳統(tǒng)的分類法、主題法(關鍵詞法、單元詞法還是敘詞法等)，還是用于數(shù)字資源描述與揭示的元數(shù)據(jù)，大多是由專業(yè)人員制定和標引。網(wǎng)絡環(huán)境下，數(shù)字化存貯、網(wǎng)絡途徑獲取已成為人們利用信息資源的主流方式，信息資源內(nèi)容控制的主體也隨之擴展到專業(yè)不同、層次各異的各種終端用戶�；谛畔�(nèi)容揭示的資源控制逐漸呈現(xiàn)出開放性、共享性、交互性的特點，體現(xiàn)專業(yè)化與社會化控制并存的發(fā)展趨勢。
　　以下我們通過元數(shù)據(jù)和大眾分類法的對比分析說明信息資源內(nèi)容控制的多樣化發(fā)展。大眾分類法(Folksonomy)是一種由用戶參與和主導的信息資源組織控制方式，作為構(gòu)筑下一代互聯(lián)網(wǎng)(Web 2.0)的核心要素，大眾分類法由用戶自發(fā)的用標簽(Tag)對感興趣的資料進行分類，并與他人共享標簽的過程和結(jié)果。它揚棄了以往信息資源控制事先確定大綱的方式，由用戶自由選擇關鍵詞甚至顏色來分類和描述信息內(nèi)容。
　　作為網(wǎng)絡環(huán)境下數(shù)字化信息資源內(nèi)容控制方式，如果說元數(shù)據(jù)是“關于數(shù)據(jù)的數(shù)據(jù)(Data about Da―ta)”，那么大眾分類法就是“關于數(shù)據(jù)的標簽(Tag a―bout Data)”。兩者的出發(fā)點都是組織信息以便利用戶的使用，但前者是通過專業(yè)人士以標準化方式推行，后者則更多依賴大眾的參與和“重量級應用”。圖1展示了基于元數(shù)據(jù)的標準化控制和基于用戶標簽的自由化控制模式。
　　“元數(shù)據(jù)”通常采用結(jié)構(gòu)化、規(guī)范化或標準化的方式對“數(shù)字資源”進行標識，由專業(yè)機構(gòu)專業(yè)人員制定。當前，由于元數(shù)據(jù)種類繁多，相互之間缺乏有效的互操作機制，從而影響了元數(shù)據(jù)控制信息資源的效率；“Tag標簽”由用戶根據(jù)個人需要在提交匯聚數(shù)字資源過程中，對數(shù)字資源加上個性化的標識說明，“Tag標簽”在應用過程中不斷生成優(yōu)化，而非采用預設的結(jié)構(gòu)模式。事實上，在元數(shù)據(jù)標準化控制模式和用戶標簽控制模式中，“用戶”應用的社會互聯(lián)效應不同。在“用戶Tag標簽模式”中，用戶不僅是信息資源的使用者，同時也是信息內(nèi)容的建設匯聚者，在應用與建設“數(shù)字資源”與“Tag標簽”的過程中，用戶之間能夠不斷建立社會聯(lián)系�；谟脩魳撕炞杂煽刂颇Ｊ�，我們完全認可信息資源的內(nèi)容控制系統(tǒng)將成為一個合作的、分布式的、國際化的、基于網(wǎng)絡的生態(tài)系統(tǒng)。
　　目前，無論是元數(shù)據(jù)還是基于Tag的大眾分類法，還沒有從全局或者根本上解決信息資源組織控制問題，從某種程度上講，大眾分類法提供了新的視角來看待如何控制信息資源以及用戶的參與對信息資源控制的影響。總體而言，信息資源的控制總是處于有序和無序、標準和自由之間并保持某種動態(tài)均衡。
　　
　　3.4控制技術(shù)的智能化發(fā)展
　　目前，信息資源內(nèi)容揭示主要以文獻單元為基礎和以數(shù)據(jù)(各種事實、概念、數(shù)值的總和等)單元為基礎，大多是靜態(tài)的、列舉式的。未來信息資源內(nèi)容控制將以專家系統(tǒng)為基礎，具有動態(tài)聯(lián)系、判斷、分析、比較、推理等新型的知識處理與組織功能。
　　解決信息資源智能化揭示與控制的主要困難，首先是信息按思維程序要求的有效排列和多方面處理之間的矛盾；其次是輸入文獻知識單元的處理和判斷，以及人工智能的智能化水平的提高。當代人工智能技術(shù)的發(fā)展為信息資源的動態(tài)結(jié)構(gòu)揭示和智能化控制提供了可能。
　　當前不斷發(fā)展的專家系統(tǒng)被稱為體外大腦，其中的知識庫相當于人腦的知識存儲結(jié)構(gòu)，是接受新知識的必要條件，其推理機構(gòu)類似于人腦的特殊思維活動機制。專家系統(tǒng)對輸入知識的處理和判斷可以類比人對知識的處理過程�；谶@一事實，如果向系統(tǒng)輸入文獻中的靜態(tài)知識單元，并提出顯示知識組織和推理的要求，則系統(tǒng)可以顯示文獻作者的推理和思維信息，而這正是所需求的動態(tài)知識信息。智能系統(tǒng)將知識揭示與文獻控制融為一體，除提供動態(tài)知識外，還可以在更廣的范圍內(nèi)進行知識組織與處理，將反映相關知識的信息資源進行有機結(jié)合，從而取得濃度很高的高層次知識信息。應該說，這是信息資源控制工作的一場變革。當前，這一研究尚處于初級狀態(tài)，在某些方面僅僅存在某些學者和用戶的設想。
　　人工智能技術(shù)促進了信息內(nèi)容的挖掘與深層次揭示，以更好滿足不同用戶的各種需求，提供個性化的信息服務。從信息中采掘知識，再將知識轉(zhuǎn)變?yōu)樯鐣敻�，體現(xiàn)信息資源內(nèi)容控制深化發(fā)展的方向，目的是向人們提供便于利用的、可以幫助解決問題的序化知識，實現(xiàn)從信息層次向知識層次的根本轉(zhuǎn)變。

基于內(nèi)容揭示的信息資源控制的演進|信息資源規(guī)劃的內(nèi)容

熱點文章閱讀