幾個值得關(guān)注的語義出版研究熱點(diǎn)
發(fā)布時間:2018-06-26 來源: 散文精選 點(diǎn)擊:
[摘 要] 自語義出版的概念正式提出后,工業(yè)界和學(xué)界對語義出版的關(guān)注越來越高,由于語義出版和Web技術(shù)密切相關(guān),近幾年Web等領(lǐng)域的發(fā)展給語義出版帶來了新動向,也出現(xiàn)了一些對語義出版內(nèi)涵的再思考。本文對目前主流的語義出版研究和實(shí)踐現(xiàn)狀進(jìn)行梳理總結(jié),發(fā)掘了語義出版數(shù)據(jù)的開放共享、去中心化語義出版實(shí)踐、真正的語義出版等研究熱點(diǎn),希望引起學(xué)界對這些研究方向的關(guān)注和重視。語義出版數(shù)據(jù)的開放共享、去中心化實(shí)踐是Web技術(shù)的開放性及數(shù)據(jù)科學(xué)發(fā)展的必然結(jié)果,伴隨著這些最新的技術(shù)和實(shí)踐原則的提出和推進(jìn),將進(jìn)一步引起各界對語義出版研究與實(shí)踐的深化以及對什么是真正的語義出版的思考。
[關(guān)鍵詞] 語義出版 開放共享 FAIR 可信任 去中心化
[中圖分類號] G237 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1009-5853 (2018) 02-0016-07
[Abstract] After the definition of semantic publishing put forward in 2009, more and more attentions are paid from industry and academia. Due to the close relation between semantic publishing and web techniques, new trends from the field of web and related domains were brought into the scope of semantic publishing, and some new ideas about the original concept of semantic publishing emerged recently. In this paper, main stream of semantic publishing studies and practices were classified and summarized, and opening, sharing, decentralizing and genuine semantic publishing as the newest hotspots in semantic publishing field were proposed with expectation to bring more attentions to people in this field. It is an inevitable result of the openness of the Web and development of data science that opening, decentralizing as new trends come out in the development of semantic publishing. Together with these newly put forward techniques and principles, this will introduce more and more people to consider the connotation of the genuine semantic publishing in the future and promote more and more study and research in deep.
[Key words] Semantic publishing Opening and sharing FAIR Trusty publishing Decentralization
1 引 言
自肖頓(Shotton)[1][2]首次提出語義出版(semantic publishing)的概念后,語義出版在學(xué)術(shù)界和工業(yè)界的研究和實(shí)踐逐漸升溫。語義出版其實(shí)可以簡單地總結(jié)為任何可以增強(qiáng)出版物語義內(nèi)涵的技術(shù)手段,它是Web技術(shù)尤其是語義Web技術(shù)、文本分析等技術(shù)和出版領(lǐng)域?qū)嵺`的一次有意義的融合。Web技術(shù)中的信息發(fā)布、訪問協(xié)議以及標(biāo)記語言等技術(shù)為語義出版物提供了開放的訪問存取環(huán)境,語義Web技術(shù)中的RDF/OWL標(biāo)準(zhǔn)、Linked Data技術(shù)及實(shí)踐原則為語義出版物提供了規(guī)范的表示模型,以自然語言處理為核心的文本分析與挖掘技術(shù)則為語義出版流程的自動化提供了支撐。因此,語義出版概念并不是作為一項(xiàng)新的技術(shù)被提出,它是各種現(xiàn)有技術(shù)在出版領(lǐng)域中廣泛應(yīng)用后自然而然被歸納總結(jié)的結(jié)果。具體而言,語義出版通過可視化、動態(tài)檢索等手段來增強(qiáng)出版物的語義,對相似內(nèi)容的出版物進(jìn)行關(guān)聯(lián),共享出版物背后的科學(xué)數(shù)據(jù),增加豐富的出版物元數(shù)據(jù)來提高機(jī)器的可讀性,進(jìn)而促進(jìn)出版物的可發(fā)現(xiàn)性。
語義出版模式的流行對現(xiàn)有的基于科學(xué)論文層次的科學(xué)交流來講意義重大。傳統(tǒng)的科學(xué)出版模式將科學(xué)研究成果使用自然語言進(jìn)行表達(dá)并集中存儲在數(shù)據(jù)庫中,實(shí)際上科學(xué)論文以這種方式呈現(xiàn)其中蘊(yùn)含的知識被發(fā)現(xiàn)的概率并不高,科研人員需要進(jìn)行繁瑣的出版物檢索、研讀等科研活動才能獲取并總結(jié)出所需的科研背景和現(xiàn)狀。而語義出版要求出版物具有豐富的元數(shù)據(jù)、細(xì)粒度的以及高度互聯(lián)的內(nèi)容片段,這可以極大地提高學(xué)術(shù)交流的效率以及新知識的發(fā)現(xiàn)概率[3],避免或者降低科學(xué)假設(shè)以及科學(xué)實(shí)驗(yàn)的重復(fù)進(jìn)行。本文簡要梳理了目前最新的主流語義出版的研究與實(shí)踐,重點(diǎn)分析在開放科學(xué)的環(huán)境下,語義出版研究與實(shí)踐的幾個最新的研究熱點(diǎn),主要包括:語義出版數(shù)據(jù)開放共享、語義出版的去中心化實(shí)踐以及對什么是真正的語義出版的思考。
2 語義出版發(fā)展現(xiàn)狀
語義出版技術(shù)在出版業(yè)中的應(yīng)用越來越廣泛[4],國際諸多大型企業(yè)如威科集團(tuán)[5]、愛思唯爾出版集團(tuán)[6]、BBC[7][8]等早已將語義出版技術(shù)作為其創(chuàng)新戰(zhàn)略和商業(yè)實(shí)踐的一部分。國內(nèi)外對語義出版的科學(xué)研究與實(shí)踐也逐漸增多,已經(jīng)有語義出版相關(guān)的圖書及專著相繼問世,諸如文獻(xiàn)[9][10][11]等。語義出版相關(guān)的科學(xué)活動也相當(dāng)活躍,知名的要數(shù)最近幾年陸續(xù)組織的語義出版國際研討會(Semantic Publishing Workshop,SePublica)[12],致力于解決語義出版相關(guān)的各種原則、技術(shù)問題,以及每年舉辦的語義出版挑戰(zhàn)賽(Semantic Publishing Challenges)[13],主要以從科學(xué)文獻(xiàn)中自動抽取知識片段為任務(wù)目標(biāo)。
相關(guān)熱詞搜索:幾個 熱點(diǎn) 語義 值得關(guān)注 出版
熱點(diǎn)文章閱讀