基于共引的專利情報與學術文獻對比分析:國內(nèi)外文獻數(shù)據(jù)庫對比分析
發(fā)布時間:2020-03-07 來源: 歷史回眸 點擊:
[摘要]專利情報和學術文獻間既存在著共通性,同時也具有差異性。為了考察兩者差別,采用情報方法中的共引分析法分別構建專利情報和學術文獻的共引矩陣,進一步聚類成產(chǎn)業(yè)公司群和學術團體群;然后將其可視化,以直觀的方式將兩者進行對比。通過比較,觀察到產(chǎn)業(yè)集群更為集中,而學術集群略為分散。同時也發(fā)現(xiàn)中國公司與國外公司在研究方面存在著較大差距。
[關鍵詞]共引 可視化專利情報學術文獻
[分類號]G353
在情報研究中,通過分析專利引用或論文引用數(shù)據(jù),可以發(fā)現(xiàn)相關技術分布,然后,采用統(tǒng)計學的方法對技術進行比較、歸納,可進一步知曉他們之間的相似性或差異性,這種方法已逐漸成為目前常用研究方法之一。在日益受寵的專利地圖分析中,包括多個引證指標的引文分析也已成為必不可少的組成部分。而在引文分析中,最具影響力的是共引分析方法。它通過兩篇文獻同時被后來的一篇或多篇文獻所引用的數(shù)量情況,利用聚類分析、多維尺度等多元統(tǒng)計分析理論,借助計算機,把眾多分析對象之間錯綜復雜的共引網(wǎng)絡關系簡化為若干類群之間的關系表示出來,在此基礎上分析研究不同學科及文獻的結構與特點。因此,其評價更客觀、分類更科學、方式更直觀。
1 研究背景
共引分析最早出現(xiàn)在學術文獻的分析中。1973年,美國情報學家H.G.Small提出共引理論,之后,這方面的研究工作在國外便廣泛開展起來,其主要分為兩個系列:一是H.G.Small進行的以文章為分析單位所做的共引分析研究;另一是以H.D.White為代表的以作者為分析單位進行的研究。此外,還有部分學者以期刊為分析單位進行研究。國內(nèi)從上世紀90年代起吸收了國外的共引理論,并對國內(nèi)文獻情況進行了相關分析,如北京大學信息管理系針對中文農(nóng)業(yè)期刊進行共引分析;中國科學院文獻情報中心曾對中國科技期刊引文網(wǎng)絡的國內(nèi)外影響力進行分析。
專利共引研究同樣基于H.G.Small的共引理論,國外在20世紀80 90年代就開始呈現(xiàn)出激烈研究態(tài)勢同,而國內(nèi)在最近才開始這一熱潮。武漢大學于2008年對專利計量的多個指標進行研究,其中采用共引法對有機電激光技術專利進行專利權人的聚類和可視化分析。如今,各種共引分析指標層出不窮,共引分析方法也正不斷應用于新的領域中。
在這些共引分析中,多數(shù)只針對于專利情報或學術文獻中的一項進行研究,同時涉及兩者的研究較少。國外著名引文分析機構CHI研究公司在1998年對美國和歐洲專利中的專利與論文引用關系進行了研究,但其只是討論了被專利引用的專利與非專利文獻,并未涉及公司或研究機構的對比,也未進行共引結果的比較。
我們針對這一情況,分別對專利情報的專利權人和學術文獻的發(fā)表研究機構進行共引分析,并以固體氧化物燃料電池(sOFC)為例,對兩者結果進行比較,找出產(chǎn)業(yè)界公司(專利權人)與學術界研究機構在研究方向上的共通性與差異性。
2 研究方法
由于需要考察專利情報與學術文獻兩者的關系,所以首先要分別構建兩者的共引關系矩陣,并將其可視化,在此基礎上進行最后的對比分析。
2.1 專利情報的共引分析
2.1.1 數(shù)據(jù)采集數(shù)據(jù)源是分析的基礎,為了全面、嚴格地進行分析,我們需要選擇的是具有世界范圍的專利信息,同時需要有較強大引文信息支持的數(shù)據(jù)庫。所以Derwent Innovations Index數(shù)據(jù)庫將是最好的方案。該數(shù)據(jù)庫具有100多個國家的專利信息,并含有10余個國家的專利引文信息,因此最適合進行數(shù)據(jù)采集。在制訂了相應的檢索策略后,在此數(shù)據(jù)庫中進行檢索,下載數(shù)據(jù)。
2.1.2 數(shù)據(jù)整理在下載的海量數(shù)據(jù)中,首先要區(qū)分每個公司的專利信息,也就是根據(jù)專利權人進行統(tǒng)計。現(xiàn)在,不少專利分析軟件,如TDA(Thomson Data An山一zer)等已可進行此項工作。根據(jù)Derwent公司代碼,可統(tǒng)計出每個公司的被引專利量、兩個公司的共引專利量,并構建共引矩陣。
2.1.3 聚類將得到的共引矩陣在統(tǒng)計分析軟件SPSS中進行聚類分析(Cluster),并通過多維尺度分析(MDS)將結果可視化。
2.2 學術文獻的共引分析
2.2.1 數(shù)據(jù)采集眾所周知,在學術文獻的引文系統(tǒng)中,最權威的就是SCI系統(tǒng)。該系統(tǒng)目前不僅具有期刊類的學術文獻,而且集成了會議中的學術文獻,其收錄范圍廣、質量高已得到公認。因此,在確定檢索策略后,在此數(shù)據(jù)庫中檢索,并下載數(shù)據(jù)。
2.2.2 數(shù)據(jù)整理學術文獻的引文信息與專利的引文信息不同。學術文獻的引文記錄中僅有作者信息,不具有研究機構的信息。因此,首先需要將作者與研究機構相關聯(lián),即構建作者與研究機構的矩陣,然后,根據(jù)此矩陣將被引信息中的作者與研究機構一一對應;最后將每家機構的所有作者被引信息集合、去重,得到最終的研究機構被引情況。之后,構建共引矩陣。
2.2.3 聚類通過得到的共引矩陣,進行聚類和多維尺度分析。
2.3 比較分析
將專利聚類和學術文獻聚類中的公司(或研究機構)進行比較,發(fā)現(xiàn)兩者在研究方向上的差異,同時,觀察中國的公司(或研究機構)與國外公司(或研究機構)的差距。
3 實例研究與討論
我們以SOFC為例,按照上述方法,分別進行專利情報聚類與學術文獻聚類。
3.1 專利情報聚類
截止到2008年6月,我們在Derwent InnovationsIndex中共檢索到7 057項SOFC相關專利族,通過統(tǒng)計找出被引次數(shù)在100次以上的37家高被引公司(專利權人)。
然后構建這37家公司的37×37共被引矩陣。根據(jù)矩陣,在sPss中進行聚類的結果和多維尺度分析。
虛線(聚類的平均值)可將高被引專利權人劃分成三個不同的專利權人集群:西屋電氣(A群);三菱重工(B群);其他公司(c群)。
從群的角度可以看出,唯一的大群(c群)內(nèi)的各個公司在SOFC的研發(fā)方面有著很大的關聯(lián)性,他們擁有的優(yōu)質專利基本研究方向相似,很有可能既是競爭者,又是合作者。
同時,從SOFC專業(yè)角度看,由于SOFC技術已趨向于成熟,使得各個公司在研發(fā)、產(chǎn)業(yè)化的方向趨于一致,這也是造成多家公司形成一個集群的原因之一。而西屋電氣與三菱重工分別形成兩個孤點群也表明了其在SOFC的研究中有著自己獨特的方向和特點,真實地反映出這兩家公司在SOFC領域的領先地位。
多維尺度分析的結果與聚類結果非常吻合,從檢驗值看,區(qū)分度也較好,清晰地將三個群在坐標軸內(nèi)可視化,從他們間的距離可以更加直觀地看出他們之間關系的親近程度。就如西屋電氣和三菱重工兩個點距離c群有著明顯距離,形成兩個孤點,因此形成兩個單獨的群。
3.2 學術文獻聚類 截止到2008年12月,在SCI中,共檢索到SOFC相關文獻5 330篇。根據(jù)前述方法,篩選出論文發(fā)表量在40篇以上的研究團體,對其進行共引矩陣的構建。
根據(jù)矩陣,在SPSS中進行聚類的結果和多維尺度分析結果。
我們按虛線(聚類的平均值)劃分不同的研究機構類群,共分為4個群:倫敦大學帝國理工學院(A群);美國能源部西北太平洋國家實驗室(B群);德國核研究中心有限公司、丹麥瑞索國家實驗室、日本國立材料與化學研究所和日本東北大學(c群)以及其他公司(D群)。
多維尺度分析的結果也可分為4個群,而且可視化的圖形可以更清晰的發(fā)現(xiàn)群內(nèi)關系。如D群中,各個點的距離較近,表示群內(nèi)研究機構的研究方向更為接近;而c群內(nèi)各個點相對分散,他們之間的關系比D群內(nèi)各點的關系略為疏遠。
3.3 產(chǎn)業(yè)與學術聚類的比較分析
3.3.1 產(chǎn)業(yè)的集中化學術的分散化通過兩個聚類得到的群可以發(fā)現(xiàn),由專利情報得出的SOFC產(chǎn)業(yè)集群僅有3個,其中2個群為獨立公司,而另一個群則包括了幾乎所有重要公司;由學術文獻得出的SOFC學術集群為4個,且2個大群內(nèi)的點比產(chǎn)業(yè)大群(產(chǎn)業(yè)c群)內(nèi)的點更分散。因此,對于一項技術而言,在學術階段,可能呈現(xiàn)出更多的分散趨勢;到了產(chǎn)業(yè)階段,則會優(yōu)選其中的最佳方案,朝著更實用的方向發(fā)展,由此呈現(xiàn)出技術集中的特點。
3.3.2 產(chǎn)業(yè)公司與學術機構的兩極化在兩個集群中,我們未發(fā)現(xiàn)一個在學術與產(chǎn)業(yè)中都有著較大影響力的團體機構。學術影響力較強的機構基本均為研究機構,在產(chǎn)業(yè)影響力較強的機構中多為生產(chǎn)型公司,僅有兩家是學術研究機構。這也表明在如今的技術發(fā)展過程中,學術研究機構與產(chǎn)業(yè)公司還存在著明顯的職責和分工差異。學術機構在技術初期進行大量研究,但很難將其直接產(chǎn)業(yè)化,只能選擇轉讓或與其他公司合作實現(xiàn)產(chǎn)業(yè)化;而生產(chǎn)型公司注重產(chǎn)品的知識產(chǎn)權保護,視申請專利為企業(yè)戰(zhàn)略之一,因此擁有大量產(chǎn)業(yè)化技術專利。但其在初期的理論研發(fā)力量較弱,需要借助大專院校等研究機構。
3.3.3 中國公司的差距在產(chǎn)業(yè)集群中,均為國外公司,表明中國公司在研究力上與國外公司有著較明顯的差距;而在學術集群中有4家中國的研究機構,但這4個研究機構均在一個集群中,這也表示其研究方向較為一致,不夠多樣化;同時,也還沒有形成自己的特有技術和研究方向。因此,無論中國的公司或研究機構在SOFC領域內(nèi)都需要進一步借鑒國外公司的先進技術與經(jīng)驗,尋求突破點,謀求發(fā)展。
4 結論和改進
通過共引分析及其可視化結果,我們能明確地觀察到產(chǎn)業(yè)集群(專利情報)和學術集群(學術文獻)的狀況,由此發(fā)現(xiàn)兩者在研究方向、政策上的不同;并發(fā)現(xiàn)中國的產(chǎn)業(yè)團體和學術團體與國外先進者的差距,以供中國機構借鑒。
在研究過程中,我們也發(fā)現(xiàn)了一些問題,比如:學術論文的引文信息中不含機構信息,需要進行作者和機構的核對,但由于作者的同名或跳槽現(xiàn)象,會造成研究機構被引統(tǒng)計的不準確。另外,如在找出集群后,對每個集群的技術特征進行進一步具體分析,可能演變出包含技術特征的機構集群,將會對中國的公司和研究機構有著更明確的技術指引。在今后的研究中,將進一步解決這些問題,以使共引分析的結果更完善,對中國公司的借鑒更具體,在競爭情報工作中起到更大作用。
相關熱詞搜索:情報 文獻 學術 基于共引的專利情報與學術文獻對比分析 國內(nèi)外專利研究的比較分析 情報科學
熱點文章閱讀