基于Hadoop的中醫(yī)藥大數(shù)據(jù)平臺(tái)基礎(chǔ)架構(gòu)的設(shè)計(jì)與研究
發(fā)布時(shí)間:2018-06-23 來(lái)源: 日記大全 點(diǎn)擊:
[摘要] 大數(shù)據(jù)技術(shù)在當(dāng)下被廣泛關(guān)注,構(gòu)建中醫(yī)藥大數(shù)據(jù)平臺(tái)是未來(lái)強(qiáng)化中醫(yī)藥行業(yè)競(jìng)爭(zhēng)力的有力武器。本文通過(guò)解析中醫(yī)藥大數(shù)據(jù)特性,設(shè)計(jì)和研究中醫(yī)藥大數(shù)據(jù)平臺(tái)的基礎(chǔ)架構(gòu),通過(guò)合理設(shè)計(jì)和部署集群、網(wǎng)絡(luò)和服務(wù)器等環(huán)境,力求提供穩(wěn)定可靠的中醫(yī)藥大數(shù)據(jù)基礎(chǔ)平臺(tái)環(huán)境。
[關(guān)鍵字] Hadoop;大數(shù)據(jù)平臺(tái);中醫(yī)藥;基礎(chǔ)架構(gòu)
[中圖分類(lèi)號(hào)] R2-05 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673-7210(2018)02(c)-0158-05
Design and research of traditional Chinese medicine big data platform infrastructure based on Hadoop
WANG Li WANG Ping SHEN Junhui
Information Center, Beijing University of Chinese Medicine, Beijing 100029, China
[Abstract] Big data technology has been widely concerned in the present and building a big data platform for traditional Chinese medicine is a powerful weapon to strengthen the competitiveness of traditional Chinese medicine in the future. In this paper, through the analysis of traditional Chinese medicine data characteristics, architecture design and research of traditional Chinese medicine data platform, through reasonable design and deployment of cluster, server and network environment, so as to provide a stable and reliable traditional Chinese medicine data base platform.
[Key words] Hadoop; Big data; Traditional Chinese medicine; Infrastructure
在當(dāng)今社會(huì),信息技術(shù)與經(jīng)濟(jì)社會(huì)的交匯融合已近引發(fā)了數(shù)據(jù)迅猛增長(zhǎng),數(shù)據(jù)已成為國(guó)家基礎(chǔ)性戰(zhàn)略資源。2015年8月31日,國(guó)務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(以下簡(jiǎn)稱(chēng)《綱要》),系統(tǒng)部署大數(shù)據(jù)發(fā)展工作[1]!毒V要》明確指出,推動(dòng)大數(shù)據(jù)發(fā)展和應(yīng)用,在未來(lái)5~10年打造精準(zhǔn)治理、多方協(xié)作的社會(huì)治理新模式,建立運(yùn)行平穩(wěn)、安全高效的經(jīng)濟(jì)運(yùn)行新機(jī)制,構(gòu)建以人為本、惠及全民的民生服務(wù)新體系,開(kāi)啟大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新的創(chuàng)新驅(qū)動(dòng)新格局,培育高端智能、新興繁榮的產(chǎn)業(yè)發(fā)展新生態(tài)。堅(jiān)持創(chuàng)新驅(qū)動(dòng)發(fā)展,加快大數(shù)據(jù)部署,深化大數(shù)據(jù)應(yīng)用,已成為穩(wěn)增長(zhǎng)、促改革、調(diào)結(jié)構(gòu)、惠民生和推動(dòng)政府治理能力現(xiàn)代化的內(nèi)在需要和必然選擇。
近幾年,中醫(yī)藥醫(yī)療行業(yè)的數(shù)據(jù)增長(zhǎng)迅猛,中醫(yī)藥醫(yī)療行業(yè)也應(yīng)抓住契機(jī)緊跟時(shí)代的步伐,大力發(fā)展信息化建設(shè)。2015年,國(guó)務(wù)院公布的《中醫(yī)藥健康服務(wù)發(fā)展規(guī)劃(2015-2020)》,特別提到了運(yùn)用云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等信息技術(shù)開(kāi)發(fā)智能化中醫(yī)健康服務(wù)產(chǎn)品[2]。2016年2月22日,國(guó)務(wù)院發(fā)布了《中醫(yī)藥發(fā)展戰(zhàn)略規(guī)劃綱要(2016-2030年)》,其中明確了未來(lái)十五年我國(guó)中醫(yī)藥發(fā)展方向和工作重點(diǎn),以及今后一個(gè)時(shí)期中醫(yī)藥發(fā)展的重點(diǎn)任務(wù)!吨嗅t(yī)藥健康服務(wù)發(fā)展規(guī)劃(2015-2020)》中明確指出推動(dòng)“互聯(lián)網(wǎng)+”中醫(yī)醫(yī)療作為重點(diǎn)任務(wù)之一,將推進(jìn)中醫(yī)藥信息化建設(shè)作為完成重點(diǎn)任務(wù)的保障舉措[3]。在推進(jìn)中醫(yī)藥信息化建設(shè)的保障舉措中要求按照健康醫(yī)療大數(shù)據(jù)應(yīng)用工作部署,在健康中國(guó)云服務(wù)計(jì)劃中,加強(qiáng)中醫(yī)藥大數(shù)據(jù)應(yīng)用。在若干政策的大力支持下,大數(shù)據(jù)技術(shù)與中醫(yī)藥醫(yī)療行業(yè)相結(jié)合,必將產(chǎn)生巨大的經(jīng)濟(jì)和社會(huì)效益。
1 行業(yè)背景
目前在學(xué)術(shù)界和產(chǎn)業(yè)界對(duì)于大數(shù)據(jù)(Big data)并沒(méi)有一個(gè)嚴(yán)格的定義[4]。研究機(jī)構(gòu)Gartner定義“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來(lái)適應(yīng)海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。麥肯錫全球研究所對(duì)大數(shù)據(jù)給出的定義是一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類(lèi)型和價(jià)值密度低四大特征[5]。而對(duì)于大數(shù)據(jù)的特征也是眾說(shuō)紛紜,基本上容量、種類(lèi)和速度是大數(shù)據(jù)公認(rèn)的3個(gè)基本特征[6-8]。
在中醫(yī)藥醫(yī)療行業(yè)領(lǐng)域中,中醫(yī)藥信息具有非常典型的大數(shù)據(jù)特征。首先從數(shù)據(jù)量上看,北京的一所三甲中醫(yī)醫(yī)院平均1 d的門(mén)診量可達(dá)1萬(wàn)人次,每年住院患者可達(dá)5萬(wàn)以上,如果將這些患者的診療過(guò)程全部數(shù)據(jù)化,每人次就診產(chǎn)生的醫(yī)學(xué)數(shù)據(jù)以10 M計(jì),那么每年產(chǎn)生的數(shù)據(jù)量將高達(dá)70 TB,如果把全國(guó)中醫(yī)院的臨床數(shù)據(jù)都匯聚起來(lái),其規(guī)模之大可想而知。其次,數(shù)據(jù)類(lèi)型復(fù)雜。在中醫(yī)醫(yī)院,每個(gè)患者不但要經(jīng)過(guò)辨證論治的個(gè)體化診療,還會(huì)經(jīng)過(guò)各種檢查檢測(cè)進(jìn)行疾病及其預(yù)后診斷,所以不光有病歷資料中包含的信息,還包括檢查、多種影像或病理切片檢查的生物學(xué)信息。這些眾多類(lèi)別的數(shù)據(jù)通過(guò)分析處理可以產(chǎn)生多種多樣的數(shù)據(jù)存儲(chǔ)形式。再者,在數(shù)據(jù)的時(shí)效性方面,醫(yī)療數(shù)據(jù)每時(shí)每刻都在產(chǎn)生,例如臨床診斷等都具有實(shí)時(shí)處理的需求,具有時(shí)效性。
但是目前絕大多數(shù)中醫(yī)藥醫(yī)療行業(yè)數(shù)據(jù)均處于歸檔狀態(tài),使用傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)技術(shù)使得數(shù)據(jù)的存儲(chǔ)、數(shù)據(jù)結(jié)構(gòu)擴(kuò)展、數(shù)據(jù)分析和檢索都無(wú)法發(fā)揮數(shù)據(jù)的真正的價(jià)值,數(shù)據(jù)的價(jià)值和利用率受到了嚴(yán)重制約,大數(shù)據(jù)技術(shù)的引入將很好的解決這些問(wèn)題,并為使用者帶來(lái)超乎預(yù)期的數(shù)據(jù)服務(wù)。
相關(guān)熱詞搜索:中醫(yī)藥 架構(gòu) 基礎(chǔ) 數(shù)據(jù) 研究
熱點(diǎn)文章閱讀