大數(shù)據(jù)可用性在高等教育領域的重要性研究
發(fā)布時間:2019-08-11 來源: 人生感悟 點擊:
摘要:隨著信息技術的飛速發(fā)展,各種數(shù)據(jù)增長十分迅速,數(shù)據(jù)量大到無法通過常規(guī)的方法進行分析處理,大數(shù)據(jù)應運而生,大數(shù)據(jù)在各領域應用廣泛,在高等教育領域亦是如此。高校的信息系統(tǒng)是數(shù)據(jù)生產(chǎn)大戶,但高校的數(shù)據(jù)價值密度卻很低,文章主要介紹了大數(shù)據(jù)給高校帶來的影響,指出了高校中存在的大數(shù)據(jù)可用性問題,并提出了從關系數(shù)據(jù)一致性和實體同一性兩個方面提高高校數(shù)據(jù)可用性,幫助高校從海量數(shù)據(jù)信息中提取有效數(shù)據(jù),相對提高數(shù)據(jù)的價值密度。
關鍵詞:大數(shù)據(jù);數(shù)據(jù)價值密度;數(shù)據(jù)可用性;數(shù)據(jù)一致性;實體同一性
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2018)13-0020-02
Research on the Importance of Large Data Availability in the Field of Higher Education
HAN Xiao-xiang 1, XU Hua-zhen 2, WEI Li-hua 2
。1. Nantong Institute of Technology, Informatization Construction Management Office, Nantong 226002,China;2. Nantong Institute of Technology, School of Computer And Information Engineering, Nantong 226002,China)
Abstract: With the rapid development of information technology, all kinds of data grow very fast, and the amount of data is too large to be processed by conventional methods. Big data emerges and it is widely applied in various fields, and also in higher education. The information system of university is a big data producer, but the density of data value of university is very low. This paper mainly introduces the influence brought by big data to universities, points out the availability of big data in Colleges and universities, and puts forward methods of improving data availability from two aspects: consistency of relational data and entity identity, in order to help colleges and universities to extract effective data from massive data information, and to improve value density.
Key words: big data; data value density; data availability; data consistency; entity identity
大數(shù)據(jù)是指無法在可承受的時間范圍內用常規(guī)的軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要采用新處理模式才能獲取很多智能的、深入的、有價值的信息,以期得到更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資源[1]。目前,大家比較公認的是大數(shù)據(jù)具有4V的特點:數(shù)據(jù)規(guī)模大,即數(shù)據(jù)量大,數(shù)量級別從TB躍升到PB,不久將會產(chǎn)生EB級別甚至ZB更高級別的數(shù)據(jù);數(shù)據(jù)種類多,數(shù)據(jù)類型不僅包括傳統(tǒng)的關系結構化類型,還包括半結構化和非結構化類型;處理速度快,數(shù)據(jù)產(chǎn)生和更新的頻率快,要求處理數(shù)據(jù)的速度更快;價值密度低,數(shù)據(jù)海量增長,但獲取到的有用信息難度也不斷加大[2]。
1 高校中的大數(shù)據(jù)
大數(shù)據(jù)現(xiàn)已提升到國家戰(zhàn)略層面,“十三五”規(guī)劃明確提出要大力發(fā)展大數(shù)據(jù)產(chǎn)業(yè),加快建設數(shù)據(jù)強國,實現(xiàn)我國從數(shù)據(jù)大國向數(shù)據(jù)強國轉變。大數(shù)據(jù)正推動著各行業(yè)的發(fā)展。高校作為教育機構,它不僅能夠利用信息化技術發(fā)展教育,還對信息時代的發(fā)展起到促進作用[3]。高校也是數(shù)據(jù)生產(chǎn)大戶,高校的工作從宏觀上可劃分為教學、科研、管理三大類,從教學上看,會產(chǎn)生學生作業(yè)數(shù)據(jù),學生學習成績數(shù)據(jù),教師備課教案數(shù)據(jù),教師備課數(shù)據(jù)等;從科研上,會產(chǎn)生教師科研方面的數(shù)據(jù);從管理上,會產(chǎn)生學生基本信息數(shù)據(jù),教師基本信息數(shù)據(jù),其他崗位工作人員基本信息數(shù)據(jù),學校基本信息數(shù)據(jù),學生各項評比數(shù)據(jù)等等。高校中產(chǎn)生的這些數(shù)據(jù)具有數(shù)量大、種類多、產(chǎn)生快、真實可信和具備分析價值等特點,完全符合大數(shù)據(jù)的特征。研究這些數(shù)據(jù),對于高校建設與發(fā)展有著重要的意義。比如大數(shù)據(jù)可以預測學生是否能順利完成課業(yè),紐約州波基普西市瑪麗斯特學院(Marist College)與運營數(shù)據(jù)分析公司Pentaho合作發(fā)起開源學術分析計劃(The Open Academic Analytics Initiative),旨在一門新課程開始的兩周內預測哪些學生可能會無法順利完成課程。通過收集分析學生的學習習慣—例如點擊線上閱讀材料、是否在網(wǎng)上論壇中發(fā)言、完成作業(yè)的時長——來預測學生的學業(yè)情況、及時干預幫助問題學生,從而提升畢業(yè)率。再比如大數(shù)據(jù)可以發(fā)現(xiàn)被關注的學生對象,電子科大曾做過一個課題—尋找校園中最孤獨的人。他們從3萬名在校生中,采集到了2億多條行為數(shù)據(jù),數(shù)據(jù)來自學生選課記錄、進出圖書館、寢室,以及食堂用餐、超市購物等數(shù)據(jù)。通過對不同的校園一卡通“一前一后刷卡”的記錄進行分析,可以發(fā)現(xiàn)一個學生在學校有多少親密朋友,比如戀人、閨蜜。最后,他們找到了800多個校園中最孤獨的同學,這些同學平均在校兩年半時間,一個知心朋友都沒有。這些人中的17%可能產(chǎn)生心理疾病,剩下的則可能用意志力暫時戰(zhàn)勝了癥狀,這些同學就需要學校和家長重點予以關愛。高校中大數(shù)據(jù)應用廣泛,但也存在一定的問題,后面將做著重分析。
相關熱詞搜索:可用性 高等教育 重要性 領域 數(shù)據(jù)
熱點文章閱讀