數(shù)據(jù)挖掘技術(shù)在茶葉病蟲害預(yù)警中的研究與應(yīng)用
發(fā)布時(shí)間:2019-08-31 來源: 散文精選 點(diǎn)擊:
摘要:數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用于農(nóng)業(yè)生產(chǎn),采用Weka軟件的關(guān)聯(lián)規(guī)則挖掘算法,對(duì)近3年氣象和病蟲害監(jiān)測數(shù)據(jù)庫的重要特征屬性進(jìn)行挖掘,得到氣象條件與茶葉病蟲害發(fā)生等級(jí)之間的關(guān)聯(lián)規(guī)則,旨在為做好病蟲害預(yù)防準(zhǔn)備和發(fā)出預(yù)警信號(hào)提供決策支持。
關(guān)鍵詞:數(shù)據(jù)挖掘;茶葉病蟲害;關(guān)聯(lián)規(guī)則;預(yù)警;應(yīng)用
中圖分類號(hào):TP311.13;S685.14 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2013)24-6172-03
數(shù)據(jù)挖掘(Data mining,DM)也叫數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(Knowledge discovery from database,KDD),是20世紀(jì)90年代發(fā)展起來的數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫應(yīng)用領(lǐng)域一個(gè)欣欣向榮的前沿學(xué)科,對(duì)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析以及模型化處理,提取隱含在其中的但又是潛在有用的信息和知識(shí)的過程。在過去的幾年中,我國曾耗費(fèi)巨資進(jìn)行各種農(nóng)業(yè)數(shù)據(jù)的普查,積累了各種作物的苗情、土情、肥情、水情、蟲情、氣象和災(zāi)害等數(shù)據(jù)資料,但基本上是作為文件存檔,而在生產(chǎn)過程中,我國許多地區(qū)還處在盲目生產(chǎn)、無計(jì)劃無規(guī)律的狀態(tài)[1]。數(shù)據(jù)挖掘通過分析存在于數(shù)據(jù)庫里的數(shù)據(jù)來解決問題,已應(yīng)用于茶葉鑒定[2]和農(nóng)產(chǎn)品安全生產(chǎn)[3]。在茶葉病蟲害數(shù)據(jù)庫中合理使用數(shù)據(jù)挖掘技術(shù),挖掘出氣象條件與茶葉病蟲害發(fā)生等級(jí)之間的關(guān)聯(lián)關(guān)系,有助于依據(jù)天氣預(yù)報(bào)對(duì)茶葉病蟲害及時(shí)發(fā)出預(yù)警信號(hào),提高茶葉的產(chǎn)量和質(zhì)量。
云南省常發(fā)生的茶葉主要蟲害有小綠葉蟬(Empoasca pirisuga Matumura)、茶葉斑蛾(Eterusia aedea Linnaeus)、茶細(xì)蛾(Caloptilia theivora Walsingham)等,其中小綠葉蟬是云南省普洱市茶葉主產(chǎn)區(qū)中心目標(biāo)害蟲,常年造成茶葉產(chǎn)量損失達(dá)10%~15%[4]。本研究以小綠葉蟬為主要研究對(duì)象,根據(jù)該市茶葉研究所提供的近3年氣象和病蟲害監(jiān)測數(shù)據(jù)庫,抽取月份(Month)、平均氣溫(Average temperature)、最高氣溫(Maximum temperature)、最低氣溫(Minimum temperature)、降雨量(Rainfall)、日照時(shí)數(shù)(Sunshine hours)和小綠葉蟬蟲數(shù)(Insect pest level)7個(gè)特征屬性,采用理論與實(shí)踐相結(jié)合的研究方法,運(yùn)用數(shù)據(jù)挖掘Weka平臺(tái)的關(guān)聯(lián)規(guī)則算法實(shí)現(xiàn)挖掘目標(biāo)。
1 數(shù)據(jù)預(yù)處理
對(duì)氣象和病蟲害數(shù)據(jù)庫先進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換,原始的數(shù)據(jù)是存儲(chǔ)為Xls的表文件,先另存為Csv格式文件,然后打開Weka,選擇Tools菜單下的ArffViewer模塊,找到此Csv文件,重新保存為Arff格式。其次進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換,7個(gè)特征屬性中有連續(xù)的Numeric數(shù)值型數(shù)據(jù),而關(guān)聯(lián)規(guī)則挖掘算法處理的是Nominal布爾型離散數(shù)據(jù),這就需要對(duì)挖掘數(shù)據(jù)集分組,轉(zhuǎn)換成布爾型離散數(shù)據(jù),茶葉蟲害根據(jù)小綠葉蟬蟲數(shù)分為4個(gè)等級(jí),分別是輕度發(fā)生(Mild)、中度發(fā)生(Moderate)、嚴(yán)重發(fā)生(Serious)、非常嚴(yán)重發(fā)生(Very serious),轉(zhuǎn)換后的數(shù)據(jù)如圖1所示。通過Preprocess中的Visualize all可視化界面,可以很直觀地看到數(shù)據(jù)的分類匯總可視化圖,如圖2所示。
2 關(guān)聯(lián)規(guī)則挖掘
2.1 概念
根據(jù)得到的挖掘結(jié)果,可以獲取氣象條件與茶葉病蟲害發(fā)生等級(jí)的關(guān)聯(lián)規(guī)則:降雨量小于55.77 mm或者日照時(shí)間在200.10~227.88 h的月份,小綠葉蟬蟲害輕度發(fā)生;最高氣溫高于30.67 ℃或者日照時(shí)間少于137.17 h的月份,小綠葉蟬蟲害中度發(fā)生;降雨量小于141.18 mm或者日照時(shí)間在87.32~113.44 h的月份,小綠葉蟬蟲害嚴(yán)重發(fā)生;最高氣溫在29.27~30.73 ℃的月份,小綠葉蟬蟲害發(fā)生非常嚴(yán)重。這些聯(lián)系的置信度都大于90%,降低置信度進(jìn)行挖掘,會(huì)有更多的規(guī)則。
3 結(jié)語
可見,小綠葉蟬蟲害的發(fā)生與氣象條件息息相關(guān),茶農(nóng)可以根據(jù)天氣預(yù)報(bào)提前做好預(yù)防蟲害發(fā)生的準(zhǔn)備,如采取噴霧預(yù)防農(nóng)藥、人工遮陰、人工干預(yù)氣象等措施;農(nóng)業(yè)技術(shù)部門提前發(fā)出預(yù)警信號(hào),為蟲害防治提供決策支持。
參考文獻(xiàn):
[1] 勞 飛,朱玉業(yè).數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2007,35(13):4053,4082.
[2] 張 超,張婭玲,楊如艷.數(shù)據(jù)挖掘在茶葉鑒定中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2012,40(2):1219-1220.
[3] 張 洵.數(shù)據(jù)挖掘在農(nóng)產(chǎn)品安全生產(chǎn)中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2007,35(34):11294-11295.
[4] 唐智英,王祖鳳.關(guān)聯(lián)規(guī)則挖掘技術(shù)在茶葉病蟲害中的研究與應(yīng)用[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2012(15):114-115.
[5] TAN P N, STEINBACH M, KUMAR V.數(shù)據(jù)挖掘?qū)д揫M].范 明,范宏建,譯.北京:人民郵電出版社,2006.
相關(guān)熱詞搜索:病蟲害 預(yù)警 茶葉 數(shù)據(jù)挖掘 研究
熱點(diǎn)文章閱讀