基于BPSO和SVM的烤煙煙葉圖像特征選擇方法研究
發(fā)布時間:2019-08-24 來源: 歷史回眸 點(diǎn)擊:
摘要:利用圖像特征對煙葉進(jìn)行分級時,提出了一種對煙葉圖像特征進(jìn)行有效選擇的新方法——利用二進(jìn)制粒子群算法聯(lián)合SVM模型自適應(yīng)地選擇對煙葉分級影響較大的特征,剔除對分級影響較小或相互間有關(guān)聯(lián)的某些特征,并利用Adaboost和RBF分類器進(jìn)行驗證。結(jié)果表明,用SVM分類器時,用被選特征比輸入全部特征具有更好的分級正確率;對于相同的分類器,利用二進(jìn)制粒子群和SVM算法自適應(yīng)篩選后的特征比輸入全部特征具有更好的分級吻合率。
關(guān)鍵詞:煙葉;二進(jìn)制粒子群;支持向量機(jī);特征選擇
中圖分類號:TP181 文獻(xiàn)標(biāo)識碼:A 文章編號:0439-8114(2015)02-0449-04
DOI:10.14088/j.cnki.issn0439-8114.2015.02.050
Methods of Selecting Image Feature of Tobacco Leaf Based
on BPSO Combined with SVM
YANG Fan, SHEN Jin-yuan
(School of Information Engineer, Zhengzhou University, Zhengzhou 450001, China)
Abstract: A method combining binary particle swarm optimization(BPSO) with SVM algorithm was proposed to select the important features for grading tobacco. Adaboost and RBF with the features selection was used to verify the conclusion. Results showed that the accuracy of SVM was improved by the new method. The adaptive feature selection of BPSO combined with SVM improved the accuracy of the tobacco grading with same model.
Key words: tobacco leaf; BPSO; SVM; feature selection
目前,我國煙葉分級主要還是依靠人工進(jìn)行分級,這種方法存在著主觀性強(qiáng)、效率低等缺點(diǎn),因此近年來研究人員在煙葉智能分級方面進(jìn)行了研究。煙葉的智能識別方法主要有利用煙葉的化學(xué)特征、光譜特征和圖像特征。其中,利用圖像特征對煙葉進(jìn)行分級有著對煙葉無損、設(shè)備簡單、效率較高等優(yōu)點(diǎn),能夠解決人工檢測方法的各種缺點(diǎn),因此有著廣闊的應(yīng)用前景,研究人員在這一領(lǐng)域進(jìn)行了大量的研究[1-3]。在圖像特征的基礎(chǔ)上,人們使用了多種分類器對煙葉進(jìn)行分級,包括支持向量機(jī)[4,5]、神經(jīng)網(wǎng)絡(luò)[6-8]、主成分分析[9]、模糊識別[10]、粗糙集[11]等方法。但是在之前的研究中通常采用獲得的所有圖像特征進(jìn)行訓(xùn)練和分類,而一些特征如長、寬、長寬比、面積、周長等之間存在著很大的相關(guān)性,同時由于特征數(shù)目多使得分級模型復(fù)雜、計算量大,不僅造成訓(xùn)練模型所需時間長,而且分級時所需要的時間也長,這對于收購煙葉的實時要求是非常不利的。另外,特征數(shù)目多、模型復(fù)雜,建立訓(xùn)練模型時所需要尋找的參數(shù)多,參數(shù)之間又互相影響,這可能影響到最佳參數(shù)的選擇,因而影響到分級模型的正確分級率。因此對特征進(jìn)行有效篩選,減少特征數(shù)目對于煙葉自動分級是必要而有意義的[12,13]。本研究提出一種與結(jié)果直接相關(guān)的特征選擇方法,在去除那些相關(guān)性較大的特征改善煙葉圖像識別效果的同時,還可以減短分類器訓(xùn)練和分級時間而加快分級速度。
粒子群算法(PSO)屬于進(jìn)化算法的一種,這種算法以其實現(xiàn)容易、精度高、收斂快等特點(diǎn)引起了學(xué)術(shù)界的重視,并且在解決實際問題中展示了其優(yōu)越性,其中二進(jìn)制粒子群(BPSO)是將PSO算法離散化的一種改進(jìn)算法。支持向量機(jī)(SVM)是一種經(jīng)典的模式識別方法,其在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,也曾被應(yīng)用于煙葉的分類中。本研究使用BPSO并聯(lián)合SVM算法對煙葉的圖像特征進(jìn)行選擇,并分別使用SVM、RBF和Adaboost算法進(jìn)行了驗證。
1 烤煙煙葉特征提取
煙葉分級主要是對煙葉的部位、顏色、等級進(jìn)行分類,其中部位為B(上部)、C(中部)、X(下部)3種,等級根據(jù)不同品質(zhì)可能有3種或者4種,顏色分為F(檸檬黃)、L(橘黃)、R(紅棕色)3種。在這3個部分的基礎(chǔ)上,我國最新發(fā)布的煙葉分級標(biāo)準(zhǔn)將烤煙煙葉分為了42個等級。
本研究采用的烤煙煙葉圖片為使用CCD攝像頭在暗箱中拍攝獲取的煙葉透射圖像(圖1),因為相比反射圖片,透射圖片能更好的體現(xiàn)厚度等特征。在對煙葉圖像進(jìn)行背景分割、降噪等一系列預(yù)處理后在對其進(jìn)行特征提取,本研究提取8個外形特征:長、寬、長寬比、面積、周長、破損率、圓形度、矩形度;12個顏色特征:R、G、B和H、S、I的均值和方差;4個紋理特征:能量、慣性、相關(guān)性、熵。
2 基于BPSO和SVM的特征篩選
2.1 PSO算法
粒子群算法是1995年由Eberhart和Kennedy 提出的一種進(jìn)化算法,來源于對鳥群捕食的行為研究。PSO初始化即為一個覓食的鳥群,其中每只鳥為一個隨機(jī)粒子(隨機(jī)解),每個初始粒子的位置都是隨機(jī)的。由一個速度參數(shù)來決定它們位置變化的快慢,而每個粒子的位置優(yōu)劣都由一個適應(yīng)度值(Fitness value)來評價。在每一代中,整個族群找到的最優(yōu)解被稱為全局極值(gbest),每個粒子本身所找到的最優(yōu)解被稱為這個粒子的個體極值(pbest)。在每一代進(jìn)化中,每個粒子通過跟蹤gbest和pbest兩個極值來不斷更新自己和自己的速度,然后通過迭代找到最優(yōu)解。
熱點(diǎn)文章閱讀