基于shenk’s算法的煙葉近紅外光譜模型轉移研究
發(fā)布時間:2019-08-24 來源: 幽默笑話 點擊:
摘 要:面對近紅外應用模型共享較難問題,研究采用shenk’s算法解決煙葉化學成分近紅外光譜分析模型應用中的模型轉移。為實現(xiàn)煙葉近紅外光譜模型轉移,以山東、云南、四川、廣西四個產(chǎn)區(qū)的煙葉作為分析對象,采用Thermofisher Nicolet AntrisII相同型號的兩臺儀器采集近紅外光譜分別作為主機和子機,在主機上建模,用shenk’s和斜率/截距兩種轉移算法對子機進行模型轉移對比分析。同時,使用ICCA國際標準和t檢驗兩種方法評價模型的傳遞性。研究結果表明,利用shenk’s算法能夠從根本上對模型進行轉移,滿足模型傳遞誤差要求,且預測結果與主機不存在顯著性差異,斜率/截距法沒達到穩(wěn)定的效果,所以shenk’s算法可有效的實現(xiàn)煙葉模型傳遞問題。
關鍵詞:煙葉;模型轉移;shenk’s算法;斜率/截距
中圖分類號:TP301.6 文獻標識碼:A
1 概述
近年來近紅外光譜分析技術已成為發(fā)展最為迅速的光譜技術之一。隨著近紅外光譜分析技術在各行業(yè)飛速發(fā)展,解決模型傳遞問題成為各行業(yè)的重中之重。模型傳遞也稱為儀器標準化,是指經(jīng)過數(shù)學處理后,使一臺儀器上的模型能夠用于另一臺儀器,從而減少重新建模所帶來的巨大工作量,實現(xiàn)樣品和數(shù)據(jù)資源的共享。目前,模型傳遞大多使用的是有標模型傳遞算法,主要有斜率/截距(B/S)算法[1]、shenk’s算法[2]和直接校正(DS)算法[3]等,其中應用最為普遍和最為成功的方法是B/S算法和DS算法。DS算法所需標樣多,其光譜只是在波長很小的范圍內發(fā)生變化,有時會存在“過校正”現(xiàn)象。而shenk’s算法利用某波長點小窗口范圍的光譜數(shù)據(jù)來計算該波長的校正參數(shù),標樣少,可以避免過校正現(xiàn)象。所以本文將shenk’s算法和B/S算法應用于煙葉在Nicolet AntarisII上模型轉移,并比較兩種轉移算法優(yōu)劣。
2 實驗材料與方法
2.1 儀器參數(shù)
nicolet AntarisII傅立葉變換近紅外光譜儀(美國Thermo Nicolet儀器公司),配有積分球漫反射采樣系統(tǒng)、InGaAs檢測器、Result光譜采集軟件和半徑6cm石英杯等。兩臺儀器分別作為主機和子機。儀器的工作參數(shù)為:光譜范圍10000cm-1~3999cm-1,分辨率8cm-1,掃描次數(shù)設為64次,旋轉樣品杯且掃描樣品前均掃描背景。
2.2 樣品前處理
采集山東、云南、四川、廣西四個產(chǎn)區(qū)的395個樣品,將這些樣品在烘箱中60烘干,去梗磨碎,過60目篩,稱量50g分別在兩臺相同型號的儀器上掃描近紅外光譜。從中選出206個代表性樣品作為校正集, 48個樣品作為驗證集,選取誤差較小、且重復性較好的15個樣品作為模型轉移樣本。
2.3 數(shù)據(jù)預處理、建模
將測定樣品的總糖、還原糖、總氮、煙堿和cl的值與主機采集的NIR譜圖按一一對應的原則,導入化學計量學軟件。通過光譜處理、光譜范圍選擇、SG導數(shù)濾波和偏最小二乘(PLS)回歸建模,建立四個產(chǎn)區(qū)烤煙煙葉的5種主要化學成分定量預測模型。
3 結果分析
從兩個方面來看模型的轉移效果,一是:用shenk’s算法對光譜進行轉移,將轉移后的光譜數(shù)據(jù)用于主機模型上進行預測烤煙煙葉的5項指標;二是:用B/S算法對子機上的預測值進行轉移預測烤煙煙葉的5項指標。并通過ICCA國際標準和t檢驗評估模型的轉移效果。
3.1 兩臺儀器轉換前和轉換后特征分析
由圖1可見,同一個樣品分別在主機和子機上采集到的兩條原始光譜的形狀雖然非常相似,但兩臺儀器的吸光度強度明顯看出區(qū)別。從圖2中看到,光譜經(jīng)過shenk’s算法轉移之后與主機光譜幾乎不存在差異。以總糖為例,從圖3和圖4來看經(jīng)B/S算法轉換后,主機和子機預測值的差距變大。
3.2 模型的直接傳遞與轉移后的結果分析
。1)按照ICCA國際標準模型轉移判斷設備的傳輸性標準偏差是否小于2/3*SEP。
根據(jù)表1所示:主機和子機直接傳遞預測值的標準偏差均大于2/3*SEP,所以主機和子機之間需要轉移。分別通過shenk’s算法和斜率/截距進行轉移,主機和shenk’s算法轉移預測值偏差的標準偏差均小于2/3*SEP,達到了模型轉移的效果;主機和B/S算法轉移預測值偏差的標準偏差均大于2/3*SEP,沒有達到轉移的效果。
。2)t檢驗評價分析
根據(jù)表2所示,主機和子機直接傳遞的t檢驗值均大于臨界值,所以主機和子機存在顯著性差異,故主機和子機之間需要轉移。主機和子機shenk’s算法轉移預測值的t檢驗值均小于臨界值,所以主機和子機shenk’s算法轉移不存在顯著性差異,達到轉移的效果;主機和子機B/S算法轉移預測值的t檢驗值只有總糖達到了轉移效果,不存在顯著性差異。
結語
本文基于Nicolet AntarisII系列近紅外光譜儀實際應用中在線檢測煙葉化學成分分析模型的轉移,應用shenk’s算法使預測結果得到明顯的改善,并且由于shenk’s算法是一元全光譜校正法,其計算過程是利用原光譜進行的,基本無信息的丟失。而從分析結果上來看,斜率截距法也使預測結果得到了改善,但沒達到預期的結果,斜率截距轉移后還存在顯著性差異,并且斜率截距只是在預測值上對結果進行了校正,不能從根本上解決問題。綜上所述,shenk’s算法用于煙葉各項指標模型傳遞更具優(yōu)勢,能夠較好解決煙草行業(yè)內模型無法統(tǒng)一共享等問題。
參考文獻
[1]Bouveresse E,Casolino C,de la Pezuela C.Journal of pharmaceutical and biomedical analysis,1998:18-35.
[2]褚小立.化學計量學方法與分子光譜分析技術[M].北京:化學工業(yè)出版社,2011:109.
熱點文章閱讀