基于深度學(xué)習(xí)的烤煙分級研究與應(yīng)用
本研究以標(biāo)準(zhǔn)的烤煙收購為場景,應(yīng)用可見光譜技術(shù)結(jié)合深度學(xué)習(xí)算法構(gòu)建面向6種烤煙類型的烤煙分級算法,目標(biāo)為實(shí)現(xiàn)完全自動(dòng)化煙葉定級。通過對機(jī)器分級技術(shù)的應(yīng)用和推廣,給煙葉分級整個(gè)流程帶來了許多好處。其一,提高煙葉分級的工作效率。其二,減少煙葉收購活動(dòng)中出現(xiàn)的糾紛數(shù)量和概率。其三,可以促進(jìn)全社會(huì)煙葉分類過程的統(tǒng)一化,規(guī)范煙草收購市場,提升我國煙草行業(yè)的全球競爭力。
1 材料與方法
1.1 數(shù)據(jù)獲取與預(yù)處理
1.1.1 煙葉樣本選擇
該項(xiàng)研究面向?qū)嶋H煙農(nóng)與收購站交接的流水線,為提升落地實(shí)用的應(yīng)用價(jià)值以及降低標(biāo)定等級的繁瑣性,最終采用了收購量集中(貢獻(xiàn)率)最高的六個(gè)等級進(jìn)行訓(xùn)練,分別為:C2F、C3F、C3L、B2F、B3F及X2F,所有收購煙葉通過青雜檢測后,統(tǒng)一進(jìn)行六分類的判別。采集對象為2021年山東省濰坊市洛莊煙站收購季煙葉,共采集6種合格等級的煙葉樣本1.8TB左右的數(shù)據(jù)集。卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練應(yīng)提供足夠多的樣本,并且每種等級相當(dāng)?shù)臉颖炯?/span>
1.1.2 采集環(huán)境
數(shù)據(jù)采集中使用白板校正技術(shù)來降低客觀因素導(dǎo)致的誤差,將WhiteBoard的樣本數(shù)據(jù)值作為基準(zhǔn)項(xiàng),對獲取的高維數(shù)據(jù)進(jìn)行基準(zhǔn)歸一化,由此降低由客觀因素導(dǎo)致誤差率提升的可能性。此外,本文提出的算法目標(biāo)正是面對實(shí)際生產(chǎn)過程的煙葉分級,所以從模型的實(shí)用性出發(fā),采集的樣本以實(shí)際需求為目標(biāo),原始數(shù)據(jù)可表示為。
1.1.3 煙葉樣本數(shù)據(jù)預(yù)處理
對于合格樣本,返回的256段波長的高光譜數(shù)據(jù)。通過對高光譜數(shù)據(jù)的采集和處理,最終得到樣本數(shù)據(jù)存儲(chǔ)在RAW文件中,由Hdr文件定義輸入數(shù)據(jù)的特性。且在該文件中具體列舉了256個(gè)波段的具體范圍,為385.60~1006.60均分的256段波段(含頭尾)。
1.2 分級算法
本文提出基于卷積神經(jīng)網(wǎng)絡(luò)算法的,通過采集的高光譜數(shù)據(jù),分別學(xué)習(xí)面向煙葉部位、煙葉顏色、煙葉等級的訓(xùn)練模型,構(gòu)建高光譜數(shù)據(jù)與煙葉部位、煙葉顏色乃至煙葉等級的非線性映射關(guān)系。此處為預(yù)處理后得到的輸入高光譜數(shù)據(jù),為面向訓(xùn)練模型的部位、顏色和等級類別。
3 實(shí)驗(yàn)評估
實(shí)驗(yàn)依托山東省濰坊市下屬煙葉收購站,利用高光譜顯像儀,在收購對算法進(jìn)行實(shí)際驗(yàn)證。經(jīng)過數(shù)據(jù)預(yù)處理的數(shù)據(jù)集總共包括六種級別煙葉(B2F、B3F、C2F、C3F、X2F、C3L),采集的全部煙葉樣本數(shù)據(jù)中80%數(shù)據(jù)進(jìn)行模型訓(xùn)練,20%數(shù)據(jù)進(jìn)行模型測試。
3.1 分級算法性能評估
對比同類型參考文獻(xiàn),在同樣獲取全光譜信息的前提下,如表1所示,本文提出的模型在損失、準(zhǔn)確率上稍顯突出,比對類型主要有四類:一、基于傳統(tǒng)的模糊識(shí)別準(zhǔn)則;二、基于統(tǒng)計(jì)學(xué)的數(shù)據(jù)挖掘算法;三、BP神經(jīng)網(wǎng)絡(luò);四、三通道輸入的卷積神經(jīng)網(wǎng)絡(luò)。通過以上實(shí)驗(yàn)結(jié)果來看,加權(quán)準(zhǔn)確率居于97.5%附近,煙葉分級要求經(jīng)過對上中下三個(gè)部位的煙葉驗(yàn)證,機(jī)器識(shí)別與專家識(shí)別的一致率大于80%,而本文研究結(jié)果遠(yuǎn)超于國家基準(zhǔn),具有可觀的探究價(jià)值。同時(shí),最重要的一點(diǎn)在于,本文的研究面向?qū)嶋H生產(chǎn)應(yīng)用,采集的煙葉圖像均為連串雜糅狀態(tài),以投入煙葉收購生產(chǎn)使用為目的,相比于理想實(shí)驗(yàn)環(huán)境下對單煙葉探究的分級算法來說更有落地應(yīng)用的說服力。在實(shí)際煙葉收購過程中,算法模型分級預(yù)測平均執(zhí)行時(shí)間在7s以內(nèi),滿足高效的煙葉收購需求。
表1 不同煙葉分級方案正確率比較
算法
| 平均正確率 /% |
基于NIR技術(shù)和ELM的烤煙煙葉自動(dòng)分級[7] | 93.51% |
基于機(jī)器視覺的煙葉分級[2] | 92.00% |
基于智能識(shí)別技術(shù)的煙葉分級技術(shù)[4] | 95.45% |
基于聚類和加權(quán)K近鄰的煙葉分級研究[8] | 93.69% |
基于PCA-GA-SVM的煙葉分級方法[13] | 95.56% |
基于圖像特征的煙葉分級[3] | 91.00% |
基于ANN分類器的煙葉分級[14] | 95.04% |
基于BP算法的煙葉分級[5] | 84.76% |
基于機(jī)器視覺與深度學(xué)習(xí)的煙葉定級研究[15] | 93.05% |
本文模型 | 97.54% |
表1中算法準(zhǔn)確率是1000次的平均準(zhǔn)確率值,相比其他算法,準(zhǔn)確率提升比例依次為4.5%,6%,2.2%,4.1%,2.1%,7.2%,2.6%,15.1%,4.8%,性能提升均超過2%,證明本文提出算法是有效的、可行的?;?/span>1000次的統(tǒng)計(jì)結(jié)果,利用本文算法和次高算法進(jìn)行統(tǒng)計(jì)學(xué)顯著性分析,即t-Tests,p值小于0.005。以上結(jié)果驗(yàn)證了本文提出算法能夠有效地改進(jìn)算法分類結(jié)果的準(zhǔn)確率。
為驗(yàn)證部分類別預(yù)測準(zhǔn)確率,基于本文算法,對4種煙葉等級(C2F、C3F、X2F、C3L)的進(jìn)行煙葉顏色、煙葉部位和煙葉最終等級模型訓(xùn)練,訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率如表2所示:
表2 4種煙葉分級方案正確率比較
算法
| 訓(xùn)練準(zhǔn)確率 /% | 測試準(zhǔn)確率 /% |
煙葉部位模型 | 99.78% | 97.11% |
煙葉顏色模型 | 99.82% | 97.94% |
本文模型 | 99.71% | 97.05% |
其中測試樣本數(shù)1732個(gè),訓(xùn)練樣本數(shù)6928個(gè)。煙葉模型在部位、顏色的訓(xùn)練和測試準(zhǔn)確率均都超過97%。因此,利用融合煙葉部位、煙葉顏色和煙葉初始等級的煙葉定級策略在提高煙葉部位、顏色的準(zhǔn)確率的同時(shí),提高了煙葉整體定級準(zhǔn)確率。
基于提出的融合煙葉顏色和部位的煙葉定級算法,將采用全部6種煙葉等級(B2F、B3F、C2F、C3F、X2F、C3L)的所有數(shù)據(jù)集進(jìn)行煙葉顏色、煙葉部位和煙葉最終等級模型訓(xùn)練,訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率如表3所示:
表3 6種煙葉分級方案正確率比較
算法
| 訓(xùn)練準(zhǔn)確率 /% | 測試準(zhǔn)確率 /% |
煙葉部位模型 | 98.88% | 98.08% |
煙葉顏色模型 | 99.91% | 98.63% |
本文模型 | 98.77% | 97.54% |
其中測試樣本數(shù)2854個(gè),訓(xùn)練樣本數(shù)11420個(gè)。煙葉模型在部位、顏色的訓(xùn)練準(zhǔn)確率均都超過98%,測試準(zhǔn)確率均超過97%。隨著數(shù)據(jù)集和煙葉類別的增加,煙葉部位和煙葉顏色模型訓(xùn)練準(zhǔn)確率在99%左右,且測試準(zhǔn)確率也都超過98%,和4種等級的煙葉顏色和部位預(yù)測基本持平。隨著數(shù)據(jù)集規(guī)模增加,本文模型相比4種煙葉等級預(yù)測準(zhǔn)確率有所提升,都超過了97%。因此,在全部數(shù)據(jù)集規(guī)模下,利用融合煙葉部位、煙葉顏色和煙葉初始等級的煙葉定級策略在提高煙葉定級準(zhǔn)確率的方案是切實(shí)可行的。
3 討論
基于圖像處理方法和卷積神經(jīng)網(wǎng)絡(luò)算法,借助煙葉的高光譜數(shù)據(jù)對煙葉進(jìn)行分級。同時(shí)仿效國家標(biāo)準(zhǔn)進(jìn)行部位、顏色、葉片質(zhì)量三層定級,葉片部位分別為下部(X)、中部(C)、上部(B),顏色分別為桔黃色(F),檸檬黃色(L)等等,質(zhì)量等級依據(jù)多大致維線索分為1到4級。分步分級的重要性非常大,拿部位來說,不同部位的煙葉由于生長條件不同,形狀特征從表面上看是有明顯區(qū)別的??傮w變化規(guī)律為:下部煙葉較寬圓;中部煙葉寬至較寬,葉尖較鈍;上部煙葉較窄,葉尖較銳。但是若和顏色信息進(jìn)行組合,會(huì)得到不同部位不同顏色反饋相同結(jié)果,由此,總體分級方案為先分“類型”,后分“組”,最后根據(jù)每個(gè)組內(nèi)煙葉質(zhì)量的好壞劃分成幾個(gè)不同的“級”,每一級的劃分通過卷積神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)。
根據(jù)分級員經(jīng)驗(yàn)和視覺檢測技術(shù)要求,采用多次分級的方式,先處理葉片圖像劃分葉片部位,其次通過相同高光譜圖像劃分顏色屬性,最后根據(jù)輸入的多維數(shù)據(jù)集判別煙葉的質(zhì)量等級,這三者共同構(gòu)成最終煙葉等級,如B2F,B為上部煙葉,F為桔黃色,2為質(zhì)量等級。該措施最直觀的作用在于分級的條理性,級與級之前無交集。根據(jù)參考文獻(xiàn)中關(guān)于煙葉分級的多數(shù)應(yīng)用實(shí)例來看,集所有屬性轉(zhuǎn)化為多維數(shù)據(jù)進(jìn)行一次性定級的方案占多數(shù),這種做法導(dǎo)致最大的問題在于級與級之中存在大范圍的交界區(qū)域,更容易因技術(shù)錯(cuò)誤導(dǎo)致等級的誤判,同時(shí)若落地于工業(yè)流水線,將大大模糊化同等級情況下不同部位或顏色的煙葉差別,不利于煙農(nóng)與收購站定價(jià)。
針對單片煙葉或具有明顯可分割特征的多片煙葉,使用圖像處理技術(shù)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)的煙草分級算法,能夠達(dá)到較高的煙葉定級。Li等研究了基于深度學(xué)習(xí)方法的41種煙葉圖像分類算法,在樣本數(shù)量較少的情況下,將遷移學(xué)習(xí)應(yīng)用于經(jīng)典的VGG16網(wǎng)絡(luò)模型,并對VGG16網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行微調(diào),模型的精度達(dá)到91.26%,比原模型高1.25%。Luo等提出了一個(gè)簡單的煙草圖像分類框架,融合了表觀特征和低維深度特征,使用改進(jìn)的AlexNet網(wǎng)絡(luò)傳遞較淺的卷積特征,通過主動(dòng)硬樣本挖掘?qū)W(wǎng)絡(luò)進(jìn)行微調(diào),與單純的表觀特征或深度特征相比,融合表觀特征和深度特征可以提高煙草分級的準(zhǔn)確性。賴福長等公開了一種基于人工智能的煙葉等級快速識(shí)別裝置,能快速識(shí)別煙葉等級。以上研究針對的是單片煙葉的定級策略,無法滿足實(shí)際烤煙收購的批量檢測的需求。
同時(shí),考慮到化學(xué)成分決定煙葉的品質(zhì),光譜特性能夠很好地反映煙葉化學(xué)成分的含量。通過分析B2F、C3F、X2F 3個(gè)煙葉等級與其主要化學(xué)成分的關(guān)系,利用多類logistic回歸模型探討不同化學(xué)成分對煙葉品級影響的差異,發(fā)現(xiàn)總生物堿、總氮、還原糖、總糖、鉀和淀粉對煙葉等級有顯著影響,利用多通道高光譜相機(jī),為煙葉定級提供了數(shù)據(jù)支撐。
為解決大樣本訓(xùn)練問題、實(shí)現(xiàn)參數(shù)簡易可調(diào)以及滿足實(shí)際收購需求等問題,利用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)煙葉分級,本文研究樣本使用連串雜糅煙葉,面向工業(yè)流水線收購,直接采集不規(guī)則合并單層煙葉進(jìn)行煙葉的分部位、分顏色的煙葉定級策略。
4 總 結(jié)
本文基于深度學(xué)習(xí)算法深入研究煙葉定級的智能化和數(shù)字化,摒棄了效率低且主觀因素強(qiáng)的人工分級技術(shù),通過機(jī)器識(shí)別技術(shù)和深度學(xué)習(xí)算法進(jìn)行自動(dòng)化智能分級,最終達(dá)到提高煙葉分級工作效率,減少人工損耗,增強(qiáng)定級精度的效果。目前,煙葉分級的自動(dòng)化和智能化以及越來越成熟,并且已有少數(shù)煙葉收購站引入自動(dòng)分級技術(shù)進(jìn)行煙葉收購活動(dòng)。此項(xiàng)技術(shù)落地應(yīng)用之后將顯著性提高我國煙葉分級效率,節(jié)省人力及雇傭成本,對煙葉農(nóng)產(chǎn)品分級的標(biāo)準(zhǔn)化有重要的正向意義。
文章來源: 《上海輕工業(yè)》 http://xwlcp.cn/w/kj/30978.html
欄目分類
- 東西交融視域下西方繪畫色彩對中國工筆畫影響探討
- 水彩畫文化語境之思:中華優(yōu)秀傳統(tǒng)文化在藝術(shù)語言里的拓展與深化
- 課程思政視域下中職美術(shù)思政資源的挖掘與利用
- 美術(shù)創(chuàng)作中的創(chuàng)造性思維
- 中職工藝美術(shù)專業(yè)服務(wù)社會(huì)美術(shù)教育的策略研究
- 探索傳統(tǒng)工藝與設(shè)計(jì)類教學(xué)的創(chuàng)新融合
- 面向AIGC職業(yè)教育產(chǎn)業(yè)需求的藝術(shù)設(shè)計(jì)人才培養(yǎng)目標(biāo)新實(shí)踐研究
- 中國傳統(tǒng)文化元素在動(dòng)漫藝術(shù)設(shè)計(jì)中的創(chuàng)新應(yīng)用研究
- 素描寫生教學(xué)中的要素探討
- 非遺文化與高校數(shù)字品牌課程融合教學(xué)實(shí)踐路徑研究
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識(shí)點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級黨報(bào)?是否有什么說據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報(bào)?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!