日本在线观看不卡,国产成人免费观看,国产gaysex男同视频chinese,欧美一级www

樹(shù)人論文網(wǎng)一個(gè)專(zhuān)業(yè)的學(xué)術(shù)咨詢網(wǎng)站!!!
樹(shù)人論文網(wǎng)

基于卷積神經(jīng)網(wǎng)絡(luò)的經(jīng)濟(jì)林產(chǎn)品檢測(cè)與分選研究進(jìn)展

來(lái)源: 樹(shù)人論文網(wǎng)發(fā)表時(shí)間:2021-07-01
簡(jiǎn)要:摘要:經(jīng)濟(jì)林作為重要森林資源,其種植面積及產(chǎn)品產(chǎn)量逐年增加。隨著科學(xué)技術(shù)的不斷創(chuàng)新與升級(jí),經(jīng)濟(jì)林產(chǎn)品加工產(chǎn)業(yè)快速發(fā)展、衍伸產(chǎn)品日趨增多,急需智能化檢測(cè)、采收與分選

  摘要:經(jīng)濟(jì)林作為重要森林資源,其種植面積及產(chǎn)品產(chǎn)量逐年增加。隨著科學(xué)技術(shù)的不斷創(chuàng)新與升級(jí),經(jīng)濟(jì)林產(chǎn)品加工產(chǎn)業(yè)快速發(fā)展、衍伸產(chǎn)品日趨增多,急需智能化檢測(cè)、采收與分選技術(shù)與裝備。深度融合人工智能技術(shù)與經(jīng)濟(jì)林產(chǎn)品加工產(chǎn)業(yè),是實(shí)現(xiàn)高效化、精準(zhǔn)化、智能化發(fā)展的重要手段之一。文中綜合比較了深度學(xué)習(xí)技術(shù)中不同卷積神經(jīng)網(wǎng)絡(luò)算法及模型的優(yōu)缺點(diǎn),綜述了其在經(jīng)濟(jì)林產(chǎn)品檢測(cè)與分選中的研究進(jìn)展,并針對(duì)研究應(yīng)用過(guò)程中存在的問(wèn)題提出了建議,以期為經(jīng)濟(jì)林產(chǎn)品檢測(cè)與分選的智能化發(fā)展提供參考。

基于卷積神經(jīng)網(wǎng)絡(luò)的經(jīng)濟(jì)林產(chǎn)品檢測(cè)與分選研究進(jìn)展

  本文源自張曉; 劉英; 李玉榮; 費(fèi)葉琦, 世界林業(yè)研究 發(fā)表時(shí)間:2021-06-30

  關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò),經(jīng)濟(jì)林,目標(biāo)檢測(cè),產(chǎn)品分選,應(yīng)用研究

  經(jīng)濟(jì)林是森林資源的重要組成部分,根據(jù)聯(lián)合國(guó)糧農(nóng)組織發(fā)布的 2020 年《全球森林資源評(píng)估》報(bào)告,全球共有 40.6 億 hm2 森林,約 30%的森林用于木材和非木材林產(chǎn)品生產(chǎn),其中非木材林產(chǎn)品主要包括經(jīng)濟(jì)林果、木本糧油、森林藥材、林產(chǎn)飲料、森林食品等。2018 年我國(guó)各類(lèi)經(jīng)濟(jì)林產(chǎn)品產(chǎn)量達(dá)到 1.57 億 t,總產(chǎn)值達(dá)到 7.33 萬(wàn)億元。經(jīng)濟(jì)林產(chǎn)業(yè)具有資源豐富、產(chǎn)品種類(lèi)多、應(yīng)用范圍廣等特點(diǎn)[1-2]。隨著科學(xué)技術(shù)的不斷創(chuàng)新與升級(jí),經(jīng)濟(jì)林產(chǎn)品加工產(chǎn)業(yè)快速發(fā)展、衍伸產(chǎn)品也日趨增多[3-4]。但目前我國(guó)在經(jīng)濟(jì)林產(chǎn)品資源利用上仍存在采收不及時(shí)、效率低下、產(chǎn)品分級(jí)不嚴(yán)格以及商品化處理落后等問(wèn)題,因此對(duì)新技術(shù)、新裝備的需求極大。近年來(lái),基于深度學(xué)習(xí)的人工智能技術(shù)不斷推陳出新,為經(jīng)濟(jì)林產(chǎn)品檢測(cè)、采收與分選技術(shù)及裝備研究提供了理論依據(jù),為產(chǎn)業(yè)的高效化、精準(zhǔn)化、智能化發(fā)展提供了重要技術(shù)支撐。本文將簡(jiǎn)述卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程,綜合比較不同卷積神經(jīng)網(wǎng)絡(luò)算法及模型的優(yōu)缺點(diǎn),以及在經(jīng)濟(jì)林產(chǎn)品檢測(cè)與分選中的研究進(jìn)展,并針對(duì)實(shí)際應(yīng)用過(guò)程中存在的問(wèn)題提出進(jìn)一步的研究建議,以期基于深度學(xué)習(xí)技術(shù)的卷積神經(jīng)網(wǎng)絡(luò)在經(jīng)濟(jì)林產(chǎn)品檢測(cè)與分選領(lǐng)域中的應(yīng)用發(fā)揮更重要的作用。

  1 卷積神經(jīng)網(wǎng)絡(luò)發(fā)展歷程及特點(diǎn)

  卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度監(jiān)督學(xué)習(xí)的代表算法之一,是一種帶有卷積結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)形式為:輸入層--> 卷積層 --> 池化層 --> (重復(fù)卷積、池化層) … --> 全連接層--> 輸出結(jié)果,至少包括 5 個(gè)隱含層。其中卷積層(convolutional layer)用于提取特征;池化層(max pooling layer)用于下采樣(down sampling),卻不損壞識(shí)別結(jié)果;全連接層(fully connected layer)用于分類(lèi)。CNN 利用反向傳播算法訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)中的權(quán)重,使其特有的感受野結(jié)構(gòu)與實(shí)際的生物神經(jīng)網(wǎng)絡(luò)更加接近,更能有效地提取復(fù)雜任務(wù)的高階非線性特征[5],解決了傳統(tǒng)人工智能網(wǎng)絡(luò)參數(shù)太多、訓(xùn)練復(fù)雜且冗余等問(wèn)題,其模型的準(zhǔn)確率也比傳統(tǒng)方式高很多[6]。CNN 通過(guò)稀疏連接、權(quán)重共享、最大池采樣等,具有極強(qiáng)的適應(yīng)性,善于挖掘數(shù)據(jù)局部特征,提取目標(biāo)的全局訓(xùn)練特征和分類(lèi)[7],常用于復(fù)雜多樣環(huán)境下的目標(biāo)檢測(cè)、圖像識(shí)別與分類(lèi)等[8-9],其發(fā)展歷程如圖 1 所示。

  1)目標(biāo)識(shí)別與分類(lèi)。1998 年 LeCun 等基于 Fukushima 的研究工作使用 BP 算法設(shè)計(jì)并訓(xùn)練得到了 LeNet-5 模型,隨后涌現(xiàn)出 AlexNet、VGG16、VGG19 等新模型,通過(guò)不斷迭代優(yōu)化,模型的訓(xùn)練速度得到提升,準(zhǔn)確率也逐步提高。但隨著網(wǎng)絡(luò)層數(shù)及參數(shù)的不斷增加,網(wǎng)絡(luò)參數(shù)壓縮研究也相繼被提出,如 GoogLeNet 的 inception 模塊、ResNet 的殘差連接結(jié)構(gòu)等[10]。經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)模型的優(yōu)點(diǎn)及相關(guān)參數(shù)如表 1 所示。

  2)目標(biāo)檢測(cè)。區(qū)域卷積神經(jīng)網(wǎng)絡(luò)算法(Region-CNN)是第 1 個(gè)成功將深度學(xué)習(xí)應(yīng)用到目標(biāo)檢測(cè)上的算法,隨著研究不斷深入,F(xiàn)ast RCNN、Faster RCNN、Mask RCNN 等算法橫空出世。其中 Faster RCNN 克服了提取卷積特征時(shí)的冗余操作,提出了 RPN 結(jié)構(gòu),并融入 GPU 并行運(yùn)算能力,大大提高了算法的檢測(cè)和識(shí)別速度而不降低精度[11]。在此基礎(chǔ)上,Mask RCNN 增加了像素級(jí)別的實(shí)例分割遮罩分支,同時(shí)實(shí)現(xiàn)了目標(biāo)檢測(cè)和實(shí)例分割,統(tǒng)一網(wǎng)絡(luò)損失[12]。不同算法綜合比較如表 2 所示。

  2 不同卷積網(wǎng)絡(luò)算法在經(jīng)濟(jì)林產(chǎn)品目標(biāo)檢測(cè)中的應(yīng)用

  隨著油茶、紅棗、茶葉、林果等經(jīng)濟(jì)林產(chǎn)品種植面積不斷增加,產(chǎn)品產(chǎn)量逐年上升,利用智能機(jī)器人技術(shù)提高林產(chǎn)品采摘效率、節(jié)約人力成本已是必然趨勢(shì),因此在自然環(huán)境下進(jìn)行目標(biāo)果實(shí)的準(zhǔn)確分割、特征提取及檢測(cè)對(duì)經(jīng)濟(jì)林產(chǎn)業(yè)智能化發(fā)展具有重要的科學(xué)研究意義和廣闊的應(yīng)用前景。反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、隨機(jī)森林(RF)、主成分分析(PCA)、遺傳算法(GA)和支持向量機(jī)(SVM)等基于淺層神經(jīng)網(wǎng)絡(luò)的模型算法普遍存在特征提取不完全、網(wǎng)絡(luò)泛化性能差、網(wǎng)絡(luò)魯棒性差等問(wèn)題;且往往只考慮單一特征,網(wǎng)絡(luò)收斂速度較慢,容易陷入局部最優(yōu),不能快速、準(zhǔn)確地檢測(cè)多目標(biāo)。

  因此,許高建等[13]基于 Faster RCNN 深度網(wǎng)絡(luò)模型開(kāi)展了茶葉嫩芽的檢測(cè)研究,利用區(qū)域建議網(wǎng)絡(luò)生成高質(zhì)量的區(qū)域建議框,選用隨機(jī)梯度下降算法(BGD)作為模型優(yōu)化器,實(shí)驗(yàn)結(jié)果表明,模型精確率為 85.14%,召回率為 78.9%,mAP 為 82.17%,該深度網(wǎng)絡(luò)模型能夠有效識(shí)別茶葉嫩芽。朱超偉[14]提出一種改進(jìn)的單一損失函數(shù) Fast RCNN 模型用于靈武長(zhǎng)棗的檢測(cè),通過(guò)較小維度的網(wǎng)絡(luò)深度和卷積次數(shù)識(shí)別目標(biāo),使用雙層損失函數(shù)(A-softmax loss、L-softmax loss 函數(shù))并行運(yùn)算,實(shí)驗(yàn)結(jié)果表明,該模型的精確率、召回率、mAP 分別提升至 92.96%、94.62%、80%,相比其他模型有明顯提高。閆建偉等[15]通過(guò) Faster RCNN 的交替優(yōu)化訓(xùn)練方式、雙線性插值、感興趣區(qū)域校準(zhǔn)(ROI align)的區(qū)域特征聚集等手段,使得自然環(huán)境下刺梨果實(shí)檢測(cè)的目標(biāo)矩形框更加精確,召回率最高達(dá)到 96.93%,準(zhǔn)確率最高達(dá)到 95.53%,同時(shí)檢測(cè)的平均速度能夠達(dá)到 0.25 s/幅。陳斌等[16]基于 Faster-RCNN 卷積神經(jīng)網(wǎng)絡(luò)模型檢測(cè)自然環(huán)境中的油茶果圖像,利用邊框回歸修正錨框獲得精確的候選區(qū)域,再利用區(qū)域生成網(wǎng)絡(luò) RPN 進(jìn)行分類(lèi)和校準(zhǔn),檢測(cè)結(jié)果表明,準(zhǔn)確率達(dá)到 98.92%,圖像識(shí)別時(shí)間為 0.21 s/幅,進(jìn)一步提高了油茶果的識(shí)別精度與速度,滿足了實(shí)時(shí)檢測(cè)要求。但上述研究仍存在參數(shù)量大、訓(xùn)練速度慢、訓(xùn)練時(shí)間較長(zhǎng)等問(wèn)題。因此,任會(huì)等[17]基于 Faster-RCNN 網(wǎng)絡(luò)構(gòu)建了橘子識(shí)別模型,采用 Softmax 得到錨框?qū)儆谖矬w或背景的概率,相較于傳統(tǒng)方法,不僅識(shí)別率提升了 26%,還減少了參數(shù)量和預(yù)測(cè)時(shí)間,大幅加快了訓(xùn)練速度。張習(xí)之等[18] 還提出一種基于改進(jìn) Mask RCNN 網(wǎng)絡(luò)的油茶果檢測(cè)分割方法,對(duì)特征提取模塊進(jìn)行改造,利用并聯(lián)的不同尺寸的分解卷積核實(shí)現(xiàn)對(duì)不同類(lèi)型特征學(xué)習(xí),模型識(shí)別準(zhǔn)確率、精確率、召回率分別為 87.5%、87.9%和 87%。Mask RCNN 網(wǎng)絡(luò)的層數(shù)較淺,計(jì)算量較小,訓(xùn)練時(shí)間僅為 27 h,該算法在訓(xùn)練時(shí)間上有明顯優(yōu)勢(shì),具有較好的實(shí)時(shí)性與一定的實(shí)用性。

  綜上所述,F(xiàn)aster RCNN、Mask RCNN 等新算法通過(guò)接入?yún)^(qū)域生成網(wǎng)絡(luò) RPN、引入雙層損失函數(shù)、融合提取多特征等手段極大地提高了網(wǎng)絡(luò)的學(xué)習(xí)能力、穩(wěn)定性等。相比傳統(tǒng)算法,基于深度學(xué)習(xí)技術(shù)的卷積神經(jīng)網(wǎng)絡(luò)能更好地適應(yīng)田間復(fù)雜環(huán)境,目標(biāo)檢測(cè)效果更優(yōu),檢測(cè)速度也基本達(dá)到實(shí)時(shí)采摘的要求,檢測(cè)模型的實(shí)用性得到極大地提升。但目前國(guó)內(nèi)大部分研究主要針對(duì)二維圖像進(jìn)行訓(xùn)練及檢測(cè),缺乏對(duì)多維信息的研究,無(wú)法獲取圖像中的目標(biāo)位置,尤其在復(fù)雜環(huán)境背景下,光照、陰影以及遮擋對(duì)小目標(biāo)或稠密目標(biāo)識(shí)別效果影響非常大,后續(xù)可以考慮采用深度相機(jī)、雙目相機(jī)、測(cè)距雷達(dá)等[19]手段獲取更多復(fù)雜條件下的樣本數(shù)據(jù)信息,建立多維信息的數(shù)據(jù)集,增加模型的普適性。例如,Bargoti 等[20]提出一種具有 CNN 和多尺度多層感知器(MLP)2 種特征學(xué)習(xí)的圖像分割方法,結(jié)合球形數(shù)字相機(jī)獲取 360° 全景視圖,并基于霍夫圓變換(CHT)和分水嶺分割算法(WS)對(duì)自然環(huán)境下的果園圖像數(shù)據(jù)進(jìn)行蘋(píng)果、芒果的檢測(cè)和計(jì)數(shù),結(jié)果表明,誤差從 13.3%提高到了 10.84%,其 F1值最高達(dá)到 86.1%,平方相關(guān)系數(shù) r 2 為 0.826。Madeleine 等[21]提出一種多傳感器框架來(lái)識(shí)別、跟蹤、定位和檢測(cè)果園中的芒果,綜合采用彩色相機(jī)、全球定位慣性導(dǎo)航系統(tǒng)(GPS/INS)和 3D 激光雷達(dá)收集多維數(shù)據(jù)信息,利用 GPS 軌跡數(shù)據(jù)進(jìn)行圖像比對(duì)、3D 激光雷達(dá)自動(dòng)生成冠層圖像掩模,結(jié)果表明,采用多視圖方法不需要額外校準(zhǔn),每棵樹(shù)的錯(cuò)誤率僅為 1.36%。

  3 不同卷積網(wǎng)絡(luò)模型在經(jīng)濟(jì)林產(chǎn)品分選中的應(yīng)用

  常規(guī)人工分選不僅分級(jí)效率較低,且受個(gè)人主觀因素影響,難以實(shí)現(xiàn)標(biāo)準(zhǔn)化作業(yè),不能滿足市場(chǎng)需求。因此,依據(jù)經(jīng)濟(jì)林產(chǎn)品精深加工生產(chǎn)需求,采用近紅外光譜、高光譜、深度學(xué)習(xí)等技術(shù)進(jìn)行原果精確識(shí)別與高效分選,對(duì)提高經(jīng)濟(jì)林產(chǎn)品的品質(zhì)和附加值具有重要意義?;谏鲜鰣D像識(shí)別技術(shù)能夠得到豐富的圖像信息和光譜信息,然而傳統(tǒng)的支持向量機(jī) ( SVM)、連續(xù)投影算法(SPA)、偏最小二乘法(PLS)、神經(jīng)網(wǎng)絡(luò)(BP)、遺傳算法(GA)等已無(wú)法適應(yīng)越來(lái)越龐大且復(fù)雜的數(shù)據(jù)量,其模型識(shí)別與預(yù)測(cè)能力性能也有待進(jìn)一步提升。例如,使用 SPA 提取樣本特征建立 LS-SVM 模型,利用大規(guī)模訓(xùn)練樣本對(duì)正常、黑斑、破裂核桃進(jìn)行判別,存在訓(xùn)練速度較慢、不適合多分類(lèi)研究等問(wèn)題[22]。例如,利用 BP 神經(jīng)網(wǎng)絡(luò)、偏最小二乘法、支持向量機(jī)的多源信息融合模型進(jìn)行板栗分級(jí),利用 PLS 模型進(jìn)行核桃殼、核桃仁、分心木的識(shí)別與分選,均存在收斂速度慢、局部極小化、預(yù)測(cè)能力和訓(xùn)練能力矛盾、樣本依賴(lài)性高等問(wèn)題[23]。利用 GA 算法進(jìn)行油茶果果殼與茶籽分選,存在過(guò)早收斂、效率低、不能全面表示優(yōu)化問(wèn)題的約束等問(wèn)題[24]。

  針對(duì)上述問(wèn)題,海潮[25]對(duì) GoogleNet Inception-v3 模型的學(xué)習(xí)率、批次大小、迭代次數(shù)進(jìn)行調(diào)節(jié)與優(yōu)化,實(shí)驗(yàn)結(jié)果表明,該模型對(duì)于干條、黃皮、破頭、霉變 4 類(lèi)缺陷以及正常棗的識(shí)別效果良好,準(zhǔn)確率達(dá)到 98.65%,但訓(xùn)練時(shí)間較長(zhǎng);因此又利用遷移學(xué)習(xí)在較少的數(shù)據(jù)集上實(shí)現(xiàn)較好的訓(xùn)練效果,節(jié)省了大量訓(xùn)練時(shí)間,準(zhǔn)確率為 94.60%。Zhou 等[26]基于卷積網(wǎng)絡(luò) VGG 模型,應(yīng)用 SWA 優(yōu)化器和 w-softmax 損失函數(shù)對(duì)青梅進(jìn)行多缺陷分類(lèi),實(shí)驗(yàn)結(jié)果表明,正常青梅的識(shí)別率達(dá)到 95.65%,單個(gè)青梅圖像檢測(cè)時(shí)間為 84.69 ms。謝為俊等[27] 對(duì) AlexNet 網(wǎng)絡(luò)進(jìn)行優(yōu)化,選用批量歸一化(BN)作為模型歸一化方法,提高模型訓(xùn)練收斂速度和模型的泛化性能;利用 Swish 函數(shù)可有效解決 ReLU 激活函數(shù)出現(xiàn)神經(jīng)元死亡的問(wèn)題,從而提高模型準(zhǔn)確率和訓(xùn)練收斂速度;通過(guò)壓縮模型卷積層感受野和全連接層節(jié)點(diǎn),可進(jìn)一步提高訓(xùn)練速度;實(shí)驗(yàn)結(jié)果表明,該模型對(duì)油茶籽完整性的識(shí)別準(zhǔn)確率達(dá)到 98.05%。王立揚(yáng)等[28]通過(guò)改進(jìn)經(jīng)典卷積神經(jīng)網(wǎng)絡(luò) LeNet-5 模型以提高蘋(píng)果分級(jí)準(zhǔn)確率,改用LeakyReLU 激勵(lì)函數(shù),并加入 Dropout層防止過(guò)擬合,實(shí)驗(yàn)結(jié)果表明,測(cè)試集準(zhǔn)確率達(dá) 98.37%,識(shí)別時(shí)間為 120 ms。通過(guò)上述研究,逐步提升了網(wǎng)絡(luò)模型的準(zhǔn)確率,但識(shí)別時(shí)長(zhǎng)仍不太理想。因此,Wang 等[29]基于藍(lán)莓高光譜數(shù)據(jù),利用殘差網(wǎng)絡(luò) ResNet 和改進(jìn) ResNeXt 網(wǎng)絡(luò)對(duì)不同藍(lán)莓內(nèi)部品質(zhì)損傷進(jìn)行分選,相比傳統(tǒng)機(jī)器學(xué)習(xí)方法,2 種深度學(xué)習(xí)網(wǎng)絡(luò)具有更好的分類(lèi)性能,實(shí)驗(yàn)結(jié)果表明,微調(diào)后每個(gè)測(cè)試樣本的分類(lèi)時(shí)間僅為 5.2 和 6.5 ms,但 ResNet 和 ResNeXt 網(wǎng)絡(luò)的平均準(zhǔn)確率和 F1僅為 88.44%、87.84%和 89.52%、89.05%。Altheri 等[30]根據(jù)紅棗成熟度、類(lèi)型等構(gòu)建紅棗果實(shí)實(shí)時(shí)分類(lèi)模型,數(shù)據(jù)集包含 350 多個(gè)棗叢的 5 種不同成熟度紅棗,共 8 072 張圖像,使用 AlexNet、VGG-16 和改進(jìn) VGG-16 3 個(gè) CNN 模型進(jìn)行比對(duì),實(shí)驗(yàn)結(jié)果表明,模型分類(lèi)準(zhǔn)確率分別為 99.01%、97.25%和 98.59%,分類(lèi)時(shí)間分別為 20.7、 20.6 和 35.9 ms,均能夠滿足工廠自動(dòng)化分級(jí)的需求。

  綜上所述,相比傳統(tǒng)算法,AlexNet、VGGNet、GoogleNet 和 ResNet 等 CNN 深度學(xué)習(xí)模型在網(wǎng)絡(luò)學(xué)習(xí)能力、特征表達(dá)能力、緩解模型退化和降低運(yùn)算量等方面具有更好的性能,模型訓(xùn)練泛化性能、收斂速度、準(zhǔn)確率和識(shí)別時(shí)間均有很大提升,可滿足在線實(shí)時(shí)分選的要求。但卷積神經(jīng)網(wǎng)絡(luò)作為監(jiān)督學(xué)習(xí)的代表算法,存在樣本數(shù)量大且需要精準(zhǔn)預(yù)標(biāo)定、計(jì)算量大、訓(xùn)練時(shí)間長(zhǎng)等問(wèn)題,且由于高光譜圖像維度較高、信息量大、參數(shù)多,對(duì)硬件要求苛刻,尚難以用于實(shí)際規(guī)模化應(yīng)用[31]。

  4 研究存在的不足及建議

  卷積神經(jīng)網(wǎng)絡(luò)在提取目標(biāo)的全局訓(xùn)練特征和分類(lèi)等方面具有明顯優(yōu)勢(shì)[32],基于深層卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法,通過(guò)圖像語(yǔ)義分割、實(shí)例分割、圖像標(biāo)注等手段,具有泛化能力強(qiáng)、魯棒性好等特點(diǎn)[33]。因此,在經(jīng)濟(jì)林產(chǎn)品目標(biāo)檢測(cè)和分選中的應(yīng)用越來(lái)越廣泛,但也面臨著很多困難與挑戰(zhàn),還需要對(duì)深度學(xué)習(xí)理論進(jìn)行不斷優(yōu)化與改善,為經(jīng)濟(jì)林產(chǎn)品加工產(chǎn)業(yè)的高效化、精準(zhǔn)化、智能化發(fā)展提供重要技術(shù)支撐。

  4.1 存在的不足

  1)需要龐大的樣本集和精準(zhǔn)的預(yù)標(biāo)定。CNN 作為監(jiān)督學(xué)習(xí)的典型圖像分類(lèi)算法,訓(xùn)練樣本大,耗時(shí)較長(zhǎng),并需要通過(guò)頻繁迭代訓(xùn)練提高網(wǎng)絡(luò)精度,且采用梯度下降算法很容易使訓(xùn)練結(jié)果收斂于局部最小值而非全局最小值。因此,在算法模型的收斂速度、延展性及數(shù)據(jù)規(guī)模等方面仍有待進(jìn)一步優(yōu)化提升。

  2)網(wǎng)絡(luò)結(jié)構(gòu)模型逐漸復(fù)雜化。由于需要基于近紅外光譜、高光譜技術(shù)提供的海量數(shù)據(jù)進(jìn)行訓(xùn)練、調(diào)參、尋優(yōu),R-CNN、Fast R-CNN 等兩階段目標(biāo)檢測(cè)算法模型整體較大,存在模型復(fù)雜、層次深、訓(xùn)練參數(shù)多、訓(xùn)練時(shí)間長(zhǎng)等缺點(diǎn),無(wú)法在檢測(cè)速度、精度及模型大小方面實(shí)現(xiàn)較好的平衡;且為了保證算法的準(zhǔn)確率和實(shí)時(shí)性,對(duì)計(jì)算機(jī)圖形處理器(GPU)、內(nèi)存等硬件要求更高,無(wú)法滿足小設(shè)備上的應(yīng)用要求。

  3)小目標(biāo)或稠密目標(biāo)的特征信息不完善。由于田間環(huán)境復(fù)雜,且油茶、紅棗、茶葉、林果等經(jīng)濟(jì)林產(chǎn)品體積較小,多呈聚集狀態(tài)。常規(guī)的二維圖像數(shù)據(jù)無(wú)法全面表述目標(biāo)特征信息,在實(shí)際檢測(cè)過(guò)程中無(wú)法有效解決圖像遮擋、交疊、復(fù)雜背景顏色高度相似性等問(wèn)題。

  4.2 進(jìn)一步研究建議

  1)深度優(yōu)化監(jiān)督學(xué)習(xí)算法。例如,將有監(jiān)督學(xué)習(xí)轉(zhuǎn)化為半監(jiān)督或無(wú)監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)算法既沒(méi)有訓(xùn)練集,也無(wú)須預(yù)標(biāo)定?;谏窠?jīng)科學(xué)研究,可堆棧多層,以貪婪式的方式逐層重復(fù)訓(xùn)練,減少數(shù)據(jù)依賴(lài)性。

  2)輕量化設(shè)計(jì)網(wǎng)絡(luò)框架模型。引入專(zhuān)門(mén)針對(duì)移動(dòng)端設(shè)計(jì)的輕量化網(wǎng)絡(luò)架構(gòu),如 MobleNets、GhostNet 等新網(wǎng)絡(luò),運(yùn)用深度分離卷積代替?zhèn)鹘y(tǒng)卷積、線性映射生成更多的特征圖等方法,減少模型參數(shù)和計(jì)算量,縮短訓(xùn)練時(shí)間,提升模型實(shí)用性。在硬件上,使用云計(jì)算方式進(jìn)行深度學(xué)習(xí)訓(xùn)練,降低運(yùn)算成本。

  3)構(gòu)建多元化數(shù)據(jù)集。結(jié)合相應(yīng)的 3D 技術(shù),如深度相機(jī)、雙目相機(jī)、測(cè)距雷達(dá)等手段獲取更多的訓(xùn)練樣本信息,建立多維信息數(shù)據(jù)集,有效補(bǔ)充目標(biāo)物的三維特征,以實(shí)現(xiàn)對(duì)目標(biāo)物體更為高效、快速的檢測(cè)與分選。