本發(fā)明涉及圖像識(shí)別,具體涉及一種基于視覺技術(shù)的多目標(biāo)識(shí)別方法及系統(tǒng)。
背景技術(shù):
1、隨著計(jì)算機(jī)視覺技術(shù)的不斷進(jìn)步,基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)在多個(gè)領(lǐng)域得到了廣泛應(yīng)用,如視頻監(jiān)控、自動(dòng)駕駛、智能農(nóng)業(yè)等。特別是在自動(dòng)化牧場管理中,準(zhǔn)確識(shí)別和分類羊群中的每只羊具有重要意義。例如在內(nèi)蒙古,有牧民使用無人機(jī)進(jìn)行放牧,并將這一過程通過直播平臺(tái)分享給網(wǎng)友,這種新型的放牧方式不僅提高了效率,也吸引了網(wǎng)友的興趣;然而,在實(shí)際直播應(yīng)用過程中,由于羊群中的羊通常緊挨且大小不一,容易導(dǎo)致目標(biāo)識(shí)別不準(zhǔn)確,可能會(huì)造成個(gè)別羊丟失,從而為牧民帶來經(jīng)濟(jì)損失。而在密集放牧場景中,羊群常呈現(xiàn)以下特征:羊只個(gè)體空間分布緊密,羊只目標(biāo)重疊率高;羊只因年齡、姿態(tài)差異導(dǎo)致尺度變化顯著;小羊目標(biāo)在遠(yuǎn)距離拍攝時(shí)像素占比低;因此在對羊群進(jìn)行多目標(biāo)識(shí)別時(shí),會(huì)導(dǎo)致將多只羊誤識(shí)別為一只羊,進(jìn)而影響到識(shí)別結(jié)果的精度和可靠性。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種基于視覺技術(shù)的多目標(biāo)識(shí)別方法及系統(tǒng),以解決現(xiàn)有的問題:由于羊只個(gè)體空間分布緊密,羊只目標(biāo)重疊率高,在對羊群進(jìn)行多目標(biāo)識(shí)別時(shí),會(huì)導(dǎo)致將多只羊誤識(shí)別為一只羊。
2、本發(fā)明的一種基于視覺技術(shù)的多目標(biāo)識(shí)別方法及系統(tǒng)采用如下技術(shù)方案:
3、本發(fā)明提出了一種基于視覺技術(shù)的多目標(biāo)識(shí)別方法,該方法包括以下步驟:
4、獲取牧場內(nèi)羊群遙感圖像;
5、獲取牧場內(nèi)羊群的遙感圖像中若干個(gè)連通域;根據(jù)連通域內(nèi)部分布情況,獲取每個(gè)連通域的疑似羊群分布值;根據(jù)連通域的形狀,以及疑似羊群分布值,獲取連通域內(nèi)的羊群緊挨程度;
6、對連通域進(jìn)行多目標(biāo)識(shí)別,得到連通域內(nèi)若干個(gè)目標(biāo)框以及對應(yīng)的目標(biāo)概率;根據(jù)連通域進(jìn)行開運(yùn)算前后的差異情況,獲取連通域內(nèi)每個(gè)目標(biāo)框的只羊分割不準(zhǔn)確性;根據(jù)目標(biāo)框與其他目標(biāo)框之間內(nèi)部的連通域的邊緣分布情況,以及只羊分割不準(zhǔn)確性和目標(biāo)概率,獲取連通域內(nèi)每個(gè)目標(biāo)框的誤檢程度值;根據(jù)連通域內(nèi)的羊群緊挨程度和目標(biāo)框的誤檢程度值,獲取連通域的綜合羊只識(shí)別準(zhǔn)確性;基于綜合羊只識(shí)別準(zhǔn)確性獲取牧場內(nèi)羊群進(jìn)行多目標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的最優(yōu)步長參數(shù);
7、基于最優(yōu)步長的卷積神經(jīng)網(wǎng)絡(luò)對牧場內(nèi)羊群遙感圖像進(jìn)行多目標(biāo)只羊的識(shí)別。
8、優(yōu)選的,所述根據(jù)連通域內(nèi)部分布情況,獲取每個(gè)連通域的疑似羊群分布值的具體方法為:
9、對第個(gè)連通域進(jìn)行腐蝕操作,得到第個(gè)連通域腐蝕后被劃分為多個(gè)連通域;并將第個(gè)連通域腐蝕后被劃分為多個(gè)連通域的數(shù)量,作為第個(gè)連通域內(nèi)的疑似羊只數(shù);將第個(gè)連通域內(nèi)的疑似羊只數(shù)的歸一化值與第個(gè)連通域的面積之間的乘積,作為第個(gè)連通域內(nèi)的疑似羊群分布值。
10、優(yōu)選的,所述根據(jù)連通域的形狀,以及疑似羊群分布值,獲取連通域內(nèi)的羊群緊挨程度的具體方法為:
11、根據(jù)連通域的形狀,獲取連通域內(nèi)的羊群之間縫隙顯著度;
12、將第個(gè)連通域內(nèi)的羊群之間縫隙顯著度的反比例歸一化值與第個(gè)連通域內(nèi)的疑似羊群分布值的乘積,作為第個(gè)連通域內(nèi)的羊群緊挨程度。
13、優(yōu)選的,所述根據(jù)連通域的形狀,獲取連通域內(nèi)的羊群之間縫隙顯著度的具體方法為:
14、第個(gè)連通域的凸包面積與面積之間的差值,作為第個(gè)連通域的空白區(qū)域面積;將第個(gè)連通域的空白區(qū)域面積與凸包面積的比值,作為第個(gè)連通域內(nèi)的羊群之間縫隙顯著度。
15、優(yōu)選的,所述根據(jù)連通域進(jìn)行開運(yùn)算前后的差異情況,獲取連通域內(nèi)每個(gè)目標(biāo)框的只羊分割不準(zhǔn)確性的具體方法為:
16、利用開運(yùn)算對第個(gè)連通域內(nèi)第個(gè)目標(biāo)框內(nèi)的連通域進(jìn)行腐蝕膨脹操作,得到開運(yùn)算后第個(gè)目標(biāo)框內(nèi)的連通域;將第個(gè)目標(biāo)框內(nèi)的連通域的面積與開運(yùn)算后第個(gè)目標(biāo)框內(nèi)的連通域的差值的絕對值,記為目標(biāo)差值;
17、在對第個(gè)連通域內(nèi)第個(gè)目標(biāo)框內(nèi)的連通域進(jìn)行腐蝕操作,得到腐蝕后被劃分為多個(gè)連通域中,將面積最大的連通域的中心位置與第個(gè)目標(biāo)框的中心位置之間的歐氏距離,記為目標(biāo)距離;將目標(biāo)差值與目標(biāo)距離的乘積,作為第個(gè)連通域內(nèi)第個(gè)目標(biāo)框的只羊分割不準(zhǔn)確性。
18、優(yōu)選的,所述根據(jù)目標(biāo)框與其他目標(biāo)框之間內(nèi)部的連通域的邊緣分布情況,以及只羊分割不準(zhǔn)確性和目標(biāo)概率,獲取連通域內(nèi)每個(gè)目標(biāo)框的誤檢程度值的具體方法為:
19、對于第個(gè)連通域中任意兩個(gè)目標(biāo)框,選取目標(biāo)概率大的目標(biāo)框作為標(biāo)準(zhǔn)目標(biāo)框,另一個(gè)作為對比目標(biāo)框;利用圖像金字塔技術(shù)將對比目標(biāo)框進(jìn)行縮放,直至與標(biāo)準(zhǔn)目標(biāo)框?yàn)橥却笮。?/p>
20、獲取標(biāo)準(zhǔn)目標(biāo)框與對比目標(biāo)框之間的最終匹配相似度;
21、獲取第個(gè)連通域內(nèi)第個(gè)目標(biāo)框與所有連通域內(nèi)每個(gè)目標(biāo)框之間的最終匹配相似度,將最終匹配相似度的最大值的反比例歸一化值與第個(gè)連通域內(nèi)第個(gè)目標(biāo)框的只羊分割不準(zhǔn)確性的乘積,作為第個(gè)連通域內(nèi)第個(gè)目標(biāo)框的誤檢程度值。
22、優(yōu)選的,所述獲取標(biāo)準(zhǔn)目標(biāo)框與對比目標(biāo)框之間的最終匹配相似度的具體方法為:
23、在標(biāo)準(zhǔn)目標(biāo)框內(nèi)選取豎直方向上,以標(biāo)準(zhǔn)目標(biāo)框內(nèi)部的連通域的邊緣位置上最高的像素點(diǎn)為起點(diǎn),順時(shí)針獲取標(biāo)準(zhǔn)目標(biāo)框的鏈碼序列;在對比目標(biāo)框內(nèi)選取豎直方向上,以對比目標(biāo)框內(nèi)部的連通域的邊緣位置上最高的像素點(diǎn)為起點(diǎn),順時(shí)針獲取對比目標(biāo)框的鏈碼序列;將標(biāo)準(zhǔn)目標(biāo)框的鏈碼序列與對比目標(biāo)框的鏈碼序列之間的dtw值的反比例歸一化值,作為標(biāo)準(zhǔn)目標(biāo)框與對比目標(biāo)框之間的匹配相似度;
24、預(yù)設(shè)一個(gè)旋轉(zhuǎn)參數(shù),將對比目標(biāo)框每次順時(shí)針旋轉(zhuǎn),并在每次旋轉(zhuǎn)后獲取標(biāo)準(zhǔn)目標(biāo)框與對比目標(biāo)框之間的匹配相似度;在所有次旋轉(zhuǎn)對應(yīng)的標(biāo)準(zhǔn)目標(biāo)框與對比目標(biāo)框之間的匹配相似度中,將匹配相似度的最大值作為標(biāo)準(zhǔn)目標(biāo)框與對比目標(biāo)框之間的最終匹配相似。
25、優(yōu)選的,所述根據(jù)連通域內(nèi)的羊群緊挨程度和目標(biāo)框的誤檢程度值,獲取連通域的綜合羊只識(shí)別準(zhǔn)確性的具體方法為:
26、將第個(gè)連通域的面積與第個(gè)連通域內(nèi)所有目標(biāo)框內(nèi)連通域的面積的累加和之間的差值絕對值,記為第一差值;將第個(gè)連通域內(nèi)所有目標(biāo)框的誤檢程度值的均值與第個(gè)連通域內(nèi)的羊群緊挨程度的比值,記為第一比值;將第一差值與第一比值的乘積的反比例歸一化值,作為第個(gè)連通域的綜合羊只識(shí)別準(zhǔn)確性。
27、優(yōu)選的,所述基于綜合羊只識(shí)別準(zhǔn)確性獲取牧場內(nèi)羊群進(jìn)行多目標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的最優(yōu)步長參數(shù)的具體方法為:
28、對于任意一個(gè)步長參數(shù)的卷積神經(jīng)網(wǎng)絡(luò),在利用所述任意一個(gè)步長參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)對牧場內(nèi)羊群的遙感圖像進(jìn)行多目標(biāo)識(shí)別時(shí),將牧場內(nèi)羊群的遙感圖像中所有連通域的綜合羊只識(shí)別準(zhǔn)確性的均值,作為所述任意一個(gè)步長參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)選程度;
29、預(yù)設(shè)一個(gè)初始最大步長參數(shù)和一個(gè)最小步長參數(shù),將卷積神經(jīng)網(wǎng)絡(luò)的步長參數(shù)從開始逐步減小至,獲取每個(gè)步長參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)選程度;將優(yōu)選程度最大的步長參數(shù),作為牧場內(nèi)羊群進(jìn)行多目標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的最優(yōu)步長參數(shù)。
30、本發(fā)明還提出了一種基于視覺技術(shù)的多目標(biāo)識(shí)別系統(tǒng),包括存儲(chǔ)器和處理器,所述處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序,以實(shí)現(xiàn)上述的一種基于視覺技術(shù)的多目標(biāo)識(shí)別方法的步驟。
31、本發(fā)明的技術(shù)方案的有益效果是:本發(fā)明根據(jù)連通域的形狀,以及疑似羊群分布值,獲取連通域內(nèi)的羊群緊挨程度;對連通域進(jìn)行多目標(biāo)識(shí)別,得到連通域內(nèi)若干個(gè)目標(biāo)框以及對應(yīng)的目標(biāo)概率;根據(jù)連通域進(jìn)行開運(yùn)算前后的差異情況,獲取連通域內(nèi)每個(gè)目標(biāo)框的只羊分割不準(zhǔn)確性;根據(jù)目標(biāo)框與其他目標(biāo)框之間內(nèi)部的連通域的邊緣分布情況,以及只羊分割不準(zhǔn)確性和目標(biāo)概率,獲取連通域內(nèi)每個(gè)目標(biāo)框的誤檢程度值;根據(jù)連通域內(nèi)的羊群緊挨程度和目標(biāo)框的誤檢程度值,獲取連通域的綜合羊只識(shí)別準(zhǔn)確性;基于綜合羊只識(shí)別準(zhǔn)確性獲取牧場內(nèi)羊群進(jìn)行多目標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的最優(yōu)步長參數(shù);基于最優(yōu)步長的卷積神經(jīng)網(wǎng)絡(luò)對牧場內(nèi)羊群遙感圖像進(jìn)行多目標(biāo)只羊的識(shí)別;以此通過自適應(yīng)步長參數(shù)策略,卷積核能夠更精細(xì)地掃描圖像,通過分析目標(biāo)框內(nèi)羊群的緊挨信息,模型能夠更加精準(zhǔn)地確定目標(biāo)框的位置和大小,提升檢測的準(zhǔn)確性;且本發(fā)明能夠適應(yīng)不同密度的羊群,并且在復(fù)雜背景和不同光照條件下,依然能夠保持較高的檢測精度。