本技術(shù)涉及人工智能中的圖像處理,特別是涉及一種圖片數(shù)據(jù)預處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品。
背景技術(shù):
1、在進行圖片中目標對象的檢測和識別時,圖像本身質(zhì)量的好壞和數(shù)據(jù)量的大小會直接影響到后續(xù)模型架構(gòu)的設(shè)計、損失函數(shù)的選擇、優(yōu)化算法的實現(xiàn)以及識別效果的精度等等。因此在進行檢測或識別操作之前,需要對圖片進行恰當?shù)念A處理操作。圖片預處理主要是為了能夠消除掉圖片中的一些噪點信息,增強有效信息的可讀性,能夠更大限度地優(yōu)化數(shù)據(jù)信息,為后續(xù)圖片中目標對象的檢測提供優(yōu)質(zhì)條件?,F(xiàn)有數(shù)據(jù)預處理技術(shù)一般都是檢查數(shù)據(jù)中的異常,根據(jù)業(yè)務(wù)需求進行數(shù)據(jù)去噪,去除無用信息或者非法信息,然后把圖文數(shù)據(jù)(文字數(shù)據(jù)為圖片數(shù)據(jù)的標簽)全部交給模型進行訓練。新的業(yè)務(wù)需求出現(xiàn)后,開發(fā)人員需要根據(jù)新的業(yè)務(wù)邏輯再進行數(shù)據(jù)預處理,再把圖文數(shù)據(jù)作為輸入進行模型訓練,模型內(nèi)部進行向量化把圖文數(shù)據(jù)變?yōu)樘卣飨蛄繑?shù)據(jù)。這樣的流程增加了數(shù)據(jù)預處理的時間成本。并且大量的圖文數(shù)據(jù)中包含著與業(yè)務(wù)需求無關(guān)的數(shù)據(jù),這些無關(guān)的數(shù)據(jù),會進一步增加模型的訓練成本和空間復雜度。在調(diào)整模型的算法或者想進行算法參數(shù)調(diào)整的時候,這一預處理過程又會重復。
技術(shù)實現(xiàn)思路
1、本技術(shù)的目的是提供一種圖片數(shù)據(jù)預處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品,將圖片數(shù)據(jù)直接以特征向量的形式存儲于向量數(shù)據(jù)庫中,在用于模型訓練時,不僅能避免重復的操作流程,還能降低模型訓練的時間復雜度和空間復雜度,減少同等條件下模型訓練和調(diào)參過程中需要的硬件資源。
2、為實現(xiàn)上述目的,本技術(shù)提供了如下方案。
3、第一方面,本技術(shù)提供了一種圖片數(shù)據(jù)預處理方法,包括:
4、根據(jù)目標檢測模型的任務(wù)目標獲取對應(yīng)的圖片數(shù)據(jù)集;所述目標檢測模型的任務(wù)目標包括人物對象檢測、動物對象檢測、車輛對象檢測、病灶區(qū)域檢測、障礙物檢測、產(chǎn)品缺陷檢測、異常物品檢測和病蟲害區(qū)域檢測;對應(yīng)的圖片數(shù)據(jù)集包括人物圖片數(shù)據(jù)集、動物圖片數(shù)據(jù)集、車輛圖片數(shù)據(jù)集、病灶圖片數(shù)據(jù)集、障礙物圖片數(shù)據(jù)集、產(chǎn)品圖片數(shù)據(jù)集、物品圖片數(shù)據(jù)集和農(nóng)作物圖片數(shù)據(jù)集;
5、按照待檢測的目標種類對圖片數(shù)據(jù)集中的各類圖片數(shù)據(jù)進行分類和篩選,得到目標種類數(shù)據(jù)集;
6、對目標種類數(shù)據(jù)集中各個目標種類的圖片數(shù)據(jù)進行數(shù)據(jù)均衡處理,得到均衡后數(shù)據(jù)集;
7、對均衡后數(shù)據(jù)集中的每張圖片數(shù)據(jù)進行特征維度優(yōu)化處理,得到優(yōu)化后的特征向量;
8、將優(yōu)化后的特征向量存入向量數(shù)據(jù)庫,供目標檢測模型訓練使用。
9、可選地,所述按照待檢測的目標種類對圖片數(shù)據(jù)集中的各類圖片數(shù)據(jù)進行分類和篩選,得到目標種類數(shù)據(jù)集,具體包括:
10、通過clip模型計算圖片數(shù)據(jù)集中的每張圖片數(shù)據(jù)與每個目標種類的相似度,保留相似度大于相似度閾值的圖片數(shù)據(jù),構(gòu)成目標種類數(shù)據(jù)集。
11、可選地,所述對目標種類數(shù)據(jù)集中各個目標種類的圖片數(shù)據(jù)進行數(shù)據(jù)均衡處理,得到均衡后數(shù)據(jù)集,具體包括:
12、判斷目標種類數(shù)據(jù)集中各個目標種類的圖片數(shù)據(jù)中,任意兩個目標種類之間的圖片數(shù)據(jù)比例是否均衡;
13、若比例均衡,則將每個目標種類的圖片數(shù)據(jù)進行數(shù)據(jù)壓縮,壓縮至同一分類數(shù)量nmax;其中nmax為數(shù)據(jù)壓縮后占比最大的目標種類所包含的圖片數(shù)量;
14、若比例不均衡,則對占比較小的目標種類的圖片數(shù)據(jù)進行數(shù)據(jù)增強,對占比較大的目標種類的圖片數(shù)據(jù)進行數(shù)據(jù)壓縮,將各個目標種類的圖片數(shù)據(jù)增強或壓縮至同一分類數(shù)量nmax。
15、可選地,所述對均衡后數(shù)據(jù)集中的每張圖片數(shù)據(jù)進行特征維度優(yōu)化處理,得到優(yōu)化后的特征向量,具體包括:
16、對均衡后數(shù)據(jù)集中的每張圖片數(shù)據(jù)進行分塊處理,將每張圖片數(shù)據(jù)分割成m行×n列的多個圖片塊;m和n均為大于1的整數(shù);
17、對每個圖片塊進行塊級分類,將包含目標對象的圖片塊標記為1,將不包含目標對象的圖片塊標記為0,得到帶標簽的圖片塊;
18、基于每個圖片塊所帶標簽,對每張圖片數(shù)據(jù)分割成的多個圖片塊進行篩選和重組,得到優(yōu)化后的特征向量。
19、可選地,所述基于每個圖片塊所帶標簽,對每張圖片數(shù)據(jù)分割成的多個圖片塊進行篩選和重組,得到優(yōu)化后的特征向量,具體包括:
20、遍歷每張圖片數(shù)據(jù)分割成的m行×n列的多個圖片塊,以每一行為單位,將標簽為1的圖片塊保留,將標簽為0的圖片塊丟棄;
21、將所有標簽為1的圖片塊重組為1×x維度的特征矩陣,每一行圖片塊重組成功后添加序列起始位置標記[b],最后一行圖片塊重組結(jié)束后添加序列結(jié)束位置標記[e],得到優(yōu)化后的特征向量;其中x為每張圖片數(shù)據(jù)中標簽為1的圖片塊數(shù)量。
22、可選地,所述將優(yōu)化后的特征向量存入向量數(shù)據(jù)庫,供目標檢測模型訓練使用,具體包括:
23、將優(yōu)化后的特征向量作為特征數(shù)據(jù)集,存入向量數(shù)據(jù)庫中;
24、進行目標檢測模型訓練時,將特征數(shù)據(jù)集劃分為訓練集、驗證集和測試集,用于對目標檢測模型進行訓練、驗證和測試。
25、第二方面,本技術(shù)提供了一種圖片數(shù)據(jù)預處理裝置,包括:
26、圖片數(shù)據(jù)集獲取模塊,用于根據(jù)目標檢測模型的任務(wù)目標獲取對應(yīng)的圖片數(shù)據(jù)集;所述目標檢測模型的任務(wù)目標包括人物對象檢測、動物對象檢測、車輛對象檢測、病灶區(qū)域檢測、障礙物檢測、產(chǎn)品缺陷檢測、異常物品檢測和病蟲害區(qū)域檢測;對應(yīng)的圖片數(shù)據(jù)集包括人物圖片數(shù)據(jù)集、動物圖片數(shù)據(jù)集、車輛圖片數(shù)據(jù)集、病灶圖片數(shù)據(jù)集、障礙物圖片數(shù)據(jù)集、產(chǎn)品圖片數(shù)據(jù)集、物品圖片數(shù)據(jù)集和農(nóng)作物圖片數(shù)據(jù)集;
27、圖片分類篩選模塊,用于按照待檢測的目標種類對圖片數(shù)據(jù)集中的各類圖片數(shù)據(jù)進行分類和篩選,得到目標種類數(shù)據(jù)集;
28、數(shù)據(jù)均衡處理模塊,用于對目標種類數(shù)據(jù)集中各個目標種類的圖片數(shù)據(jù)進行數(shù)據(jù)均衡處理,得到均衡后數(shù)據(jù)集;
29、特征維度優(yōu)化模塊,用于對均衡后數(shù)據(jù)集中的每張圖片數(shù)據(jù)進行特征維度優(yōu)化處理,得到優(yōu)化后的特征向量;
30、特征向量存儲模塊,用于將優(yōu)化后的特征向量存入向量數(shù)據(jù)庫,供目標檢測模型訓練使用。
31、第三方面,本技術(shù)提供了一種計算機設(shè)備,包括:存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)所述圖片數(shù)據(jù)預處理方法。
32、第四方面,本技術(shù)提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)所述圖片數(shù)據(jù)預處理方法。
33、第五方面,本技術(shù)提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)所述圖片數(shù)據(jù)預處理方法。
34、根據(jù)本技術(shù)提供的具體實施例,本技術(shù)公開了以下技術(shù)效果。
35、本技術(shù)提供的一種圖片數(shù)據(jù)預處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品,一方面根據(jù)目標檢測模型的任務(wù)目標和待檢測的目標種類自動篩選目標種類數(shù)據(jù)集并均衡種類占比,另一方面進行了圖片數(shù)據(jù)的特征維度優(yōu)化處理,實現(xiàn)了特征降維。使用本技術(shù)方法預處理后的圖片數(shù)據(jù),直接以特征向量的形式存儲于向量數(shù)據(jù)庫中,這樣在用于目標檢測模型訓練時,不僅避免了重復的操作流程,又降低了模型的時間復雜度以及空間復雜度,降低了同等條件下模型的訓練時間,減少了訓練、調(diào)參過程中需要的硬件資源,從而有效減少了模型訓練成本。