本發(fā)明涉及氣體檢測領域,具體涉及氣體檢測報警方法。
背景技術:
1、地下空間如地下停車場、地鐵站、礦井等,因空間封閉通風系統(tǒng)難以高效置換空氣,有害氣體易積聚,且地下環(huán)境復雜,多種因素綜合影響氣體濃度分布。精準檢測有害氣體濃度有利于保障地下空間人員安全,不僅能實時掌握濃度變化,還能在濃度超閾值時觸發(fā)報警系統(tǒng),提供安全預警,避免健康風險和安全事故。
2、現(xiàn)有氣體檢測技術多采用常規(guī)傳感器直接測量,溫度和濕度的變化會影響傳感器測量結果,導致測量精度不高,同時,現(xiàn)有氣體檢測技術采用固定閾值進行判別,忽略時段和位置對于氣體濃度的影響,誤判概率較高。
技術實現(xiàn)思路
1、本發(fā)明針對現(xiàn)有技術存在的不足,提出氣體檢測報警方法,實現(xiàn)基于恒溫恒濕協(xié)同調控的精確氣體濃度檢測以及考慮檢測位置、檢測時段的自適應危險判斷,提高了氣體的測量精度并減少誤判的概率。
2、實現(xiàn)本發(fā)明目的的技術解決方案為:
3、氣體檢測報警方法,包括以下步驟:
4、在當前的檢測時刻收集環(huán)境氣體樣本,測量當前的樣本溫度、樣本濕度并分別比對標準溫度、標準濕度以計算溫度偏差、濕度偏差,結合耦合補償模型獲取當前的溫度補償和濕度補償;
5、運用雙智能體協(xié)調算法,將控溫設備與控濕設備視作智能體并通過模擬調控收集經(jīng)驗池以訓練更新智能體的動作網(wǎng)絡、收益網(wǎng)絡和目標網(wǎng)絡,訓練完成后基于溫度、濕度的偏差及補償確定智能體當前的控溫動作和控濕動作以使環(huán)境氣體樣本達到標準溫度與標準濕度;
6、測量獲取當前的氣體濃度表,采用時空高斯建模提取當前的檢測時刻、檢測位置和氣體濃度表的時空特征生成當前的概率密度,基于概率密度與置信區(qū)間的歸屬關系決策當前的環(huán)境狀態(tài)標簽;
7、通過貝葉斯分類器將當前的氣體濃度表、檢測時刻、檢測位置和環(huán)境狀態(tài)標簽歸類于決策樹的葉節(jié)點以確定下次的檢測時刻。
8、具體的,耦合補償模型考慮控溫和控濕的相互影響關系,表明濕度補償與溫度偏差成線性相關且溫度補償與濕度偏差成線性相關,線性相關的系數(shù)和偏置采用線性回歸方法結合大量歷史溫度數(shù)據(jù)與濕度數(shù)據(jù)確定。
9、進一步的,雙智能體協(xié)調算法用于確定當前的控溫動作和控濕動作使環(huán)境氣體樣本達到標準溫度與標準濕度,包括以下步驟:
10、初始化控溫動作網(wǎng)絡、控濕動作網(wǎng)絡的控溫參數(shù)和控濕參數(shù),控溫動作網(wǎng)絡的輸入、輸出為溫度偏差與溫度補償拼接的溫度狀態(tài)矢量和控溫動作,控濕動作網(wǎng)絡的輸入、輸出為濕度偏差和濕度補償拼接的濕度狀態(tài)矢量和控濕動作;
11、初始化溫度收益網(wǎng)絡、濕度收益網(wǎng)絡的溫度收益參數(shù)和濕度收益參數(shù),溫度收益網(wǎng)絡和濕度收益網(wǎng)絡的輸出分別為未來的控溫收益和控濕收益;
12、分別復制控溫動作網(wǎng)絡、控濕動作網(wǎng)絡、溫度收益網(wǎng)絡和濕度收益網(wǎng)絡生成相應的目標網(wǎng)絡,目標網(wǎng)絡包括目標控溫動作網(wǎng)絡、目標控濕動作網(wǎng)絡、目標溫度收益網(wǎng)絡和目標濕度收益網(wǎng)絡,目標網(wǎng)絡的目標參數(shù)包括目標控溫參數(shù)、目標控濕參數(shù)、目標溫度收益參數(shù)和目標濕度收益參數(shù),其中,和分別為目標控溫動作網(wǎng)絡輸出的目標控溫動作和目標控濕動作網(wǎng)絡輸出的目標控濕動作,目標溫度收益網(wǎng)絡和目標濕度收益網(wǎng)絡的輸出分別為目標控溫收益和目標控濕收益;
13、設置控溫獎勵函數(shù)和控濕獎勵函數(shù),當溫度偏差和濕度偏差的絕對值小于相應的偏差閾值時,控溫獎勵函數(shù)和控濕獎勵函數(shù)會給予即時的正獎勵;
14、將當前的溫度狀態(tài)矢量和濕度狀態(tài)矢量分別作為第1輪的溫度狀態(tài)矢量和濕度狀態(tài)矢量,將每輪的溫度狀態(tài)矢量和濕度狀態(tài)矢量輸入控溫動作網(wǎng)絡和控濕動作網(wǎng)絡生成控溫動作和控濕動作并模擬執(zhí)行,生成下輪的溫度狀態(tài)矢量和濕度狀態(tài)矢量并計算每輪的控溫獎勵和控濕獎勵,將每輪中的輸入量、輸出量、生成量和計算結果構成每輪的經(jīng)驗樣本,重復輪構建經(jīng)驗池;
15、利用經(jīng)驗池協(xié)同訓練控溫智能體和控濕智能體,定義第輪的目標控溫貢獻和目標控濕貢獻分別等于第輪的控溫獎勵加折算因子與第輪的目標控溫收益的乘積和第輪的控濕獎勵加折算因子與第輪的目標控濕收益的乘積,其中,和分別為第輪的溫度狀態(tài)矢量代入目標控溫動作網(wǎng)絡輸出的輪的目標控溫動作和第輪的濕度狀態(tài)矢量代入目標控濕動作網(wǎng)絡輸出的輪的目標控濕動作,,為迭代總輪數(shù),定義控溫損失和控濕損失分別為輪的目標控溫貢獻與控溫收益的誤差均值和目標控濕貢獻與控濕收益的誤差均值;
16、利用控溫損失關于溫度收益參數(shù)的負梯度和控濕損失關于濕度收益參數(shù)的負梯度分別更新溫度收益參數(shù)和濕度收益參數(shù),依據(jù)輪的控溫收益和控溫動作關于控溫參數(shù)的梯度之積的均值和輪的控濕收益和控濕動作關于控濕參數(shù)的梯度之積的均值分別更新控溫參數(shù)和控濕參數(shù),將目標網(wǎng)絡的目標參數(shù)更新為平衡系數(shù)與相應的原網(wǎng)絡的參數(shù)的乘積加平衡互補系數(shù)與當前的目標參數(shù)的乘積;
17、當所有的負梯度和梯度之積的均值均收斂時,控溫智能體和控濕智能體訓練完成,將當前的溫度狀態(tài)矢量和濕度狀態(tài)矢量輸入訓練完成的控溫動作網(wǎng)絡和控濕動作網(wǎng)絡,獲取當前的控溫動作和控濕動作并執(zhí)行,使環(huán)境樣本氣體達到標準溫度與標準濕度。
18、具體的,當前的氣體濃度表包括當前的二氧化碳濃度、總烴濃度和硫化氫濃度,分別通過現(xiàn)有的紅外吸收法、光離子化檢測法和電化學法測量。
19、進一步的,采用時空高斯建模提取當前的檢測時刻、檢測位置和氣體濃度表的時空特征生成當前的概率密度,基于概率密度與置信區(qū)間的歸屬關系決策當前的環(huán)境狀態(tài)標簽,包括以下步驟:
20、將當前的檢測時刻、檢測位置和氣體濃度表拼接為當前的特征矢量,依據(jù)訓練均值和訓練方差標準化處理當前的特征矢量,生成標準特征矢量,其中,訓練均值和訓練方差為訓練集中特征矢量分布的均值和方差;
21、將標準特征矢量輸入時空卷積模型,采用逐點時間卷積擴充標準特征矢量的通道,生成當前的第一特征矩陣,采用逐通道時間卷積將第一特征矩陣中個通道的特征進行加權聚合,生成當前的第二特征矢量,采用空洞空間卷積捕捉第二特征矢量的空間依賴關系,生成當前的時空特征矢量,其中,空洞空間卷積通過在傳統(tǒng)卷積核中插入0實現(xiàn);
22、將時空特征矢量輸入高斯模型生成當前的概率密度并判斷是否位于置信區(qū)間內,若位于置信區(qū)間內,設置環(huán)境狀態(tài)標簽以反映安全狀態(tài),若位于置信區(qū)間外,設置環(huán)境狀態(tài)標簽以反映危險狀態(tài)。
23、更進一步的,時空卷積模型和高斯模型需要預先訓練,包括以下步驟:
24、收集多個不同的特征矢量以構建訓練集,每個特征矢量包括檢測時刻、檢測位置和處于安全狀態(tài)的氣體濃度表,計算訓練集的訓練均值和訓練方差;
25、構建時空卷積模型并初始化時卷積參數(shù),標準化處理訓練集中的特征矢量并輸入時空卷積模型,生成時空特征矢量集,采用最大似然估計法計算時空特征矢量集中時空特征矢量的估計均值矢量和估計協(xié)方差矩陣;
26、依據(jù)估計均值矢量和估計協(xié)方差矩陣構建高斯模型,定義損失函數(shù)為時空特征矢量集中每個時空特征矢量輸入高斯模型所得的概率密度的負對數(shù)之和;
27、使用隨機梯度下降不斷更新卷積參數(shù)以最小化損失函數(shù)并更新高斯模型直至損失函數(shù)收斂,設置置信度為0.95,基于高斯分布特性,置信區(qū)間位于估計均值矢量加減1.96倍的標準差向量范圍內,其中,標準差向量的平方為估計協(xié)方差矩陣的對角線元素排列構成的方差向量。
28、進一步的,決策樹的構建基于分類回歸樹實現(xiàn),收集多個決策特征矢量構建決策訓練集,每個決策特征矢量包括檢測時刻、檢測位置、氣體濃度表、環(huán)境狀態(tài)標簽和檢測間隔,設置根節(jié)點的匹配數(shù)據(jù)集為決策訓練集,計算決策特征矢量中每個特征的每個特征值對于根節(jié)點的基尼指數(shù),將基尼指數(shù)最小的特征及對應特征值作為根節(jié)點的分裂特征和分裂值,執(zhí)行節(jié)點分裂,將決策訓練集中分裂特征的特征值小于或等于分裂值的決策特征矢量作為一級左節(jié)點的匹配數(shù)據(jù)集,剩余的決策特征矢量則作為一級右節(jié)點的匹配數(shù)據(jù)集,對每個節(jié)點執(zhí)行可分判決,當節(jié)點的匹配數(shù)據(jù)集的基尼值小于基尼閾值或匹配數(shù)據(jù)集的決策特征矢量數(shù)小于最小矢量數(shù),將該節(jié)點作為葉節(jié)點并停止分裂,其余情況則對該節(jié)點遞歸執(zhí)行節(jié)點分裂和可分判決,直至所有節(jié)點均為葉節(jié)點時利用每個葉節(jié)點的匹配數(shù)據(jù)集的平均檢測間隔標記葉節(jié)點。
29、更進一步的,通過貝葉斯分類器將當前的氣體濃度表、檢測時刻、檢測位置和環(huán)境狀態(tài)標簽歸類于決策樹的葉節(jié)點以確定下次的檢測時刻,包括以下具體步驟:
30、將當前的環(huán)境狀態(tài)標簽與特征矢量拼接為當前的決策特征矢量;
31、計算決策樹中每個葉節(jié)點的先驗概率,每個葉節(jié)點的先驗概率等于葉節(jié)點的匹配數(shù)據(jù)集的決策特征矢量數(shù)除以決策訓練集的決策特征矢量總數(shù);
32、計算每個葉節(jié)點的條件概率,每個葉節(jié)點的條件概率等于決策特征矢量中每個維度的特征值在葉節(jié)點的匹配數(shù)據(jù)集中出現(xiàn)的概率之積;
33、基于貝葉斯定理,每個葉節(jié)點的后驗概率與葉節(jié)點的先驗概率和條件概率的乘積成正相關,將決策特征矢量歸屬于先驗概率和條件概率乘積最大的葉節(jié)點;
34、獲取決策特征矢量歸屬的葉節(jié)點標記的平均檢測間隔,則下次的檢測時刻等于當前的檢測時刻加獲取的平均檢測間隔。
35、本發(fā)明與現(xiàn)有技術相比,其顯著優(yōu)點在于:
36、1、在檢測時刻收集環(huán)境氣體樣本并測量樣本的溫度和濕度,基于溫度和濕度的偏差,結合考慮溫度變化與濕度變化交互影響的耦合補償模型獲取相應的補償,運用雙智能體協(xié)調算法,將控溫設備與控濕設備分別視作智能體進行模擬調控訓練,訓練后基于溫度、濕度的偏差及補償確定控溫動作和控濕動作以使環(huán)境氣體樣本達到標準溫度與標準濕度,避免溫度和濕度對于氣體濃度測量的影響。
37、2、采用時空高斯建模提取當前的檢測時刻、檢測位置和氣體濃度表的時空特征生成當前的概率密度并決策當前的環(huán)境狀態(tài)標簽,通過貝葉斯分類器將當前的氣體濃度表、檢測時刻、檢測位置和環(huán)境狀態(tài)標簽歸類于決策樹的葉節(jié)點以確定下次的檢測時刻,實現(xiàn)了考慮時空關系的環(huán)境危險性的動態(tài)決策判斷,同時結合判斷結果自適應確定檢測間隔以避免非必要的頻繁檢測。