本公開涉及自動(dòng)駕駛汽車的生態(tài)駕駛領(lǐng)域,具體而言,涉及車輛縱向速度控制換道的生態(tài)駕駛方法及系統(tǒng)。
背景技術(shù):
1、出行與運(yùn)輸需求的增加促進(jìn)了交通運(yùn)輸行業(yè)的進(jìn)步,在增強(qiáng)轉(zhuǎn)移能力的同時(shí),環(huán)境污染、能源危機(jī)等問題也在持續(xù)加劇。公路運(yùn)輸在能源消耗方面占據(jù)重要地位,因此,減少公路運(yùn)輸能源消耗,對(duì)保護(hù)生態(tài)環(huán)境和能源安全具有重要意義。
2、其中自動(dòng)駕駛技術(shù)與生態(tài)駕駛策略的結(jié)合成為交通領(lǐng)域研究的熱點(diǎn)。自動(dòng)駕駛技術(shù)的發(fā)展為實(shí)現(xiàn)高效、安全且環(huán)保的交通系統(tǒng)提供了新的可能性。通過精確的車輛控制和智能決策,自動(dòng)駕駛汽車有潛力顯著降低能源消耗和減少環(huán)境污染。
3、生態(tài)駕駛旨在減少車輛能耗和碳排放,同時(shí)提升行駛效率,已成為自動(dòng)駕駛領(lǐng)域的重要研究方向。然而,傳統(tǒng)生態(tài)駕駛多依賴規(guī)則和經(jīng)驗(yàn),在應(yīng)對(duì)復(fù)雜交通場(chǎng)景和多變路況時(shí)效果有限,且難以動(dòng)態(tài)適應(yīng)實(shí)際環(huán)境。近年來,drl技術(shù)憑借其強(qiáng)大的自適應(yīng)和優(yōu)化能力被引入生態(tài)駕駛,為復(fù)雜交通環(huán)境中的決策優(yōu)化帶來了新的可能性。
4、盡管drl在自動(dòng)駕駛中展現(xiàn)出優(yōu)勢(shì),但仍面臨智能體學(xué)習(xí)收斂緩慢、在安全性與效率間平衡難以實(shí)現(xiàn)等不足。
技術(shù)實(shí)現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)中存在的上述問題,本公開設(shè)計(jì)了一種基于速度導(dǎo)向換道的生態(tài)駕駛方法,其采用基于智能駕駛員模型(idm)的速度引導(dǎo)算法,為drl智能體提供加速度參考,從而加速訓(xùn)練并提升策略穩(wěn)定性。同時(shí),結(jié)合滾動(dòng)預(yù)測(cè)的換道決策方法,智能體可以實(shí)時(shí)預(yù)判未來一段時(shí)間的狀態(tài),優(yōu)化換道決策。該方法的應(yīng)用有效解決了復(fù)雜交通環(huán)境中自動(dòng)駕駛車輛的節(jié)能優(yōu)化和通行效率問題,實(shí)現(xiàn)了安全、平穩(wěn)、高效的行駛體驗(yàn)。具體技術(shù)方案如下。
2、第一方面,本公開提出一種基于速度導(dǎo)向換道的生態(tài)駕駛方法,所述方法包括下述步驟:以虛擬車輛模擬受控車輛在相鄰車道的行駛,同時(shí)獲取虛擬車輛、受控車輛當(dāng)前時(shí)間的行駛狀態(tài);基于獲取的虛擬車輛、受控車輛的行駛狀態(tài),采用滾動(dòng)預(yù)測(cè)的方法,利用訓(xùn)練好的actor網(wǎng)絡(luò)在預(yù)設(shè)變化范圍內(nèi)預(yù)測(cè)未來一段時(shí)間t內(nèi)虛擬車輛、受控車輛的加速度,通過車輛動(dòng)力學(xué)模型,獲取對(duì)應(yīng)的每個(gè)時(shí)刻的狀態(tài);基于預(yù)測(cè)的每個(gè)時(shí)刻的狀態(tài)和加速度,利用同步訓(xùn)練好的critic網(wǎng)絡(luò)計(jì)算虛擬車輛、受控車輛在時(shí)間段t內(nèi)每個(gè)時(shí)刻的即時(shí)獎(jiǎng)勵(lì),進(jìn)而累積t個(gè)時(shí)刻的即時(shí)獎(jiǎng)勵(lì)獲取虛擬車輛、受控車輛的總價(jià)值;按基于虛擬車輛、受控車輛的總價(jià)值而預(yù)設(shè)的換道時(shí)機(jī)與換道路線的判斷準(zhǔn)則,執(zhí)行換道策略;其中,行駛狀態(tài)包括參考速度、當(dāng)前車輛的速度、當(dāng)前車輛的加速度、道路坡度,前車速度,前車加速度和前車距當(dāng)前車輛的距離,前方交通信號(hào)燈相位、當(dāng)前狀態(tài)剩余時(shí)間、當(dāng)前車輛距停止線的距離。
3、在上述技術(shù)方案的一種實(shí)施方式中,所述參考速度,通過基于智能駕駛員模型設(shè)計(jì)具有跟車場(chǎng)景和交叉口通行場(chǎng)景的速度引導(dǎo)算法獲取,具體為:在跟車場(chǎng)景下,車輛加速度計(jì)算方式:amax為受控車輛的最大加速度,為受控車輛的期望速度,s與δv分為前車與后車之間的距離和速度差,為期望跟車距離,s0為停車狀態(tài)最小間距,t與bcomf為保證車輛安全與舒適度的參數(shù);在交叉口場(chǎng)景下,當(dāng)前方為紅燈時(shí),計(jì)算受控車輛的最短停車距離,若大于停車需求行駛距離,車輛需要立即采取停車策略,反之,繼續(xù)采用跟車場(chǎng)景的行駛策略。
4、在上述技術(shù)方案的一種實(shí)施方式中,所述即時(shí)獎(jiǎng)勵(lì)包括安全性獎(jiǎng)勵(lì)、通行效率獎(jiǎng)勵(lì)、能耗優(yōu)化獎(jiǎng)勵(lì);安全獎(jiǎng)勵(lì)具體設(shè)計(jì)為:通行效率獎(jiǎng)勵(lì)具體設(shè)計(jì)為rtravel=vego-vlimit;能耗獎(jiǎng)勵(lì)具體設(shè)計(jì)為式中:vego為受控車輛車速,vref為參考速度,vlimit為道路限速,preq為根據(jù)車輛縱向動(dòng)力學(xué)計(jì)算得到的需求功率,n表示動(dòng)力傳遞過程中的總效率。
5、在上述技術(shù)方案的一種實(shí)施方式中,所述訓(xùn)練采用基于td3的強(qiáng)化學(xué)習(xí)算法。
6、在上述技術(shù)方案的一種實(shí)施方式中,所述基于虛擬車輛、受控車輛的總價(jià)值而預(yù)設(shè)的換道時(shí)機(jī)與換道路線的判斷準(zhǔn)則為:若虛擬車輛的總價(jià)值與受控車輛的總價(jià)值之比大于等于預(yù)設(shè)值,則建議由受控車輛的道路換道到虛擬車輛的所在道路;否則,不建議換道。
7、第二方面,本公開提出一種基于速度導(dǎo)向換道的生態(tài)駕駛系統(tǒng),所述系統(tǒng)包括下述模塊:行駛狀態(tài)獲取模塊,被配置以虛擬車輛模擬受控車輛在相鄰車道的行駛,同時(shí)獲取虛擬車輛、受控車輛當(dāng)前時(shí)間的行駛狀態(tài);加速度和狀態(tài)獲取模塊,被配置基于獲取的虛擬車輛、受控車輛的行駛狀態(tài),采用滾動(dòng)預(yù)測(cè)的方法,利用訓(xùn)練好的actor網(wǎng)絡(luò)在預(yù)設(shè)變化范圍內(nèi)預(yù)測(cè)未來一段時(shí)間t內(nèi)虛擬車輛、受控車輛的加速度,通過車輛動(dòng)力學(xué)模型,獲取對(duì)應(yīng)的每個(gè)時(shí)刻的狀態(tài);預(yù)測(cè)計(jì)算模塊,被配置基于預(yù)測(cè)的每個(gè)時(shí)刻的狀態(tài)和加速度,利用同步訓(xùn)練好的critic網(wǎng)絡(luò)計(jì)算虛擬車輛、受控車輛在時(shí)間段t內(nèi)每個(gè)時(shí)刻的即時(shí)獎(jiǎng)勵(lì),進(jìn)而累積t個(gè)時(shí)刻的即時(shí)獎(jiǎng)勵(lì)獲取虛擬車輛、受控車輛的總價(jià)值;換道決策模塊,被配置按基于虛擬車輛、受控車輛的總價(jià)值而預(yù)設(shè)的換道時(shí)機(jī)與換道路線的判斷準(zhǔn)則,執(zhí)行換道策略;其中,行駛狀態(tài)包括參考速度、當(dāng)前車輛的速度、當(dāng)前車輛的加速度、道路坡度,前車速度,前車加速度和前車距當(dāng)前車輛的距離,前方交通信號(hào)燈相位、當(dāng)前狀態(tài)剩余時(shí)間、當(dāng)前車輛距停止線的距離。
8、本發(fā)明對(duì)比現(xiàn)有技術(shù)有如下的有益效果:通過集成跟車策略與交叉口通行策略的速度引導(dǎo)算法,提供行駛加速度參考值,從而加速智能體收斂進(jìn)程;在速度引導(dǎo)算法的指導(dǎo)下,指導(dǎo)策略的更新,車輛由當(dāng)前道路向高價(jià)值道路換道行駛時(shí),有效解決了復(fù)雜交通環(huán)境中自動(dòng)駕駛車輛的節(jié)能優(yōu)化和通行效率問題,實(shí)現(xiàn)了安全、平穩(wěn)、高效的行駛體驗(yàn)。
1.一種基于速度導(dǎo)向換道的生態(tài)駕駛方法,其特征在于,所述方法包括下述步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述參考速度,通過基于智能駕駛員模型設(shè)計(jì)具有跟車場(chǎng)景和交叉口通行場(chǎng)景的速度引導(dǎo)算法獲取,具體為:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述即時(shí)獎(jiǎng)勵(lì)包括安全性獎(jiǎng)勵(lì)、通行效率獎(jiǎng)勵(lì)、能耗優(yōu)化獎(jiǎng)勵(lì);
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓(xùn)練采用基于td3的強(qiáng)化學(xué)習(xí)算法。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于虛擬車輛、受控車輛的總價(jià)值而預(yù)設(shè)的換道時(shí)機(jī)與換道路線的判斷準(zhǔn)則為:
6.一種基于速度導(dǎo)向換道的生態(tài)駕駛系統(tǒng),其特征在于,所述系統(tǒng)包括下述模塊:
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述參考速度,通過基于智能駕駛員模型設(shè)計(jì)具有跟車場(chǎng)景和交叉口通行場(chǎng)景的速度引導(dǎo)算法獲取,具體為:
8.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述即時(shí)獎(jiǎng)勵(lì)包括安全性獎(jiǎng)勵(lì)、通行效率獎(jiǎng)勵(lì)、能耗優(yōu)化獎(jiǎng)勵(lì);
9.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述訓(xùn)練采用基于td3的強(qiáng)化學(xué)習(xí)算法。
10.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述基于虛擬車輛、受控車輛的總價(jià)值而預(yù)設(shè)的換道時(shí)機(jī)與換道路線的判斷準(zhǔn)則為: