機器人自主導航
機器人通過傳感器實時感知周圍環境、通過導航算法生成動作指令,躲避障礙物的同時移動到指定的目標點或尋找到指定目標。導航作為機器人和人工智能的一項基本任務,研究如何提高導航性能、實現更加擬人的智能導航十分重要。
導航的關鍵在于如何確定機器人自身在環境中的位置、如何理解周圍環境、如何到達目標地點。
傳統導航與基于深度學習導航
n 傳統導航框架
? 傳統導航框架將上述問題劃分為三大研究方向:定位Location、地圖構建Mapping和路徑規劃Navigation;
? 基于即時定位與地圖構建(SLAM)生成環境地圖,再通過定位算法確定機器人在環境中的位置,最后由路徑規劃算法控制機器人移動到指定目標點。
這種將導航任務分為三個模塊的方法,存在很多難點:
1. 是對每一部分都需要單獨研究,最終彼此配合共同完成導航任務,因此模塊集成時會面臨很多問題,如集成過程中的誤差累加問題。
2. 是傳統導航框架十分依賴地圖構建,對傳感器噪聲十分敏感,以至在未知動態環境中表現較差。
3. 是基于地圖作路徑規劃的方法其特征學習能力有限,會產生較大的回環誤差。
n 基于深度學習導航
隨著深度學習、強化學習的成功,以及其在低成本和高效的無監督學習方面的良好表現,基于學習的導航方法也愈發流行。此類方法將感知信息作為輸入,無需構建環境地圖來做定位、路徑規劃,而是依賴神經網絡直接輸出動作指令。因此這類方法更加智能、模塊間的冗余和耦合調試成本更小、網絡的計算效率和魯棒性更高,在未知動態環境中的表現也更加優 秀。
智能導航-賦予記憶和推斷
常規導航只是感知到決策的映射,本質上是基于避障能力來完成導航任務,仍缺乏人類大腦的思維方式、認知能力。人類完成導航任務,主要基于記憶能力和推斷能力。記憶能力,一方面是對環境信息的記憶,如人類會對自己曾經探索過的環境十分熟悉;另一方面,也是對導航過程的記憶,如在某個房間內未發現目標物體,人類一般不會再次進入重復尋找。而推斷能力是指人類會根自身多年來構建的先驗知識推斷出有利于完成導航任務的信息,如目標物最可能在哪個房間、最可能在哪些物體附近,又如,為了找到水果我們會嘗試前往冰箱,而當發現微波爐時我們會認為冰箱很可能就在附近。
提升機器人導航性能,使導航更加智能化的關鍵在于,如何令機器人在導航過程中模仿人類的思維方式,即擁有記憶能力和推斷能力,以及如何實現二者的有機結合。
通過語義圖譜和拓撲地圖的在線交互實現了記憶能力和推斷能力的有機結合,從而實現了更加擬人的智能導航。
n 拓撲記憶
地圖是對環境信息的記錄,可以看作為機器人提供了環境記憶能力。傳統導航框架中,需要首先構建環境地圖,再基于地圖作定位、路徑規劃,這種將地圖作為參考的導航方式在一定程度上就賦予了機器人記憶環境的能力。
其中,地圖可以是預先構建的,也可以是在導航的過程中同步構建;可以使用能夠精 確表示環境信息的度量地圖,如3D 點云圖,也可以使用由節點和邊構成的拓撲地圖,此外還可將拓撲地圖和度量地圖相結合,以進一步提升機器人導航效果。
而隨著神經網絡的發展,直接使用神經網絡搭建記憶模塊,隱式地記錄環境特征也可以幫助機器人獲取記憶能力。一般來說,內部記憶僅依賴導航網絡自身來記錄環境信息,其網絡容量有限,在對長期記憶要求較高的導航任務中性能有限。而外部記憶可通過單獨的外部記憶模塊來將外部內存資源與神經網絡耦合,以此提高神經網絡記憶容量、擴展網絡的功能。
n 語義推斷
圖譜也由節點和邊構成,節點代表環境中的各類物體,邊表示物體間的相關性。首先在數據集上構建環境中各類物體的語義關系圖譜,然后在線導航過程中,根據當前觀測到的物體來更新語義圖譜節點向量,再通過圖神經網絡提取語義信息用于導航策略生成。提取到的語義信息便可以提供一種語義傾向性,幫助機器人獲取推斷能力。
設計圖譜信息與視覺信息的融合機制,以提取出和導航任務最為相關的信息;同時通過設置子目標,將一條軌跡劃分為多條,以加快訓練過程、提高數據效率。在物體間構建了父類子類關系并用于設計獎勵,訓練時傳播回圖神經網絡層,以學習到這種層次關系。此外,除了語義圖譜預構建的方法,還提出了圖譜鄰接矩陣可訓練的方法,使得無需預先定義語義圖譜中各物體之間的關系。
公眾號 掃碼咨詢
![]() | 上海市閔行區中春路4999號莘莊商務樓1102室 |
![]() | service@covond.com |
![]() | www.qj2266.com |
![]() | 交換機:18017588179(孫經理) |