在代爾夫特理工大學的“網(wǎng)絡動物園”中,無人機正在進行爭分奪秒的競賽,以測試為下一代太空任務設計的基于神經(jīng)網(wǎng)絡的人工智能控制系統(tǒng)的性能。
這項研究由歐空局先進概念團隊和代爾夫特理工大學微型飛行器實驗室MAVLab共同開展,詳情刊登在最新一期的《科學機器人》雜志上。
歐空局ACT科學協(xié)調(diào)員達里奧·伊佐指出:“通過長期合作,我們一直在研究使用可訓練神經(jīng)網(wǎng)絡來自主監(jiān)督各種高要求的航天器操作,例如行星際轉移、地面著陸和對接。”
“在太空中,必須盡可能高效地利用每一種機載資源——包括推進劑、可用能源、計算資源,通常還有時間。這種神經(jīng)網(wǎng)絡方法可以實現(xiàn)最佳機載操作,提高任務的自主性和穩(wěn)健性。但在規(guī)劃實際太空任務之前,我們需要一種方法在現(xiàn)實世界中對其進行測試。
“從那時起,我們就將無人機競賽作為理想的健身環(huán)境,以便在真實的機器人平臺上測試端到端的神經(jīng)結構,以增強對它們未來在太空中使用的信心。”
無人機一直在代爾夫特理工大學Cyber??Zoo的既定路線上展開角逐,爭奪最佳時間。Cyber??Zoo是一個10×10米的測試區(qū),由該大學航空航天工程學院維護,該學院是ESA在這項研究中的合作伙伴。由人類駕駛的“微型飛行器”四軸飛行器與采用各種方式訓練神經(jīng)網(wǎng)絡的自主飛行器交替進行。
“航天器操作的傳統(tǒng)方式是在地面上詳細規(guī)劃,然后上傳到航天器上執(zhí)行,”ACT青年畢業(yè)生實習生SebastienOriger解釋道。“本質上,當涉及到任務制導和控制時,制導部分發(fā)生在地面,而控制部分則由航天器承擔。”
然而,太空環(huán)境本質上是不可預測的,可能存在各種不可預見的因素和噪音,例如重力變化、大氣湍流或與地面模型形狀不同的行星體。
無論出于何種原因,只要航天器偏離了預定路徑,其控制系統(tǒng)就會將其恢復到設定的軌跡。但問題是,這種方法在資源方面可能非常昂貴,需要一整套強力校正。
Sebastien補充道:“我們的替代端到端制導與控制網(wǎng)絡(G&CNets)方法涉及航天器上的所有工作。航天器不再堅持單一的既定路線,而是從當前位置開始不斷重新規(guī)劃其最佳軌跡,事實證明這樣做效率更高。”
在計算機模擬中,由相互連接的神經(jīng)元組成的神經(jīng)網(wǎng)絡(模仿動物大腦的結構)在使用“行為克隆”進行訓練時表現(xiàn)良好,這種訓練基于長期接觸專家示例。但接下來的問題是如何在現(xiàn)實世界中建立對這種方法的信任。此時,研究人員轉向了無人機。
達里奧評論道:“盡管無人機飛行的速度更快、噪音更大,但無人機和航天器之間仍有相當多的協(xié)同作用。”
“在競賽中,最主要的稀缺資源顯然是時間,但我們可以利用時間替代太空任務可能必須優(yōu)先考慮的其他變量,例如推進劑質量。衛(wèi)星CPU非常受限,但我們的G&CNET卻出奇地小巧,可能最多可在內(nèi)存中存儲30,000個參數(shù),這僅需幾百千字節(jié)即可完成,總共涉及不到360個神經(jīng)元。”
為了達到最佳效果,G&CNet應該能夠直接向執(zhí)行器發(fā)送命令。對于航天器來說,這些是推進器,對于無人機來說,這些是螺旋槳。
“我們將G&CNets引入無人機所面臨的主要挑戰(zhàn)是模擬和現(xiàn)實中的執(zhí)行器之間的現(xiàn)實差距”,代爾夫特理工大學首席研究員ChristopheDeWagter表示。“我們通過在飛行過程中識別現(xiàn)實差距并教神經(jīng)網(wǎng)絡處理它來解決這個問題。例如,如果螺旋槳的推力小于預期,無人機可以通過其加速度計注意到這一點。然后神經(jīng)網(wǎng)絡將重新生成命令以遵循新的最佳路徑。”
“無人機競賽有整個學術界,一切都取決于贏得比賽,”塞巴斯蒂安說。“對于我們的G&CNets方法而言,使用無人機代表著一種在規(guī)劃實際太空任務演示之前建立信任、開發(fā)堅實的理論框架和建立安全界限的方法。”
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!