MIT硬核研究:AI讓你的麒麟臂操控?zé)o人機(jī)
in 行業(yè)動態(tài) by meng
[摘要]近日,麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究團(tuán)隊利用肌肉傳感器和運(yùn)動檢測算法,開發(fā)出一個“行為控制機(jī)器人”系統(tǒng),能通過肌肉收緊來遠(yuǎn)程遙控?zé)o人機(jī)。近日,麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究團(tuán)隊利用肌肉傳感器和運(yùn)動檢測算法,開發(fā)出一個“行為控制機(jī)器人”系統(tǒng),能通過肌肉收緊來遠(yuǎn)程遙控?zé)o人機(jī)。目前,搭載這個系統(tǒng)的無人機(jī)能夠?qū)?種手勢做出反應(yīng),反應(yīng)正確率達(dá)到81.6%。利用機(jī)器人完成工作可以解放人類的生產(chǎn)力。要達(dá)到這一目的,需要機(jī)器人和人之間達(dá)到較高的配合度。此前的研究從語音識別、自然語言處理、計算機(jī)視覺、觸覺、手勢等角度進(jìn)行了探索。結(jié)果顯示,語音、觸屏控制不夠靈敏,已有的傳感器系統(tǒng)也比較笨重。麻省理工學(xué)院的研究人員認(rèn)為讓機(jī)器人理解人類的非語言指令可以解決這些問題。據(jù)此,他們研發(fā)出一款端到端手勢控制系統(tǒng)。這個系統(tǒng)用肌電信號傳感器接收用戶手勢,用算法判斷指令內(nèi)容,不需要進(jìn)行繁瑣的數(shù)據(jù)訓(xùn)練或校準(zhǔn),配套傳感器的尺寸也比較小。這項(xiàng)研究已經(jīng)入選2020年人機(jī)交互國際會議(ACM/IEEE HRI),這是人機(jī)交互領(lǐng)域最重要的會議之一。論文發(fā)表在計算機(jī)學(xué)術(shù)網(wǎng)站ACM Digital Library上,論文題目為《使用肌肉和動作傳感器實(shí)現(xiàn)即插即用手勢控制(Plug-and-Play Gesture Control Using Muscle and Motion Sensors)》。論文鏈接:https://dl.acm.org/doi/10.1145/3319502.337482301用傳感器捕捉肌電信號,設(shè)備更輕巧肌電信號與人體的運(yùn)動意圖相關(guān)。根據(jù)之前的研究,肌電信號和相關(guān)肌肉動力學(xué)之間的建模可被用于提升外骨骼、假肢等輔助機(jī)器人的性能。本項(xiàng)研究中,研究人員嘗試?yán)眉‰娦盘杺鞲衅?也稱肌電圖傳感器,EMG),將人類手部運(yùn)動時的肌電信號傳輸給機(jī)器人。用表面肌電電極從參與者的右上臂提取肌電信號,在肱二頭肌短頭和肱三頭肌長頭上放置24mm預(yù)涂導(dǎo)電膠的Covidien電極。前臂上的裝置包括肌電圖電極和一個慣性測量設(shè)備(IMU,由一個加速度計和一個陀螺儀組成)。可穿戴式肌電信號傳感器會差異化增強(qiáng)收集到的每對肌電信號。數(shù)據(jù)收集系統(tǒng)以1KHz的頻率對肌電信號進(jìn)行采樣,并通過USB把它們傳輸?shù)娇梢暬抡婀ぞ逽imulink R2018b。▲傳感器捕捉肌電信號的過程論文指出,使用肌電信號傳感器有幾個好處:首先,降低了模型的復(fù)雜性。不需要照相機(jī)等動作捕捉設(shè)備,設(shè)備更輕巧;其次,排除了遮擋、環(huán)境噪音等因素的干擾;另外,肌肉信號能夠反映出肉眼觀測不到的運(yùn)動狀態(tài)(比如關(guān)節(jié)僵硬),有助于提升人機(jī)交互系統(tǒng)的靈活性。▲“行為控制機(jī)器人(Conduct-a-Bot)”系統(tǒng)02用算法理解手勢含義,實(shí)現(xiàn)即插即用根據(jù)論文,讓機(jī)器人理解手勢指令有兩個好處。首先,相比于連續(xù)運(yùn)動,手勢有助于增加系統(tǒng)的穩(wěn)健性;其次,這種設(shè)計可以減少需要的電極數(shù)目,降低了模型的復(fù)雜性,增加了可部署性。研究人員共設(shè)計了8種手勢,分別是:手臂僵直、轉(zhuǎn)動(分為順時針轉(zhuǎn)動和逆時針轉(zhuǎn)動)、握拳(分為左手、右手、向上、向下)、手腕彎曲和伸展。對于大多數(shù)手勢引起的肌電信號,研究人員使用自適應(yīng)在線聚類算法(Online clustering for adaptive thresholding)幫助機(jī)器人理解。最初,所有的觀察結(jié)果都儲存在未知緩沖區(qū)。幾秒鐘后,高斯混合模型(GMMs,Gaussian Mixture Models)會對數(shù)據(jù)流分類,并將其添加到相應(yīng)的滾動緩沖區(qū)中。相比于離線訓(xùn)練方法,自適應(yīng)在線聚類算法不儲存所有的歷史數(shù)據(jù),不需要大量的校準(zhǔn)、訓(xùn)練過程,可以做到即插即用。高斯混合模型(GMMs,Gaussian Mixture Models)會持續(xù)更新,聚類數(shù)據(jù)流并創(chuàng)建自適應(yīng)閾值。這樣,系統(tǒng)就可以適應(yīng)不同用戶的使用習(xí)慣。對于那些很難用自適應(yīng)閾值來描述的手勢(在上、下、左、右四個方向上的握拳動作),研究人員用一個神經(jīng)網(wǎng)絡(luò)來幫助系統(tǒng)理解。這個神經(jīng)網(wǎng)絡(luò)用過去收集的一些受試者數(shù)據(jù)進(jìn)行訓(xùn)練。通過這兩種方法,最終每個集群的訓(xùn)練池中都包含至少25%的手勢。使用固定的覆蓋率有助于保持原有的手勢分類。03測試1200次,分類器識別準(zhǔn)確率達(dá)97.6%在測試階段,研究人員按照這樣的順序給出指令:轉(zhuǎn)動,手臂僵直,向上、下、右握拳,向左握拳。分類器優(yōu)先按照最近0.2s內(nèi)檢測到的手勢做出反應(yīng),其次按照根據(jù)肌電信號預(yù)測到的運(yùn)動意圖做出反應(yīng)。研究人員安排6名參與者做出1200次命令手勢,以此評估分類器的性能和界面效率。根據(jù)統(tǒng)計結(jié)果,分類器對手勢動作的識別準(zhǔn)確率達(dá)到97.6%。▲分類器分類準(zhǔn)確率根據(jù)肌電信號預(yù)測運(yùn)動意圖方面,分類器對于向上握拳的預(yù)測準(zhǔn)確率最高,達(dá)到100%;對向左握拳的預(yù)測準(zhǔn)確率最低,為80%。▲分類器預(yù)測準(zhǔn)確率另外,研究人員把這個系統(tǒng)應(yīng)用于一個Parrot Bebop 2無人機(jī)。該無人機(jī)尺寸大約為35*43cm,重500g。在119分鐘的飛行時間中,測試人員隨機(jī)做出1535個命令手勢,無人機(jī)在81.6%的情況下做出了正確反應(yīng)。04結(jié)語:未來機(jī)器人或能識別更多手勢麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室的研究團(tuán)隊設(shè)計出的“行為控制機(jī)器人”系統(tǒng)有效提升了人機(jī)交互的效率。論文中寫道:“(我們)提出的方法在改善真實(shí)場景中的人機(jī)協(xié)作方面邁出了一步。這種協(xié)作越來越普及,會帶來更多效益。”研究人員表示將繼續(xù)研究,致力于使機(jī)器人理解更多手勢,并嘗試提升傳感器性能,捕捉到更精細(xì)的肌電活動。