您的位置:首頁 > 資訊 > 行業(yè)動(dòng)態(tài) > 正文

人類引導(dǎo)的人工智能框架有望在新環(huán)境中實(shí)現(xiàn)更快的機(jī)器人學(xué)習(xí)

2023-08-07 08:57 性質(zhì):原創(chuàng) 作者:南山 來源:AGV
免責(zé)聲明:中叉網(wǎng)(m.qcxy.net.cn)尊重合法版權(quán),反對(duì)侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn),與本網(wǎng)無關(guān)。如有需要?jiǎng)h除,敬請(qǐng)來電商榷?。?/div>
在智能家居時(shí)代即將來臨的未來,購買家務(wù)機(jī)器人可能會(huì)成為常態(tài)。然而,當(dāng)這些自動(dòng)助手無法執(zhí)行看似簡單的任務(wù)時(shí),消費(fèi)者可能會(huì)感到挫敗。此時(shí),美國麻省理工學(xué)院電氣工程和計(jì)算機(jī)科學(xué)系的研究員 A...

在智能家居時(shí)代即將來臨的未來,購買家務(wù)機(jī)器人可能會(huì)成為常態(tài)。然而,當(dāng)這些自動(dòng)助手無法執(zhí)行看似簡單的任務(wù)時(shí),消費(fèi)者可能會(huì)感到挫敗。此時(shí),美國麻省理工學(xué)院電氣工程和計(jì)算機(jī)科學(xué)系的研究員 Andi Peng 及其團(tuán)隊(duì)的研究就顯得尤為重要,他們正在研發(fā)一個(gè)新的方法來改善機(jī)器人的學(xué)習(xí)能力。

Peng女士和她的研究團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了一個(gè)人機(jī)交互框架,該系統(tǒng)的核心特性是能夠生成反事實(shí)敘述,準(zhǔn)確指出機(jī)器人要成功執(zhí)行任務(wù)所需的改變。比如,當(dāng)機(jī)器人無法識(shí)別一只特殊顏色的杯子時(shí),該系統(tǒng)會(huì)為機(jī)器人提供可能的替代情景,也許,如果杯子是更常見的顏色,機(jī)器人就能成功識(shí)別。這些反事實(shí)解釋與人類反饋相結(jié)合,簡化了為機(jī)器人微調(diào)生成新數(shù)據(jù)的過程。

Peng女士闡釋道:“微調(diào)是優(yōu)化已經(jīng)熟練掌握一項(xiàng)任務(wù)的現(xiàn)有機(jī)器學(xué)習(xí)模型的過程,使其能夠執(zhí)行另一項(xiàng)類似的任務(wù)?!?/p>

該系統(tǒng)的測(cè)試效果令人印象深刻,使用此方法訓(xùn)練的機(jī)器人表現(xiàn)出了快速的學(xué)習(xí)能力,同時(shí)也減少了人類教師的投入時(shí)間。如果能在更廣泛的領(lǐng)域成功實(shí)施,這種創(chuàng)新的框架可能幫助機(jī)器人更快地適應(yīng)新環(huán)境,最大程度地減少用戶對(duì)高級(jí)技術(shù)的需求。這項(xiàng)技術(shù)可能會(huì)成為推動(dòng)通用機(jī)器人更好地幫助老年人或殘疾人的關(guān)鍵。

Peng女士表示:“最終目標(biāo)是使機(jī)器人能夠在一個(gè)類似于人類的抽象層面上進(jìn)行學(xué)習(xí)和發(fā)揮作用?!?/p>

機(jī)器人學(xué)習(xí)的一個(gè)主要難點(diǎn)是所謂的“分布轉(zhuǎn)移”,指的是機(jī)器人遇到在訓(xùn)練過程中未見過的物體或空間的情況。為了解決這個(gè)問題,研究人員引入了一種名為“模仿學(xué)習(xí)”的方法。然而,這種方法仍有其局限性。

Peng女士說:“想象一下,我們必須用 30,000 個(gè)杯子進(jìn)行示范,機(jī)器人才能夠拿起任何一只杯子。相比之下,我更希望只用一個(gè)杯子進(jìn)行示范,然后教機(jī)器人如何拿起任何顏色的杯子?!?/p>

因此,他們的系統(tǒng)將識(shí)別哪些對(duì)象屬性對(duì)完成任務(wù)至關(guān)重要(比如杯子的形狀),哪些屬性則不是(比如杯子的顏色)。有了這些信息,該系統(tǒng)將生成合成數(shù)據(jù),改變“非必要”的視覺元素,以優(yōu)化機(jī)器人的學(xué)習(xí)過程。

為了評(píng)估這一框架的效果,研究人員進(jìn)行了一項(xiàng)涉及人類用戶的測(cè)試,以確定系統(tǒng)的反事實(shí)解釋是否增強(qiáng)了他們對(duì)機(jī)器人任務(wù)表現(xiàn)的理解。

Peng女士說:“我們發(fā)現(xiàn),人類天生就擅長這種形式的反事實(shí)推理。正是這種反事實(shí)元素使我們能夠?qū)⑷祟惖耐评砟芰o縫地轉(zhuǎn)化為機(jī)器人邏輯。”

在多次模擬中,機(jī)器人通過他們的方法學(xué)習(xí)得更快,表現(xiàn)優(yōu)于其他技術(shù),同時(shí)還減少了用戶示范的需求。

在未來,這個(gè)團(tuán)隊(duì)計(jì)劃在實(shí)際的機(jī)器人上實(shí)施這個(gè)框架,并致力于通過生成機(jī)器學(xué)習(xí)模型來縮短數(shù)據(jù)生成時(shí)間。這種突破性的方法可能改變機(jī)器人的學(xué)習(xí)軌跡,為機(jī)器人更好地融入我們?nèi)粘I钪械奈磥礓伷降缆贰?/p>

網(wǎng)友評(píng)論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機(jī)掃碼看新聞