
在東京一棟外觀(guan)低調的(de)辦公(gong)建筑里面(mian),住(zhu)著一個(ge)(ge)(ge)異常聰(cong)明(ming)的(de)由日(ri)本Fanuc公(gong)司造(zao)出來的(de)工業機器(qi)人(ren)。給機器(qi)人(ren)一個(ge)(ge)(ge)任務,比(bi)如從(cong)一個(ge)(ge)(ge)盒子里拾取(qu)小工具然后(hou)放(fang)入(ru)另一個(ge)(ge)(ge)容器(qi)里,機器(qi)人(ren)將用整個(ge)(ge)(ge)晚上想出如何完(wan)成任務。到(dao)了(le)清晨,機器(qi)居然掌握了(le)這(zhe)項工作,就好像是一位專家為它設定了(le)程序一樣。
在(zai)十二月份,Fanuc在(zai)東京國(guo)際(ji)展覽會上展示了一臺(tai)經(jing)強(qiang)化學習訓(xun)練的機器人。
可以(yi)有(you)極好的(de)精確(que)度(du)(du)和速度(du)(du),但是(shi)它們(men)通(tong)常(chang)需要人(ren)非常(chang)謹慎的(de)編寫程(cheng)序(xu),從而做一(yi)些像抓(zhua)取物品這(zhe)樣(yang)的(de)事。這(zhe)是(shi)很困難(nan)且耗費時間的(de),意味著(zhu)這(zhe)樣(yang)的(de)機器人(ren)往往只能在高度(du)(du)控制的(de)環境(jing)中工作。
Fanuc的(de)(de)(de)機(ji)器(qi)人(ren)使用了一(yi)種名為(wei)深(shen)度(du)強(qiang)化學習的(de)(de)(de)技術,來訓(xun)練它自己,可隨時(shi)學習新的(de)(de)(de)任(ren)務。它在(zai)嘗試拾起物(wu)品的(de)(de)(de)同時(shi),能(neng)夠抓取這個過程(cheng)的(de)(de)(de)錄像。不管每(mei)次它是成功了還是失(shi)敗(bai)了,它都會記住物(wu)品長什么(me)樣的(de)(de)(de),用它學到的(de)(de)(de)知識(shi)改進控制它行動的(de)(de)(de)深(shen)度(du)學習模型或大型神經網(wang)絡。在(zai)過去幾年,深(shen)度(du)學習被證明(ming)是模式識(shi)別領(ling)域中的(de)(de)(de)一(yi)條強(qiang)有力的(de)(de)(de)途徑(jing)。
「大約八個小時后,它就達到了百(bai)分之九十或更(geng)高(gao)的(de)準(zhun)確度,也就是像一位(wei)專家(jia)為它編寫程序那樣差不多的(de)準(zhun)確度,」 Preferred Networks的(de)首席研究(jiu)官(guan)Shohei Hido說。這家(jia)公司位(wei)于東京,專攻機器學習。「它整晚都在(zai)工作(zuo);到了第二天早晨,它調整好(hao)了。」
機(ji)器(qi)人研究員正在測(ce)試強(qiang)化(hua)學習,將它作為一種簡化(hua)和加(jia)快工(gong)廠機(ji)器(qi)人編寫程序的手(shou)段。這個(ge)月早期,Google發布了自己研究使用(yong)強(qiang)化(hua)學習教機(ji)器(qi)人如何抓緊物品的細節信息。
Fanuc機(ji)器人是由(you)Preferred Networks編寫(xie)程序。Fanuc這家世界最(zui)大(da)的工(gong)業機(ji)器人生產商,去年(nian)八月對Preferred Networks投資了(le)730萬美元(yuan)。 這家兩家公(gong)司(si)去年(nian)12月在東京的國際機(ji)器人展覽會上展示了(le)這個學習型機(ji)器人。
Hido說,這種學(xue)習(xi)方式潛在的(de)(de)一(yi)個巨大好處是(shi),如(ru)果幾(ji)個機(ji)器人并(bing)行工作(zuo)然后(hou)分享他們(men)學(xue)到的(de)(de),就可以(yi)促進學(xue)習(xi)。所以(yi),八(ba)個機(ji)器人一(yi)起工作(zuo)一(yi)小時可以(yi)執行與一(yi)臺機(ji)器工作(zuo)八(ba)小時時相(xiang)同的(de)(de)學(xue)習(xi)任(ren)務。「我(wo)們(men)的(de)(de)計劃(hua)是(shi)面(mian)向分散(san)式學(xue)習(xi)的(de)(de),」Hido說,「你可以(yi)想(xiang)象成百(bai)上千個機(ji)器人分享信息。」
這種分散式學習的形式,有(you)時(shi)叫做「云機器人」,正在(zai)成為(wei)科研界(jie)和產業(ye)界(jie)的大趨(qu)勢。
「Fanuc完全可以想到(dao)這一點」 Ken Goldberg說,他是加州大學伯克利(li)分校的(de)(de)研究機器人(ren)的(de)(de)教授(shou),因為它在全世(shi)界的(de)(de)工廠里設置了如此多的(de)(de)機器。他補充到(dao),云機器人(ren)將最有可能重(zhong)塑機器人(ren)在接下來幾(ji)年被(bei)應用的(de)(de)方式(shi)。
Goldberg和同(tong)事(包括幾位Google的研(yan)究員)事實上正在(zai)將(jiang)這一步(bu)推向更(geng)遠,他們教機器(qi)(qi)人(ren)如何使用特定(ding)的動作進行抓(zhua)取,并非對特定(ding)物(wu)品的抓(zhua)取,而是特定(ding)形狀的物(wu)品都能抓(zhua)起。一篇(pian)關于這項工作的論文將(jiang)在(zai)五月份出現在(zai) IEEE 機器(qi)(qi)人(ren)和自動化國(guo)際會議上。
然而,Goldberg特(te)別提到,將機器(qi)學(xue)習(xi)(xi)應用于機器(qi)人(ren)是充(chong)滿挑戰的(de)(de),因為(wei)控制行為(wei)遠比辨認圖片中的(de)(de)物(wu)體復雜得多。「深(shen)度學(xue)習(xi)(xi)在(zai)(zai)模(mo)(mo)式識別上取得了巨大的(de)(de)進步(bu),」Goldberg說(shuo),「在(zai)(zai)機器(qi)人(ren)領域,你(ni)面臨的(de)(de)挑戰是你(ni)要(yao)做(zuo)的(de)(de)不(bu)只(zhi)是模(mo)(mo)式識別。機器(qi)人(ren)要(yao)能夠針(zhen)對大量的(de)(de)不(bu)同輸入產生合適的(de)(de)行為(wei)。」
Fanuc可能不是唯一一家使用機(ji)器學習開發(fa)機(ji)器人(ren)(ren)的(de)公司(si)。在2014年(nian),瑞士的(de)機(ji)器人(ren)(ren)制(zhi)造商ABB投(tou)資(zi)了另一家叫做Vicarious的(de)人(ren)(ren)工智(zhi)能創業公司(si)。不過,那筆投(tou)資(zi)的(de)成果還沒有顯現。更多(duo)最新(xin)數據分(fen)析、市場分(fen)析報告、市場調研、行業分(fen)析,請訪問。
煤炭行業20項專利項目榮獲第
廣東廣州釋放約12.5億填埋場版權聲明