人工智能限制與否:‘堂吉訶德’系統(tǒng)通過(guò)講故事來(lái)教機(jī)器人價(jià)值觀
發(fā)布時(shí)間:2016-02-19 責(zé)任編輯:susan
【導(dǎo)讀】機(jī)器人是否存在不道德的行為或者是選擇傷害人類呢?人工智能(AI)的快速發(fā)展使我們?cè)桨l(fā)擔(dān)憂。“堂吉訶德”系統(tǒng)通過(guò)訓(xùn)練機(jī)器人閱讀故事的方法來(lái)教導(dǎo)它們“價(jià)值校準(zhǔn)”,讓機(jī)器人讀故事來(lái)學(xué)習(xí)事件可以接受的后果,并理解要在人類社會(huì)中獲得成功應(yīng)當(dāng)怎樣表現(xiàn)。
一些人呼吁禁止機(jī)器人技術(shù)的研究;其他人則呼吁更多地研究理解怎樣對(duì)人工智能進(jìn)行限制。 但是如果沒(méi)有成為人類的“用戶說(shuō)明書(shū)”,機(jī)器人又怎樣來(lái)學(xué)習(xí)倫理行為呢?
美國(guó)佐治亞理工學(xué)院、交互計(jì)算分院的研究人員Mark Riedl 和 Brent Harrison 認(rèn)為,答案在于“堂吉訶德”系統(tǒng)— — 在亞利桑那州鳳凰城(2016 年2 月 12-17日)的AAAI(美國(guó)人工智能學(xué)會(huì))第16次會(huì)議上公布。“堂吉訶德”系統(tǒng)通過(guò)訓(xùn)練機(jī)器人閱讀故事的方法來(lái)教導(dǎo)它們“價(jià)值校準(zhǔn)”,讓機(jī)器人讀故事來(lái)學(xué)習(xí)事件可以接受的后果,并理解要在人類社會(huì)中獲得成功應(yīng)當(dāng)怎樣表現(xiàn)。
“不同文化背景里的故事集,用寓言、小說(shuō)和其他文學(xué)形式的正確和不正確行為示例,來(lái)教導(dǎo)孩子做出社會(huì)認(rèn)可的舉止行為。” Riedl說(shuō),他是副教授和娛樂(lè)智能實(shí)驗(yàn)室主任。“我們認(rèn)為機(jī)器人對(duì)故事的理解可以讓它們減少精神病患者出現(xiàn)的行為,并且強(qiáng)化它們“不要傷人”的選擇,同時(shí)達(dá)到期望的任務(wù)目標(biāo)。
配圖說(shuō)明:研究學(xué)者 Mark Riedl 和 Brent Harrison 的“堂吉訶德”系統(tǒng)教導(dǎo)機(jī)器人在與人互動(dòng)時(shí)候表現(xiàn)為正派角色,并且這是把倫理價(jià)值觀系統(tǒng)構(gòu)建進(jìn)入到新型人工智能的巨大努力的一部分。
“堂吉訶德”系統(tǒng)是一種通過(guò)對(duì)社交中恰當(dāng)行為給予獎(jiǎng)勵(lì),使得人工智能的目標(biāo)與人類價(jià)值觀一致的一種校準(zhǔn)方法。它是建立在Riedl教授之前的一個(gè)研究——“天方夜譚”系統(tǒng),的基礎(chǔ)上的。“天方夜譚”系統(tǒng)展示了人工智能如何通過(guò)在互聯(lián)網(wǎng)上面的眾包模式故事情節(jié),來(lái)匯集得出正確的行動(dòng)后果。
“天方夜譚”系統(tǒng)可以學(xué)習(xí)什么是正常的或者正確的情節(jié)圖譜。然后它把數(shù)據(jù)結(jié)構(gòu)傳遞給“堂吉訶德”,“堂吉訶德”再將其轉(zhuǎn)換成“獎(jiǎng)勵(lì)信號(hào)”——在反復(fù)試錯(cuò)學(xué)習(xí)過(guò)程中強(qiáng)化特定的行為并且懲罰其他的行為。大體上,“堂吉訶德”可以學(xué)習(xí)到,當(dāng)它表現(xiàn)為故事里面的正派角色而不是任性而為或是表現(xiàn)為反派角色的時(shí)候,它將會(huì)獲得獎(jiǎng)勵(lì)。
例如,某個(gè)機(jī)器人的任務(wù)是盡可能快地為某個(gè)人拿到一個(gè)藥方,機(jī)器人可以:a)搶劫藥房,奪取藥物,并跑走; b) 與藥劑師有禮貌地進(jìn)行交互,或 c) 排隊(duì)等候。如果沒(méi)有“價(jià)值校準(zhǔn)”和積極強(qiáng)化機(jī)制,這個(gè)機(jī)器人可能會(huì)認(rèn)為搶劫是最快和最便宜的方式,來(lái)完成其任務(wù)。通過(guò)“堂吉訶德”系統(tǒng)的“價(jià)值校準(zhǔn)”,這個(gè)機(jī)器人將因?yàn)槟托呐抨?duì)等候并且付費(fèi)買(mǎi)藥方而獲得獎(jiǎng)勵(lì)。
Riedl 和 Harrison 在他們的研究中證明了,在某個(gè)給定的情境中, 價(jià)值校準(zhǔn)獎(jiǎng)勵(lì)信號(hào)怎樣可以產(chǎn)生并展開(kāi)所有可能的步驟,引導(dǎo)機(jī)器人進(jìn)入一個(gè)情節(jié)軌道樹(shù),然后這將被機(jī)器人用來(lái)形成“情節(jié)選擇”(類似我們很多人可能參與過(guò)的一種可以自由選擇后續(xù)情節(jié)發(fā)展的小說(shuō)),并且根據(jù)它的選擇,機(jī)器人將會(huì)受到獎(jiǎng)勵(lì)或者懲罰。
如果機(jī)器人有一個(gè)限定性的、并且需要它和人類交流才能達(dá)成的任務(wù)目標(biāo),那么“堂吉訶德”方法是最佳的,并且它是人工智能朝向普遍性道德推理能力的最原始、初級(jí)的一步。Riedl 如此說(shuō)。
“我們相信,人工智能必須植入特定的文化從而適應(yīng)特定社會(huì)環(huán)境的價(jià)值觀念,并且通過(guò)這樣做,它將努力避免不當(dāng)?shù)男袨榕e止,”他補(bǔ)充說(shuō),“賦予機(jī)器人閱讀并理解故事的能力,可能是在缺乏成為人類的用戶說(shuō)明書(shū)情況下,最好的權(quán)宜之計(jì)。”
特別推薦
- 協(xié)同創(chuàng)新,助汽車(chē)行業(yè)邁向電氣化、自動(dòng)化和互聯(lián)化的未來(lái)
- 功率器件熱設(shè)計(jì)基礎(chǔ)(八)——利用瞬態(tài)熱阻計(jì)算二極管浪涌電流
- 用于模擬傳感器的回路供電(兩線)發(fā)射器
- 應(yīng)用于體外除顫器中的電容器
- 將“微型FPGA”集成到8位MCU,是種什么樣的體驗(yàn)?
- 能源、清潔科技和可持續(xù)發(fā)展的未來(lái)
- 博瑞集信推出高增益、內(nèi)匹配、單電源供電 | S、C波段驅(qū)動(dòng)放大器系列
技術(shù)文章更多>>
- 模擬信號(hào)鏈的設(shè)計(jì)注意事項(xiàng)
- 熱烈祝賀 Andrew MENG 晉升為 ASEAN(東盟)市場(chǎng)經(jīng)理!
- 邁向更綠色的未來(lái):GaN技術(shù)的變革性影響
- 集成電阻分壓器如何提高電動(dòng)汽車(chē)的電池系統(tǒng)性能
- 帶硬件同步功能的以太網(wǎng) PHY 擴(kuò)大了汽車(chē)?yán)走_(dá)的覆蓋范圍
技術(shù)白皮書(shū)下載更多>>
- 車(chē)規(guī)與基于V2X的車(chē)輛協(xié)同主動(dòng)避撞技術(shù)展望
- 數(shù)字隔離助力新能源汽車(chē)安全隔離的新挑戰(zhàn)
- 汽車(chē)模塊拋負(fù)載的解決方案
- 車(chē)用連接器的安全創(chuàng)新應(yīng)用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門(mén)搜索
PLC
Premier Farnell
Recom
RF
RF/微波IC
RFID
rfid
RF連接器
RF模塊
RS
Rubycon
SATA連接器
SD連接器
SII
SIM卡連接器
SMT設(shè)備
SMU
SOC
SPANSION
SRAM
SSD
ST
ST-ERICSSON
Sunlord
SynQor
s端子線
Taiyo Yuden
TDK-EPC
TD-SCDMA功放
TD-SCDMA基帶