网易首页 > 网易科技 > 网易科技 > 正文

机器人会伤害你?科学家做了实验并回答了七个问题

0
分享至


本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯11月8日消息】艾萨克阿西莫夫著名的机器人三定律,对机器人和自动机器人设下行为准则以确保人类的安全,也是一个著名的虚构学说。这部法则首次出现在他1942年的短篇小说《跑位》中,并且也出现在《我,机器人》等经典作品中,在刚开始出现的时候看起来很不错:

1、机器人不得伤害人类,或因不作为而使人类受到伤害。

2、除非违背第一法则,机器人必须遵守人类的命令。

3、在不违背第一及第二法则下,机器人必须保护自己。

当然,应用在现实中的隐藏的冲突和漏洞比比皆是,在我们这个拥有着先进的机器学习软件和自动化机器人时代,定义和实施人工智能的一套完整可行的道德规范已经成为像机器智能研究所和OpenAI所重点考虑的问题。

Christoph Salge是纽约大学的一名计算机科学家,他采取了一种不同的方法。Salge和他的同事Daniel Polani并没有用自上而下的哲学理论来定义人工智能的行为,而是在研究一种自下而上的道路,或者是“机器人应该首先做什么”。正如他们在最近的论文中所写的那样,“给予权利是机器人三定律的替代品。”“授权”这个概念在一定程度上受到了控制论和心理学的启发,它描述了一个代理人的内在动机,即坚持并在其周围环境中工作。“就像有机体一样,它想要生存下去。它想去影响世界,”Salge解释道。在电池电量过低的情况下,Roomba会在它快没电时自动寻找充电站,这可能是一种非常基本的授权方式:它必须采取行动让自己没电不能续航时通过充电来维持自身的生存。

授权听起来像是一个导致像Nick Bostrom这样的安全智能思想家担心的结果:强大的自治系统只关心如何让自己的利益最大化并做出一些疯狂的行为。但是,研究人类机器社交互动的Salge想知道,如果一个被授权的人工智能“也观察到到另一个被授权的人工智能”,结果会是怎样。你不仅想让你的机器人保持运转,你还想保持对它能够与人类友好相处而进行控制。”

Salge和Polani意识到,信息理论提供了一种方法,将这种相互赋权转化为一种数学框架,即可以付诸行动的一个非哲学化的人工智能。Salge说:“机器人三定律的一个缺点是,它们是基于语言的,而语言有高度的模糊性。”“我们正在努力寻找一种可以实际操作的东西。”


Quanta与Salge讨论了信息理论、虚无主义人工智能和人类与机器人互动的犬类模型。下面是经过精简编辑的对话。

问:一些技术专家认为,人工智能是一个重大甚至当今存在的威胁。失控的人工智能会让你担心吗?

我对此不抱太好的看法。我的意思是我确实认为现在机器人和人工智能的影响力越来越大。但我认为,我们可能更应该关心的是这些人工智能将影响未来职位的更替、决策的制定,也可能会使民主的丧失,以及隐私的丧失。我不确定这种失控的人工智能有多大可能会让这些发生。即使是人工智能可以帮助我们控制医疗系统,或者得到一些治疗方案,但我们也应该开始关注由此产生的伦理问题。

问:赋权将如何帮助我们解决这些问题呢?

我认为,赋权确实是一种填补漏洞的的想法。它让一个人工智能帮助人类避免死亡,但一旦你满足了这个基本的底线,它仍然有一种持续的动力去创造更多的可能性,让人类更多地表现自己来对世界产生更大的影响。在Asimov的一本书中,我认为机器人最终将所有人类置于某种安全的容器中。这当然是我们所不愿意看到的。然而,让我们的能力增强并持续地影响世界似乎是一个更有趣的最终目标。

问:你在一个游戏环境中测试了你的虚拟人工智能。然后发生什么呢

一个被自己的力量所激励的人工智能会跳出炮弹的方向,或者避免落入一个洞中,或者避免任何可能导致其丧失机动性、死亡或被破坏的情况,从而减少其运作性。它只会不停地运行。

当它与一个人类棋手配对时,它被设计成能自我增强,我们观察到虚拟机器人会保持一定的距离来避免阻碍人类的行动。它不会阻碍你进入,它也不会站在你无法通过的门口。我们看到,这种效果基本上人类会让他的同伴形影不离,这样同伴才能就能帮到他。它导致了一些可以引领或跟随的行为。

例如,我们还创造了一个激光屏障的场景,对人类有害,但对机器人无害。如果这个游戏中的人类离激光更近,突然就会有越来越多的激励因素驱使机器人去阻挡激光。当人类站在它旁边时,它的动机就会变得更强,这意味着“我现在想穿过它”。这个机器人会挡住激光,站在它前面。

问:这些人工智能是否有出现任何意想不到的行为,就像Asimov小说中出现的三部法律一样?

我们最初设计的行为很好。例如,虚拟机器人会干掉那些想要杀死你的敌人。偶尔,如果这是唯一能拯救你的方法,它可能会跳到你面前为你挡子弹。但在一开始,有一件事让我们有点吃惊,那就是它也非常害怕你。

这与它的“本地正向”模式有关:基本上,它所判断的是,未来发生的两三个行为对人类或者它本身的世界的影响是怎样的。因此,作为简单的第一步,我们编写了这个模型,假设玩家会随机操作。但在实际操作中,这意味着机器人的行为实际上是基于在假定人是一种精神变态者的情况下,所以在任何时候,比如说,人类都可以决定向机器人开火。所以机器人总是非常小心地待在那些人类无法杀死它的位置上。

我们必须解决这个问题,所以我们建立了一个我们称之为信任的假设。基本来说,“同伴机器人”的行为是基于这样的假设:人类只会选择那些不会移除代理自身权力的行为——这可能是一个更自然的伴侣模式。

我们在比赛中注意到的另一件事是,如果你有10个生命值,你的同伴机器人并不关心你失去前八、九个生命值,甚至会在一段时间内认为射杀你只是一种诙谐的行为。在这个实验中我们再次意识到,我们生活的世界与电脑游戏中的模型之间存在着间隙。一旦我们用基于生命损失来生产出能力限制模型,这个问题就解决了。但它也可以通过设计本地正向模型来解决,这让它能够预知未来的一切条件,而不仅仅是几个步骤。如果这名机器人能够深入了解未来,就会发现拥有更多的生命值可能会对未来有所帮助。

机器人基本上会说,“哦,我不能开枪打死他,或者我可以开枪打死他这两者没有区别。”有时机器人甚至会射杀你。这种情况当然是个大问题。我不能宽恕随意开枪的玩家。我们增加了一个补丁,让虚拟机器人更关心你的授权,而不是它自己的。

问:如何让这些概念变得更精确?

如果你把机器人看作是控制系统,你可以从信息的角度来思考:世界上发生的任何事情,在某种程度上影响着你。我们不只是在谈论你所感知到的事物,而是任何一种影响——它可能是任何在周围世界和你之间来回流动的东西。可能是温度影响你,或者是营养进入你的身体。任何渗透到这个边界的世界和人工智能之间都携带着信息。同样,人工智能也能以多种方式影响外部世界,也能输出信息。

你可以把这种流动看作是信道容量,这也是信息理论中的一个概念。当你获得高度的授权能够采取不同的行动,这将导致不同的结果。如果这些能力中的任何一个变得更糟,那么你的授权就会降低——因为能力的丧失对应着你和环境之间的信道容量可量化的减少。这是核心理念。

问:这个人工智能需要赋予多大的权利去工作?

赋权有一个优势,即使你的知识还没有完善,它也可以被应用。人工智能的确需要一个模型来说明它的行为将如何影响世界,但它并不需要完全了解这个世界以及它的所有复杂之处。与一些试图将世界上的一切都尽可能完美了解的方法相比,你只需要弄清楚你的行为是如何影响你自己的看法的,那么你只需要弄清楚你的行为到底意味着什么。你不需要知道所有的东西都在哪里。但你可以有一个帮助你探索世界的人工智能。它会做一些事情,试图弄清楚某件事的行为是如何影响世界的。随着这种模式的发展,人工智能也会更好地了解它的授权程度。

问:当你已经在虚拟环境中测试过之后,为什么不在真实的世界里实施呢?

扩大这种模式的主要障碍,以及我们为什么不把它放在任何真正的机器人身上,是因为在像现实世界这样的富裕环境下,很难计算出一个人工智能和一个人类之间的信道容量。目前有很多项目在努力提高它们的效率。我保持乐观的态度,但目前这是一个计算问题。这就是为什么我们把这个框架应用到电脑游戏的同伴机器人上,这也是一种更加简单的形式来让这些计算问题更容易解决。

这听起来好像让我们的机器变得像强大的功能犬一样。

实际上,我认识一些机器人专家,他们有意让机器人模仿狗狗的行为。我的意思是,让机器人像我们的狗一样对待我们,这可能是一个我们都能接受的未来。

(选自:wired编译:网易见外编译机器人 审校:付曾)

关注网易智能公众号(smartman163),获取人工智能行业最新报告。

相关推荐
热点推荐
一家五口失联最新消息:女儿发声,人和车都没找到,已采血验DNA

一家五口失联最新消息:女儿发声,人和车都没找到,已采血验DNA

180°视角
2024-05-02 11:19:22
特斯拉腾空翻滚10多次!警方:避让行人操作不当,1人重伤3人轻伤

特斯拉腾空翻滚10多次!警方:避让行人操作不当,1人重伤3人轻伤

新民晚报
2024-05-02 09:44:14
正式确定!CBA顶级后卫签约上海,携手王哲林,冲击总冠军

正式确定!CBA顶级后卫签约上海,携手王哲林,冲击总冠军

保持热爱0263
2024-05-02 13:32:01
副国级乌云其木格突然去世,官方回应死因,疑似最后露面照流出

副国级乌云其木格突然去世,官方回应死因,疑似最后露面照流出

求实者
2024-05-01 19:46:59
他8年前因处置重大群体性事件不力被取消提拔正厅,如今被查

他8年前因处置重大群体性事件不力被取消提拔正厅,如今被查

巴蜀法眼
2024-05-02 12:40:24
TikTok 因绕过苹果 App Store 应用内购系统引起争议

TikTok 因绕过苹果 App Store 应用内购系统引起争议

IT之家
2024-05-01 10:51:14
1991年李瑞环在华西村发现华国锋的照片,村领导:我们农民讲感情

1991年李瑞环在华西村发现华国锋的照片,村领导:我们农民讲感情

旧时楼台月
2024-05-02 08:53:35
我国癌症高发,都是包子惹得祸?提醒:4种食物才是“含铝大户”

我国癌症高发,都是包子惹得祸?提醒:4种食物才是“含铝大户”

奇妙的本草
2024-04-29 19:00:06
堵了6小时!浙江姑娘无语:还要开7小时!网友:还是低估了…

堵了6小时!浙江姑娘无语:还要开7小时!网友:还是低估了…

FM93浙江交通之声
2024-05-01 21:49:02
女子提车问界M7才7天,智驾出问题:前方没车突然急刹、车身抖动

女子提车问界M7才7天,智驾出问题:前方没车突然急刹、车身抖动

财经三剑客
2024-04-24 13:03:36
广东两“70后”省委常委,进京履新

广东两“70后”省委常委,进京履新

极目新闻
2024-05-02 10:10:38
久违了!帕尔马重回顶级联赛,意甲七姐妹齐聚‍♀️

久违了!帕尔马重回顶级联赛,意甲七姐妹齐聚‍♀️

直播吧
2024-05-02 14:20:23
山东夫妻失联近一个月,最后一次定位显示在泰国,家人报警

山东夫妻失联近一个月,最后一次定位显示在泰国,家人报警

极目新闻
2024-05-02 09:03:29
拉裤里!张韶涵演唱会疑拉稀,前排闻到臭味,裙子上有黄色污渍

拉裤里!张韶涵演唱会疑拉稀,前排闻到臭味,裙子上有黄色污渍

八卦王者
2024-05-02 10:55:34
闹大了!上海一女子称三代都是税务局人,评论炸锅,官方回应来了

闹大了!上海一女子称三代都是税务局人,评论炸锅,官方回应来了

鹏飞深文
2024-05-01 14:42:24
江西又出“体制”炫富?

江西又出“体制”炫富?

林中木白
2024-05-01 13:30:02
女主播换衣服不慎漏出,惊呆了网友!

女主播换衣服不慎漏出,惊呆了网友!

我是宁言
2024-05-01 17:59:41
广东省委书记表态!救人!

广东省委书记表态!救人!

楚楚的留香
2024-05-02 12:59:48
后续!广东梅龙高速路塌方:总投资21亿,施工期间就多次塌方!

后续!广东梅龙高速路塌方:总投资21亿,施工期间就多次塌方!

古希腊掌管松饼的神
2024-05-01 11:55:39
“中国和世界逆行”

“中国和世界逆行”

求实处
2024-05-01 18:15:03
2024-05-02 16:22:44

科技要闻

4月交付量理想超问界,小米首月交付超七千

头条要闻

广东书记、省长面向塌方发生地三鞠躬 向遇难人员致哀

头条要闻

广东书记、省长面向塌方发生地三鞠躬 向遇难人员致哀

体育要闻

这场欧冠,多特的他诠释了什么叫"台柱子"

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

日元如此疯狂波动,背后谁在收割?

汽车要闻

预售2.89-3.49万 奔腾小马正式开启预售

态度原创

时尚
本地
健康
房产
公开课

为什么劝4、50岁女人少穿“瑜伽裤”?看完3组素人街拍,你就懂了

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

春天野菜不知不识莫乱吃

房产要闻

单价2万内,装标4200+,主城改善大盘无套路硬刚!

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版
×