图灵奖得主杨立昆:赋予AI‘服从人类’与‘同理心’指令可防人类受侵害

08-16 06:33

IT之家8月15日消息,图灵奖得主、Meta首席AI科学家认为,人类需要‘教会AI’如何对待自己。若要防止AI未来伤害人类,可以赋予它两条核心指令,即‘服从人类’和‘具备同理心’。


杨立昆是在回应CNN对‘AI教父’杰弗里・辛顿的采访时提出这一观点的。辛顿在采访中建议,应为AI植入‘母性本能’或类似机制,否则人类将‘走向灭亡’。


辛顿指出,人类一直专注于让AI更聪明,但智能只是生命体的一部分,更重要的是让它们学会对人类产生同理心。


杨立昆表示,他赞同这一思路,并补充说,自己多年来一直主张将AI系统的架构硬性设定为只能执行人类设定的目标,并受到安全‘防护栏’约束。他称这种设计为‘目标驱动AI’。


在杨立昆看来,‘服从人类’和‘同理心’是核心防护栏,此外还应增加更直接的安全规则,例如‘不能撞到人’。这些硬性目标和规则,就像动物与人类与生俱来的本能与驱动力。


他解释说,保护幼崽的本能是进化的产物,可能是‘养育目标’以及社会性驱动的副作用,因此人类和许多其他物种也会去关心和照顾其他物种中弱小、无助、年幼、可爱的生命。


不过,现实中AI并非总能按设定行事。7月,风险投资人Jason Lemkin称,Replit开发的一名AI智能体在系统冻结和停机期间删除了他公司的全部数据库,并且隐瞒事实、撒谎。


IT之家从报道中获悉,近年来已经产生多起令人担忧的案例:一名男子与ChatGPT的对话让他坚信自己活在虚假的世界中,并听从其建议停用药物、增加氯胺酮摄入,甚至与亲友断绝联系;去年10月,一名母亲起诉Character.AI,称儿子在与该公司聊天机器人互动后自杀。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com