生成AI正在改变整个世界,聊天机器人只是儿科的一部分。
人工智能革命的影响不会仅限于聊天机器人。生成型人工智能技术正在以各种方式重塑我们的生活,从研究新的塑料食菌和创新的癌症治疗,到独立辅助机器人和无人驾驶汽车。相比之下,会说话的机器人似乎只是微不足道的一部分。

我们经常把现在的人工智能等同于一台可以写、可以交流、可以编程、可以拍照的电脑,但实际上,这些功能大多是基于一个名字。Transformer“基于底层技术。但是,这种基于注意力机制的神经网络结构的应用范围远不止于此。
Transformer在两年前为OpenAI推出ChatGPT奠定了基础。现在,许多企业都在积极探索如何以新颖的方式使用这种创新技术。例如,Waymo正在使用它来开发自动驾驶出租车,而EvolutionaryScale是一家生物学初创企业,它设计了一种全新的蛋白质分子。
01 从文本翻译到通用学习者。
现代人工智能一直擅长识别信息,但过去的局限性限制了它更多的潜力。以语言为例,过去的人工智能系统只能逐一处理单词,并根据单词出现的顺序进行预测,这大大削弱了他们理解单词深层含义的能力。
2017年,谷歌研究人员专注于开创性文章中的语言翻译。他们发现,如果人工智能系统能够一次性处理整篇文章,并结合上下文阅读,翻译质量将大大提高。
艾伦人工智能研究所非营利性机构人工智能研究科学家蒂姆·德特默斯(Tim Dettmers)解释说,Transformer的工作原理是探索每个输入信息和获取信息之间的相关性。

EvolutionaryScale设计了一种类似水母闪亮蛋白的蛋白质,其序列全部由人工智能创造,在大自然中是前所未有的。
基于Transformer的人工智能系统不仅可以识别模式,还可以预测未来,甚至创造新的信息,具有这种深度的前后文理解能力。这种能力不仅限于文字,也适用于其它数据。
亚历山大,EvolutionaryScale首席科学家,里夫斯。(Alexander Rives)表示:“这些模型在一定程度上揭示了数据的潜在结构。
EvolutionaryScale正在利用公开的蛋白质序列数据和相关知识来训练其人工智能。它的人工智能不需要人类工程师的干预,就会发现分子构建块之间的关系,从而创造出全新的蛋白质。
EvolutionaryScale已经设计了一个概念验证分子——一种类似于水母发光蛋白的蛋白质,但是它的序列都是人工智能创造的,大自然还没有发现。
公司的最终目的是帮助各种企业——从制药公司到合成化工公司——制造前所未有的物质,如携带能消化塑料新酶的细菌或针对个人特定癌症的新疗法。
02 从聊天机器人到真正的变形金刚
卡罗尔·豪斯曼(Karol Hausman)努力建立一个通用的人工智能系统,可以为随机机器人增加动力。他指出:“我们的目标是建立一个模型,它可以控制任何机器人执行各种任务。”
Physicalalal由豪斯曼创建 虽然Intelligence公司成立不到一年,但它们已经进化到可以处理图像,这是豪斯曼机器人技术的核心,从研究与ChatGPT同源的大型语言模型组合开始。
最近的演示中,Physical Intelligence的一对机器人手臂已经成功地完成了机器人领域最具挑战性的任务之一——叠衣服。由于服装形状多变,处理起来需要极高的灵活性和准确性,机器人专家很难提前编写动作序列,以引导机器人移动四肢抓取和折叠服装。
Physical Intelligence系统可以很容易地应对这个挑战,它可以把衣服从烘干机里拿出来,整齐地折叠起来,这一切都归功于一个不需要人类干预就可以自学的系统。这个系统只需要大量的数据作为输入,就可以实现目标。这次演示和其他类似演示的出色表现促使该公司在本月早些时候成功从包括杰夫·贝索斯在内。(Jeff Bezos)与OpenAI等投资者一起筹集了4亿美元的资金。

麻省理工学院的研究人员拍摄了一段用机械臂喂狗的视频,名叫Momo,并训练另一个人工智能机器人用这些视频执行同样的任务。
今年10月,麻省理工学院的研究人员宣布,他们正在探索一种基于Transformer的类似技术,旨在创建一个机器人大脑,它可以从各种来源获取大量数据,并在各种环境中灵活运行。例如,他们拍摄了许多视频,将狗粮倒入碗中喂食,并训练另一个人工智能机器人执行同样的任务。
03 机器人,你可以开我的车。
与机器人技术领域类似,研究自动驾驶汽车的研究人员和公司也在探索基于Transformer的“视觉语言模型”的应用。该模型不仅可以处理和关联语言信息,还可以处理和关联图像信息。Nuro总部位于加州、Waymo,伦敦的Wayve,以及谷歌母公司旗下的Waymo,都在积极选择这一模式。
这与以前在自动驾驶领域使用的方法有很大不同。过去的方法通常是结合人类编写的指令和旧的人工智能技术来处理传感器数据,然后识别路上的物体。基于Transformer模型的新型提供了一条捷径,使自动驾驶系统能够轻松获得过去难以获得的世界通用知识。
例如,在最新的一篇论文中,Waymo的研究人员展示了如何使用谷歌自己的商业人工智能系统Gemini来识别和应对那些从未接受过训练的物体,比如过马路的狗。

Wayve是许多利用新型人工智能技术帮助无人驾驶汽车应对突发情况的公司之一
04 真正的帮手并不能完全取代人类。
艾伦人工智能研究所的科学家蒂姆·德特默斯指出,虽然这些系统功能齐全,但仍然存在局限性和不可预测性,因此不能完全替代人类。
以EvolutionaryScale的人工智能为例,尽管它可以为人类在实验室中生成分子提供新的建议,但是人类仍然需要完成实际的合成和测试工作。同样,基于Transformer的驾驶模式也远远没有达到完全自动驾驶的可靠性。
此外,他们的智能水平受到他们接受的训练数据的限制。像OpenAI这样的大语言模型已经开始受到互联网上有用数据匮乏的限制。对于机器人或无人驾驶汽车来说,如果他们想以这种方式学习,他们需要大量关于他们在现实世界中运行时会遇到什么情况的数据,这也是目前各公司争相获取此类数据的原因之一。
这些限制在Physical Intelligence的机器人尤为明显。他们的系统已经学会了叠衣服,但是为了应用于不同的家庭,他们需要根据每个家庭的具体情况重新学习这个过程。这将消耗工程师大量的时间,同时训练模型也需要足够的资金支持。
对于这一点,该公司首席执行官豪斯曼表示:“我想明确一点,虽然我们为自己的成就感到骄傲,但是我们仍然处于起步阶段。
本文来源于“腾讯科技”,编译:金鹿,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




