所有的网页搜索结果都是AI生成的?那也许正是李彦宏想看到的。

2024-04-22

四月十六日上午,李彦宏在百度AI开发者大会上重点介绍了三款产品——


AgentBuilder、AppBuilder、ModelBuilder。


虽然这次会议被称为开发者会议,这三种产品似乎都是针对开发者的,但事实上,李彦宏在整个会议上都在大力宣传一个观点:


任何一个普通人都可以在AI工具的帮助下成为开发者。


这句话其实有两层含义。首先,由于“编程”技能的熟练成本较高,大多数普通人被拦在门外,大量创造性的想法被困在现实中,难以实现,自然阻止了许多应用的出现。


AI工具的出现使得自然语言编程成为可能,大大降低了应用的开发成本。


第二,同样是因为开发人员数量少,网络上的大部分信息都以散点状的形式出现在用户面前。


举个简单的例子,硅基君打算去上海玩一周,现在需要做策略,但是搜索航班、餐厅、景点、酒店需要反复搜索、查看、记录。


但是如果有一个AI专门做游戏策略和行程安排的话。 Agent,这个过程不是简单多了吗?


再举个例子,如果我们直接用网页搜索“上海游玩策略”,旅行社或者携程美团等产品页面出现的概率很大,用户想要更详细的信息还是要反复搜索查看,效率极低。


但是,如果出现一个类似文心的对话窗口,无论是了解上海的所有信息,还是在一个窗口完成旅游预订服务,显然都会更加方便。


为什么这些旅行社不做这样的页面?同样是因为开发成本太高。


现在百度想要解决的就是这样一个问题:


每个人都可以低成本地开发自己的应用程序。


在百度推出的三款产品中,硅基君尝试过,AgentBuilder、AppBuilder、ModelBuilder,发现真的很方便。


01 AgentBuilder


第一个是AgentBuilder,李彦宏说: 智能体可能是未来大家最近最主流的大模型使用方法。基于强大的基础模型,智能体可以批量生成,应用于各种场景。 ”。


目前所谓的智能体,更像是AI助手。


进入百度文心智能体平台,可以看到各种类型的现成智能体。硅基君简单翻了一下,常见的应用场景基本都被覆盖了。


根据李彦宏的说法: (在百度平台上)建立了3万多个智能体,5万多名开发商和数万家企业入驻。 ”。


工作智能体包括“Canva设计助手”、“TreeMind树图”、“AI搜索助手”等;生活学习中也有很多心智体,比如“熊猫天天AI故事”、“读书专家”等等,让用户的生活更加方便。


事实上,它非常接近OpenAI的GPT store。


但毕竟定向推广,如果客户有自己的特殊需求,百度文心智能体也提供了非常简单的生产方法,客户可以用自然语言(说实话)建立智能体。


具体看一下怎么操作。


五一快到了,硅基君想出去旅游,但是呆了20多年,对旅游一无所知,文心智能体可以帮忙。


点击左侧的“建立智能体”,有代码能力的用户可以选择低代码模式,但大多数情况下,用户可以通过使用“零代码”来满足需求。


接下来,硅基君将智能体命名为五一旅游助手,并简要描述了它的设定:你是一名旅游专家,对中国各地的名胜和文化风光都很珍贵。而且你可以随时查询当地景点的门票费用。


随后进入文心智能体建立的主页,主要由基础设备、高级配置、浏览调优三部分组成。


事实上,到了这个阶段,文心智能体已经建立得差不多了。,因为智能体的核心功能“指令”(prompts)“部分,文心一言已根据您的设置进行扩展。


硅基君简单地看了一下,这个指令写得比一般没有受过训练的人要好。


对于高级设置,用户可以添加一些“代码生成器”、“画一幅画”等工具,使其具有很强的智能体能。


和指令一样,文心智能体验根据你的设置推荐相关工具。比如推荐硅基君的五一旅游助手,可以配备“酒店查询”、“景区推荐”、“景区门票”等。


最后,在实战阶段,可以问“故宫的开放时间”这样的细节。即使是“如何出国旅行只有5000元”这样棘手的问题,文心智能也有板有眼的回答。它还提供了许多链接材料,为用户提供了更多的内容。



在这里还没有结束。硅基君希望自己的智能身体更加个性化。因此,李白的照片被上传为五一旅游助手的数字形象。为了丰富智能身体的数据,硅基君还上传了一些上海旅游的信息,让五一旅游的智能助手首先成为上海本地通行证。


简单评价一下,虽然智能机构不是百度独家的,但OpenAI也推出了GPTs。但是百度的文心智能机构真的很方便。百度可以一键生成智能机构的核心功能指令,并根据用户需求提供相关工具。


在极端情况下,顾客给智能体起名字,写一句话设置,点两下鼠标,一个可用的智能体就诞生了。


02 AppBuilder


接下来,我们来看看百度AppBuilder。该产品可以大大降低AI原生应用开发的门槛。开发者可以使用自然语言开发AI原生应用程序,而不需要编写一行代码。


有多方便,用李彦宏的话说: 最早只需三个步骤,开发者就可以使用自然语言开发AI原生应用程序。 ”。


第三步,是不是太夸张了?


与AgentBuilder相比,AppBuilder在许多地方都有相似之处,但是最大的特点是可以使用更多的专业部件。,比如语音识别,手写文字识别,还支持快递查询、热门短视频等第三方api接口。


比如硅基君想做一个拍照解题的应用,硅基君可能需要编程,调用百度飞桨的paddleocr库等。,然后在识别后在网上搜索。AppBuilder集合了文本识别和网络搜索功能。


“我想做,硅基君告诉百度AppBuilder,” 一个可以拍题解答的应用程序。在思考了AppBuilder之后,做了一个应用框架。


下一步,硅基君配备了所需的模型和部件。AI自动推荐的关键部件“手写识别”和“通用文字识别”,不需要客户一一搜索。在模型方面,百度ERNIE3.5或4.0可以主要使用,不同的模型能力、前后文字的长度和价格是不同的。


应用程序就这样完成了!?


硅基君随机百度了一个问题,为AppBuilder做了一个问题。



对于纯文 字题,AI识别完整,答案正确,还普及了等差数列。做几何题的时候,AI对图形识别不是很好,但是根据描述给出了建议。可以理解,毕竟只使用文字识别部件,图像识别不到是正常的。


如果你有api界面,你也可以把它应用到百度的AI中。比如李彦宏展示了AI如何引用大学界面,让学生更容易查询课表和饭卡余额。


虽然现在有各种各样的图书馆可以方便地实现许多功能,但仍然需要编程基础。AppBuilder汇集了百度的各种部件,解决了这个问题。百度飞浆有很多功能,希望到时候能一起加入。


03 ModelBuilder


最终是百度发布的ModelBuilder,一个更适合专业开发者使用的工具。


众所周知,对于现在的AI来说,背后的大模型是最重要的。但是从零开始训练一个成本太高,微调技术难度大,更别说对于像硅基君这样的新手来说,在huggingface上找模型需要一些时间。


ModelBuilder正在解决这个问题。ModelBuilder提供了四个场景:“大模型直接调用”、“大模型调优训练”、“Prompt工程”和“插件应用”。


ModelBuilder提供了77种模型供用户在模型直接调用模式下选择。除了百度自己的大模型,市场上几乎都有流行的开源大模型,比如Mistral-7B、Llama2-7B、Gemma-7B等。


进入模型详情页,用户可以看到模型基准分数、技术亮点等。详细写了哪些模型更适合问答,哪些模型更适合角色扮演。


ModelBuilder还为模型微调、Prompt工程提供了详细的流程。


用李彦宏的话说:“ ModelBuilder可以根据开发者的需要定制任何尺寸模型,并根据细分场景进一步调整模型,从而达到更好的效果。 ”。


举例来说,李彦宏展示了一个经过调整的模型,如何很好地批改作文,为学生提供建议。


步骤一:建立数据。模型调整的效果很大程度上取决于我们的数据质量。 ModelBuilder提供了数据清洁、数据标记和数据增强的工作流程。


步骤二,数据收集完成后,在ModelBuilder上选择基本模型进行微调,微调参数配置平台会提供建议,可以算是AI训练AI?


开发者可以在Prompts工程中学习百度精选的Prompts。硅基君使用了ModelBuilder的五子棋Prompts,并与百度大模型一起玩了一场酣畅淋漓的五子棋。


虽然与AgentBuilder相比、AppBuilder,ModelBuilder很难上手,但是它可视化的页面,清晰的流程,确实比纯代码页面方便很多。


李彦宏曾宣布:“ 只要你会说话,你就能成为一个开发者,用你的创造力改变你的命运。 ”。


用过三款产品后,硅基君觉得这一天不远了。


本文来自微信公众号“新硅NewGeek”(ID:XinguiNewgeek),作者:董道力,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com