Kimi在线浏览器插件,偷袭AI搜索?

07-15 09:25


作者|陶然 编辑|魏晓


Kimi大模型在上半年爆红,进行了一次小而美的更新。


以Kimi浏览器助手//微软Bing为主流浏览器的谷歌Chrome和微软Bing上线 Kimi Copilot 浏览器插件。



浏览器插件?这一年,通用大型军备竞赛,算不上一条热门跑道。


而且,仅仅看介绍文案,Kimi的插件似乎只是一个功能的扩展,AI搜索,总结网页和摘要功能,横向比较2024年神仙打架的很多模式,甚至不是新功能。


然而,在过去的几天里,官方插件从月亮的暗面提供,迅速进入了Bing浏览器的受欢迎程度(但这种受欢迎程度实际上是智能推荐,不同用户的受欢迎程度可能不一样),并且在圈内非常受欢迎。


一群网友对讨论区的评价如下:


什么是浏览助手?Kimi做了什么,让这个插件如此神奇?


传统工人的工作搭子


来了?


大部分浏览器插件都是网页中使用的一些小功能,蓝媒君只有几个浏览器插件,基本上就是广告拦截、视频调整和PDF编辑。


但是Kimi做的这个插件,有点特别。


特别好用-浏览器插件包括三个功能,即文本划线提问、文本摘要总结、设置Kimi长驻网页侧栏。


当Bing/Chrome浏览器被添加和扩展后,一个圆形的Kimi图标会出现在网页(默认页面右下方,可以自由拖动)中,这表明插件已经被启用。




此时,在网页中,当鼠标移动到高亮部分时,Kimi小图标会弹出。点击图标,Kimi插件会自动调用大模型的AI能力,帮助您解释这部分文字。



此外,还可以自动浏览前后文本,帮助用户总结一大段文本的主要内容。



不过有点遗憾的是,目前版本的Kimi浏览器助手似乎没有及时更新数据库,也没有能力像AI搜索应用一样在全网搜索信息,更像是大模型加持的百科全书。


Kimi插件不知道。


GPT-4o已经发布了


第2个功能“文本摘要总结”,就是Kimi擅长文本处理,做了一点扩展。


点击右下角的Kimi图标,对话框会弹出在网页中:输入框可以提出用户的需求,以及“总结全文”功能的预设按钮。



将万字访谈录直接扔给Kimi测试:不需要选择任何内容,直接从页面点击总结全文。Kimi很快在短时间内生成了一个500字的总结,简要描述了访谈内容,然后分点整理了几个主要话题。


阅读长文本这一功能说起来并不新鲜,国内许多大模型的本体,其实已经卷入了几十万甚至上百万字符的水平。


但是Kimi的插件安排在网页上之后,难免会遇到很多无效的影响信息,比如信息类的侧面列表,或者其他同类型文章的推荐链接,都是以文字的形式同时出现在页面上,因为内容很可能是相似的,因为算法。


这就要求大模型自动识别和划分页面上的文本类型,哪些是连贯的文章内容,哪些是与文章本身无关的其他文本内容。


无论是通过网页布局还是文字前后关系,总之Kimi在识别文章主体方面找不到问题,对文章内容的概括能力依然在线。


与前两个项目不同,第三个功能“Kimi侧栏长驻”有一个相对具体的应用场景——Kimi提供了另一个调用Kimi的方案,这样大型模型就可以长驻网页的侧栏,从而节省了来回切换网页的时间。



点击右下角的Kimi图标,大模型将自动出现在屏幕右侧,然后将插件界面从全局浮窗转换为侧栏。用户可以直接问Kimi网页中的内容,也可以要求Kimi搜索其他地方的信息。




当然,因为这部分功能调用的是Kimi大模型本身(与网页版的Kimi和手机APP互通),优点是可以在手机和网页上同步搜索内容,但在高峰期无法避免计算率墙。



“好用”是一种能力


Kimi这次更新浏览器插件只能算是一个“小更新”,对比很多通用大模型的版本迭代,或者隔一段时间发布新功能。


并没有像之前在哔哩哔哩等平台上投流那样大肆宣传和推广。好像只是月亮暗面的开发者做了一个常用的工具,开放给客户体验没有bug。


但是这个小插件,确实带来了一些变化,至少可以改变:


改变一些用户使用大模型的习惯和流程。


经过三个功能的体验,虽然有时候提供的内容比较有限,算率墙的问题似乎短时间内无法解决,但插件Kimi给蓝媒君带来的直观感受是非常方便易用。


以前在PC端,如果在阅读过程中需要用大模型搜索某个问题,流程一般会选择要检查的内容,复制粘贴或者编辑问题,打开大模型官网粘贴,然后复制内容到某个文档查看,或者在网页之间来回切换。


这是可以的,和现在这种直接在网页内部调用小窗口Kimi的方式有很大区别,但是有区别的是使用方便,是客户体验。


这个问题,很直观。


安装插件后,无需转换网页来回检查,直接从小窗户查看信息,输入侧栏中需要大模型回答的问题,效率的提高大大提高了感觉。


在蓝媒君看来,这个插件的推出带来的变化绝不是已经很流行的Kimi,还有一个额外的入口。相反,它准确地解决了工人们的烦恼,他们还没有完全转向大模型处理数据,浏览器仍然经常使用。



使这些农民工能够更加流畅、方便地调用大模型能力,对厂家而言,就是让商品更接近目标客户。


Apple今年在苹果WWDC上线。 Intelligence,智能化写作、AI邮件、文本总结等功能,实际上都是安卓阵营早就做出来的功能,


但是苹果AI的讨论度还是很高的,反响还是不错的。一方面,苹果与OpenAI的合作确实领先于技术实力;另一方面,从形式上可以看出,苹果真的把AI能力放在了日常用户的使用习惯之间,而不是增加一个新的APP,增加一个新的设备,让用户有更多的程序。


Apple 在客户打字、回复邮件或阅读的过程中,Intelligence的写作工具可以主动调用AI能力进行协助,相当于一个方便的AI工具可以在屏幕旁边垂直获得,不需要四处看看怎么用,合适不合适。这种logo长驻带来的存在感也是一种营销。


使能力强的应用“易于使用”本身就是一种能力。但是在这方面,Kimi大型浏览器插件显然可以获得高分。


本文来自微信公众号“AI蓝媒汇”(ID:作者:陶然,36氪经授权发布,lanmeih001)。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com