Windows微软发布 Agent Arena 基准框架
IT 世家 9 月 15 科技媒体日新闻 NeoWin 昨日(9 月 14 日本)发布博文,报道称微软正式推出。 Windows Agent Arena 基准框架,用于评估生成式 AI Agents 在 Windows PC 上的性能。
Windows Agent Arena 标准框架
这个标准框架是微软表示的 AI Agents 使用主流 Windows 应用方面的优势和速度,包括 Microsoft Edge 和谷歌 Chrome 浏览器,Visual Studio Code 编程应用、记事本、时钟、绘图等预装应用 Windows 应用,VLC 等待主流媒体播放器。
IT 微软官方博文内容的世家翻译部分如下:
我们采用 OSWorld 构建跨越代表领域的框架 150 多项多元化 Windows 这些任务要求代理人具备计划、屏幕理解和工具使用的能力。
我们的基准测试也是可扩展的,可以在 Azure 上无缝并行,然后在短时间内 20 在几分钟内完成全面评估。
Navi
微软研究所还建立了自己的多模态。 Agents Navi,并在 Windows Agent Arena 在基准测试中进行了实验。
“你可以把我正在浏览的网页转换成我正在浏览的网页,然后根据特定的文本提醒任务, PDF 文件是否放在我的主屏幕上,就是那张桌面?”数据显示,Navi 平均通过率为 与人类相比,19.5% 74.5% 表现得分,这个分数还是很低的。
IT 这个家庭还附有一个参考地址
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com