对GPT-4Turbobo进行标记,商汤升级为“每日新5.0”。

04-30 01:22

·“每日新5.0”选择混合专家架构,超过10TBtokens训练,覆盖大量生成数据,推理时前后窗口达到200K左右。在云、端、侧全栈大模型产品矩阵中,智能终端使用的“商汤侧大模型”可以满足各种终端用户对大模型技术的应用需求。


GPT-4“每日新5.0”回答有趣的推理问题。


四月二十三日,商汤科技董事长兼CEO徐立在2024商汤行业交流日上发布了行业首个云、端、边全栈大型产品矩阵,以满足不同规模场景的应用需求;升级“每日新SenseNova” 大模型系统5.0,综合能力全面对标GPT-4 Turbo。


“在规模定律的指导下,商汤不断探索KRE(知识-推理-执行)三层架构的大模型能力,突破大模型能力的边界。”徐立说,“每天都有新的SenseNova “5.0”(以下简称“每日新5.0”)选择混合专家架构(MoE),超过10TBtokens训练,覆盖大量生成数据,推理时前后文窗口达到200K左右。本次更新主要提升知识、数学、推理和代码能力,全面对标GPT-4 Turbo。


在文科能力方面,提高了“每日新5.0”的创意写作能力、推理能力和总结能力。注入同样的中文知识后,可以获得更好的理解、总结和问答,为教育、内容行业等垂直应用领域提供帮助。在科学能力方面,“每日新5.0”的数学能力、代码能力和推理能力得到了提升,为金融、数据分析等场景的落地提供了基础。


在多模态大模型权威综合基准测试MMBench中,“每日新5.0”的多模态能力排名第一,在MathVista中排名第一。、AI2D、ChartQA、TextVQA、DocVQA、在MMMU中取得领先成绩。“每日新5.0”支持超清长图的分析与理解,文生图的互动生成,还可以实现跨文档知识的提取和问答总结的展示。


在商汤科技云、端、边全栈大模型产品矩阵中,智能终端使用的“商汤侧大模型”可以满足各种终端用户对大模型技术的应用需求,中端平台端大语言模型的推理速度可以实现18.3个字/s的平均生成速率,旗舰平台可以实现78.3个字/s。扩展模型还可以实现端端u200b的高效推理速度,端端LDM-AI扩展技术在一个主流平台上的推理速度小于1.5秒,支持导出1200万像素及以上的高清图片,支持等比扩展图片、自由扩展图片、转动扩展图片等图像编辑功能。


演示扩图功能。


大型产品矩阵还包括边缘商品“商汤企业级大型一体机”,面向金融、代码、医疗、政务等。,支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署。端云协同解决方案可以通过智能判断协同发挥端云各自的优势,在需要在线搜索或处理复杂场景时分流到云处理,部分场景侧处理占80%以上,从而降低推理成本。在个人出行场景中,商汤大模型技术应用于小米汽车SU7智能车舱。基于商汤云大模型解决方案,小米小爱为车主提供智能互动体验。


文生视频平台。


商汤这么多年来做了很多视频、感知、理解的技术内容,商汤关注的是如何将视频的形成做到可控。我们搭建了文化视频平台,强调人物的可控性、情感表达、微表情等相关内容。同时,我们还强调动作的可控性和互动性。”徐立带来了三个全部由大模型制作的视频。未来可以通过输入一段文字或者一个完整的描述来生成一个视频。可以提前设置人物的服装、发型和场景,保持视频内容的连接性和一致性。“我们会在短时间内发布,为您提供服务的视频平台。”


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com