AI界本周(4.15-4.21)发生了什么?

04-28 11:41

文|赵炜嘉


编辑|邓咏仪


大佬言论


李彦宏:开源模型将越来越落后

四月十六日,百度创始人、董事长兼首席执行官李彦宏在Createate 在2024年百度AI开发者大会上,自然语言将逐步成为未来的通用编程语言,每个人都可以成为开发者,用自己的创造力改变自己的命运。李彦宏还指出,“以前大家都觉得开源便宜。事实上,在模型场景中,开源是最贵的。因此,开源模型会越来越落后。”


扎克伯格:Llamama80亿元 3还不够小,大模型需要提高训练质量。

4月18日,Llama 三是在著名主持人Dwarkesh正式发布后,扎克伯格。 在Patel的播客中,谈到Meta。 AI技术路线,未来规划,开源哲学。扎克伯格说:Llama 最小版本的80亿参数模型“不够小”,不能满足大量使用场景。他更喜欢将模型蒸馏到5亿和10亿,看看他能做什么。


李飞飞报告:中国大模型世界第二,但专利数量和机器人世界第一。

四月十五日,由中国女科学家、“人工智能教母”李飞飞联合领导的HAI研究所(Stanford HAI)最近发布了《2024》 年度人工智能指数报告。
报告指出,2023 年,61 一个著名的人工智能模型来自美国机构,超越了欧盟。 21 个和中国的 15 个。 然而,中国仍然是美国最大的竞争对手,中国的机器人安装量居世界第一。同样,世界上大多数人工智能专利(61%)来自中国。


此外,4月18日,李飞飞在拜登国情咨文演讲中呼吁拜登政府投资建设国家计算能力和数据库房。她指出,目前大量AI学术界的明星人才正在流失,大企业正在以高薪挖掘学术界的人才资源。研究大模型的高成本正在排除这一领域的研究人员,从而损害学术界的单独研究。


大事件


Meta 新一代开源模型 Llama 3

当地时间4月18日,Meta 公司宣布推出新一代大型语言模型Llamama最新开源。 3,包括 8B 和 70B 这两个参数规模。Llama 3在由24000个GPU组成的定制集群中,使用15万亿个token进行训练,前后长度达到8K,推理代码大大提高,代码和权重全开源。Llama 现在可以在网页版Meta 使用AI免登录。


Stable Diffusion 3 API发布

4月17日,Stability StableAI正式发布 Diffusion 3 API,在文字位置、提示词遵循层面等方面,新SD3大幅提升,超越DALLL。-E 和Midjourney3 V6等行业领先模式。SD3技术目前还没有完全开源,但是Stability 对普通用户来说,AI承诺SD3模型不收费。


Reka 与GPT-4相比,Core登场。、Claude 3

前DeepMind4月16日、Google 由Brain和FAIR成员组成的AI初创公司Reka推出了与GPT-4相匹配的多模式大模式Reka Core,具有理解图像、音频和视频的能力,支持GPT-4和Claude的32种语言。 3 Opus匹敌。然而,Reka并没有计划开源这个模型。


AI界前线


OpenAI是东京第一个亚洲服务办公室。

4月15日,OpenAI宣布在日本东京开设第一个亚洲服务办公室,承诺与政府、当地企业和研究机构合作,开发安全的AI工具,以满足当地需求。与此同时,OpenAI还宣布推出了一款GPT-4定制模型,专门为日本语言优化而设计。它在翻译和总结日语文本方面表现出色,性能和速度明显提高,成本更高效,速度提高到原来的三倍。


电动版Atlas机器人波士顿动力推出

当地时间4月17日,波士顿动力推出全电动版,原液压版Atlas人形机器人退役一天后, 机器人Atlas。
电动Atlas的动作自由度和灵活性远远超过人类。它继承了液压版的三指设计,选择了比前身更流线型的设计,机械框架更加灵活,类似于环形灯的头部,不暴露任何电缆。



英特尔推出了世界上最大的神经拟态系统,比人脑快200倍

美国芯片巨头英特尔当地时间4月17日(Intel)该公司宣布,它已建立了世界上最大的神经拟态系统Halalala Point,拥有11.5 1亿次神经元和1280亿次突触,最高速度可达人脑200倍。该系统最初部署在桑迪亚国家实验室,选择英特尔Loihi 2Cpu,旨在支持类脑AI未来的研究。


文心一言4.0工具版更新,还发了三个AI开发工具。

4 月 16 2024百度Create 在AI开发者大会上,百度正式宣布基础模型全面更新,并推出了包括智能体开发工具在内的4.0工具版。 AgentBuilder、AI 原生应用开发工具 为了对应不同的开发场景,AppBuilder和模型定制工具ModelBuilder。


贾佳亚团队Mini-Gemini全开源源

贾佳亚团队,香港中文大学终身教授,提出多模式模型Mini-Gemini,结合ChatGPT,提供2B到34B模型大小范围。 DALL·E 具有更高清晰度图像的准确理解,更高质量的训练数据,更强的图像分析推理能力,还可以结合图像推理和生成。目前,Mini-从代码、模型到数据,Gemini已经完全开源,在线Demo也已经发布。


联想正式宣布5款AI PC

四月十八日,联想TechWorld 2024年在上海开幕。联想发布了AI智能体“联想小天”嵌入个性化的AI。 PC系列产品。用户可以基于自然语言与“小天”互动,“小天”可以在互动中逐渐完善。在官方演示中,“小天”有能力通过自然语言找到照片、AI跨端生图等本土化的AI。


融资动态


创业公司芯片 Rivos 融资 2.5 亿美金

4月17日消息,RISC-Rivos宣布,V芯片创业公司正在宣布 A-3 在轮融资中筹集了超过 2.5 一亿美元,这笔资金将专门用于开发第一款针对生成式AI()和数据分析工作负荷的加速器产品。Matrix Capital是本轮最大的投资者管理人员,英特尔资本,联发科(MTK)、Cambium Capital、CIDC、Capital Hotung和TEN Venture Group和其他投资机构也积极参与此次融资。


在阿联酋AI公司,微软将投资15亿美元

4月16日,微软表示,将向总部位于阿联酋的人工智能公司G42投资15亿美元,让这家美国科技巨头在G42获得少数股权和董事会席位。G42将在微软的云计算平台Azure上运行,为世界公共行政用户和大型企业提供先进的人工智能解决方案。


新玩意


Rewind宣布改名为Limitless,推出可穿戴AI吊坠

四月十七日,Rewind改名为Limitless,推出了可穿戴的会议场景。 AI 吊坠具有提供实时笔记、会议转录和会议摘要的功能,预计8月份售价99美元。Limitless为用户配置了“同意方式”,以确保隐私保护和加密云服务的数据隐私,用户可以控制参数解密。


前沿研究


Meta可以实现无限前后文长度的新算法。

联合南加州大学的Meta,CMU、最近,UCSD的研究人员发表了一篇名为Megalodon的算法。它是一种新型的神经网络结构,能够有效地处理有无限前后长度的文本。Megalodon引进了多个创新部件,显著提高了模型能力、稳定性和训练性能,并且在多个基准测试中表现出了优于Llama2的性能。


VASA-11微软推出单图生数字人技术

四月十八日,微软发布了VASA-1技术,可以通过单个图片和音频生成逼真的数字视频。VASA-1使用面部动态统一编码和Diffusion Transformer技术可以实现精确的唇语同步和自然的表情动作,并且支持即时生成。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com