世界AI大赛,美国的优势不仅仅是英伟达

2024-07-03

在全球人工智能市场竞争中,“主权人工智能”已成为一个日益重要的问题。


大多数关于这个话题的讨论都集中在以下几个关键问题上:


全世界都希望尽快成为亿美元的人工智能市场,让人工智能成为我国经济发展的关键引擎。


每个国家和地区都希望建立一个体现当地语言、政治和文化的本土人工智能系统


每个国家和地区都认为技术是应对当前世界政治紧张局势的正确选择。


这一“技术主权”的焦虑,主要来自于人们对技术落要面对的代价的深刻认识。


领先的美国科学技术带来的好处越来越明显。20 世纪 80 年代和 90 时至今日,美国科技巨头如微软、英特尔主宰。 PC 时代远超亚洲和欧洲的竞争对手。在接下来的几十年里,随着硅谷出现了一波又一波的国际企业,同样的循环出现在互联网搜索、社交媒体、电子商务、移动和云计算等领域。


2022 年 11 月 30 日本,美国企业 OpenAI 发布给大型语言模型(LLM)ChatGPT。接着,大众对 AI 关注技术的热情迅速被点燃。那时,ChatGPT 它已经成为历史上增长最快的消费软件应用程序,同时也在世界范围内掀起 AI 投资热潮。英国半导体公司 Arm 和 Amadeus Capital Partners 赫尔曼·豪泽的创始人 (Hermann Hauser) 他说:“我们很担心美国会再次遥遥领先。”在欧洲建立技术主权的必要性方面,豪泽写了很多文章。


怎样掌握人工智能主权?


全世界都在为AI做准备,面对美国再次领先。 “粮草”。根据IDC数据,2022年全球人工智能IT投资总额为1,324.9亿美元,预计2027年将增至5,124.2亿美元,复合增长率为31.1%。IDC预测,在生成型AI市场中,全球生成型AI市场的复合增长率可能达到85.7%。2027 年,45% 企业将掌握并使用生成式 AI 为了共同开发数字产品和服务,全球生成型AI市场规模接近1500亿美元。


作为 AI 载体、数据中心的建设正在如火如荼地进行。


投资日本政府 协助725亿日元 KDDI、软银和 Sakura 等待多家日本企业 AI 建立地方云数据中心的应用程序。印度政府宣布 12.5 亿美计划,名叫“亿美元计划”IndiaAI Mission”。通过这一计划,印度将在全国范围内为创业者、创业公司、学生和教育机构提供方便的计算能力。


这种竞争使得英伟达芯片供不应求。当地时间 6 月 18 日前,英伟达盘股上涨3.2%,推高该公司市值3.33亿美元,市值超过微软。Arm 似乎创始人的担忧正在实现。


英伟达商品在那里 AI 在美国的广泛应用已经成为美国 AI 产业发展的重要优势。即使世界正在进行 AI 投资,美国 AI 在非美国地区,投资总额仍然领先于投融资规模。



信息来源:PitchBook


当然,英伟达只是美国人工智能的一部分,尤其是大语言模型行业的一部分。基于英语数据库的模型训练,其他语言的用户可以进入 LLM 在市场上,面对自然堡垒。


在处理本地语言新词时,外国大型语言模型往往面临着理解的困难。以中文为例。虽然ChatGPT等模型可以识别包括中文在内的各种语言,但在处理非英语语言时,可能会受到语言结构和语法的挑战,因为它们的训练数据主要基于英语文本,从而影响其导出效果。最近,一篇论文指出,与直接使用非英语语言作为提示词相比,先将非英语语言翻译成英语,再进行输出处理效果更好。


另外,值得注意的是,汉语和英语在训练和推理上存在着显著的“不公平”。由于汉语语言的复杂性,AI 使用中文数据准确练习和推理模型可能会受到挑战,增加了使用和维护中文模型的难度。同时,对于开发大模型的公司来说,建立一个大的中文模型可能要承担更多的成本,因为它需要额外的资源。


具体而言,中文token的数量一般是英语的两倍多,这主要是由于中文词汇的丰富含义和灵活的语言构成。汉语词汇往往具有深厚的文化底蕴和丰富的情境意义,这大大增强了语言的歧义性和处理难度。相比之下,英语的语法结构相对简单,这在一定程度上促使英语比中文更容易理解和处理一些自然语言理解任务。而 毕竟使用token的数量就是成本, OpenAI 的 GPT-4 模型 API,每输入 1 千 token 至少要花费 0.03 美金。


根据上述观点,一些工程师指出,汉语和英语在模型训练的基本原理上没有本质区别。两者都将句子分解成独立的单词,然后将这些单词列入向量数据库,通过神经网络进行深入学习。事实上,OpenAI在初期也面临着效果不佳的困境,主要是因为信息量的不断积累和扩展,最终取得了显著的效果。


所以,不管是什么样的语言模型,其训练的核心原理都是一致的,训练难度不会因语言差异而发生显著变化。由于数据量巨大,美国在语言模型领域并没有表现出特殊的优势,其表现更为出色。相比之下,中国在语料多样性方面具有一定的优势。然而,由于中文处理过程中会涉及到更多的token,模型在运行过程中所需的内存和计算资源也会相应增加,从而增加成本。当前,国内通义千问在相关行业表现出色,这也得益于其大量的数据支持。


尽管信息量是最重要的因素,但全世界都在围绕自己的语言发展大语言模型。


非英语大模型的攻击


HyperClova X 另外一个重要的动机是追求更低的会计成本。使用 LLM 费用通常取决于他们需要处理的数据量,他们将这些信息分解成标记的单词或字符块。标记越多,成本就越高。


Naver,韩国互联网巨头,正在积极开发自己的大型语言模型。——HyperClova X,并且计划将其广泛应用于各种服务中。这种模式的引入有望深刻影响Naver在这个高度数字化的中国许多应用的运行和体验。Naver的业务范围很广,包括电子商务、搜索引擎、旅游服务等诸多领域。


为了确保HyperClovaa Naver特别成立了一支专业的安全专家队伍,其输出内容能充分契合韩国国内观众的文化背景。KangGNaver研究主管 Min Yoo指出,韩国社会具有丰富的新词文化,这些新词通常使外国大型语言模型难以捉摸。与此同时,与美国人民相比,韩国人民对政府调控房价等社会问题的态度更为支持。因此,HyperClova 在回应相关问题时,X能比非韩国模型更准确地体现这些社会价值观。


Kang Min Yoo说,在处理问题时,大型语言模型通常会根据语境和位置的不同得到不同的答案。这就是HyperClova X是R&D过程中需要重点考虑的问题之一。


当然,追求更低的会计成本也促进了HyperClova。 xR&D的重要动力之一。使用大型语言模型时,成本通常与需要处理的数据量成正比。数据量直接关系到模型需要处理的标记数量。因此,降低标记数量,降低会计成本,成为HyperClova 在R&D过程中,X是一项重要任务。


Naver 声称,它的模型与之相比 OpenAI 的 GPT-3 含有 6,500 韩语数据数量翻倍,可以将韩语查询分解成更少的标记,从而有效降低成本。根据西方大型语言模型 LLM 独立分析表明,处理非英语语言的查询通常需要比英语更多的标记。


类似的故事在印度上演。人工智能创业公司 Sarvam AI 维韦克·拉加万的创始人(Vivek Raghavan)正致力于打造印地语专用模型 OpenHathi,为了提高其在印地语环境中的运行效率。尽管印地语是世界上使用最广泛的语言之一,但拉加万指出,印地语在世界上应用最广泛。 Common Crawl 这个网络数据存储库中所占的数据比例仅为大约。 0.17%。而 Common Crawl 它是世界上许多最大的人工智能公司训练其模型的重要资源。


当地 AI 降低模型成本的有效性已经引起了知名投资者的高度关注。硅谷是著名的风险投资家 Vinod Khosla 透露,他通常不会投资于和与和。 OpenAI 与其它行业领导者直接竞争的企业,因为他认为新创企业很难在竞争中领先。但是,他却是这样 Sarvam AI 还有日本创业公司 Sakana AI 除了这两家公司的投资之外。谈到印度语言,Khosla 这表明,基于英语的人工智能系统在处理印度语言时的效率往往比专门为这些语言设计的模型低三到五倍。在印度,他强调降低成本尤为重要,每分钟使用模型的成本要达到最低。


欧洲的 AI 布局


在激烈的竞争中,欧洲公司值得关注。要知道,如果追溯到人工智能的历史,欧洲就是这项技术的发源地。英国加拿大人 法国出生的Hinton和 Yann LeCun,他们被称为“人工智能教父”。



AI在非美国地区 十大投资案例


根据上表显示的数据,欧洲在人工智能领域的投资总额明显领先于其他领域。另外,在过去的十年里,欧洲监管机构开始制定更严格、更严格的基本规则,旨在使科技巨头企业遵循其指导原则。包括德国和英国在内的欧盟及其成员国已经通过了2016年实施的《通用数据保护条例》等多项隐私法规,旨在严惩滥用客户个人数据的互联网企业。


最近,为了遏制科技领域的“守门人”,欧盟甚至出台了《数字市场法案》,通过不正当手段压制规模较小的竞争者。


越来越多的欧洲人工智能创业公司,并逐渐引起硅谷投资者的关注。OpenAI版法国版——Mistral,到目前为止,已经筹集了超过10亿美元的资金,包括本周早些时候公布的一轮融资,其估值据报道已经达到62亿美元。另外,法国人工智能公司H(原名Holistic)也曾在谷歌CEO埃里克·施密特和LVMHCEO伯纳德·阿诺等行业知名人物处筹集资金2.2亿美元。


然而,就像现代西方政治和经济的变化一样,美国再次“超越”了欧洲。也许和欧洲文化有关。与美国相比,欧洲的商业文化更注重谨慎,而不是单纯的成长,这在一定程度上可能会导致欧洲在突破性技术领域的成功案例减少。在欧洲,一直有很多优秀的大学和人才,但是,这些优秀的人才和学术资源在商业化方面并没有得到充分有效的利用。


在中国,不久前,商汤科技发布了第一款粤语大模型Sensechat。可以发现,LLM的竞争已经从硬件全面启动到软件。在这个AI中 在主权竞争中,美国正在从世界各地追逐。


本文来自微信公众号“半导体产业纵横”(ID:ICViews),作者:6000,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com