心高命薄:印度AI的野心和困境

05-31 00:38

在目前的AI热潮中,除了中美巨头,还有一个来自东方的大国,试图在人工智能的竞争中抓住机遇——是的,它是我们神奇的邻居,印度!


据Kantar最新调查报告显示,印度目前已经有了7.24亿人已使用AI(不一定都是GPT这样的大模型)。


就官方而言,对于生成式 AI 这个行业,印度也很感兴趣。


去年八月,印度联邦内阁允许投资人工智能、网络安全和数字技能的发展。卢比(约130.7亿人民币)1490.3亿的计划。


在这样的刺激下,今年1月,印度终于诞生了自己的大型独角兽公司。——Krutrim。仅仅一个月后,该公司就以10亿美元的估值筹集了5000万美元。


但是,印度AI这个盛会,表面上锣鼓喧天,但是一打开锅盖,里面的“菜”就可以一言难尽了。


先说“选手”吧,印度在AI企业数量上,与中国相比,这种差距可不是一星半点。


在中国,不仅有百度、阿里、腾讯等巨头推出了文心、盘古这样的大模式,还有一堆短小精悍的团队,比如月亮的暗面、智谱AI。、百川智能和Minimax,也都做出了自研模式,可以拿出来。


而且印度呢,大模型相关的公司很少,自研模式更是凤毛麟角。


根据Tracxn和印度人工智能协会的数据,印度在模型领域的企业不到10家,这些公司主要忙于与人工智能协会进行对话。、智能化助手和某些特定行业的应用,基本不接触基本模型的研发。


目前印度唯一的自研模型Krutrim AI ,还充满了“咖喱味”。


不但被曝出有套壳ChatGPT的嫌疑,而且根据用户的经验报告,Krutrim 使用AI时,只允许输入。 424 字符(不含空格),而且有时候在交互的过程中也会突然懵逼,甚至忘记了自己是谁。


实际上,去年有人预测了印度AI的前景。


2023 年 6 月,Sam Altman 有人问印度,如果印度团队花费1000万美元建立一个大模型,能否与OpenAI竞争?Altman 回答:没有机会。


01 AIIT大国的IT也不好。


在IT圈里,这个著名的大国印度,竟然在AI方面如此拉胯,实在让人感到有些意外。


我们通常认为这个AI模型归根结底是一个高级程序,不比那些需要精密机械和复杂化工的产品更复杂。我们必须一步一步地爬上产业链的台阶。


理论上,只要你掌握了算法和数据,加上几个打代码的高手,理论上应该是游刃有余的。印度人在代码和编程方面是公认的能力。


且不说谷歌和微软的首席执行官皮查伊和纳德拉都是印度人,就连当时写威振AI界的文章也是如此。《Attention is All You Need》硅谷八子中的两人,也是印度人。


同样,Sora今年震惊了AI世界,其核心R&D人员包括一位来自印度的技术天才Aditya。 Ramesh。


Aditya Ramesh也参与了DALL的开发-E


甚至特斯拉的自动驾驶负责人Ashok Elluswamy,Ganeshh超级计算机Dojo前负责人 同样,Venkataramanan也来自印度。


按道理说,编程、软件方面的人才那么多,搞AI应该很有优势啊,那么为什么印度在模型上这么拉胯呢?


事实上,这种“低门槛”的技术,“只需要几个聪明人”和“只需要一个程序员就可以做好一切准备”,在一定程度上是产业上的一种错觉。


这种错觉就像:“在车辆方面非常强大的中国,应该很容易建立一个网络汽车平台”,但现实是他们就是做不到。比如德国和日本虽然是传统的汽车强国,但是你见过哪个牛气的网络汽车平台从他们身上冒出来?



在德国,Free 像Now这样的本土网约车APP,2023年的用户数量只是大约有350万个区域。


事实上,不管是网约车,还是大模型,都不像看上去那样,只要几个聪明的程序员鼓捣两下,就可以得到。


因为这背后涉及的项目表面上只是一堆程序和代码,但本质上与一个国家的基础研究、基础设施、市场人群和数字化程度有着千丝万缕的联系。


就网约车而言,基础研究方面,网约车涉及网约车。GPS、定位算法之类的东西;就基础设施而言,需要有覆盖面广的高速网络;在市场端,要有大量经常乘车出行、熟练上网的人来支撑。


同理,AI领域虽然没有某些行业那么复杂,但是仍然有自己的产业链。


分为上、中、下三游,每个环节背后都对应着科研、市场或数字化程度等不可或缺的因素。


具体来说,AI行业的上游是基础研究,如机器学习算法、神经网络结构等。,这需要大量的跨学科人才和基础理论人才;但可悲的是,今天的印度在人工智能领域被理论和科研的人才基础直接从顶层抽走。


02 引诱高订单


由于两个原因,印度缺乏AI基础研究人才:


1、IT外包带来的“毒蛋糕”效应;


2、国内拉胯基础设施。



首先,我们来谈谈第一点。


20世纪90年代,印度遭遇了严重的外汇困境,赤字占其GDP的8.5%左右。印度政府不得不进行一系列市场化改革,以打破这一局面。


改革中最重要的一点是鼓励私立教育机构的发展,尤其是那些致力于工程、管理、信息技术等应用学科的学院和大学。


这些以市场为导向的私立学校很快就瞄准了一条特别香的赛道。——IT外包。


这是因为,从成本和收益比来看,当时印度的基础设施和工业能力太差,资金非常匮乏。从事制造业是一个吃力不讨好的行业。


假如培养制造业的技术人才,毕业后就业率会很难看。


相比之下,IT外包不仅是一项轻资本的工作,也是一项盈利的最佳生意,因为印度人英语好,劳动力便宜。


所以,从20世纪90年代开始,各种以信息技术为主的应用类专业开始在印度大学野蛮成长。


而且这种情况,也造成了今天印度科研“重应用,轻理论”的局面。


例如,在2021年的一份报告中,约70%的印度工程与技术专业学生招收了总招生人数。


但是在基础研究方面,根据《自然指数》(Nature Index)数据,2022年,在自然科学方面,中国大约有20050个项目,美国有21473个项目,而印度只有1280个项目。


虽然印度后来意识到了这种模式的缺点,并想过改变,但印度放弃了“浪子回头”的想法有两个重要原因。


第一个原因,真的是美国人给的太多了。


由于美国计算机巨头在90年代开始全球扩张,印度的IT人才从大量的大外包订单中获得了高薪。


20世纪90年代中期,印度IT从业人员的平均年薪约为8000-12000美元,到2000年初,印度普通农村家庭的年收入仅为300-500美元,而印度IT从业人员的平均年薪约为8000-12000美元,而印度普通农村家庭的年收入仅为600-800美元。



另外一个重要原因是印度拉胯的工业、基础设施,使得很多基础科研相关工作缺乏必要的硬件。


03 捉急的基建


这里有一个反直觉的现象:AI领域的研究和实验,其实和其他基础研究一样,是一项非常重视硬件设施的研究。不仅仅是编程大师折腾两个算法那么简单。


为了保持大模型的运行,必须要有大量的GPU,以及相应的数据中心,在这个背后,必须有足够的电力、能源和稳定、高速的网络基础设施来传输数据。


但是偏偏印度在这些基础设施方面,表现实在不太好。


2023年,在超大规模数据中心数量方面,印度只有一个明显的差距。18个超大型数据中心,而中国的公开数据接近100个


而且超大型数据中心,是衡量AI算率的一个重要指标。


这一差距的背后,是一系列支持和维护数据中心运行的配套设施,涵盖了电力、网络、制冷系统等。


印度在这方面也被中国甩了好几条街。


第一,在能源方面,2023年中国超大规模数据中心的能源消耗估计达到180。-200 TWh,而且印度只有大约10-15 TWh


这是因为印度在电力方面的基础设施,实在是太急了。


根据2022年印度民意调查机构对2万多人的调查,三分之二的家庭表示会突然断电,三分之一的家庭每天固定“小黑两小时”。



这种电力不够普通人家里灯泡亮,还想养AI这个电耗子?


除电力外,在网络基础设施方面,2023年,中国5G基站总数已经超过248万个,覆盖率超过96%,而印度总数仅为30万个,覆盖率仅为30~40%。


但是,在更关键的制冷系统方面,中国液体直接冷却,浸没式液体冷等先进的液冷技术处于领先地位(使用率为30%)。相比之下,大多数印度数据中心仍然使用传统数据。蒸发冷却系统,液冷技术缺乏广泛的应用(使用率在10%左右)。


以上基础设施都让印度的计算机科学人才,即使想回国为AI工作,也会面临“聪明的女人没有米饭很难做饭”的困境。


所以,印度聪明的年轻人,最终往往只能含泪打包行李,漂洋过海到美国实现科研梦想。


2023年,约有6万名印度计算机理论人才选择了海外发展,约占当地计算机理论人数的40%,相比之下,在中国,流失率仅为15%。


一方面是美国抛出的高IT外包订单,另一方面是国内拉胯的基础设施。在两者的相互作用下,印度只能在“科技施工队”的道路上越陷越深,难以自拔。


而且这一顶层理论人才的差距,直接关系到印度在AI领域的上限。


04 低数字社会


如果说印度在AI产业链上游的问题主要是基础理论人才的缺乏,那么印度在AI产业链中游的困境,也就是模型训练,主要是很难为大型模型的优化和迭代提供足够的数据。


大家都知道,目前大型模型训练所需的数据,大部分来自网络。


而且印度在这方面,最大的硬伤就是整个社会的数字化程度太低。


虽然印度网民的数量听起来相当虚张声势,将近9亿军队,但是这里有一个重要的区别,在一个国家,用户数量并不等于数字化水平。


现在经常使用AI的朋友,估计可以感觉到,目前AI最大的立足点是ChatGPT,通常是一些。特别集中的信息、数据场景。


比如长篇报告总结,专业研究报告分析,或者帮助处理一些复杂的代码等等。


这种场景通常包含大量的数据和信息,数据或数据的数量已经达到一定的水平。当人脑觉得负担太大的时候,大家都会觉得AI是必须的。


从这个角度来看,社会数字化程度越高,与AI的匹配程度就越高。



相反,在一个数字化程度较低的国家,人们在日常活动中无法生成如此多的数据,或者即使生成了数据,这些数据大多以“线下”的形式存在,所以AI很难有用。


从这个角度来看,所谓的数字化程度,并不只是表面上的“用户数量”指标,而是指在日常生活中,每个人的工作、购物、学习、看病等工作都可以多方面在网上处理;企业能否通过数字化的方式提高效率。


虽然现阶段,印度网民的数量相当多,但是仔细研究一下,他们每天都在网上做些什么?


据著名会计和咨询公司KPMG在印度分布的统计,印度网民目前每日主要上网活动,社交网络,即时通讯和视频娱乐等待领域最多,占总上网时间的近90%。



但是除了娱乐内容之外,其它活动的频率也明显降低了许多。


据使用次数统计,印度仅有56.3%的用户通过网络进行网上购物,但在中国,这一比例已达83%。


此外,在网络汽车平台等生活服务方面,印度本土和网络汽车平台Ola在2022年的年订单量约为3.7亿单,而在同一时期,中国滴滴出行订单量达到370亿单,是其100多倍。



但是在企业端,在印度,互联网普及率仅为49%,而且相比之下,中国企业的网络普及率明显提高,达到95%左右。


表面上看,这种“低数字化”的现状主要是由于落后的基础设施(5G普及率不到30%)造成的,但从更深层次的角度来看,这与印度目前的情况相同。固有的产业布局,有很大的关系。


05 分工的重要性


当前印度的产业布局,服务业占GDP的60%左右。但是大部分都是低端服务行业,比如零售、酒店或者餐饮。


农业业占15%-18%,制造业略低,只有12%。


事实上,这种以农业、服务业为主导的产业布局,很难承载数字经济所需的复杂产业链和高附加值服务。



农业业和很多服务业,产业链往往很短,比较单一,就像种田、养牲一样,供应链比较短。


还有那些日常服务,比如餐厅做饭,店铺卖货,家政打扫卫生,生产链比较简单,就完了,很少涉及复杂的。整合上下游产业链或者增值服务。


说白了,这样的行业,数据和信息业务缺乏复杂的需求。


这样的信息,人脑实际上可以完全处理,不需要AI。


相对于以农业、服务为主导的社会,工业界的一个主要特征就是存在大量的分工与合作。


从最初的原材料处理,到新产品的设计、R&D、组装和测试,最后,我们必须打造品牌、营销和保证售后服务。经过这个过程,就会形成复杂的产业链。


每个环节都可以创建更大的数据和信息增量。


以新能源汽车的生产为例。在设计阶段,大量的设计数据和模拟数据将通过CAD/CAE软件设计车辆并进行模拟测试。


在生产过程中,生产线上的设备状态、物料流动、生产进度等,同样会产生大量的实时动态。


而且由于制造环节本身创造的数据流,工业辐射效应,一些工业活动还会给其它看似不相关的行业带来意想不到的新信息和数据。


例如,在金融和保险行业,有基于汽车行驶数据的保险费用。


在广告业,为了实现精准营销,公司必须利用大数据分析消费者偏好、社交媒体互动数据等,对广告营销进行优化。



总之,如果没有工业化,社会就很难产生复杂的分工,在人们的生活中,没有复杂的分工,就不会产生大量的数据、信息。


因此,现在每一个风险投资机构,都不太看好印度AI公司。


去年,印度与大模型相关的AI公司的融资总额约为1.6亿美元。然而,在中国,一家企业的总融资额仅在每月的暗面就达到了30亿美元。


这样一个巨大的差距背后,不仅是对印度AI实力的焦虑,更重要的一个原因是AI在印度并没有真正的市场规模和潜力。


毕竟,如果放在中国的环境中,即使大模型暂时很难在C端打开局面,至少在B端,由于数字化程度高,大模型仍然可以在一些定制和垂直的场景(如金融和医疗)中找到立足之地。


另一方面,印度,在整个社会低数字化的情况下,除了聊天和娱乐,大模型还能用于什么?


但是如果只是聊天和娱乐,上社交媒体和刷短视频不是更香吗?


One More Thing


当前印度在AI方面的困境,实际上表明:目前的AI竞争,从浅薄的角度来看,只是某一特定技术的竞争,往深处看,是一个国家整体科研实力的较量,再往深处看,就是不同国家之间,社会发展水平、产业布局、人口素质等方面的综合竞争。


总的来说,数字化程度越高,AI落地和普及的效果就越好。


在AI普及程度较高的国家,通过收集用户的反馈数据,可以形成数据飞轮,进一步优化和迭代模型。


印度的尴尬之处在于,作为一个尚未完成工业化的半农业国家,他正在追求数字时代AI的产物。


更讽刺的是,印度对AI的追求越多,他们以前的“金饭碗”就越有可能被带走。因为目前的生成式AI,在很多功能上,都是直接朝着取代一些高端服务业的目标前进。


例如,在5月21日的微软开发者大会上,微软不仅发布了最新版本的Copilot,配备了GPT-4o,还在会上展示了GitHub“帮助新手编程” Copilot Workspace。


这是一款程序编程是通过聊天来完成的。软体。这样,任何初学者都可以开发自己的软件,即使他们对编程语言知之甚少。


想象一下,如果未来编程、电话客服等所有岗位都可以被AI取代,那么印度之前赖以致富的“IT外包”之路还能有效吗?


当时,工业基础薄弱、IT金饭碗再次被夺走的印度,如何在AI时代生存,将成为一个巨大的问题。


本文来自微信公众号“酷玩实验室”(ID:coollabs),作者:酷玩实验室,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com