不要再吹巴黎的松弛感了,他们正在那里排队。

08-10 13:15

在此期间,巴黎奥运会的热度算得上是打满了,编辑部的朋友们每天围在一起看比赛,甚至还有半夜约会。


而且每当看到世界冠军打出好球,射出高分环的时候。。。世超脑子里总有一个想法: " 如果那一年我也练了一两手,现在高低也是世界冠军,对吧? " 。


可是,真的现在我去玩两个,马上又菜鸟显形了,活脱脱一个人菜瘾大。


所以,我心里还是知道,这些奥运选手,身体来到世界各地参加比赛,哪一个没有在背后流下三船五车的汗水,估计世超这辈子都没有机会了。


但是就在网上冲浪的时候,我们发现这次巴黎奥运会上,一堆明星、运动员和观众,都在晒自己玩其他运动。


比如游泳运动员刘湘打排球。


前 NBA 冠军托尼 · 帕克,也在展示自己的排球爆扣。


查了一下才知道,原来这是我们中国科技在法国露出的大脸,名字叫“中国科技”阿里云奥运智影时刻 ( Cloud Memento ) 。


简而言之,阿里云在巴黎埃菲尔铁塔、荣军院、战神广场三个地标场所,各自设立了一个感觉点。


在这 3 个感受点,任何人都需要花掉它 3 秒,拍几张照片,就可以通过了。 AI 科学技术,生成奥运运动视频


恐怕你们都无法想象这个东西在奥运会上有多火,现场排队的外国人,我估计可以从西直门排到八达岭。


而且最近这段时间,巴黎是时而下雨,时而暴晒的冰火二重天。


但是观众愣是从雷雨交加,排到了艳阳高照。


说什么也要体验,来自遥远东方的神秘。 AI 科技。


别的不说,光看现场排队的情况,你说这是哪个奥运冠军在签名我都相信。


而且在现场,观众感觉很有趣。


这儿刚来一个哥们,还挺开心的,露出一口白牙。


那儿又来了一个 " 鸣人 " ,放着 " 萨斯给 " 不管怎样,反而来到现场,放了一个影分身练习柔道。


参与者虽然肤色不同,年龄不同,性别不同,但主要是全民参与,每一个人都想体验科技的魅力。


每个人都一个个上台,简单的花几秒钟摆出一个个 " A 字型 " 站立好姿势,采集就结束了。


她们只需在台下等一会儿,就可以在手机上看到自己变成了一个英俊的运动高手。


一声声 " Cool " 赞美的声音,也不断地从人群中传来,甚至有一些体验者,当场将奥运时刻分享到社交平台上,秀一波。


而且在这些队伍中,我们也看到了一些 " 特殊 " 的体验者


一位坐轮椅的中东设计师,来到现场后,在工作人员的帮助下完成了采集。


多年没有运动过的她,成功地利用了这项技术,沉迷于柔道运动员。


即使在现场,我们也被抓住了。 TikTok 顶流男巫 Zach King 。


这个哥们这次又来到巴黎玩花活,把整个巴黎变成了他的排球场,就像变戏法一样。


结果是一不小心,参观阿里云奥运智影时刻的感受点,直接被硬控制,当场生成自己的排球秀。


而且在这场爆红的现场背后,差评君也发现,虽然看上去一点也不简单,但实际上也确实有些东西。


因为阿里云奥运智影时刻 Cloud Memento ,以及今天大火的生成式 AI 大滴不同。


众所周知,目前生成式 AI 的通病是,生成的物品,主推一手无拘无束。,你要个" 阳光彩虹小白马 ",它可以为你生成一个 " 阳光 " " 彩虹 " 和 " 小白马 " 。


不能说无关紧要,但也是牛头不对马嘴。


所以,为达到更好的效果,阿里云巴黎奥运会智影时刻,并非让步。 AI 直接生成视频,而选择使用 " 静态人物照片生成指定体育视频 " 。


通过几张简单的照片, AI 通过计算,可以准确地捕捉和恢复,并产生新的动作。


因此,视频的主题基本上是一样的。


但是这样的行为还是会有很多问题,因为让图片移动,很容易出现失真、模糊、帧率抖动等情况。


特别是在使用一些真人照片作为模板时,我们最起码的要求是:生成得像照片本人吧?


就像下面这样,给几个小姑娘整上了鬼片的特效,我估计也只有伽椰子看了才能说好。


那么阿里云是怎样处理这个难题的,我们也去翻论文,发现他们直接捣乱了一套名字。 Animate Anyone ( 让每个人都动起来 )算法,而且这个算法中,可以有很多黑科技。


举一个简单的例子:


在让一幅画移动的过程中,最难的是让一幅画移动。 AI 按照现有照片, " 想象 " 该如何移动呢?


众所周知,视频中人物的动作是通过一帧一帧的过渡来实现的,就像我们小时候画的火柴人一样,通过快速翻转,卡在人眼里。 " 视觉暂留 " 的 bug ,使大脑认为人移动了。


但是要实现这种顺滑的连技,那么画火柴人的时候,我们要想好火柴人的动作是怎样连接下来的,一张张画。


可对 AI 而言: " 这个题目太难了,我不会做! "


很多时候, AI 会使身体动了手甩出去,头往前走,屁股却还在后面拖着,总之看着就是一眼假。


为确保人物的稳定性与前后形象一致,阿里云在其中加了一个。 " 参考图像网络 ReferenceNet " 。


这个东西相当于一个活字印刷板,它可以一口气提取图片中所有的空间细节信息。


然后把去噪 U-Net 接入进来,这个 U-Net 相当于一台精确的印刷机,它可以精确地分割前面捕捉到的信息,清晰地 get 产生许多图像元素。


这么一来, U-Net 在生成目标图像时,可以理解在哪里生成细节,从而实现人物形象的一致性。


不要给海王做原图,输出一位徐锦江老师。


对图片细节问题进行处理后,剩下的考验,处理动作和姿势


阿里云 AI 团队也没有太多的力量,直接设计了一个姿态引导器 Pose Guider 。


说白了,这个姿势引导就等于是我们小时候练字的字帖,跟着字帖写字,那效果肯定是杠杆。


所以,当模型生成视频时有了方向,就会使生成的图像动作稳定下来,不会给出跑偏的机会。


再加上其它的一些 " 法术 " ,最后,阿里云的工程师们终于练成了一套九阳绝学。 Animate Anyone 算法。


有了这个技巧,静态人物的图像可以很容易地转换成动画视频,甚至可以通过输入姿势的顺序准确控制视频中的人物动作。


可以说这是实验室的理想状态,等到巴黎奥运会现场,阿里云奥运智影时刻也上了一层楼。 buff


比如一会儿晴天一会儿大雨天,光线的变化就足够了。 AI 喝一壶,奥运会上有复杂的镜子,相当于拿着放大镜看手脚的动作,观察脸上的表情,这也给了你。 AI 带来了新的挑战。


阿里云 AI 于是,团队又结合实际情况,创造了一些新的想法。


举例来说,在前面的实验室里,所有的生成图像都是 2D 照片产生的 " 纯电方式 " ,到达巴黎现场,改为巴黎现场。 2D 3D 混合动力模式,更准确地捕捉动作和表情。


然后把前边 " 2D 3D " 采集的数据,采用云智能渲染技术,直接对环境光场进行快速分析。


获得的数据,与云实施的光跟踪技术无缝结合,大约等于让真正的阳光晒进虚拟场景。


正是这些技术上的努力,最终才得到了阿里云奥运智影在奥运会上的爆红。


可以这么说,这一次,阿里云根本就是活该。


当然,在本届巴黎奥运会上,除了阿里云奥运会的智影时刻,阿里云也付出了巨大的努力。


特别是在帮助奥运转播的道路上,具有重要的历史意义。


要知道,在之前的奥运会上,卫星转播一直是世界上最大的直播力量。


而且今年,阿里云领队成功地反超,有 11000 小时游戏直播画面在云上分发给全世界,超过三分之二的全球信号是通过云传递的。,这是 1964 今年东京奥运会卫星电视转播至今,又一次重大技术进步。


另外,阿里云带来的, AI 提升全新的直播技术,还拥有独特的高自由度回放系统。


例如,关键时刻可以定格,然后 " 子弹时间 " 般的回看。


举例来说,在男子百米决赛中,最终的差距只有 0.005 秒,还得靠阿里云这一套。 " 云自由度高回望 " 技术,几乎在直播的瞬间,让全世界的观众,一眼就能看出谁是冠军。


这种技术,大大增强了观赛体验,赢得了大家的一致好评。


阿里云也出手了,帮忙修好了。 100 多年前巴黎奥运会的珍贵形象。


这一系列行动,吸引了国际奥委会主席巴赫,直接感谢阿里云的工作。


所以在本届奥运会上,阿里云凭借深厚的技术实力,正在为这一点而奋斗。 120 国际盛会余年历史,在技术上注入力量,插入云计算 AI 的翅膀


从技术上讲,阿里云显然把这次奥运会视为科技赛场,无论是帮助奥运会云转播还是为观众塑造体验。


但是,在整个过程中,我们似乎没有 " 她们纯粹是在炫耀技巧,秀肌肉。 " 的感觉。


它们更好地将技术与人结合起来:


或者为办赛人员提供技术支持;


要不要为奥运迷丰富现场活动;


不要为全世界的观众升级观赛体验;


。。。


总而言之,一切,实际上都反映了阿里云的态度:技术是一种方式, " 人 " 才是目的


正如乔布斯最初所说: " 光有科技是不够的,科技要与人文和人性相结合,才能产生让我们的心为之歌唱的结果。 " 。


毫无疑问,阿里云就是这么做的。


发文:八戒


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com