不要再吹巴黎的松弛感了，他们正在那里排队。

2024-08-10

在此期间，巴黎奥运会的热度算得上是打满了，编辑部的朋友们每天围在一起看比赛，甚至还有半夜约会。

而且每当看到世界冠军打出好球，射出高分环的时候。。。世超脑子里总有一个想法： " 如果那一年我也练了一两手，现在高低也是世界冠军，对吧？ " 。

可是，真的现在我去玩两个，马上又菜鸟显形了，活脱脱一个人菜瘾大。

所以，我心里还是知道，这些奥运选手，身体来到世界各地参加比赛，哪一个没有在背后流下三船五车的汗水，估计世超这辈子都没有机会了。

但是就在网上冲浪的时候，我们发现这次巴黎奥运会上，一堆明星、运动员和观众，都在晒自己玩其他运动。

比如游泳运动员刘湘打排球。

前 NBA 冠军托尼 · 帕克，也在展示自己的排球爆扣。

查了一下才知道，原来这是我们中国科技在法国露出的大脸，名字叫“中国科技”阿里云奥运智影时刻 ( Cloud Memento ) 。

简而言之，阿里云在巴黎埃菲尔铁塔、荣军院、战神广场三个地标场所，各自设立了一个感觉点。

在这 3 个感受点，任何人都需要花掉它 3 秒，拍几张照片，就可以通过了。 AI 科学技术，生成奥运运动视频。

恐怕你们都无法想象这个东西在奥运会上有多火，现场排队的外国人，我估计可以从西直门排到八达岭。

而且最近这段时间，巴黎是时而下雨，时而暴晒的冰火二重天。

但是观众愣是从雷雨交加，排到了艳阳高照。

说什么也要体验，来自遥远东方的神秘。 AI 科技。

别的不说，光看现场排队的情况，你说这是哪个奥运冠军在签名我都相信。

而且在现场，观众感觉很有趣。

这儿刚来一个哥们，还挺开心的，露出一口白牙。

那儿又来了一个 " 鸣人 " ，放着 " 萨斯给 " 不管怎样，反而来到现场，放了一个影分身练习柔道。

参与者虽然肤色不同，年龄不同，性别不同，但主要是全民参与，每一个人都想体验科技的魅力。

每个人都一个个上台，简单的花几秒钟摆出一个个 " A 字型 " 站立好姿势，采集就结束了。

她们只需在台下等一会儿，就可以在手机上看到自己变成了一个英俊的运动高手。

一声声 " Cool " 赞美的声音，也不断地从人群中传来，甚至有一些体验者，当场将奥运时刻分享到社交平台上，秀一波。

而且在这些队伍中，我们也看到了一些 " 特殊 " 的体验者。

一位坐轮椅的中东设计师，来到现场后，在工作人员的帮助下完成了采集。

多年没有运动过的她，成功地利用了这项技术，沉迷于柔道运动员。

即使在现场，我们也被抓住了。 TikTok 顶流男巫 Zach King 。

这个哥们这次又来到巴黎玩花活，把整个巴黎变成了他的排球场，就像变戏法一样。

结果是一不小心，参观阿里云奥运智影时刻的感受点，直接被硬控制，当场生成自己的排球秀。。

而且在这场爆红的现场背后，差评君也发现，虽然看上去一点也不简单，但实际上也确实有些东西。

因为阿里云奥运智影时刻 Cloud Memento ，以及今天大火的生成式 AI 大滴不同。

众所周知，目前生成式 AI 的通病是，生成的物品，主推一手无拘无束。，你要个" 阳光彩虹小白马 "，它可以为你生成一个 " 阳光 " " 彩虹 " 和 " 小白马 " 。

不能说无关紧要，但也是牛头不对马嘴。

所以，为达到更好的效果，阿里云巴黎奥运会智影时刻，并非让步。 AI 直接生成视频，而选择使用 " 静态人物照片生成指定体育视频 " 。

通过几张简单的照片， AI 通过计算，可以准确地捕捉和恢复，并产生新的动作。

因此，视频的主题基本上是一样的。

但是这样的行为还是会有很多问题，因为让图片移动，很容易出现失真、模糊、帧率抖动等情况。

特别是在使用一些真人照片作为模板时，我们最起码的要求是：生成得像照片本人吧？。

就像下面这样，给几个小姑娘整上了鬼片的特效，我估计也只有伽椰子看了才能说好。

那么阿里云是怎样处理这个难题的，我们也去翻论文，发现他们直接捣乱了一套名字。 Animate Anyone （让每个人都动起来）算法，而且这个算法中，可以有很多黑科技。

举一个简单的例子：

在让一幅画移动的过程中，最难的是让一幅画移动。 AI 按照现有照片， " 想象 " 该如何移动呢？

众所周知，视频中人物的动作是通过一帧一帧的过渡来实现的，就像我们小时候画的火柴人一样，通过快速翻转，卡在人眼里。 " 视觉暂留 " 的 bug ，使大脑认为人移动了。

但是要实现这种顺滑的连技，那么画火柴人的时候，我们要想好火柴人的动作是怎样连接下来的，一张张画。

可对 AI 而言： " 这个题目太难了，我不会做！ "

很多时候， AI 会使身体动了手甩出去，头往前走，屁股却还在后面拖着，总之看着就是一眼假。

为确保人物的稳定性与前后形象一致，阿里云在其中加了一个。 " 参考图像网络 ReferenceNet " 。

这个东西相当于一个活字印刷板，它可以一口气提取图片中所有的空间细节信息。

然后把去噪 U-Net 接入进来，这个 U-Net 相当于一台精确的印刷机，它可以精确地分割前面捕捉到的信息，清晰地 get 产生许多图像元素。

这么一来， U-Net 在生成目标图像时，可以理解在哪里生成细节，从而实现人物形象的一致性。

不要给海王做原图，输出一位徐锦江老师。

对图片细节问题进行处理后，剩下的考验，处理动作和姿势。

阿里云 AI 团队也没有太多的力量，直接设计了一个姿态引导器 Pose Guider 。

说白了，这个姿势引导就等于是我们小时候练字的字帖，跟着字帖写字，那效果肯定是杠杆。

所以，当模型生成视频时有了方向，就会使生成的图像动作稳定下来，不会给出跑偏的机会。

再加上其它的一些 " 法术 " ，最后，阿里云的工程师们终于练成了一套九阳绝学。 Animate Anyone 算法。

有了这个技巧，静态人物的图像可以很容易地转换成动画视频，甚至可以通过输入姿势的顺序准确控制视频中的人物动作。

可以说这是实验室的理想状态，等到巴黎奥运会现场，阿里云奥运智影时刻也上了一层楼。 buff 。

比如一会儿晴天一会儿大雨天，光线的变化就足够了。 AI 喝一壶，奥运会上有复杂的镜子，相当于拿着放大镜看手脚的动作，观察脸上的表情，这也给了你。 AI 带来了新的挑战。

阿里云 AI 于是，团队又结合实际情况，创造了一些新的想法。

举例来说，在前面的实验室里，所有的生成图像都是 2D 照片产生的 " 纯电方式 " ，到达巴黎现场，改为巴黎现场。 2D 3D 混合动力模式，更准确地捕捉动作和表情。

然后把前边 " 2D 3D " 采集的数据，采用云智能渲染技术，直接对环境光场进行快速分析。

获得的数据，与云实施的光跟踪技术无缝结合，大约等于让真正的阳光晒进虚拟场景。

正是这些技术上的努力，最终才得到了阿里云奥运智影在奥运会上的爆红。

可以这么说，这一次，阿里云根本就是活该。。

当然，在本届巴黎奥运会上，除了阿里云奥运会的智影时刻，阿里云也付出了巨大的努力。

特别是在帮助奥运转播的道路上，具有重要的历史意义。

要知道，在之前的奥运会上，卫星转播一直是世界上最大的直播力量。

而且今年，阿里云领队成功地反超，有 11000 小时游戏直播画面在云上分发给全世界，超过三分之二的全球信号是通过云传递的。，这是 1964 今年东京奥运会卫星电视转播至今，又一次重大技术进步。

另外，阿里云带来的， AI 提升全新的直播技术，还拥有独特的高自由度回放系统。

例如，关键时刻可以定格，然后 " 子弹时间 " 般的回看。

举例来说，在男子百米决赛中，最终的差距只有 0.005 秒，还得靠阿里云这一套。 " 云自由度高回望 " 技术，几乎在直播的瞬间，让全世界的观众，一眼就能看出谁是冠军。

这种技术，大大增强了观赛体验，赢得了大家的一致好评。

阿里云也出手了，帮忙修好了。 100 多年前巴黎奥运会的珍贵形象。

这一系列行动，吸引了国际奥委会主席巴赫，直接感谢阿里云的工作。

所以在本届奥运会上，阿里云凭借深厚的技术实力，正在为这一点而奋斗。 120 国际盛会余年历史，在技术上注入力量，插入云计算 AI 的翅膀。

从技术上讲，阿里云显然把这次奥运会视为科技赛场，无论是帮助奥运会云转播还是为观众塑造体验。

但是，在整个过程中，我们似乎没有 " 她们纯粹是在炫耀技巧，秀肌肉。 " 的感觉。

它们更好地将技术与人结合起来：

或者为办赛人员提供技术支持；

要不要为奥运迷丰富现场活动；

不要为全世界的观众升级观赛体验；

。。。

总而言之，一切，实际上都反映了阿里云的态度：技术是一种方式， " 人 " 才是目的。

正如乔布斯最初所说： " 光有科技是不够的，科技要与人文和人性相结合，才能产生让我们的心为之歌唱的结果。 " 。

毫无疑问，阿里云就是这么做的。

发文：八戒

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

星舰发动机吹成艺术品，被网友称为放屁枪。。

湖名创作背景：英特尔CPU号码真的存在吗？

一天能工作20小时的人形机器人，已在工厂工作。

浙江各地明确：周六上班！台州也是如此

为什么黑芝麻智能是智能汽车AI芯片的第一股？

项目推荐

AI云印侠

宾果智能

幸福绩效