美国NAB大会透视:生成AI、软件定义、XR、十大趋势,如创作者经济等

05-02 01:17

最近,第101届NAB Show(美国广播电视展)在拉斯维加斯举行。展览内容作为全球电视和广播业最具影响力的展览之一,代表着全球产业与技术相结合的前沿趋势。通过今天的展览,我们可以看到生成式AI。、云计算,软件定义,虚拟拍摄,XR、许多前沿的数字技术,如区块链甚至人形机器人,正在加速融入媒体行业,并产生令人惊讶的概率。


1. 人工智能已经成为2024年媒体行业创新的焦点。


和去年的NAB一样 Show最大的区别是,在本次展览的1000多家展商中,近200家展出了人工智能相关技术工具,并举办了150多次以人工智能为核心话题的会议。去年,很少有制造商打着AI的幌子。


总的来说,国际媒体行业展现了整个行业、整个过程。 AI的明显趋势包括内容创作、分发、观众参与和货币化。根据Devoncroft发布的AI冲击指数调查,声音/视频剪辑是未来2-3年AI影响较大的领域,这意味着AI已经将深入媒体行业的核心环节转化为行业共识。


头部技术服务商,如亚马逊,微软,Adobe,都是针对媒体推出的。 一系列AI产品或解决方案,引起了广泛关注。亚马逊展示的内容是最全面的。它在内容制作、审批、搜索、摘要、问答和广告等方面推出了与AI相结合的工具和解决方案。,并专门构建了生成人工智能(GenAI)游乐场,高尔夫体验馆等,可以促进观众的感受和探索。除了通用的coplit之外,微软还展示了智能媒体运营和媒体本土化的AI方案。


腾讯作为为数不多的中国参展商之一,重点展示了媒体处理服务(Media Processing Service,MPS)以方案为代表,可以大大降低视频等媒体文件的存储和传输成本,提供一系列丰富的AI功能,如视频质量增强、超分、除噪、插帧、擦写&修复、实时翻译、横向和纵向转换、敏感信息屏蔽等,吸引了众多国家访客的关注。


图片:亚马逊PartyRock支持生成个性化AI应用程序。


图片:腾讯云MPS方案- 极速超清完美压缩


2. 真正实用的GenAI在媒体上还有待时日。


尽管许多制造商展示了GenAI、与大模型相关的大部分信息仍处于概念或实验阶段。根据现场观察和与业内人士的交流反馈,传媒行业仍然使用传统的单一任务和小型AI,而GenAI至少要到明年才能看到真正实用的例子和效果。


例如,Adobe在展览会上宣布了一个重大更新消息,除了自己的Firefly之外,Sora还将、Pika、第三方AI视频生成模型工具,如Runway,集成到其视频编辑软件Premiererer Pro(PR)其中,走在行业前列,激发了广泛的兴趣与讨论。由于官方演示视频发布,客户可以在PR中灵活选择AI模型工具,只需输入文本提示词即可。 点击操作,可以方便地添加、删除或改变视频中的目标,增加辅助镜头,甚至扩展和增加某个镜头。整个使用过程非常顺畅,展现了软件工具与GenAI有效结合的理想模式。但是当Adobe专家在展会现场试用时,坦率地说,这只是一个视频。(just a vedio)、无demo,具体发布日期尚不确定。事实上,传统AI在视频剪辑中的应用仍然是基于文本编辑快速建立粗剪、AI音频类别标签、语音转换文本、增强语音、情景编辑检验、自动色彩校正等功能。


可以看出,目前通用的GenAI还是有局限性的,在内容生产中可能很难直接调用。比如生产的视频要与原始视频前后一致连贯,工程优化要有目的性,甚至模型本身要实现版本更新的性能突破,这样才有望达到Adobe演示视频中显示的实用水平。


图:Adobe Premiere 第三方GenAIPro调用演示视频


图:Adobe Premiere 目前使用的ProAI编辑功能


3. 海外媒体制造商和客户已经达成共识


本次展览还有一个明显的特点。大量展商提供基于云的解决方案和服务,包括许多传统企业将传统工具和业务转移到云上。随着数字媒体内容的不断增加和客户媒体消费的日益个性化,云方式可以更灵活地适应不断变化的市场,已经成为海外媒体机构的普遍选择,作为现场远程直播和后期生产工作流程的基础设施。


在云厂商方面,比如亚马逊,重点展示了基于云的六大方案,包括流媒体、媒体供应链和档案、数据科学与分析、货币化等。,这些方案直接面向消费者,涵盖了媒体行业全过程的核心场景和阶段。与此同时,亚马逊还与英伟达合作建立了支持展览的NAB新闻编辑室。 Show LIVE全球在线直播,给观众带来直观感受。亚马逊的多个产品和方案获得了NAB年度商品奖,这也反映了行业对云计算的肯定,比如AWS。 Deadline Cloud的云渲染可以简化设置,提高3D渲染效率,云广播和直播方案可以有效降低监控的复杂性,保证质量。


图片:亚马逊和英伟达给予支持 NAB Show LIVE News Desk


传统制造商、媒体公司也在积极拥抱云。例如国家冰球联盟(NHL)北美首个职业联盟的直播云广播设计,涉及通过 Verizon 5G 摄像机信号由网络发送, AWS 对云边进行处理,实现“从冰上捕捉到广播的速度从几秒钟到几毫秒不等”。辛克莱广播是美国第二大电视台运营商(Sinclair Broadcast),整个广播业务已经在AWS协商部署,包括现场新闻制作和基于IP的广播创作,实现了186个不同网站的统一管理。传统的摄影设备巨头索尼,也专注于云和虚拟制作领域的解决方案,其Creators' Cloud是一个基于云的平台和应用套件,包括编辑合作和媒体管理、流程传输、监控和控制等多种部件功能,并提供个人和企业服务。Blackmagic视频设备和技术服务商 Design企业,为其著名的后期制作系统——达芬奇(DaVinci Resolve 提供云合作功能,使生产过程中的各种角色能在全球范围内进行远程高效的合作。



图:Blackmagic DavincinCloud支持 Resolve 超过19个客户远程合作


4. 专深小企业 建立一般大平台合作生态的典型方式


亚马逊、微软等通用平台在西馆占据核心地位,各平台携带众多合作伙伴生态展示了一系列行业解决方案。大平台和小公司的合作普遍而深刻,令人印象深刻。


亚马逊占据了展厅入口的位置,几乎每个解决方案都列出了大量合作伙伴的名字。在这些工作中,内容制作展示了如何在云上建立一个整体工作室,使用虚幻引擎和 Cuebric 的生成式 AI 协助构成虚拟制作,并采用 Wacom 平板电脑;选择视觉效果和渲染 Foundry 的 Nuke 和 SideFX 的 Houdini;使用 Adobe Premiere 和 Streambox 实时视频预览在云中编辑,并使用 Frame.io 管理生产资产;使用; Leostream 和 Qumulo 管理云工作室。展示整个工作流程,使用即将上映的科幻/喜剧电影《月球上的女牛仔》。 从头到尾制作90秒电影预告片的过程。


图片:亚马逊和UE等合作伙伴的内容制作和编辑工具


图片:亚马逊联合十多家供应商云端播出和发布


微软与自己的合作伙伴展示了互动电视的使用场景Beat the BUZZR。现场与英伟达联合展示了电视购物的现场互动竞猜游戏,让参展商能有效地与当前节目互动。



图片:微软和英伟达的互动电视展示


在微软的互动电视方案中,很多合作伙伴联合为用户提供服务:比如MediaKind改变了流媒体直播的感受,实现了动态广告营销和数字内容交付;Prime Focus TechnologiesCLEAR AI提供智能编辑、人工智能协助内容审核、社交媒体营销、情景广告、媒体供应链管理等功能,帮助用户充分释放互动电视的商业潜力;Alice & XRRSmith联合微软推出 服务器,将游戏的互联交互特性与媒体事件的数据洞察相结合,使媒体公司能够更好地了解观众,并通过有目的的节目和促销设计,对观众的行为做出即时反应,实现从被动观察到主动、沉浸式参与的升级;Symphony Al Media推出 微软Azuree集成了Copilot OpenAl服务将帮助用户快速分析跨分发平台和收入模式的内容性能,并提供AI驱动的洞察力,从而释放流媒体内容和服务的新价值。


5. 软体定义正在改变行业内的玩法。


国外各类媒体软件工具在云基础设施和平台的支持下,呈现出繁荣发展的趋势。与以专业硬件配置为主的传统内容摄制方式相比,软件的使用更加灵活,成本更低,越来越被海外媒体用户所接受。在软件应用的驱动下,硬件配置和环境也呈现出可以大大简化、轻量化的趋势。有些硬件展商觉得,看云和软件这样发展几年后,也许现在这些硬件配置就没了。


腾讯多媒体实验室真彩云境虚拟拍摄工作站的现场展示备受关注。该工作站的核心是通过软件算法实现虚拟拍摄和生产,摆脱了传统硬件配置和传感器依赖的限制,可以低成本、高效地生产即时特效内容。现场有用户对体验后的反馈非常感兴趣,表示考虑回去更换现在昂贵的设备。


一些硬件厂商也在从容应对“软化”变革,推出软件,不断完善功能,结合更轻的硬件,软硬件结合提高性价比和竞争力。从长远来看,特别是在短视频、GenAI等大发展的推动下,媒体行业的主流可能会逐渐从“重硬件、重资产”转变为“重软件、轻资产”。


图片:腾讯云媒体解决方案矩阵


图片:腾讯多媒体实验室真彩云境虚拟拍摄工作站,提供便携、高性价比的虚拟拍摄


6. 虚拟拍摄成为行业标准


即时虚拟拍摄可以说遍布了整个展览,不仅包括面试节目的包装,还包括即将到来的2024年美国大选演示,以及观众可以深刻体验的虚拟拍摄驾驶演示。各大厂商都在展示自己的虚拟拍摄技术,允许拍摄,不受时间和空间的限制,为媒体内容制作提供更灵活、更沉浸的拍摄方式。


虚拟拍摄的特点是“眼见为实”,它结合了虚拟现实(VR)、增强现实(AR)、计算机生成图像(CGI)以及游戏引擎等技术,通过实时渲染实现场景的实时可视化,从而颠覆了传统的媒体节目制作过程。虚拟拍摄可以大大缩短生产周期,降低成本,提高效率,给影视行业带来巨大的变革和发展机遇,有望进一步推动媒体行业的创新和发展。


图片:现场观众可体验虚拟拍摄的互动区域


图片:现场展示虚拟拍摄和生成播出内容的场景


7. 混合现实已经部分进入商业现实


混合现实的体验不是来自会场本身,而是来自会场以外的美国泛娱乐商业场景,融入了很多与现实相关的混合技术。典型的洛杉矶好莱坞环球影城,裸眼3D等技术被深度嵌入大量游戏项目中,让用户感觉更加沉浸和超越现实,同时也节省了传统的物理环境和设施建设成本。最令人印象深刻的是Studio。 在Tour项目中,我坐电动车去了好莱坞片场。在穿越一个洞穴的时候,一群演员出现在我旁边表演歌舞和戏剧。一开始大家都以为是真人,仔细看才知道都是3D情境和数字人。


图片:Studioo好莱坞环球影城 “现场表演”在Tour项目途中


拉斯维加斯的巨型球体建筑Sphere进一步将现实与现实相结合的互动体验打造成了一个新的城市地标,被称为当今世界上最接近元宇宙的地区。这个球被54,000平方米的LED屏幕覆盖,是目前最大、分辨率最高的LED屏幕。内部还安装了近16000平方米的环绕式LED屏幕,可以播放多台8K摄像头捕获的360度全景视频。结合音乐会级音频系统、定制触感地板等多种感官技术,效果非常震撼。目前,Sphere的直接收入主要包括外墙广告、日常参观门票和租赁表演。政府和开发商估计也可以吸引游客,促进当地消费和就业。


图片:拉斯维加斯的新地标建筑 Sphere的外观


图片:Sphere内部球形影院播放电影《地球明信片》


会场内还有相关的前沿展示和专题讨论,特别是以Apple为中心。 Vision Pro。如云图形公司OTOY、Roddenberry电影公司 Entertainment 联合派拉蒙游戏工作室,推出了Vision。 Pro 第一个大型扩展包《The Roddenberry Archive》,使用户能够沉浸在“星际迷航”的空间体验中,探索数百个地方和物品。其中也有专门为Vision设计的 Pro重置的概念视频和纪实片,具有超高的光跟踪质量和分辨率。


图:Apple Vision Pro上的《The Roddenberry Archive》


腾讯多媒体实验室也带来了Apple Vision 结合Pro的最新结果,使用全息视频 舞者Demo,由6DoF(六自由度)技术制成。观众可以从任何角度参与内容,并结合内容。 Vision Pro 透视功能,实现虚拟与实景完美结合的互动体验。与普通VR360相比,6DoF更加先进和沉浸,需要体积视频等新技术的支持,将自由度从三扩展到六,信息量也大大增加了传统的流媒体带宽。腾讯多媒体实验室自主研发的压缩引擎支持6DoF/点云/VVC等前沿视频技术,可以大大降低带宽,实现未来视频的流媒体传输。


图片:Apple腾讯多媒体实验室 Vision 舞者Demomo展示在Pro上的6DoF技术。


8. 作为媒体主持人的人形机器人值得期待


参加展览欢迎会议,Ameca(由自主人工智能驱动的人形机器人)和 Futuri Media 创始人兼首席执行官 Daniel Anstandig 演讲结束了。未来,人形机器人参与媒体和综艺节目是一个非常值得期待的方向,这将为媒体内容制作带来更多有趣和互动的直播效果。不难想像,将来出现一个机器人作为主持人的频道也许就在不久的将来。随着人形机器人技术的不断演变和大模型在智能化、机器人语言交互等方面的帮助,机器人可以在更多场景中担任主持人和演员,如聚会、真人秀、时事评论、电影和电视剧。


图片:NAB开场欢迎词Ameca的互动词


在Sphere展厅里,还有很多Ameca供观众互动体验。Ameca不仅可以实现流畅的对话,还可以根据现场提问观众的声音方向调整身体方向,然后直接与正在说话的观众互动。它的英语对话非常流畅,有了相关的肢体语言,机器人互动不再生硬,还可以用中文进行简单的对话,比如“你好,谢谢,欢迎”。


图片:Ameca,Sphere展厅的接待机器人,吸引了大量的观看体验。


9. 创造者经济可能会迎来新一轮的爆发


展览还专门打造了一个全新的创作者经济展区,举办了近百场特别活动,其中包括数百家参展商。内容创意可能在GenAI的加持下井喷。在工具的帮助下,创作者可以更快、更快地生成各种形式的内容,如文字、照片、视频等。在数字创新正在迅速改变传统广播、媒体和娱乐产业的世界里,创作者经济已经成为重塑格局、重新定义内容创建、分发和货币化的动力。


一些创作者在展会上分享了他们的新工作室,比如汽车 DIY YouTuber Lucky Lopez 拍摄他的车库,并开发了一些定制技术,使他能够在没有大型制作团队的情况下更容易地制作内容。


图:汽车 DIY YouTuber Lucky Lopez 分享过去一年的工作


也有一些创作者分享了创作者的经济案例,比如线上线下结合, YouTube 系列《Snake Discovery 》它是由明尼阿波利斯一家宠物店的老板制作的。除产品及其它收入来源外, 3500名会员为公司带来了超过3500名会员 收入为125000美元。它还反映了一个新的特点,即大多数创作者的经济活动并不依赖于数十亿次点击或数千万粉丝。大多数好机会都来自于未来。 Snake Discovery 这类企业,他们围绕自己的工作建立了一个小而强大、高度参与、非常热情和忠诚的社区。


根据高盛的说法,现在全世界都有 从去年开始,5000万人在创作者经济中工作,根据他们的预测,创作者的经济规模可能会翻一番。 达到2500亿美元 2027 年 4800亿美金。创作者经济继续颠覆传统媒体的创作、制作、广告和发行。据eMarket研究,品牌投资于网络名人创作者的费用增长速度将超过 Facebook、Instagram、TikTok、YouTube 还有Snapchat 上面的付费广告。


图片:网红营销与广告增长对比


创造者经济之所以能够获得如此强劲的发展势头,主要有四个原因。第一,生成式AI技术的创新:不管是GPT4等文字生成大模型,Midjourney、Dell-像E3这样的文生图模型,还是Pika?、Runway、Sora等文化视频模型,人工智能的技术进步给创作者带来了革命性的帮助,创作者可以利用工具寻找灵感,让创意快速呈现。这样大大提高了创作效率,同时也让更多的人有机会创作出平均水平最高的作品,大大降低了创作门槛,丰富了市场供给。第二,商业化日益完善:创作者可以通过广告、赞助、产品销售、粉丝直接奖励支持等各种货币化渠道。第三,社区参与和私域流量的加持:与受众的直接联系可以实现更有意义的互动反馈,增强客户信任,增加用户购买,从而繁荣创作者的经济生态。第四,灵活的工作选择:创作者经济提供独立工作、个人可控时间表和灵活性。


10. 信任危机的数字内容依赖于区块链等技术创新。


区块链和Web3也是本次展览的一个值得关注的话题,一些讨论认为,人工智能和元宇宙可能是好莱坞乃至影视圈的下一个商业模式。在R&D帮助创作者经济大发展的情况下,未来数字媒体内容的形式、生产流通模式、实现模式将更加丰富多变。如何保证数字内容的安全和版权收益的公平分配,防止盗窃、伪造、滥用等风险,已经成为媒体和娱乐行业日益面临和解决的问题。


在主展区举行的“公平透明电影制作未来”工作会议上,探讨了相关问题。代表性案例是非营利组织去中心化照片(Decentralized Pictures,DCP),通过区块链和数字货币创建了透明的电影制作管理平台和独立的奖励系统。通过智能合同,提交人、审稿人、评估师、版主等。电影相关内容可以根据需要参与并领取奖励,支持合理分配收入。这个平台已经成功地设计了许多单独的电影。


实际上,区块链在电视广播领域的使用速度可能会更快,特别是对内容准确性和实时性要求较高的新闻领域。例如,BBC和Adobe、内容来源和真实性联盟由谷歌、英特尔、微软等公司联合创立(C2)PA)并且制定了技术标准,将加密元数据添加到图像和视频文件中,类似于给出数字内容“出生证明”。OpenAIDALL-E 最近,为了避免美国总统大选前被滥用传播虚假消息,也宣布加入这一标准。Fox还开发了一种内部系统Verify,它是基于Polygon。 在Labs开发的区块链上,也是为了确保媒体内容的来源可以追溯。项目经理反映,Fox新闻或体育在线发布的每一条内容,或者当地电视台发布的任何一条内容,都会同时写入区块链进行加密签名验证。


图片:C2PA防篡改签名过程示意


本文来自微信微信官方账号“腾讯研究院”(ID:cyberlawrc),作者:腾讯云智慧传媒 ×,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com