中信证券:Sora横空出世标志着AI大模型保持高速迭代升级 建议关注三条投资主线

作者: 智通财经 汪婕 2024-02-23 08:26:05
中信证券发布研报表示,近期随着Sora横空出世,该行认为其标志着AI大模型保持高速迭代升级,AI大模型在泛化以及特化两条发展路径取得了长足进步。

智通财经APP获悉,中信证券发布研报表示,近期随着Sora横空出世,该行认为其标志着AI大模型保持高速迭代升级,AI大模型在泛化以及特化两条发展路径取得了长足进步。OpenAI再次推出行业颠覆级新产品,Sora为目前文生视频领域SOTA模型,在时长、分镜、物理引擎、视频格式、语义理解等文生视频重点指标均大幅优于同类别产品。

展望行业未来发展趋势,该行认为Sora再次验证当下AI大模型行业的规模效应规律,算力仍为AIGC行业发展“底座”,以AI芯片为核心的算力产业链仍具备空中加油的潜力。同时,该行认为Sora有望在短视频领域率先应用,短视频的时长普遍在60秒及以下,Sora的内容产出能力充分适配短视频时长与使用场景,可以大幅提升创作效率并降低创作门槛。此外,Sora等AI工具将大幅降低大众利用AI合成高质量视频的难度,AIGC内容滥用风险或将持续扩大,因此该行认为AIGC监管重要性也将持续提升。

该行综合梳理三条投资主线:1)受益于算力产业链高景气的支撑硬件;2)受益于AI大模型升级的AI应用;3)AIGC内容滥用风险扩大带来丰富的AI监管需求。

中信证券的主要观点如下:

OpenAI发布Sora,重新定义文生视频。

近期,OpenAI发布文生视频大模型Sora,再次点燃AIGC行业。根据OpenAI官网信息,Sora可生成时长为1分钟的高清视频,初步具备对通用物理世界进行建模的能力。2023年以来,AIGC在文字、图片以及视频生成领域均迎来跨越式发展,该行认为Sora为目前文生视频领域SOTA(state-of-the-art)模型,在时长、分镜、物理引擎、视频格式、语义理解等领域均大幅优于同类别产品:

1)时长方面,根据新京报贝壳财经数据,在相同的提示词下,Sora可生成近1分钟的视频,Pika仅能生成3秒的视频,Gen-2video可以生成4秒的视频;

2)分镜方面,该行认为Sora具备媲美人类的场景设计能力,可直接输出多角色、多场景和运镜的视频;

3)物理引擎方面,根据OpenAI官网公开的样例,该行认为Sora已初步具备模拟物理世界运行方式的能力,尤其对物体纹理以及物体运行轨迹模拟优于同类别产品;

4)视频格式方面,Sora可支持多样式视频格式,可以采样宽屏1920x1080p视频、竖屏1080x1920视频以及介于两者之间的所有视频格式,具备更高的可用性;

5)语义理解方面,Sora对提示词有更深入的理解,能够准确理解用户意图,在同一视频的不同画面可保持一致的视觉风格,保持较强的逻辑性。

融合多类型技术方案,OpenAI引领AIGC升级。

OpenAI持续推动AIGC行业发展,Sora横空出世体现了OpenAI已将其在文字以及图片生成领域的领先优势延展至视频领域。根据OpenAI官网技术文档,OpenAI应用了诸如时空补丁(Spacetime Patches)、扩散转换器(Diffusion Transformers)等技术,可将各类可视化数据转化为统一表示,从而达成生成式模型的大规模训练,并最终实现生成不同持续时间、纵横比和分辨率的视频和图像。另外,OpenAI也在Sora中借鉴或应用了DALL·E3和GPT技术,借助其综合AI大模型能力实现文生视频SOTA模型。Sora借鉴DALL·E3中的re-captioning技术,对高度描述性的视频转译进行训练,显著提高文本保真度和视频的整体质量。同时,OpenAI还利用GPT技术将简短的用户提示转换为更长的详细转译,使得Sora能够精确地按照用户提示生成高质量的视频。

规模效应(Scaling Law)持续有效,算力产业链仍具备空中加油的潜力。

AI大模型具有“涌现能力”,当训练量超过某个阈值时,模型精度会突然暴增。根据OpenAI官网技术文档,Sora研发团队发现扩散转换器在视频生成领域具有巨大的潜力,展示了不同训练阶段下,使用相同种子和输入的视频样本对比,结果发现随着训练量的增加,样本质量有着明显的提高。该行认为Sora实现现象级文生视频效果再次证明,在现有的AI模型框架下,规模效应仍为最有效方案之一,提供更为充沛的算力基础继而提升模型训练量为升级AI大模型表现的重要途径。因此,随着AIGC行业技术发展,AI大模型向着泛化及特化两条路径持续发展,该行认为算力仍为AIGC行业发展“底座”,头部科技企业仍将进行“算力军备竞赛”以推进AI大模型能力持续升级,以AI芯片为核心的算力产业链仍具备空中加油的潜力。

该行预计文生视频将在短视频行业率先应用,2025年潜在市场空间中值达80亿元。

Sora模型出色的语义理解、视频编辑和扩展能力为创作者提供了灵活和广泛的创意空间,该行认为有望加速文生视频应用在各行业的渗透率。短视频的时长普遍在60秒及以下,Sora的内容生成能力充分适配短视频时长及应用场景,可以大幅提高创作效率并降低创作门槛。目前,我国短视频行业仍处在快速发展阶段,根据《2023中国网络视听发展研究报告》(中国互联网络信息中心),2022年我国短视频市场规模接近3000亿元。该行假设视频创作成本占短视频市场规模的10%,在AI+视频渗透率5%-35%、短视频中视频创作市场规模340-460亿元的假设下,该行测算国内文生视频应用在短视频领域2025年潜在市场空间中值达80亿元。

AIGC内容滥用风险扩大,AIGC监管重要性提升。

随着Sora逐步推广,大众利用AI合成高质量视频的难度将会进一步降低。因此,AIGC滥用生成包含有害内容或虚假信息的文本、照片、视频,对个人、机构、社会带来了新的安全问题。根据量子位智库预测,中国AIGC市场规模有望在2030年达到11491亿元。信息化投入中,安全投入占比一般在5%-10%以上。由于AI大模型的特殊性,AI安全将会贯穿从数据标注、模型训练和开发、内容生成、应用开发的全过程,投入占比较高。该行假设AIGC监管在整个产业链中的占比为5%-10%,则测算出2030年我国AIGC监管市场规模将达到575-1149亿元。

风险因素:

Sora等文生视频模型商业化进展不及预期;Sora等文生视频模型实际使用体验不及预期;算力成本优化不及预期;政策监管持续收紧;行业竞争持续加剧;AI监管发展不及预期;地缘政治风险。

智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏