关闭引导
炸裂!短视频也能AI生成 OpenAI发布首个视频大模型Sora
2024-02-16 14:57:50
广州日报新花城


由Sora模型生成的视频。

生成式大模型又再进化了,如今,短视频能用AI大模型来完成。2月16日,美国人工智能公司OpenAI发布消息,首个视频生成模型Sora发布。Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示词技术,为视觉训练数据生成高度描述性的标注,因此能够更忠实地遵循用户的文本指令。


(OpenAI官网截图,Sora能根据文本指令生成1分钟的视频)

据介绍,Sora能够根据文本指令生成长达60秒(即1分钟)视频,同时保持视觉质量并遵守用户提示。Sora可生成具有多个角色、特定类型运动以及精确主题和背景细节的复杂场景。该模型对语言有深刻理解,能够准确领会提示,生成令人信服的角色。Sora还可以在单个生成视频中创建多个镜头,准确保留角色和视觉风格。

目前可见的由Sora生成的演示视频,足以跟人工制作的短视频媲美。如由“中国龙年春节”为提示词生成的视频片段,中国熙熙攘攘的人群中,有人在舞龙,舞龙动作相当丝滑标准,还有人举起手机拍摄,场景细节丰富、严谨,但这并不是真实场景。


又如,几只巨大的猛犸象穿过一片白雪覆盖的草地,长毛在风中轻轻飘动,远处是白雪覆盖的树木和大山。一切都栩栩如生,但这些都是由大模型成视频。


据了解,除了能够仅根据文本指令生成视频之外,Sora模型还能够获取现有的静态图像并从中生成视频,准确地让图像内容动起来并关注小细节。还可以获取现有视频并对其进行扩展或填充缺失的帧。

据悉,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步更好地助力创意工作者。

市场分析师指,估计Sora可能会对数字娱乐市场产生重大影响,因为新的个性化内容将在各个渠道上传播。

文/广州日报·新花城记者:文静

广州日报·新花城编辑 谢婵

@广州日报 版权所有 转载需经授权