当前位置：2024年 > 第2期NO.57

2024（2）：Web2.0时代

点击量：1835

Sora：人工智能文生视频大模型

Sora，美国人工智能研究公司OpenAI发布的人工智能文生视频大模型，于2024年2月15日（美国当地时间）正式对外发布。Sora这一名称源于日文“空”（そら sora），即天空之意，以示其无限的创造潜力；其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。

Sora可以根据用户的文本提示创建最长60秒、准确反映用户提示、可一镜到底的逼真视频。该模型了解这些物体在物理世界中的存在方式，可以深度模拟真实物理世界，能生成具有多个角色、包含特定运动的复杂场景。Sora也存有以下弱点：可能难以准确模拟复杂场景的物理原理，无法理解因果关系，混淆提示的空间细节，难以精确描述随着时间推移发生的事件等。

Sora的出现标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃。通过不断深入研究和发展Sora等先进模型，人类有望在未来实现更加智能、高效和多样化的视频生成与处理技术。

由Sora生成的名为《雨后的东京街头》视频场景

爱阅板报

2024（2）：Web2.0时代