ChatGPT官网

OpenAI发布首款根据文本生成视频的大模型Sora

chatgpt2024-10-25 15:59:00182
2024年2月16日,马斯克的人工智能公司OpenAI发布首款根据文本生成视频的大模型Sora (黑脸田鸡),该模型可以快速生成60秒1080P高质量视频、准确反映用户提示,再次惊艳全球。

这是在ChatGPT大模型之后,OpenAI带给我们的再次震撼,在这短短的一分钟视频中,文本主题清晰,角色表情生动,场景复杂精细,视频逻辑顺畅,标志着文生视频大模型能力进一步提升。

其技术原理和ChatGPT类似,就是凭借大量的数据和训练,建立起大模型,然后利用强大的算力快速生成内容。

以下是OpenAI公司对Sora的介绍

能力 我们正在教人工智能理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要真实世界交互的问题。介绍sora,我们的文本到视频模式:sora可以生成长达一分钟的视频,同时保持视觉质量并遵守用户提示。如今,红队队员可以利用sora来评估关键区域的危害或风险。为了改进该模型以最大限度地帮助创意专业人士,我们还向许多视觉艺术家、设计师和电影制作人提供访问权限,以获得他们的反馈。我们很早就分享了我们的研究进展,以开始与OpenAI以外的人合作并获得他们的反馈,并让公众了解即将到来的人工智能能力。    sora能够生成具有多个角色、特定运动类型以及主体和背景的精确细节的复杂场景。 该模型不仅理解用户在提示中要求的内容,还理解这些内容在现实世界中的存在方式。该模型对语言有着深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。sora还可以在一个生成的视频中创建多个镜头,准确地保留人物和视觉风格。 目前的模式存在缺陷。它可能难以准确模拟复杂场景的物理过程,也可能不理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后,饼干可能没有咬痕。该模型还可能混淆提示的空间细节(例如,混淆左右),并且可能难以准确描述随时间发生的事件,例如跟随特定的相机轨迹。 

OpenAI根据提示词生成的首个视频

提示词:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。

 安全性 在OpenAI产品中使用sora之前,我们将采取几项重要的安全措施。我们正在与红队成员合作,他们是错误信息、仇恨内容和偏见等领域的专家,将对该模型进行对抗性测试。我们还在开发工具来帮助检测误导性内容,例如检测分类器,可以判断视频是何时由sora生成的。如果我们在OpenAI产品中部署该模型,我们计划在未来包含C2PA 元数据。除了开发新技术为部署做准备之外,我们还在利用现有的安全方法,这些方法是我们为使用DALL E 3的产品设计的,也适用于sora。例如,在OpenAI产品中,我们的文本分类器将检查并拒绝违反我们使用政策的文本输入提示,如要求极端暴力、性内容、仇恨图像、名人肖像或他人知识产权的提示。我们还开发了强大的图像分类器,用于审查生成的每个视频的帧,以帮助确保在向用户展示之前遵守我们的使用政策。我们将与世界各地的政策制定者、教育家和艺术家合作,了解他们关心的问题,并确定这项新技术的积极使用案例。尽管进行了广泛的研究和测试,我们无法预测人们使用我们技术的所有有益方式,也无法预测人们滥用技术的所有方式。这就是为什么我们认为从现实世界的使用中学习是随着时间的推移创建和发布越来越安全的人工智能系统的关键组成部分。 
sora生成的花瓣老虎研究技术 sora是一种扩散模型,它从一个看起来像静态噪声的视频开始生成视频,并通过多个步骤去除噪声来逐渐转换视频。sora能够一次生成完整的视频或扩展生成的视频使其更长。通过一次为模型提供许多帧的预见性,我们解决了一个具有挑战性的问题,即确保一个主体即使暂时离开视野也保持不变。与 GPT 模型类似,sora使用变压器架构,释放出卓越的扩展性能。我们将视频和图像表示为称为补丁的更小数据单元的集合,每个补丁都类似于GPT的代币。通过统一我们表示数据的方式,我们可以在比以前更广泛的视觉数据上训练扩散变压器,跨越不同的持续时间、分辨率和纵横比。sora以过去对戴尔和GPT模型的研究为基础。它使用DALL-E 3中的重新捕获技术,该技术涉及为视觉训练数据生成高度描述性的字幕。因此,该模型能够在生成的视频中更忠实地遵循用户的文本指令。除了能够仅根据文本指令生成视频之外,该模型还能够获取现有的静态图像并从中生成视频,精确地制作图像内容的动画并注意小细节。该模型还可以获取现有视频并扩展它或填充丢失的帧。在我们的技术报告中了解更多信息。sora是能够理解和模拟真实世界的模型的基础,我们认为这种能力将是实现AGI 的重要里程碑。 

本文链接:https://www.rongxin.vip/openai_sora_48.html

sora openai使用方法sora openai如何使用sora意思sora openai下载

相关文章

网友评论