ChatGPT官网

OpenAI的Sora未披露信息猜想

chatgpt2024-10-16 08:17:32193
(1)模型:模型的具体结构、模型的参数量、关键参数(patch size、token数目等)?
参数量在200~ 300亿之间。

(2)数据:用了哪些数据?规模如何?
游戏引擎生成了部分数据。‍‍‍‍‍
(3)资源:用了多少算力?训练了多久?
10万张卡以上,至少一个月以上的时间。‍
(4)如何处理高帧率、时间长、高分辨率的视频?目前主流的视频生成模型都是cascade结构,也就是先生成低分辨率、低帧率的视频,再不断地在时间和空间维度上upsample。不知道Sora是否是直接一次性输出其展示的结果,如果是那样,那又会有多少token呢?
一次性输出。‍‍‍‍‍‍‍

(5)如何解决motion的问题?目前的视频生成模型普遍生成的motion都不太好,最简单的例子就是“人走路”,大部分模型无法生成连贯的、长时间的、合理的人行走的过程。而Sora生成的结果在连贯性、合理性上相比之前的模型都有着断代的领先。那到底是什么促使了这样的结果呢?是模型尺寸的scale up吗?需要scale up到什么size?还是数据的收集和清洗呢?以及要做到什么程度呢?
模型尺寸scale up出来的。‍‍‍


本文链接:https://www.rongxin.vip/openai_sora_51.html

how to use sora openaisora openai使用教程openai sora怎么用sora openai如何使用

相关文章

网友评论