OpenAI放王炸,Sora无限使用!3大新功能,2024最大惊喜!

今天凌晨2点,OpenAI开启了第三天技术直播,正式发布了期待已久的产品——Sora Turbo。

与早期版本相比,Turbo的生成效率更快,能通过文本直接生成最多20秒1080P视频,这是目前全球生成时长最高的视频模型之一,同时支持文本+图片/视频,生成特定视频内容,使得模型的生成效果更加可控。

例如,你想在一段普通的视频中加上梵高《星夜》的效果,只需要上传原视频然后用文本描述就能轻松实现。也就是说,即便你不会使用AE、Nuke、C4D等专业视频软件,通过Sora也能为视频轻松添加特效了。

目前,Sora已经正式进入使用阶段没有任何限制,最让人惊喜的是ChatGPT Plus和Pro会员无需额外费用就能使用,这么良心是万万没想到的。

OpenAI为了更好的让用户使用Sora还开发了全新UI,同时提供社区分享服务,用户可以把自己生成的视频分享给其他人,或者借鉴其他人的提示效果来完善自己作品。

OpenAI放王炸,Sora无限使用!3大新功能,2024最大惊喜!

知名艺术家Emi Kusano通过Sora制作了一个怀旧的日式舞蹈风格视频。虽然还存在一些瑕疵,但整个视频里的人数、颜色复杂程度、物理模拟、场景融合都表现出了非常好的效果。

Emi表示,Sora最神奇的是,可以让她很多只存在脑海中的概念、抽象场景成为了现实,同时在生成的过程中又创造了很多意想不到的场景,帮助她打开了新的创作思路。

一个机器人走在一个赛博朋克风格的街道。

一个充满鲸鱼、鲨鱼的海洋世界。

一只变色龙变成了孔雀。

Sam Altman曾兴奋的说过,今天将是一场非常炸裂的产品发布会。雪藏10个月的Sora终于与大家见面了,没有辜负期望依然是那个能打的王者,2024年生成式AI领域最大惊喜非它莫属。

Sora技术原理简单介绍

Sora的核心技术之一便是对Patch的应用。它允许Sora在大量的图像和视频数据上进行密集训练。从每一个存在的视频中剪出的Patch,可以被堆叠起来并输入到模型中。

这种基于Patch而非视频全帧的训练方式,使得Sora能够处理任何大小的视频或图片,无需进行裁剪。这不仅增加了用于训练的数据量,也提高了输出质量。

OpenAI放王炸,Sora无限使用!3大新功能,2024最大惊喜!

为了进一步提升效率和效果,Sora采用了视频压缩网络,这是一种专门设计用来降低视觉数据维度的神经网络。通过该网络,原始视频被转换成一个在时间和空间上都经过压缩的潜在表示。Sora在这个压缩后的潜在空间内接受训练,并学习如何生成新的视频内容。同时,还训练了一个解码器模型,用于将生成的潜在表示映射回像素空间,恢复为可视化的视频帧。

对于时空潜伏斑块,在获取压缩输入视频后,OpenAI 从中提取出一系列时空 Patch 作为转换标记。基于这种 Patch 表示法,Sora 得以在各类视频和图像数据上进行训练,无论是不同分辨率、时长还是长宽比的素材都能轻松应对。在推理阶段,通过在适宜大小的网格中合理排列随机初始化的 Patch,便能精准控制生成视频的尺寸规格。

在模型架构设计方面,Sora 巧妙地融合了扩散模型与 Transformer 架构。这种融合方式达成了高效且高质量的视频内容生成效果。

同时,Sora 采用创新的扩散式转换器方法,取代了传统的U – Net 架构,这一举措有效提升了对输入图像与文本标签之间分布关系的捕捉能力。Sora 还运用描述性合成描述符展开训练,这些描述符对于模拟现实场景以及规划未来行动发挥重要作用。

OpenAI放王炸,Sora无限使用!3大新功能,2024最大惊喜!

由于训练视频模型对大量带有相应字幕的视频有着强烈需求,OpenAI 将 DALL・E3的重新字幕技术引入到 Sora 体系之中。

首先训练出一个具备高度描述性的字幕模型,接着利用该模型为训练集中的所有视频创建文本字幕。OpenAI 坚信,在这种高度描述性的视频字幕基础上开展训练,能够有效提升文本的保真度以及视频的整体质量。

OpenAI放王炸,Sora无限使用!3大新功能,2024最大惊喜!

与 DALL – E3类似,OpenAI 借助 GPT 将简短的用户提示转换为篇幅更长且内容详细的字幕信息,然后将其传输给视频模型。通过这一系列技术手段的协同运作,Sora 能够精准地依据用户的文本提示,生成高质量的长视频内容。

目前,Sora已经启用了全新域名https://sora.com/ 可以制作各种视频了。

快讯转自站长之家,转载请注明出处

上一篇:

下一篇:

最新资讯

  • 爱思助手无法绑定Apple ID怎么办?

    不少人在用爱思助手的时候,都会遇到一个挺让人头疼的问题:明明 Apple ID 和密码都没错,但就是提示无法绑定,反复尝试也不成功。看着一堆提示弹窗,心态很容易直接崩掉。其实这个问…

    2025年12月24日
  • 苹果系统什么版本最好用

    每次苹果发布新系统,总会有一波人跃跃欲试,也总会有一波人默默观望。升级还是不升级,几乎成了果粉的年度哲学问题。系统版本这么多,到底哪个才是真的“最好用”,其实并没有一个放之四海而皆…

    2025年12月24日
  • 苹果手机丢了怎么追踪手机位置显示离线

    (图片来源网络,侵删) 苹果手机丢了,本来就够闹心了,结果打开“查找”,一看:设备显示离线,那种感觉基本等于心凉了一半。很多人第一反应是——是不是彻底找不回来了?其实不一定,关键要…

    2025年12月24日
  • 苹果手机密码忘记了怎么解开不刷机

    (图片来源网络,侵删) 不少人都有过这种崩溃时刻:手机放桌上好好的,拿起来一解锁,突然发现密码怎么都不对。多试几次,直接被提示“已停用”,这时候再去网上一搜,全是“刷机”“清空数据…

    2025年12月24日
  • 鸿蒙系统跟安卓系统有什么区别?

    这几年只要一聊国产手机系统,鸿蒙和安卓几乎绕不开。很多人会问:鸿蒙系统和安卓系统到底有什么区别?是不是换了个名字的安卓?值不值得用?这个问题网上说法很多,但真正能把差别讲清楚的并不…

    2025年12月24日
  • 手机蓝牙打不开一打开就自动关闭怎么回事

    很多人都遇到过这种情况:想连个耳机、车载或者手表,结果蓝牙刚打开,“啪”一下自己又关了,反复几次都一样,看着就让人上火。其实这种问题并不稀奇,原因也没你想的那么玄乎,大多数都能自己…

    2025年12月24日
  • 电脑运行速度慢的原因及解决方法

    电脑变慢这件事,本质上不是“老了”,而是系统在悄悄给自己加负重。优化的目标只有一个:让系统回到“只干正事、不内耗”的状态。下面给你一套优先级明确、有效且不过度折腾的方案。 (图片来…

    2025年12月24日
  • 腾讯会议怎么使用

    腾讯会议作为一款高效便捷的远程会议工具,已经成为许多企业和个人的首选。本文将详细介绍腾讯会议的使用方法,帮助您轻松掌握这款工具。 (图片来源网络,侵删) 准备工作 在使用腾讯会议之…

    2024年8月6日
  • 微信收款积分在哪里查

    微信收款积分是微信平台上的一种激励机制,用户通过使用微信支付进行收款,可以积累积分,并在微信平台内兑换相应的奖励或优惠。对于很多用户来说,如何查找微信收款积分却是一个令人头疼的问题…

    2024年8月6日
  • 管理员权限在哪里设置

    在许多操作系统中,管理员权限是控制计算机或网络系统中特定功能的关键。拥有管理员权限的用户可以对系统进行更深层次的操作,包括安装程序、修改系统设置等。对于一些用户来说,如何设置管理员…

    2024年8月6日