直击OpenAI连续12天狂欢第三日:Sora登场
12月10日消息,OpenAI在今日凌晨两点的发布会上正式发布了人工智能视频生成工具Sora,向全部ChatGPT Plus和Pro用户免费开放。Sora成为独立产品,OpenAI为其专门开设网站Sora.com。
初期将面向美国用户以及国际上的“大多数国家/地区”。用户无需为这项工具支付额外费用,它将包含在现有的付费ChatGPT账户中。
OpenAI官网信息显示,Sora目前并未向全球用户开放,目前已向全球155个国家和地区开放了服务。在首批可使用Sora的国家和地区当中,包括中国台湾。中国大陆及中国香港,以及英国和欧盟国家,都不在名单当中。
目前,ChatGPT Plus收费为20美元/月,ChatGPT Pro收费为200美元/月。Plus用户每月可生成高达50个480p分辨率的视频,或者更少的720p分辨率视频。Pro用户每月可生成高达500个视频,且分辨率更高,视频时长更长。
OpenAI联合创始人、首席执行官山姆奥特曼(Sam Altman)在社交媒体X上发帖称:“大家好,这是Sora,我们的视频生成模型。今天,我们开始了红队测试,并向一群有限的创作者开放了访问权限。这是一个了不起的时刻。”奥特曼在帖子中特别表扬了Sora项目负责人蒂姆布鲁克斯(Tim Brooks)、比尔皮布尔斯(Bill Peebles)和阿迪塔拉梅什(Aditya Ramesh),称他们非常棒,他们和整个团队的工作令人惊叹。
Sora生成视频演示:绚丽圣诞树
OpenAI官网信息显示,Sora的新版本Sora Turbo包括了六大功能:
--Remix:使用Remix替换、移除或重新想象视频中的元素。该功能允许用户描述对视频的更改,Sora完成其余工作。
--Re-cut:寻找并隔离最佳帧,向任一方向延伸以完成场景。
--Storyboard:在个人时间轴上组织和编辑独特的视频序列。该功能允许用户使用时间轴在整个序列中引导具有多个操作的视频。
--Loop:修剪并创建无缝重复的视频。用户可以指定视频循环的起点和终点,Sora 填补空白,创造无缝重复场景。
--Blend:将两个视频合并成一个无缝的剪辑。用户可以将两个视频混合在一起,创建一个全新的场景。
--Style presets:使用预设风格(Presets)创造并分享激发用户想象力的风格。
自该公司在今年2月放出Sora展示片段引发关注后,一直未宣布对公众正式开放的日期,在此之前仅向安全团队、一些视觉艺术家、设计师和电影制作人开放了Sora的使用权限。
从当地时间12月5日开始,OpenAI进入一个持续发布新功能的周期,在12天内将通过12场直播活动发布新产品和功能。在此之前,OpenAI已经发布了ChatGPT Pro计划和强化微调技术。
Sora的工作原理与OpenAI的图像生成工具DALL-E相似,用户只需输入想要的场景描述,Sora便能生成高清视频片段。此外,Sora还能够根据静态图像生成视频灵感,扩展现有视频或填补缺失的帧。
以下是OpenAI在官网发布的题为《Sora来了--我们的视频生成模型从研究预览阶段走出》的博客文章:
我们的视频生成模型开始在sora.com网站上推出。今年年初,我们介绍了Sora,该模型能够根据文本创造逼真的视频,并分享了我们在世界模拟方面的初步研究进展。Sora作为人工智能理解和模拟现实世界的基础--这是开发能够与物理世界互动的模型的重要一步。
我们开发了Sora的新版本--Sora Turbo,它的速度显著快于我们在2月份预览的模型。今天,我们将其作为独立产品在Sora.com上发布,供ChatGPT Plus和Pro用户使用。
专为Sora设计的全新界面
用户可以生成高达1080p分辨率、长达20秒、宽屏、垂直或方形宽高比的视频。用户可以自带素材进行扩展、混音和融合,或者完全从文本生成新内容。
我们还开发了新的界面,使用户能够更容易地通过文本、图像和视频提示Sora。我们的故事板工具让用户能够精确指定每一帧的输入。此外,我们还有特色和最新动态,这些动态不断地用社区的创作进行更新。
Sora 的可用性和订阅
Sora作为Plus账户的一部分,不收取额外费用。用户可以每月生成高达50个480p分辨率的视频,或者更少的720p分辨率视频。对于那些想要更多使用Sora的用户,Pro计划包括10倍的使用量、更高的分辨率和更长的时长。我们正在为不同类型的用户制定不同的收费标准,计划在明年初提供。
我们的部署方法
我们部署的Sora版本有许多限制。它经常生成不现实的物理效果,并且在长时间内对复杂动作的处理上存在困难。尽管Sora Turbo比2月发布的预览模型快得多,但我们仍在努力使这项技术让每个人都负担得起。
我们为什么现在推出视频生成技术,是为了给社会时间来探索其可能性,并共同开发规范和保障措施,确保随着领域的发展,它被负责任地使用。
所有Sora生成的视频都带有C2PA元数据,这将识别视频来自Sora,提供透明度,并可用于验证来源。虽然不完美,我们增加了默认的水印等安全措施,并构建了内部搜索工具,使用技术属性帮助验证内容是否来自Sora。
今天,我们正在阻止特别有害的滥用形式,例如儿童性虐待材料和性深度伪造。在启动时,对人的上传将受到限制,但随着我们完善深度伪造缓解措施,我们打算向更多用户推出这一功能。
我们希望Sora的这个早期版本能够使世界各地的人们探索新形式的创造力,讲述他们的故事,并推动视频叙事的可能性。我们对世界将用Sora创造什么感到兴奋。
OpenAI同时在官网还发布了《Sora使用指南》,全文如下:
以下是一些关于如何遵守Sora的界限,并确保所有使用都符合道德标准、法律要求和OpenAI的使用政策的提示。
1.遵守OpenAI的使用政策
所有Sora用户都已同意OpenAI的使用政策、服务条款和使用条款。这些政策普遍适用于OpenAI服务,旨在确保人工智能技术的安全可靠使用。用户可以在https://openai.com/policies/usage-policies/查看OpenAI的最新使用政策。
Sora目前仅对至少18岁的成年人开放。
1.1 未经许可使用肖像
用户不得创建描绘任何个人肖像的视频,除非得到他们的明确同意。这包括公众人物和私人个体,尽管允许描绘已故的历史人物。即使得到他们的许可,也不允许上传包含18岁以下儿童的内容。
1.2 避免非法内容或可能侵犯知识产权的内容
OpenAI的条款禁止任何可能违反法律的内容--包括以侵犯他人权利的方式使用他人的知识产权。
1.3 不适当和有害内容
禁止Sora用户创建或分发促进伤害的内容。这包括用于欺凌、骚扰、诽谤、基于受保护属性的歧视、儿童性化或促进暴力、仇恨或他人痛苦的内容。这包括但不限于:
--色情内容,包括非自愿色情图像(NCII)和儿童性化内容
--过度的血腥或暴力,包括自残的描绘
--由于其淫秽、暗示性或图形性质,不适合一般观众的内容
1.4 误导性内容
OpenAI的政策禁止使用Sora创建或分发用于欺诈、诈骗或误导他人的任何内容,并且应在视频生成过程中披露人工智能的使用。因此,用户不应:
--传播错误信息或虚假信息
--创建旨在欺诈或诈骗他人的误导性内容
--采取措施掩盖或隐藏视频生成过程中人工智能技术的使用
2.举报违规行为
如果用户遇到自己认为违反OpenAI任何政策的内容,请立即报告。我们严肃对待所有违规行为,并将审查报告的内容,以确保其符合我们的条款和更广泛的OpenAI使用政策。
此前陷入争议
Sora此前主要面向一小群安全测试人员,他们负责测试该模型在错误信息和偏见等方面的漏洞。Reddit用户在今年10月月曾询问过OpenAI高管关于Sora的发布日期,怀疑该模型是否因计算/推理时间或安全问题而延迟。对此,OpenAI的产品负责人凯文威尔(Kevin Weil)回应称:“需要完善模型,确保安全/仿冒等问题得到解决,并扩展计算能力!”
OpenAI在10月份完成了最新一轮融资,从多家投资公司和大型科技公司筹集的66亿美元,估值达到1570亿美元。此外,公司还获得了40亿美元的循环信贷额度,使其总现金流超过100亿美元。这是OpenAI雄心勃勃的成长计划的一部分,该公司正与亚马逊支持的Anthropic、埃隆马斯克(Elon Musk)的xAI、谷歌、Meta、微软和亚马逊竞争,力争在未来十年内,从预计产值将突破1万亿美元的生成式人工智能市场中分得最大的一块蛋糕。
在完成融资的同一个月,OpenAI在ChatGPT中推出了搜索功能,使其能够更好地与谷歌、微软的Bing和Perplexity等搜索引擎竞争,并可能吸引更多原本访问这些网站进行网络搜索的用户。本月初,该公司又聘请了其首位首席营销官,显示出该公司计划增加营销投入以扩大用户基础。
随着Sora的推出,OpenAI正寻求与Meta和谷歌等公司的人工智能视频生成工具竞争。今年1月,谷歌发布了文生视频大模型Lumiere。其他初创公司,如Stability AI的Stable Video Diffusion也提供了类似的人工智能工具。亚马逊也推出了名为“Create with Alexa”的模型,该模型能够根据用户的提示生成短篇动画儿童内容。
继聊天机器人和图像生成器之后,视频可能是生成式人工智能的下一个前沿领域。尽管创意机会将激发一些人工智能爱好者的兴趣,但新技术也带来了严重的错误信息问题,尤其是在全球范围内发生重大政治选举之际。根据机器学习公司Clarity的数据,人工智能生成的深度伪造视频数量同比增长了900%。
OpenAI已将多模态--结合文本、图像和视频生成--作为其提供更广泛人工智能模型套件的突出目标。Sora的发布消息紧随抗议者泄露看似Sora副本的决定之后,他们对ChatGPT制造商对待艺术家的方式表示担忧。
OpenAI的Sora早期访问计划包括约300名艺术家,他们在11月下旬发表了一封公开信,批评OpenAI在开放性或艺术支持方面做得不够,仅限于市场营销。抗议者在公开信中表示:“亲爱的人工智能统治者,我们获得Sora的使用权,承诺成为早期测试者、红队成员和创意合作伙伴。然而,我们认为,我们被引诱进行‘艺术洗白’,以告诉世界Sora对艺术家来说是一个有用的工具。”
信中还提到,数百名艺术家通过错误测试和对Sora的反馈为OpenAI提供了无偿劳动,而“数百人免费贡献,少数人将通过竞赛被选中,让他们用Sora创造的影片放映提供的补偿微乎其微,与OpenAI获得的大量公关和营销价值相比微不足道。”他们表示:“我们并不反对将AI技术作为艺术工具使用(如果我们反对,我们可能就不会被邀请参加这个项目)。我们不同意的是艺术家项目的推出方式,以及该工具在可能公开发布之前的呈现方式。我们向世界公开这一信息,希望OpenAI能变得更加开放,对艺术家更加友好,并在支持艺术方面不只是公关噱头。”(科技新闻特约编译无忌)