OpenAI,又出“大招”
金钱解码者
2024-06-05 23:16:22
0

  一句话生成一段高清视频,OpenAI再次给业内带来震撼。

  2月16日,OpenAI正式发布了首款文生视频大模型Sora,范例视频一经发布迅速引发业内热议,其接近商业化的水准的运镜呈现能力让网友直呼,“又有一个行业的人要失业了”。

高稳定性AI视频

  2月16日,据相关媒体报道,美国人工智能公司OpenAI发布了首款文生视频模型——Sora。

  随着此消息一起发布的,还有一段时长为1分钟的范例视频。

  这段视频采用一镜到底的方式拍摄,值得关注的是,不同于此前许多AI大模型文生图时,人物形象前后不一致,此次OpenAI的视频大模型中女主角、背景人物,都展现了极强的一致性。

  并且在随后公布的多段AI生成的视频中,无论镜头如何切换,人物前后都保持了高度的稳定性。

  据OpenAI官网介绍,此次大模型“通过一次性为模型提供多帧的预测,我们解决了一个具有挑战性的问题”。据了解,此次大模型完美继承DALL·E 3的画质和遵循指令能力,能生成长达1分钟的高清视频。

  对于此次新发布的大模型,OpenAI的创始人山姆·阿尔特曼(Sam Altman)显然也自信满满,他在社交平台上发布多条动态推荐,还亲自下场为网友生成视频:“你们随意来prompt,我一一输出。”

  “从图片到视频是大模型技术的一轮提升。”一家国内大模型厂商工程师告诉记者,由于此前的AI文生图都具有一定随机性,因此若一帧一帧生成视频很容易出现主体人物前后不一致的问题。

  而从此次Sora展现出来的超强稳定性来看,这款大模型从技术上应该实现了重要突破。

  对于技术,目前OpenAI方面并未做过多的透露,从其官网简介来看,Sora是一种扩散模型,从噪声开始,能够一次生成整个视频或扩展视频的长度。关键之处在于一次生成多帧的预测,确保画面主体即使暂时离开视野也能保持不变。

  同时,与GPT模型类似,Sora使用了Transformer架构,有很强的扩展性。在数据方面,OpenAI将视频和图像表示为patch,类似于GPT中的token。

商业性令人期待

  自去年大模型热潮兴起以来,围绕大语言模型,国内外的厂商推出了大量相关的大模型应用。不过从目前来看,除了对话类的大模型外,大部分大模型在商业上的性能均有待提高。

  而此次OpenAI的新模型则让业内看到了文生视频系大模型商业化的前景。此次Sora在范例演示中展现的多种性能已经非常接近视频工业中的日常需求。

  其一便是多机位的灵活切换。

  记者注意到,在此次演示的多段视频中,从手持相机视角到无人机空中俯拍,Sora生成的视频可以自动采用多机位、多景别的拍摄手法。而相比之下,此前的AI视频大模型大都只能以一个机位固定演示视频。

  机位与景别的灵活切换,意味着Sora对指令语言有着更为深刻的理解,能够准确从用户的文字指令中提取需求,并将这些元素在现实的复杂环境中自然呈现出来。而这甚至包含了一些现实世界中物理法则的自然运用。

  另一方面,Sora展现的超强学习能力,令其在动画方面展示出“无师自通”的天赋。

  在此次放出的示范视频中,有一段指令为“一个短毛绒怪物跪在一支红蜡烛旁的动画场景”的视频令人印象深刻。

  根据这段指令,Sora生成了一段类似于皮克斯动画电影中的怪物形象。而在这段3D动画中,Sora展现了对动画毛发特性与纹理的惊人理解。

  而要知道,作为3D动画中极为重要的一部分,毛发的渲染一直是行业里“费事费力”的一环。公开报道显示,皮克斯动画作品《怪兽公司》曾经花费数月的时间只为渲染出动画中怪物自然飘逸的毛发。

  而如今,Sora能在短短数分钟之内完成这一工作。

  该项目的研究科学家Tim Brooks表示,“这并非我们预先设定的——它完全是通过观察大量数据自然而然地学会的。”

  不过,记者也注意到,目前Sora在部分细节的生成上依然存在问题,如会凭空生成目标。同时对于一些复杂的物理场景,Sora也可能会生成错误的物体,如沙滩上浮空的塑料椅子等。

  OpenAI表示,Sora将首先提供给网络安全教授,以评估产品的危害或风险。一些视觉艺术家、设计师和电影制作人也能获得Sora的访问权限,以此收集关于创意专业人士如何使用Sora的反馈。

相关内容

无50万也能轻松投资港股:...
title===>无50万也能轻松投资港股:省钱攻略[field]...
2024-12-18 22:54:53
牛股宝:精准选股,助你投资...
title===>牛股宝:精准选股,助你投资无忧[field]bo...
2024-11-24 23:21:17
香港40岁男子夜间无证驾驶...
8月23日晚,香港街头有人驾车撞向其他车辆,致警员受伤一事引发关注...
2024-11-19 22:03:10
港亚控股(01723)发布...
智通财经APP讯,港亚控股(01723)发布截至2024年3月31...
2024-10-14 23:02:39
护航企业出海!广州举办中小...
8月30日,由中国商业股份制企业经济联合会、中小企业合作发展促进中...
2024-10-11 22:58:18
腾讯金融科技Q2毛利率提升...
作者:周梦梅腾讯控股交出一份靓丽的中报答卷。8月14日晚间,腾讯控...
2024-10-08 21:51:48

热门资讯

炒股平台大比拼:哪个平台更胜一... title===>炒股平台大比拼:哪个平台更胜一筹?[field]body===>在当今的投资市场,...
金活医药集团(01110HK)... 格隆汇8月30日丨金活医药集团(01110.HK)宣布,储小平获委任为独立非执行董事、提名委员会、薪...
鸥玛软件(301185SZ)发... 智通财经APP讯,鸥玛软件(301185.SZ)发布2024年半年度报告,报告期内公司实现营业收入1...
太平洋:给予苏垦农发买入评级,... 太平洋证券股份有限公司程晓东近期对苏垦农发进行研究并发布了研究报告《中报点评:土地资源优势进一步扩大...
北京车展:奇瑞探索06 C-D... [北京车展]2024北京国际车展已正式开幕,奇瑞汽车推出全新探索06 C-DM车型,该车在探索06燃...
苏醒与小11岁廖语辰正式官宣!... 苏醒是一位实力派的歌手,曾经参加过《超级男声》《我是歌手》等多档音乐节目,拥有众多粉丝。廖语辰是一位...
5年总统任期届满,泽连斯基不选... “520”这天发生的大事不少,先是伊朗总统莱西坠机身亡,紧接着国际刑事法院对以色列总理内塔尼亚胡发布...
河南博物院基本陈列,《泱泱华夏... 第三展厅宅兹中国——西周时期(公元前1046年-前771年)古代统治者认为王者须在天地之中建造自己的...
走进华农“开学安全第一课”:禁... 9月5日,南都记者走进华南农业大学“开学安全第一课”的现场,来自公安、消防等部门的“老师”为学校近万...
茂业商业(600828)股东深... 证券之星消息,茂业商业(600828)8月14日公开信息显示,股东深圳茂业商厦有限公司向中国光大银行...