最近,OpenAI突然发布了第一个文生视频模型——Sora。简单来说,AI视频就要变天了!它不仅可以根据文本指令创造现实和富有想象力的场景,还可以生成长达1分钟的超长视频,或者一面镜子。Runway Gen 2、Pika等人工智能视频工具在几秒钟内仍在突破连贯性,OpenAI已达到史诗纪录。在60秒的镜头结束时,视频中的女主角和背景角色达到了惊人的一致性。各种镜头随意切换,角色保持了上帝般的稳定性。
一名30岁左右的宇航员戴着红色针织摩托车头盔冒险。电影预告片展示了他穿梭于蓝天、白云和盐湖沙漠之间的精彩时刻。独特的电影风格,35毫米的电影拍摄,色彩鲜艳
OpenAI表示,该公司正在教授人工智能理解和模拟运动中的物理世界,旨在培养能够帮助人们解决需要与现实世界互动的问题的模型。在这里,将文本推出到视频模型——Sora。Sora可以生成长达一分钟的视频,同时保证视觉质量,满足用户提示的要求。
现在,Sora正在向一些成员开放,以评估关键领域的潜在危害或风险。与此同时,Open人工智能还邀请了一些视觉艺术家、设计师和电影制作人加入,希望获得有价值的反馈,以促进模型进步,更好地帮助创意工作者。Open人工智能提前分享了研究进展,旨在与Open人工智能以外的人合作,获得反馈,让公众了解即将到来的人工智能技术的新篇章。
Sora模型可以生成复杂的场景,包括多个角色、特定类型的运动、主体和背景的精确细节。该模型不仅能理解用户在提示中要求的内容,还能理解这些东西在现实世界中的存在。该模型对语言有深刻的理解,能够准确地解释提示,并产生表达丰富情感的引人入胜的角色。Sora还可以在单个生成的视频中创建多个镜头,使角色与视觉风格保持准确一致。
在技术方面,OpenAI目前披露的不多,简要介绍如下:
Sora是一种可以一次生成整个视频或扩展视频长度的扩散模型,
关键是一次生成多帧预测,以确保图片主体即使暂时离开视野也能保持不变。
与GPT模型类似,Sora采用Transformer架构,扩展性强。
就数据而言,OpenAI将视频和图像表示为patch,类似于GPT中的token。
通过这种统一的数据表示,可以在比以前更广泛的视觉数据上训练模型,涵盖不同的持续时间、分辨率和纵横比。
Sora是基于过去对DALLE和GPT模型的研究。它使用DALLL·E 重述提示词技术,为视觉训练数据生成高度描述性的标记,从而更忠实地遵循用户的文本指令。
除了根据文本指令生成视频外,该模型还可以获取现有的静态图像并生成视频,准确地移动图像内容并注意小细节。
该模型还可以获取现有视频并扩展或填充缺失帧。请参考技术论文(以后发布)了解更多信息。
OpenAI认为,Sora是能够理解和模拟现实世界的模型的基础,这一功能将成为实现AGI的重要里程碑。
360创始人周鸿祎发文称:【Sora 意味着 AGI实现将从10年缩短到1年]对于OpenAI发布的第一个视频生成模型Sora,2月16日,周鸿祎在微博上表示,这一次,很多人从技术和产品体验上分析Sora。事实上,这些都是外观的。最重要的是 Sora 技术思路完全不同。这一次,周鸿祎说 Openal利用大语言模型的优势 LLM 和 Diffusion 结合训练,让 Sora 实现了理解现实世界和模拟世界的两层能力,使视频真实,跳出来 2D 模拟真实物理世界的范围。这些都是大模型的功劳。周鸿祎认为,Open Al训练模型应该阅读大量视频。一旦人工智能连接到摄像头,再看所有的电影,YouTube 上和 TikTok 再看一遍视频,对世界的理解会远远超过文字学习,一张图比千言万语好,视频传递的信息量也会远远超过一张图,这真的离AGI不远。这不是10年或20年的问题,可能很快就能在一两年内实现。
以下是a股“AI视频”概念股梳理:
新雅达:虽然该公司没有人工智能视频业务,但这一波人工智能视频的流行程度取决于新雅达。新雅达表示,Pika开发团队的创始人之一郭文静是公司实际控制人郭华强先生的女儿。除上述关系外,该公司与Pika无关。(应用程序)
万兴科技:万兴科技很早就布局了人工智能视频领域。万兴发布的“天幕”大模型是中国第一个以视频创意应用为核心的多媒体大模型。通过输入故事摘要,可以通过大模型能力实现新视频内容的完整生成。近日,万兴科技AI视频创作软件Filmora13在东京召开新闻发布会。果麦文化:11月,公司介绍,公司人工智能漫画大模型布局进展顺利,未来将推出动画电影、短剧、互动漫画等。网达软件:根据公司半年度报告的内容,公司继续增加在综合媒体智能生产和视频人工智能行业应用领域的研发投资,研发成本较去年同期增加。(应用)
因赛集团:8月份接受调查时表示,公司国风虚拟人“姜小黄”已接入AI大模型,实现超现实主义,正在接入并用多个AI模型测试虚拟人视频生成功能。(应用)
捷成股份:根据公司半年度报告的内容,公司结合人工智能技术的发展和智能媒体资产管理系统的布局,加强人工智能资产管理领域的技术开发和应用,促进人工智能资产管理 相关技术深入应用于内容创意、影视剧内容制作、短视频创作等领域。(应用)
昆仑万维:公司正式发布了“天工SkyAgents”平台,用户可以在上面创建自己的大模型。公司“All in“人工智能,4月份发布了自主研发的大型语言模型“天宫”,最近转让子公司股权,更好地关注AGI和AIGC业务。目前,昆仑天宫已经形成了六大AI业务矩阵:人工智能大模型、人工智能搜索、人工智能游戏、人工智能音乐、人工智能动画和人工智能社交。(应用)
易点世界:8月份在接受调查时表示,内部测试中也有人工智能电子商务视频广告工具,可以达到广告材料生产效率的10倍。(应用程序)
蓝色光标:8月,蓝色光标全资子公司蓝色宇宙发布了一个在线人工智能视频制作平台——蓝色标准分离,可以降低音频和视频制作的难度。
焦点技术:在5月份的一项调查中,该公司将继续迭代人工智能小麦,并计划在未来版本中增加视频处理、人工智能数字营销和24小时人工智能客户服务。(应用程序)
美亚柏科:公司发布的AI-3300视频图像识别工作站可以检测、识别和识别生成人工智能的生成内容。(测试)
盛天网络:AI+音乐,根据最新调查,Q3有几款海外产品配备了AI歌声进化功能,获得了良好的口碑。(应用)
当红科技:目前,公司已在一些工作室、智能媒体平台等业务上实施AIGC,可通过AI技术为电视台、新媒体、互联网、泛媒体行业等客户提供短视频、长视频的制作/加工等解决方案。包括:AI智能编辑;AIGC自动生成相应的短视频,大大简化了流程,提高了效率,保证了视频上线的及时性(应用程序)
国科微:公司布局的AI视觉处理芯片主要用于机器视觉领域。在视频编码系列芯片市场,公司将继续推进视频编码系列芯片的研发,实现目标检测、目标跟踪、目标分类和行为分析,以大数据分析为代表的智能信息分析技术,实现恶性攻击预警、流量控制等应用,提高视频编码系列芯片的研究和产业化水平,支持我国人工智能芯片产业的快速发展。(芯片)。(芯片)。主题逻辑说。
10月10日,上交所再次举行券商座谈会,现场宣讲并购重组最新政策精神,并就进一步活跃并购重组市场、打通政策落地“最后一公里”听取意见建议。中信证券、中金公司、中信建投、华泰联合、国泰君安、国信证券、东方证券、广...
来源:券商中国作者:时谦今天早盘,A股市场波动较大,但经过一段下挫之后,很快就被多头拉起。而从盘面来看,以代码601开头的大盘蓝筹股(亦是高股息板块)今天表现非常突发,红利ETF大多涨幅在4%左右水平。那么,究竟又是何逻辑呢?分析...
中字头及红利资产全天保持强势,沪深两市交易量连续第4日突破2万亿元!市场对后续政策的期待仍在升温。今日(10月10日),A股三大股指走势分化,截至收盘,上证指数涨1.32%,深证成指跌0.82%,创业板指跌2.95%。全市场个股涨多跌少,超30...
要点1通化东宝控股股东所持股份质押率高遭质疑,公司董事长李佳鸿称,系东宝集团投资项目周期长造成;要点2业绩方面,李佳鸿预计称下半年公司营收将逐季恢复;要点3公司还对新产品销售情况做了介绍。财联社10月10日讯(记者 何凡...
要点1海外市场需求持续旺盛,赛轮轮胎预计公司前三季度业绩同比增约六成;要点2天然橡胶、炭黑、合成橡胶等生产原材料均有涨价,为应对成本压力,多家轮胎公司宣布产品涨价。财联社10月10日讯(记者 肖良华)海外市场需求持续旺...
本文“OpenAI发布第一个文生视频模型——Sora”由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们!