AIGC的下一个杀手级应用——视频生成
02-24     浏览量:114
AIGC下一站:视频生成
就在ChatGPT刷屏之际,谷歌AI生成的一段视频突然爆火,一时分走不少讨论度。
背后的AI模型名为Phenaki。只需提供一段提示词,这个文本转视频(Text-to-Video)模型分分钟就能生成长达两分钟的视频。
不仅时长远超早期的文生视频模型,Phenaki生成的视频还颇具故事性。
比如给它这样一段场景描述:
一只逼真的泰迪熊正在潜水;随后它慢慢浮出水面;走上沙滩;这是镜头拉远,泰迪熊行走在海滩边篝火旁。
就能得到一个视频片段
(由于公社不能上传视频 我把截图放这里 视频链接在文章最下)Meta:Make-A-Video
在“拿嘴做视频”这方面,Meta也有所布局。
Meta的文生视频模型名为Make-A-Video,同样是文本图像生成模型的升级版,主要由三部分组成:
文本图像生成模型P
时空卷积层和注意力层
用于提高帧率的帧插值网络和两个用来提升画质的超分模型
不仅给出一句“马儿喝水”,Make-A-Video就能生成出一段“纪录片”画面来
(由于公社不能上传视频 我把截图放这里 视频链接在文章最下)
哪些公司是潜力股?
机会自然属于有准备的人。比如,Image Video的核心团队就已经从谷歌出走创业。据VC爆料,首轮估值1亿美元。而除了前文提到的已有革命性技术储备的科技巨头外,还有两类公司值得关注。
其一,是具备数据基础和应用场景的公司。
在这一方面,行业中的大公司普遍更具优势。比如国外的网飞、迪士尼。
以网飞为例,公开资料显示,在2012年时,网飞就已拥有数十亿条会员评价,每天能新增百万级别的视频播放信息,包括观众的观看时长、播放设备等等。
事实上,基于如此庞大的独家数据,网飞已经在产品中尝试用AIGC替代标准内容制作。比如影片的缩略图,就是网飞采用AI算法,从影片中抽取符合用户观影习惯和需求的画面生成的。
就在今年2月初,网飞还发布了一支AIGC动画短片《犬与少年》。其中动画场景的绘制工作,都是由AI完成的。
同样,国内短视频行业两大巨头抖音和快手的动向,也值得关注。
目前,字节跳动的视频编辑工具剪映,以及快手的云剪,都已上线图文成片、文字转视频的功能。用户只需输入几个关键词或一段文字,AI就能自动搜集素材剪辑出一段视频片段。
其二,就是在垂直细分赛道上具有技术储备的公司。
比如国内的智能视觉技术企业影谱科技,成立之初就是以人工智能视觉技术产业化为主要目标,早在2018年就发布了基于生成式AI技术的AGC智能影像生产引擎,这也是国内较早提出的生成式AI的技术框架。
影谱科技的AGC通过MCVS技术(Moviebook Motion Capture from Video System)对现有视频的关键帧进行抽取,理解、关联及预测等处理,将视频内容分割为像素及子像素维度的结构化数据,并自动完成标记,即形成了对视频中各种内容的自动化理解和标注。接下来,利用3D虚拟重建等计算机图像技术,通过视频内容自动化生产引擎MAPE(Moviebook Auto-Production Engine)生成全新的视频,该方案融合了人工智能多模态语义理解,并利用深度学习实现视频自动化加工以及视频的同步生成,创新了视频影像生产方式。
这使得AGC可在极短时间内生成一段个性化视频内容,亦可以对拍摄视频进行重构,如自动锚定关键帧,根据帧内容生成原图像中没有的、无违和感的内容,再智能化生成一段AI视觉内容。
据公开数据显示,影谱科技AI生成引擎生成一段60s视频的总成本与传统方式相比降低79.8%以上,而生产率最高可以提高百倍以上;检索一段60s视频内相似帧图像或特定图像,所需总成本与人工相比降低99.73%,而错误率降低10倍以上,目前主要应用于政府服务、企业、科教、泛娱乐、媒体、文旅等领域。
002181粤传媒,参股影谱科技。
300612宣亚国际 依托ChatGPT提供智能视频生成服务300264佳创视讯 有视频生成相关专利
在这个过程中,如何抢占先机,将成为中国产业界亟需关注的命题。
至少,像影谱这样的垂直赛道种子选手,就已经得到国资基金的重视:具备国家社保基金、中央企业、国有银行、地方国资等出资背景。并且D轮融资13.6亿人民币,创下人工智能视觉生产领域的中国最高融资纪录。
这一回,我们能否走在世界之先?
ChatGPT之后,下个AIGC杀手级应用已近在眼前 视频点击左方链接