文章主题:AIGC, 剪映, AI视频
抖音CEO离任,奔赴AIGC视频新风口
佳麒 白交 发自 凹非寺
量子位 | 公众号 QbitAI
抖音集团CEO官宣卸任,真是一石激起千层浪!
一方面,虽然字节高层要调整早有传闻,但靴子落地依然让人意外:为什么会是她?
要知道张楠,可是字节从零到一打造出抖音、火山等UGC视频产品的大功臣。
另一方面,她下一步去的是一个抖音“配件”项目——剪映,并且以始终创业的状态。
虽说变动如此突然,但其实在内部早有迹可循。
消息称,过去一年张楠将大多数精力都放在剪映任务上,并且亲自带队即将推出一个AI生图和视频的产品。
抛开外界各种对大厂组织调整的讨论,咱要是从技术和趋势来看,张楠下一站,妥妥是今年的AI风口。
张楠亲自带队剪映
春节前夕,张楠朋友圈官宣即将卸任CEO的决定,之后将更多精力放在剪映上。
不过之后,她还是继续向字节跳动CEO梁汝波汇报。
🌟【重大变动】抖音巨头CEO张楠卸任,聚焦剪映背后的故事🚀💡梁汝波的内部信透露出一个关键转折——基于业务战略调整与个人职业规划,张楠做出了决定性的角色转变。👑👀曾经引领抖音风潮的领军人物,如今将重心转向了剪映平台,这无疑是对内容创新和用户服务深度挖掘的一次聚焦。🔍💼尽管离开了CEO的高位,但张楠的影响力和对抖音未来布局的影响依然深远。他的专注与决心,将继续推动这个短视频帝国稳步前行。🚀📝让我们期待这位行业精英在新领域如何书写新的篇章,同时也为抖音集团的未来发展注入更多活力。🏆#张楠离职 #抖音转型 #剪映战略
对于接任者,他表示,目前抖音集团暂时还没有新设CEO的计划。
🌟【重要变更通知】🌟各业务领域的专业人士现在直接向行业巨头抖音的掌舵者张利东阁下汇报,他的商业智慧与战略眼光无人能敌。在这个紧密的团队中,我们尊享重量级人物——抖音首席执行官韩尚佑、内容创新翘楚番茄小说负责人张超,以及信息传播巨擘今日头条的代表张超。电商领域的领军人物魏雯雯和生活服务版块的先锋浦燕子,他们的专业洞察力为公司的发展注入强劲动力。最后,广告业务的大师赵修影,以其精准营销策略引领潮流。请注意,所有沟通将以促进业务增长和提升品牌价值为目标进行。让我们共同携手,利用抖音这个平台的无限可能,共创辉煌!🌟
其中,韩尚佑作为抖音总裁,会协同所有与抖音相关的主营业务
此番字节高层变动之后,据晚点统计,目前抖音已完成高层大调整。
此前抖音的产品和商业化分别由张楠和张利东领导,如今由张利东来统筹这两大板块。
🌟【揭秘】抖音动作连连!🌟🚀 作为短视频巨头的摇篮,抖音近期迎来了一系列高层人事调整,展现出其持续创新与战略布局的决心。🚀💼 首先,重量级人物陈都烨,字节商业化领域的领军人物,已从巨量引擎营销副总裁的位置上,巧妙地转战至抖音,为品牌故事的讲述注入更强动力。💼🎨 吴晓丹,曾引领抖音增长飞速发展,如今她的角色转变,无疑将为平台内容的丰富与用户粘性提升带来新的火花。🎨🛠️ 常坤,这位抖音开放平台的老手,也加入了抖音生活服务部门,他的到来预示着抖音在社区生态和商业化融合上的深度探索。🛠️👀 这一系列变动不仅彰显了抖音内部的高效运作,也透露出其未来可能的发展方向与战略调整。👀欲了解更多抖音动态,敬请持续关注!🚀#抖音人事 #商业策略 #内容创新
抖音为什么调整?
有网友将字节前段时间的年会结合了起来……
当时,梁汝波提到,目前字节最大的危机感就是组织平庸化,“字节该有的大公司病全有了”。
🌟认知升级!🔍探索AI新领域——字节跳动的创新挑战与机遇💡在科技日新月异的浪潮中,一个可能被忽视的焦点正悄然显现:字节跳动,这个全球数字巨头,正面临着AI技术革新带来的双重考验与无限可能。💥🔥焦点转向AI生成视频——剪映,字节的闪耀之作🌟在这个信息爆炸的时代,AI技术赋予了内容创作前所未有的灵活性和效率。👀 以剪映为例,它不仅是一款热门短视频编辑工具,更是字节在AI视频生成领域的重要试验田。💻💡挑战与机遇并存——拥抱变革,引领潮流🌈面对AI的崛起,字节如何确保其在这个领域的领先地位?无疑,这需要敏锐洞察市场趋势,创新技术应用,并将用户需求无缝融入产品中。🎯 作为行业领头羊,字节跳动正以剪映为桥,连接现实与未来,书写科技与人文的交汇篇章。📚SEO优化提示:AI生成视频、字节挑战、机遇、剪映工具、技术创新、用户体验等关键词
剪映有着天生的AIGC场景优势。
✨【新兴力量崛起】虽短期崭露头角,🌟2019年的璀璨亮相让其迅速跻身短视频创作领域的佼佼者。得益于抖音的强大平台支持,这款工具犹如磁铁般吸引了众多国内外内容创作者,不论是抖音红人还是新兴博主,都将其视为提升内容影响力的重要武器。短短时间内,它已建立起稳固的地位,成为视频生态中不可或缺的伙伴。🌍
🌟【国内顶尖】剪映月活破亿,移动视频编辑巨头!🚀🔥2021年辉煌数据见证,剪映以惊人的1亿月活跃用户数,稳居国内移动视频编辑领域的巋然地位。🏆👑去年11月,剪映的创新步伐更进一步,悄然推出了“AIGC梦工厂”——“Dreamina”,一个令人惊艳的文字图像生成利器!🌈🔍这款强大的工具,凭借其AI技术的强大引擎,只需寥寥文字,就能瞬间转化为富有创意的独特视觉表达。✨💡无论是内容创作者还是普通用户,都能感受到剪映带来的便捷与创新力量,它不仅满足了大众的视频制作需求,更引领了行业的新潮流。🔥欲了解更多关于“Dreamina”或剪映的精彩,敬请关注我们后续的深度解析和使用指南。📚#剪映#移动视频编辑#AI创意生成
UGC视频的一姐,现在去带队字节AIGC视频的最前沿战队,或许也值得关注。
视频生成,AIGC的新战场
相信使用过的朋友都能感受到,剪映其实就是个“大AI”。
语音识别/生成、文本生成、虚拟人生成、AI配音等等这些基本实用的AI功能暂且不说,并且还会时常更新。
比如就有贴心的小伙伴整理了最新版本的新功能,像时空穿越特效、古风穿越特效、文字转视频、主题(标题)变视频、智能抠图、视频转手绘等等。
除此之外,剪映还同ChatGPT合作,选择他们的插件,一句话就可以做一条视频,并且支持各种细节修改。
处在AIGC视频生成风口的关键时刻,作为国内乃至全球短视频应用的顶流,无论是剪映、抖音还是背后的字节,这样的机遇当然不容错过。
而AI视频领域争斗变得愈加白热化,是从“老大哥”Runway发布Gen-2以后开始的。
无论是初创团队还是大厂,琳琅满目的视频生产工具如雨后春笋般竞相发布。
在竞赛的过程中,AI视频的画质、细节、时长等指标,快速地进行着一次又一次地飞跃。
像Stability、Runway这样的明星独角兽,估值都已达到了10亿美元量级,受到了谷歌等大厂的投资。
创立时间短一些的Pika,估值也有2亿美元,投资者中可以见到许多大佬的身影。
而在这些爆火的AIGC视频应用背后,主要有三条技术路线。
按照出现的时间顺序,首先是生成对抗网络(GAN)和变分自编码器(VAE)。
它们往往是通过非直接方式来生成视频内容,比如将运动和内容分解、把前景(移动物体)和背景分离。
这类早期方案虽然在清晰度、连贯性和时长上都不尽如人意,但也起到了抛砖引玉的作用,AI视频生成也是被GAN带火的。
△微软视频生成工具NüWA,早期版本基于GAN实现
进入新的阶段,自回归模型和扩散模型两条路成为了新的主流。
自回归模型根据先前的帧来预测下一帧,不断递归拼接,视频较为连贯自然,最典型的架构就是Transformer。
2021年,罗格斯大学的学者发表了首篇Transformer架构视频生成工具的论文,并被ICML所收录。
后来,新版本的NüWA模型也从GAN切换到了Transformer架构。
扩散模型的概念则最早在2015年的ICML上被提出,但直到2021年下半年,“Stable Diffusion”的前身“Latent Diffusion”才真正让扩散模型火了起来。
它的基本原理是通过逐步添加噪声和去除噪声来生成图像,生成图像的真实性高、细节更为清晰。
到2022年4月,扩散模型正式被谷歌应用到了视频生成领域,推出了Video Diffusion模型成为新的文生视频SOTA。
直到现在,AIGC视频领域的头部选手,大多都已采用Transformer或扩散模型作为底座。
而放眼AI视频生成的战场,不得不提的就是老牌厂商Runway了研发的Gen-2了。
Gen-2生成视频的效果已经克服了以往“一眼AI”的缺点,分辨率也达到了4k,是众多视频生成工具中清晰度最高的。
时长上,Gen-2可以一次支持18秒的长度,这在AI视频生成工具中也是前所未有。
Runway创始人兼CEO Cristóbal Valenzuela更是在?中表示,一个激动人心的新(创意)时代已经要开始了。
而在去年,Runway也迎来了一位强悍的挑战者——斯坦福华人博士郭文景(Demi Guo)休学创业做出的Pika。
它可以根据输入的图像或文本流畅地生成视频,而且可编辑性强,指定视频中的任意元素均可快速替换。
靠着Pika惊艳的效果,这家初创公司成立仅半年时,就新斩获5500万美元(约4亿人民币)融资。
其中个人投资者不乏各种大牛,如Quara创始人Adam D’Angelo、Perplexity的CEO Aravind Srinivas、GitHub前CEO Nat Friedman等等。
开源模型则有Stable Diffusion团队推出的Stable Video Diffusion,支持生成约3秒的视频,分辨率为576×1024。
除了这些专搞AI视频的初创团队,巨头大厂们也纷纷参与进了这场战争。
比如Meta于去年11月发布的Emu Video,同样支持4K画质的视频合成,在用户评估中号称打败(当时的)Gen-2、Pika等对手。
谷歌也在12月交出了自己的模型VideoPoet,它没有用常用的扩散模型,还零样本实现了SOTA。
相较于此前一些模型,画面更加稳定、动作更加逼真,清晰度也直线up。
就连主要经营硬件产品的英伟达,也推出了基于扩散模型的视频生成工具PYoCo,并被2023年的ICCV大会所接收。
不仅国际市场上的斗争火热,国内这边也同样激烈。
比如今年1月,字节就推出了AI视频生成模型MagicVideo-V2,支持4K、8K超高分辨率,测评效果超过Gen-2、Pika以及现有AI视频生成工具。
有研究者对比了MagicVideo-V2和其他大牌工具的表现,以细节写实能力为例:
小男孩在公园的小路上骑着自行车,车轮踩在碎石上发出嘎吱嘎吱的声音。
可以看出只有MagicVideo-V2和SVD生成的视频最贴合提示词,但MagicVideo又以更真实的脚步动作胜过了SVD。
(左:MagicVideo-V2,中:Stable Video Diffusion,右上:Pika,右下:Gen-2)
从2013年VAE诞生,到2020年被Transformer和扩散模型取代用了近7年,但新的模型蓬勃发展,不过才三年时间。
而像这样“长江后浪推前浪”式地竞相更新,更是最近这半年才有的事,这半年一个又一个模型相继涌现的过程中,几乎每个成果都可以说是颠覆性的。
在这样的浪潮当中,抖音当然不想成为被颠覆的一个,所以最好的方式,就是在被外部力量颠覆之前,实现自我颠覆。
字节把张楠从抖音一姐的位置换到剪映一姐,或许就是这个思路的一种反映。
— 完—
点这里?关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
责任编辑:
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!