文章主题:
AIGC听起来这么好,那跟Web3会有什么关系?大概有这几个方向值得关注。
🎨✨AI绘画新力作《太空歌剧院》在今年9月的科罗纳州博览会上大放异彩,荣获艺术一等奖,瞬间成为众人瞩目的焦点!随着AI技术在创意领域的不断突破,一系列AIGC项目频频斩获融资青睐,背后的秘密是什么呢?🤔近期,我们深入探究了AIGC(Artificial Intelligence Generative Creativity)的发展脉络,它正以惊人的速度改变艺术和创新的格局。🔍这些应用不仅展现出超凡的艺术想象力,还通过机器学习赋予作品独特个性,让传统与科技无缝对接。🖼️AIGC的独特之处在于其强大的生成能力,能够根据指令或数据自动生成多样化的视觉内容,无论是细腻的人物肖像还是宏大的宇宙场景,都能栩栩如生。🌍而且,它在版权保护和创作自由之间找到了平衡,为艺术世界带来了新的可能。📝随着投资者的持续关注和艺术家们的积极尝试,AIGC项目正逐步成为投资和创新的新热点。🌟未来,我们期待看到更多这样的创新成果,引领艺术与科技的深度融合,开启一个全新的创意时代!🚀
什么是AIGC?
🚀互联网内容进化论:PGC→UGC→引领未来的AIGC🔥从Web1.0的黄金时代起,PGC(专业内容大师)主导了内容生产,文字与视听盛宴犹如专业灯塔,保证了信息质量的熠熠生辉。随着Web2.0的浪潮,UGC(用户创意无限)崛起,每个角落都可能成为内容创作者,丰富多样成为其显著标签。而现在,AIGC(AI引领创新)正引领潮流,以自动化和效率著称,AI生成的内容如雨后春笋般涌现,文字、图片、音频、视频乃至3D模型与代码,皆由算法一手打造。NLG技术的突破让这一切变得可能,AIGC的力量不容忽视。在元宇宙这片数字原生土地上,AIGC的角色愈发关键——它将极大地推动内容创新,帮助编织海量的数字艺术,为元宇宙的繁荣奠定坚实基础。🚀请注意,以上内容已根据要求进行了改写和优化,保留了主要信息,同时避免了直接复制原文。SEO友好且易于理解,同时也增添了恰当的表情符号以提升可读性。
AIGC底层技术突破
🎨💻底技术革新引领AIGC商业化飞速发展!GAN虽曾尝试绘画,但图像波动大、分辨率有限。直到🌟2021年,OpenAI团队慷慨分享深度学习模型CLIP,点亮了AI艺术的新篇章。今年7月,Diffusion扩散模型的横空出世,更如魔法般提升了图文生成的精度与细腻度。🎨💻这些创新技术的融合,让AI创作力飞跃,优质内容触手可及!SEO优化提示:#AIGC商业# #深度学习艺术# #AI图文生成
🎨 Diffusion, a noise-reduction art form, employs a unique approach by gradually introducing disturbances to images, transforming them into a chaotic landscape of pure noise.而后, like a masterful artist, AI reconstructs the original picture from this blank canvas, learning to paint through the intricate process of restoring clarity. 🧬 Each step reveals hidden details, revealing the beauty in the restoration journey. 🔍 By optimizing for SEO and incorporating relevant keywords, we can enhance the narrative’s appeal, inviting readers to witness the magic of image recovery with every pixel. #DiffusionModel #ArtificialIntelligence #ImageRestoration
🌟CLIP, OpenAI’s game-changing 🤖发布于2021年初,引领了多模态研究的革新浪潮!🚀它以卓越的神经网络技术,将文字与图像世界无缝对接,通过深度学习的强大引擎,对语言和视觉进行精准解析。🔥不断优化内部参数,让两者紧密融合,实现文本与图像无瑕匹配的奇迹。这款模型不仅展示了AI在理解复杂信息方面的强大能力,也为未来的创新打开了无限可能。🌍无论你是文字爱好者还是图像专家,CLIP都是你探索多模态交互的理想工具。💻想要了解更多关于如何利用它来提升内容质量和优化SEO的策略?我们随时为你提供深入解析和指导!📚欲体验CLIP的魅力,只需关注相关研究动态,让我们一起见证科技的力量如何塑造未来媒体世界!🌐
🎨🚀AI文字创作力惊人:诗作、邮件、广告样样精通!今年,虚拟人度晓晓用AIGC技术一鸣惊人,1分钟内生成40多篇高考作文,分数高达48分,亮眼成绩超过75%考生!🏆🔥引领潮流的GPT-3模型,OpenAI的瑰宝,如今已商业化飞速发展。OthersideAI、Copy.ai和Jasper.ai等创新项目崭露头角,自动撰写邮件与广告文案,用户量暴增,融资不断。11月16日,知识管理神器Notion也不甘示弱,推出Notion AI,紧跟GPT-3步伐,Alpha测试已开启,引领内容协作新风尚!🚀记得关注这些AI生成文字的革命性工具,它们正以惊人的速度改变着我们的创作方式。SEO优化的关键词:AI生成、GPT-3模型、商业化应用、内容协作平台、Notion AI。
在AI生成图片方面,今年AI作画水平突飞猛进,其背后的算法模型也在不断迭代,年初推出的Disco Diffusion只能生成粗糙的图片,4月OpenAI发布的DALL-E2代已经可以生成完整的人像和图片,到8月StabilityAI发布的Stable Diffusion模型取得质的突破,已经可以生成可以媲美专业画师的作品,生成图片的效率也从年初的数小时到现在的几分钟甚至数十秒。
在AI生成音频方面,10月11日,AI播客Podcast.ai生成的一段关于乔布斯和美国知名主持人乔·罗根之间的20分钟访谈播客在科技圈广为流传,在播客中乔布斯谈到自己的大学时代、对计算机、工作状态和信仰的看法,整个播客听起来毫无违和感,基本做到以假乱真。
在AI生成视频方面,目前AI生成视频的算法模型还未成熟,也还没出现一家独大的局面。9月底Meta公布了AI制作视频工具Make-A-Video,Google也紧接着发布了Imagen Video和Phenaki。Make-A-Video具有文字转视频、图片转视频、视频生成视频三种功能。仅仅通过文本描述,Phenaki就可以生成一段情节连贯的视频。10月9日B站上的UP主“秋之雪华”公布了全球首个AI绘图、AI配音的动画《夏末弥梦》的DEMO,其画面精美程度不输专业画师的作品。
但PANews观看该DEMO后发现,动画中人物几乎是静态的,只是在场景切换时换了个另一张图,由此可以看出目前AI生成视频中动画的过度和连贯性技术还不是很成熟,因为AI生成视频需要多个AI模型来配合完成。
从技术上看,视频是把多张图片有逻辑和连贯的组合在一起。由文字生成视频,首先要生成多张图片,然后还要把这些图片有逻辑和连贯性的组合起来,因此难度比文字生成图片高了很多,如果一旦像文字生成图片那样能够高效率的生成高品质视频,将对内短视频、影视、游戏、广告等内容生产行业带来重大影响,不仅提升视频制作的效率和成本,还能帮助设计师产生更多的灵感和创意,让视频内容行业变得更加丰富和繁荣。
在AI生成3D方面,以往的“3D建模”需要利用三维制作软件通过虚拟三维空间构建出具有三维数据的模型,技术要求比较高,需要懂美术、熟悉3DMAX和Maya等软件,还需要大量的时间去人工绘制。但UC Berkeley 的几个博士后发表的论文神经辐射场技术(NeRF)可以把全景相机拍摄的视频自动渲染为3D场景,减少了人工3D建模的过程,NeRF技术在2020年的 ECCV (欧洲计算机视觉国际会议) 提出, 并在2021年的ACM(美国计算机协会)获了荣誉提名奖。著名VR科技博主Robert Scoble 7月在他的Twitter发布了这个视频,他用NeRF技术渲染Insta360全景相机所拍视频后得到的3D场景,效果令人惊叹,预计会有相关项目将NeRF技术进行商业落地尝试,对于这点非常值得期待。
AIGC领域重要项目
今年加入AI作画赛道的公司越来越多,今年分别出现了Mid Journey、DALL-E2、Stable Diffusion、Tiamat、百度文心等多家AI作画公司,以及JasperAI、CopyAI这样的AI文字项目。
从融资角度来看,目前AIGC有3个商业化的方向:
第一个方向是通过AI生成文字,比如自动写邮件和广告营销文案,这要归功于OpenAI的GPT-3 AI语言模型,目前大多数AI生成文字类项目都使用该模型。
第二个方向是利用AI作图,主要技术是结合多模态神经语言模型CLIP和图像去躁扩散模型Diffusion,仅仅提供一些关键词描述就可以自动生成图片。
第三个方向是AIGC的底层技术模型开发,OPENAI和StableAI 是这个方向的龙头,也是融资金额最大的。
预计接下来AIGC的热门方向可能是用AI生成视频和动画,这就看Meta、Google的AI视频模型能不能解决视频的连贯性和逻辑性问题,或其他公司提出更好的解决方案。
OpenAI/GPT-3, OpenAI是由马斯克和Y-Combinator CEO Sam Altman于2015年成立的一个非营利组织,但2019 年马斯克离开了OpenAI ,紧接着微软注资 10 亿美元将其变为营利性公司,并与微软的云计算平台Azure展开合作。最近微软正在对OpenAI进行新一轮的投资进行后期谈判,目前估值已经达200亿美金。GPT-3是OpenAI于2020年5月推出的自然语言处理模型,支持用户仅输入一些关键词就能生成一封邮件、文章或新闻,甚至是小说,它是目前最成熟的自然语言生成技术NLG之一。今年4月OpenAI还推出了DALL-E2项目,允许用户通过文本生成图像,成为目前主流的三大AI作画应用之一。
StableAI /Stable Diffusion,10月17日英国的Stability AI宣布以10亿美元的估值完成1.01亿美元融资,此次融资由 Coatue 和 Lightspeed 领投。消息称Stability AI正准备下一轮 10 亿美金的融资,本轮融资Google可能会参与,如果投资成功,相信Google将会和StableAI深度合作。Stability AI成立于2020年,由去中心化组织EleutherAI支持开发,其理念是“AI by the people, for the people”。StableAI主要研AI生成图片、音频、视频和3D的模型,其研发的开源AI作图模型Stable Diffusion在2022年8月一经推出就立刻吸引了大家的眼球,在Stable Diffusion的Dream Studio测试版网站中只要输入文字描述,它就能生成一副可以媲美专业画师的图片,Stable Diffusion是开源产品,一些AIGC项目对其进行了二次开发,退出了包括图像、语言、音频、视频、3D、生物AI等模型。
Midjourney:Midjourney是一款可以和Stable Diffusio以及DALL-E2媲美的AI绘画工具。Midjourney是部署在Discord上的应用,在Discord里输入文字,一分钟就可以生成对应的图片,目前其官方Discord已经拥有140万用户,其免费版本能生成的图片数量有限,超出数量需要付费订阅,如果想体验一下Midjourney作图可以查看这个教程。
OthersideAI:OthersideAI主打利用AI自动回复邮件,底层技术采用OpenAI的GPT-3 协议,OthersideAI曾获得Madrona Venture Group领投的 260 万美金种子轮融资,Madrona Venture Group曾参投过Amazon 的早期种子轮融资。 OthersideAI 的操作非常简单,只要输入邮件内容的关键要点,它就可以为生成一封完整的邮件。
CopyAI:Copy.ai 是一个通过AI来写作广告和营销文案的创业公司,它可以帮助用户几秒钟内生成高质量的广告和营销文案,主打 ToB 商业场景,它的底层技术也是采用OpenAI的GPT-3 协议。目前Copy.ai的用户包括像微软、Ebay 这样的大公司。Copy.ai 曾获得 Craft Ventures 领投的290 万美金种子轮,A 轮融资 1100 万美金,由Wing Venture Capital 领投,红杉资金及Tiger Global 跟投。
JasperAI:Jasper.ai 成立于2020年,通过 AI 帮企业和个人写营销推广文案以及博客等各种文字内容(和Copy.ai 类似),其底层技术也是 GPT-3。Jasper.ai 10月以15 亿美金估值完成了 1.25 亿美元的 A 轮融资,由 Insight Partners 领投,Coatue、BVP以及 IVP 跟投。今年1月推出第一个版本后,很快受到欢迎,短时间内获得了数百万美元的收入。
Play.ht :Play.ht 是一个 AI 文本转换语音应用,在今年9月发布了第一个语音模型 Peregrine,包含数千种说话的声音,可以学习人类的语气、音调和笑声。再进生成采访乔布斯播客的Podcast.ai就是采用Play.ht语音模型,它通过大量采集网络上关于乔布斯的录音,然后进行训练,最终生成假乔布斯的声音,相似度非常高。
Notion AI: 刚刚于本月16日公布的Notion AI是知名知识管理和内容协作平台Notion基于OpenAI GPT-3模型开发的AI文字生成工具。目前Notion AI的功能包括自动撰写文章、广告文案和播客;通过头脑风暴为用户提供创意建议;自动检查文字拼写和语法错误;自动翻译文章;目前Notion AI以白名单的形式开放Alpha版本测试。
AIGC如何助推元宇宙发展
虽然元宇宙的终极形态还无法确定,但可以肯定的是元宇宙将极大扩展人类的存在空间,在我们迈向元宇宙的过程中,需要大量的数字内容来支撑,单靠人工来设计和开发根本无法满足需求,AIGC正好可以解决这个问题。游戏将是元宇宙中最先落地的场景,元宇宙和游戏有一个共同点,都是为用户提供高度的真实感和沉浸式体验,我们可以拿AIGC在游戏中的应用来说明其将如何主推元宇宙发展。
开发游戏周期长和成本高,通常需要花费几年时间和上千万资金,好在AIGC可以极大提高游戏的开发效率,具体来说,游戏中的剧本、人物、头像、道具、场景、配音、动作、特效、主程序未来都可以通过AIGC生成。根据AIGC在文字和图像方向的推进速度,以上应用在五到十年之内应该可以实现
红杉资本在最近的研究报告中也指出,到2030年文本、代码、图像、视频、3D、游戏都可以通过AIGC生成,并且达到专业开发人员和设计师的水平。
除了游戏之外,虚拟人也是元宇宙的一个重要落地场景,AIGC同样也会促进虚拟人赛道的发展。
虚拟人是围绕一个虚拟的人设,为其设计声音、形象、动作、性格以及活动场景,其本质和游戏相似度很高。虚拟人注重一个人在虚拟世界的表演和功能性,游戏注重多个人在虚拟世界中的交互体验。游戏是一出戏,虚拟人也是在演一出戏,戈夫曼拟剧理论中的“人生如戏”一语道破了现实世界、虚拟世界的本质。
AIGC在Web3方向的应用
AIGC听起来这么好,那跟Web3会有什么关系?最近听说Web3的基金都在看AIGC方向的项目,我想大概有这几个方向值得关注。
Gamefi 开发引擎:在传统游戏中应用最广的开发引擎是Unity和Unreal,但在Web3中,游戏的开发范式也许会因AIGC带来许多变革,因此将需要一个采用AIGC技术的Gamefi开发引擎。里面的人物、场景、动画均用AIGC设计,游戏中的主程序和区块链部分也可以通过AIGC代码生成功能完成,如果这些都能实现,设计Gamefi游戏或者元宇宙场景将变得非常高效,这一套开发引擎将会具有极高的价值。目前看到RCT AI是运用人工智能为游戏行业提供完整解决方式的一个项目,但其在多大程度上采用了AIGC技术,还不得而知,不过已经有一款Gamefi游戏Mirror World是基于RCT AI来开发的,有兴趣的朋友可以进一步了解。
开发Gamefi游戏:退而求其次,如果一套AIGC全集成的Gamefi开发引擎还太遥远,那采用各个厂商提供的AIGC工具来开发Gamefi游戏也会极大的提高效率,比如用AIGC来生成游戏剧本、设计人物、生成动画这些都几乎都会很快实现,特别在AI生成视频和3D场景技术一旦成熟之后Gamefi游戏开发效率将会突飞猛进。
算力和数据共享:训练AIGC模型需要海量的数据和强大的算力,这导致成本非常巨大,AIGC行业龙头 Stability AI 为了训练其 Stable Diffusion模型,在 AWS 中运行了包含 4000 多个 Nvidia A100 GPU 的集群,运营成本高达数千万美元 。如果能通过去中心化方式发行Token激励用户提供训练模型所需的数据,就可以很好的解决AIGC生成中的版权问题。另外也可以通过发行Token的方式,激励用户提供训练模型所需要的大量算力,分散算力成本,实现成本共担,利益共享。
结语
今年7月李彦宏在百度世界大会上判断,AIGC将分为三个发展阶段:“助手阶段”——“协作阶段”——“原创阶段”。“未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”
在最近的研究报告中,红杉资本的两位合伙人也认为:“AIGC目前已经拥有更好的模型,更多的数据,更好的算力,预计杀手级应用该要出现了”。
对于以上判断,我们倾向于认同,AIGC的出现意味着创作者将从繁冗的基础性工作中解脱出来,把更多的精力放到创意表达上,这是未来内容创作行业,甚至是人类工作方式的整体趋势。
本文转自聚镁Art0X用户“茶叶”,如有侵权请联系删除。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!