近日,百度公开多项AIGC(AI Generated Content)专利,其中”文生图”相关专利的技术可以让用户实现AI作画。专利提出了一种基于AI跨模态生成大模型构建的新型交互式创作的解决方案,通过输入的文字描述内容获取图像,结合用户偏好风格进行图像调整,自动化生成既满足用户描述指令又贴切用户偏好风格的画作。此次披露的专利技术是百度AI作画产品文心一格的底层技术之一。
文心一格是百度推出的AI艺术和创意辅助平台,让用户实现一语成画,只需输入一段自己的创想文字,并选择期望的画作风格,即刻可以生成创意精美的画作。文心一格既能生产恢弘绚丽的艺术画,也能生产创意脑洞的超写实图,支持国风、动漫、插画、油画等十余种绘画风格和不同画幅的选择,让每个人都能展现个性化格调,享受艺术创作的乐趣。
文心一格的技术基础是百度文心知识增强跨模态理解大模型,具体而言,文心一格使用了百度文心ERNIE-ViLG 2.0作为AI绘画的大模型底座,ERNIE-ViLG 2.0采用知识增强算法和混合专家扩散模型建模,学习了海量优质文图数据,全面提升图像生成质量和语义一致性,在文图生成领域取得全球领先效果。
在强大的大模型技术基础上,文心一格的AI绘画全流程解决方案,通过语义理解+多画作风格适配+结果优化排序,有效解决AI绘画技术在实用中的三大难题:需求描述困难、多样化需求强、模型生成结果筛选难。首先,利用知识辅助可以更好地理解用户的输入,并自动丰富语义细节,有效降低用户输入描述成本;其次,根据不同的需求,灵活适配创意写实、恢弘构图或二者兼具的多风格画作生成能力;最后,基于跨模态匹配大模型对AI的多个生成结果自动排序,选出兼具美感与实用性的作品呈现给用户。
根据中国专利保护协会发布的《人工智能领域高价值专利分析报告》,中国AI技术发明专利价值、申请量、授权量排名中,百度均位列第一。作为文生图AIGC技术的支撑和文心一格强大的技术底座,百度的通用技术、语音技术、自然语言处理技术专利授权量和专利价值度排名第一,视觉技术专利授权量和专利价值度排名领先。百度在AIGC相关技术如图文转视频、高精度数字人生成和文生图等技术上均进行了专利布局,并有多项专利取得了专利授权。
让机器具备跨越文本、图像等多种模态的复杂场景理解与生成能力,是人工智能的重要目标之一,也让数字时代科技与产业深度融合创新,催生新业态新模式,加快产业智能化升级的新动能。人工智能在艺术领域的学习与创作能力正以蓬勃之势不断刷新我们的认知,同时也让公众对科技与艺术及文化的融合创新有了更大的想象空间。文心大模型正在成为推动AIGC发展的新引擎,基于文心大模型的AIGC将会带来创新性的探索,并赋能到更广泛的行业领域。