🔥腾讯混元大模型内测来袭！你体验了吗？🌟美图视觉大模型1.5，AI艺术革命！🎨DragonDiff

文心一言 2年前 (2023) lida

85 0 0

文章主题：

Part1动态

[国内要闻]

1.腾讯混元大模型开始应用内测多个业务线已接入

🌟【腾讯巨力新成果】🚀 深度科技引领者腾讯已推出自主研发的超先进模型——”腾讯混元大模型”，目前正处于秘密测试阶段，备受业界瞩目！👀数位腾讯内部员工透露，他们有幸首批试用，只需轻点网页或小程序入口，即可亲身体验这款革命性的AI力量。它已悄然渗透到公司的多个业务环节，为效率提升和创新注入强大动能。🛠️混元大模型的广泛应用，标志着腾讯在人工智能领域的又一里程碑，预示着未来更多可能。💡 期待其正式面世，为全球科技发展带来更多惊喜！🎉记得关注我们，获取最新科技动态哦！🌍

2.美图自研视觉大模型MiracleVision已迭代至1.5版本

🌟吴欣鸿揭秘！美图视觉大模型已进阶到1.5代，引领创新技术革新！🚀在AI领域，美图的卓越实力备受瞩目，一系列亮眼成果彰显其深厚底蕴。🎨通过不断迭代，这款强大模型已广泛应用于旗下多款产品中，为用户带来超乎想象的体验。从文生图到涂鸦生图，无论是文字融合还是图生图，美图的“AI绘画”系列功能丰富，满足你的多样化创意需求。只需轻轻一点，艺术灵感瞬间跃然眼前！👩‍🎨👨‍🎨值得一提的是，美图在AI技术上的成功案例不止于此，每一项突破都标志着行业的新高度。🏆无论是头像制作还是宠物头像，都能精准捕捉个性，展现独一无二的魅力。让我们一起期待，未来美图将如何继续用科技点亮生活，引领潮流！🚀SEO优化提示：使用关键词“美图视觉大模型”、“AI绘画”、“技术创新”、“成功实践案例”、“用户体验”等。

3.北大团队提出Dragon Diffusion，可一键拖拽编辑图像

🎨DragonDiffusion🌟 – 图像魔术师！🚀使用先进的扩散模型，DragonDiffusion让精细修图触手可及。👩‍💻通过创新的分类器引导，它将创意转化为图像流动，生成清晰的梯度效果。🔍通过特征对齐优化，每个像素都焕然一新，提升编辑质量。无需担心版权或联系方式，专注于创作无限可能！🌍让世界看到你的艺术眼光，DragonDiffusion让你的作品独一无二！✨SEO友好，搜索引擎喜爱的语言，让DragonDiffusion在数字世界中闪耀！💪快来探索，释放你的创意魔力吧！

4.余承东“剧透”鸿蒙4.0:或搭载AI大模型

🌟余承东的科技新创举！📱通过华为手机内置的小艺语音助手，他展示了超强文案创作力——利用AI的力量，小艺能自动生成发布会宣传文案，满足用户多样化需求！📝用户只需简单指令，就能看到创新内容涌现。👀视频中透露，小艺不仅聪明，而且贴心——它会根据上下文，生成连贯、准确的文本。但别忘了，底部那句温馨提醒：“AI生成，仅供参考，数据可能有小疏漏哦！”🔍华为鸿蒙4.0的到来，预示着AI技术将更深入地融入小艺，让语音助手升级为具备生成式AI的能手！🚀未来已来，科技与生活无缝对接，小艺正以AI的速度改变我们的创作方式。🏆

5.阿里云开源通义千问70亿参数模型

🎉阿里云大动作！🚀 他们已正式发布通义千问的70亿超大规模参数版——Qwen-7B与Qwen-7B-Chat，这两位智能巨擘现已在魔搭社区等你探索！💡 它们不仅是开源的（🔥），更是完全免费且适用于商业场景的金钥匙！✨ 想象一下，无尽的知识和流畅对话就在你的指尖轻轻一点。📚🎉 不要错过这个科技界的创新盛宴，立即登录魔搭社区，开启你的智能之旅吧！🚀

6.多个AIGC应用在苹果应用商店下架

🏆【AI巨头受阻】揭示Apple App Store新规则！🔍 658款热门AI应用集体下架，Chat、GPT等关键词的应用首当其冲。🚨 苹果官方出手，中国区App Store对ChatGPT服务亮红灯，明确禁止提供此类服务。开发者们面临严峻挑战，必须持有专门许可证，并向监管机构合规申请。🚀 一场技术与政策的交汇，AI行业迎来洗牌时刻。欲知详情，敬请关注未来动态。🏆 #Apple规则变更 #AI应用受限 #合规发展

7.百度文心千帆大模型平台接入LLaMA2等33个模型

百度智能云千帆大模型平台已经完成了新一轮的升级，全面接入了包括LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33个大模型，成为了国内拥有大模型最多的平台。

8.百度Apollo官宣文心大模型首批智舱应用伙伴

百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践，完成多项创新功能在量产车型平台上的验证，部分功能有望在长城、领克、smart等量产车型上率先落地。

9.百度将大型语言模型ERNIE应用于汽车，实现文字转图像功能

互联网大厂百度已经实现了将其大型语言模型 ERNIE 应用于汽车领域的承诺，并与汽车制造商长城汽车和数字驾驶舱创造者 ECARX 展开合作。

10.淘宝AI装修功能“真能造”将全面上线

淘宝于7月下旬内测的AI装修功能“真能造”将于8月14日的家装家居生态峰会上正式对外发布，届时功能将更加完善，并且在样板间UGC分享和用户交互功能等方面进一步迭代升级。

11.阿里云通义听悟上线三大新功能

阿里云通义听悟近期上线了三大新功能，其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容，从而提高职场人士和学生的工作学习效率。

12.讯飞星火APP重新上架将发布星火认知大模型2.0版本

:科大讯飞在投资者平台回应称，讯飞星火认知大模型V2.0升级发布会将于8月15日举办，届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。

13. 8月AI新规将施行:使用AI生成内容不得侵害他人肖像权

《生成式人工智能服务管理暂行办法》将在8月15日起施行，《办法》明确，提供和使用生成式人工智能服务应当尊重他人合法权益，不得危害他人身心健康，不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益。

14.AI游戏教育与产业联盟专委会正式成立

AI游戏教育与产业联盟专委会正式成立。浦东将在产业政策、运营规范、国际交流等方面，为AI和游戏产业的发展提供大力支持。

[国际要闻]

1. 苹果已研究生成式AI多年

苹果公司在2023年度的研发上花费了226.1亿美元，首席执行官蒂姆·库克明确表示其中一部分支出是因为该公司正在开发生成式人工智能。库克表示:「多年来，我们一直在进行广泛的人工智能技术研究，包括生成式人工智能。我们将继续投资、创新，并以负责任的方式推进这些技术，以帮助丰富人们的生活。显然，我们在大量投资，并且这一点在你所看到的研发支出中得到了体现。」

2. Medium禁止完全由AI生成的内容需标记AI生成部分

国外知名博客门户网站Medium.com 最近宣布，他们将禁止100% 由人工智能（AI）生成内容的发布，坚称平台为 “人类写作的家园”。Medium要求所有 AI 生成的文本都必须在 Medium 上进行标注，否则将不会被展示

3.马斯克疑似从OpenAI手中买下域名Ai.com

Elon Musk 疑似已经从 OpenAI 手中购买了域名 AI.com，将其用于他即将成立的 AI 公司 xAI。分析认为，此举可能是为了让自己的公司成为 AI 领域的中心，与 OpenAI 竞争。

4.澳大利亚新闻集团利用AI每周生成3000篇当地新闻报道

澳大利亚新闻集团（News Corp Australia）执行主席Michael Miller透露，该公司每周使用生成式人工智能制作3000篇文章，生成数千个有关天气、燃油价格和交通状况的当地报道。最近，该新闻集团发布公告招聘生成式AI数据记者，要求会使用AI自动创建新闻内容。这在新闻领域属于比较新鲜的职位，同时新闻媒体的内容创作将迎来转型时期。

5. OpenAI提交GPT-5商标申请此前称目前没有训练GPT-5计划

ChatGPT的开发者OpenAI已经向美国专利商标局（USPTO）提交了“GPT-5”的商标申请。这一消息是由商标律师Josh Gerben在推特上分享的。GPT-5被推测是OpenAI高级语言模型的下一个迭代，可能会代表自然语言处理和人工智能能力的重大进步。但是，GPT-5的具体功能和改进尚未得到OpenAI的正式确认。

6.YouTube在最新测试中使用人工智能总结视频

谷歌正在尝试使用人工智能自动生成 YouTube 视频摘要。这些摘要只会出现在有限数量的英语视频旁边，并且只能由有限数量的用户观看。它们将出现在 YouTube 的观看和搜索页面上，旨在简要概述视频内容，而不取代人工编写的现有描述。

7.消息称OpenAI测试DALL-E3.0版本

OpenAI 可能正在准备下一版本的 DALL-E AI 文本到图像生成器（称为 DALL-E3），并进行一系列 alpha 测试，这些测试现已向公众泄露。虽然测试版本显示了模型的潜力，但也暴露了一些潜在的问题，例如生成不适宜内容的风险。然而，这些问题有望在正式发布之前得到解决。

8.硅谷知名风投公司发布创建人工智能女友的说明

硅谷风投公司 Andreessen Horowitz 最近在开发者网站 GitHub 上发布了一份详细的指南，教人们如何从零开始构建一个 AI 伴侣机器人。Andreessen Horowitz在描述中写道:这些伴侣有很多可能的用例——浪漫（人工智能女朋友/男朋友）、友谊、娱乐、辅导等。该项目纯粹是为了成为开发者教程和入门堆栈那些对聊天机器人是如何构建感到好奇的人。

9.众筹网站Kickstarter要求生成式AI项目披露更多信息

Kickstarter 近日宣布，对于使用生成式人工智能（AI）工具创作图像、文本或其他作品的项目，将要求其在项目页面上披露更多与 AI 相关的信息。

10.韩国AI大模型Upstage的LLM击败ChatGPT

韩国人工智能创业公司 Upstage 的最新人工智能模型Upstage在一项全球认可的开源语言模型评估中超过了全球知名的 AI 巨头 OpenAI 的 ChatGPT。Upstage 的其采用 Meta 的 LLaMA270B 模型训练的新 AI 模型在最新的 HuggingFace Open LLM Leaderboard 排行榜上获得了平均得分72.3。

11. AI打败AI!谷歌科学家用GPT-4击败AI防篡改系统

谷歌科学家使用 GPT-4聊天机器人来欺骗 AI-Guardian 图像分类器的防御措施，并提供了相应的代码。GPT-4成功击败了 AI-Guardian 的防御，并降低了其稳健性从98% 到8%。

12. Instagram 开发新的 AI 功能，包括 AI 生成的图像检测器

Instagram正在开发新的AI功能，包括一个AI生成的图像检测器。这些新的生成式AI功能不仅可以提升用户在 Instagram 上的体验，还可以帮助打击虚假信息。

13.Stack Overflow 推出 OverflowAI

Stack Overflow 在开发者社区和人工智能之间进行了整合，推出了 OverflowAI。OverflowAI 引入了语义搜索，通过矢量数据库提供智能的响应，为开发者提供准确的问题解决方案。

14.英语的人工智能使用费比其他语言便宜15倍

研究表明，对于类似 OpenAI 的服务，由于计算成本的计量和计费方式，英语输入和输出比其他语言要便宜得多，其中简体中文的成本约为英语的两倍，西班牙语为英语的1.5倍，而掸语则要贵15倍。

15.谷歌推AI控制机器人 RT-2模型:将文本和图像转化为机器人动作

谷歌推出了 Robotics Transformer2（RT2），这是一个视觉-语言-动作(VLA)模型，可以将文本和图像输出为机器人动作。谷歌表示，RT-2「让我们更接近机器人的未来。」「就像语言模型通过从网络上的文本进行训练来学习一般的思想和概念一样，RT-2通过从网络数据中传输知识，以指导机器人行为，」谷歌 DeepMind 的机器人主管 Vincent Vanhoucke 在一篇博文中解释道。「换句话说，RT-2能够与机器人交流。」

16. Photoshop beta 版添加Firefly驱动的AI画布扩展功能

Adobe 正在构建 Firefly，其生成式 AI 模型系列，在 Photoshop 中加入了一个功能，正如该公司所描述的:「将图像扩展到原始边界之外」。这个名为「生成式扩展（Generative Expand）」的功能，在 Photoshop 的 beta 版本中可用，用户可以通过单击和拖动裁剪工具来扩展和调整图像，从而扩展画布。

Part2产品

1. Meta发布AudioCraft，可帮助用户创作音乐和音频

Meta发布了一款开源人工智能（AI）工具AudioCraft(直译为音频技艺)，该工具可以帮助用户根据文本提示创作音乐和音频。Meta表示，这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉，可用文本内容生成高质量、逼真的音频和音乐。

2.图像编辑工具EditAnything:可编辑图像中的任何元素

EditAnything 是一款基于 Segment-Anything、ControlNet、StableDiffusion 等技术的图像编辑工具。它能够编辑和生成图像中的任何内容，包括对图像中的物体进行修改、添加、删除等操作，通过调整细节和布局来生成不同风格的图像。

3.Faceswap.dev:一个免费开源的AI换脸工具高效且安全

Faceswap.dev 是一个免费开源的AI 换脸软件，可以在视频或图片中进行人脸替换。该软件旨在提供易于使用、高效、安全的 Deepfakes 工具，并致力于提高用户的道德和法律意识，防止滥用 AI 换脸技术。

4.给自动驾驶AI上“外挂”!港大