Part1动态
[国内要闻]
1.腾讯混元大模型开始应用内测 多个业务线已接入
腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。多位腾讯员工表示,他们最近收到了内部邮件邀请,可以通过网页或小程序体验混元大模型。腾讯内部多个业务也已经接入混元大模型进行测试。
2.美图自研视觉大模型MiracleVision已迭代至1.5版本
吴欣鸿透露,目前美图自研视觉大模型已迭代到1.5版本,并应用于美图旗下多款产品。目前,美图在AI层面有多个成功实践案例。“AI绘画”系列涵盖文生图、文字融合、图生图、涂鸦生图、线稿上色、头像制作、宠物头像等功能。
3.北大团队提出Dragon Diffusion,可一键拖拽编辑图像
DragonDiffusion 是一款基于扩散模型的图像编辑工具,旨在实现对图像进行精细化编辑。通过设计分类器引导的方法,DragonDiffusion 能够将编辑信号转化为梯度,通过特征对齐损失修改扩散模型的中间表示。
4.余承东“剧透”鸿蒙4.0:或搭载AI大模型
余承东在社交平台展示了一项新技术:他利用华为手机内置的小艺语音助手,写了一段发布会宣传文案。从该视频可以看出,小艺可以根据用户需求,自动生成文案等内容。而在小艺的回答下方有一行提示——“数据来源:由AI模型自动生成,可能存在疏漏,仅供参考”。华为鸿蒙4.0或将融入AI大模型的能力,使得小艺语音助手具备生成式AI的功能。
5.阿里云开源通义千问70亿参数模型
阿里云宣布开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。
6.多个AIGC应用在苹果应用商店下架
多个AI相关App在苹果应用商店下架。据七麦监控数据显示,本次共有658款应用被下架,其中包含 Chat、AI、GPT 等关键词的应用较多。根据苹果官方通知,中国区的苹果应用商店不允许提供 ChatGPT 相关的服务。同时,相关开发者需提供专门的许可证,且需要向监管部门申请。
7.百度文心千帆大模型平台接入LLaMA2等33个模型
百度智能云千帆大模型平台已经完成了新一轮的升级,全面接入了包括LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33个大模型,成为了国内拥有大模型最多的平台。
8.百度Apollo官宣文心大模型首批智舱应用伙伴
百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践,完成多项创新功能在量产车型平台上的验证,部分功能有望在长城、领克、smart等量产车型上率先落地。
9.百度将大型语言模型ERNIE应用于汽车,实现文字转图像功能
互联网大厂百度已经实现了将其大型语言模型 ERNIE 应用于汽车领域的承诺,并与汽车制造商长城汽车和数字驾驶舱创造者 ECARX 展开合作。
10.淘宝AI装修功能“真能造”将全面上线
淘宝于7月下旬内测的AI装修功能“真能造”将于8月14日的家装家居生态峰会上正式对外发布,届时功能将更加完善,并且在样板间UGC分享和用户交互功能等方面进一步迭代升级。
11.阿里云通义听悟上线三大新功能
阿里云通义听悟近期上线了三大新功能,其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,从而提高职场人士和学生的工作学习效率。
12.讯飞星火APP重新上架 将发布星火认知大模型2.0版本
:科大讯飞在投资者平台回应称,讯飞星火认知大模型V2.0升级发布会将于8月15日举办,届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。
13. 8月AI新规将施行:使用AI生成内容不得侵害他人肖像权
《生成式人工智能服务管理暂行办法》将在8月15日起施行,《办法》明确,提供和使用生成式人工智能服务应当尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益。
14.AI游戏教育与产业联盟专委会正式成立
AI游戏教育与产业联盟专委会正式成立。浦东将在产业政策、运营规范、国际交流等方面,为AI和游戏产业的发展提供大力支持。
[国际要闻]
1. 苹果已研究生成式AI多年
苹果公司在2023年度的研发上花费了226.1亿美元,首席执行官蒂姆·库克明确表示其中一部分支出是因为该公司正在开发生成式人工智能。库克表示:「多年来,我们一直在进行广泛的人工智能技术研究,包括生成式人工智能。我们将继续投资、创新,并以负责任的方式推进这些技术,以帮助丰富人们的生活。显然,我们在大量投资,并且这一点在你所看到的研发支出中得到了体现。」
2. Medium禁止完全由AI生成的内容 需标记AI生成部分
国外知名博客门户网站Medium.com 最近宣布,他们将禁止100% 由人工智能(AI)生成内容的发布,坚称平台为 “人类写作的家园”。Medium要求所有 AI 生成的文本都必须在 Medium 上进行标注,否则将不会被展示
3.马斯克疑似从OpenAI手中买下域名Ai.com
Elon Musk 疑似已经从 OpenAI 手中购买了域名 AI.com,将其用于他即将成立的 AI 公司 xAI。分析认为,此举可能是为了让自己的公司成为 AI 领域的中心,与 OpenAI 竞争。
4.澳大利亚新闻集团利用AI每周生成3000篇当地新闻报道
澳大利亚新闻集团(News Corp Australia)执行主席Michael Miller透露,该公司每周使用生成式人工智能制作3000篇文章,生成数千个有关天气、燃油价格和交通状况的当地报道。最近,该新闻集团发布公告招聘生成式AI数据记者,要求会使用AI自动创建新闻内容。这在新闻领域属于比较新鲜的职位,同时新闻媒体的内容创作将迎来转型时期。
5. OpenAI提交GPT-5商标申请 此前称目前没有训练GPT-5计划
ChatGPT的开发者OpenAI已经向美国专利商标局(USPTO)提交了“GPT-5”的商标申请。这一消息是由商标律师Josh Gerben在推特上分享的。GPT-5被推测是OpenAI高级语言模型的下一个迭代,可能会代表自然语言处理和人工智能能力的重大进步。但是,GPT-5的具体功能和改进尚未得到OpenAI的正式确认。
6.YouTube在最新测试中使用人工智能总结视频
谷歌正在尝试使用人工智能自动生成 YouTube 视频摘要。这些摘要只会出现在有限数量的英语视频旁边,并且只能由有限数量的用户观看。它们将出现在 YouTube 的观看和搜索页面上,旨在简要概述视频内容,而不取代人工编写的现有描述。
7.消息称OpenAI测试DALL-E3.0版本
OpenAI 可能正在准备下一版本的 DALL-E AI 文本到图像生成器(称为 DALL-E3),并进行一系列 alpha 测试,这些测试现已向公众泄露 。虽然测试版本显示了模型的潜力,但也暴露了一些潜在的问题,例如生成不适宜内容的风险。然而,这些问题有望在正式发布之前得到解决。
8.硅谷知名风投公司发布创建人工智能女友的说明
硅谷风投公司 Andreessen Horowitz 最近在开发者网站 GitHub 上发布了一份详细的指南,教人们如何从零开始构建一个 AI 伴侣机器人。Andreessen Horowitz在描述中写道:这些伴侣有很多可能的用例——浪漫(人工智能女朋友/男朋友)、友谊、娱乐、辅导等。该项目纯粹是为了成为开发者教程和入门堆栈那些对聊天机器人是如何构建感到好奇的人。
9.众筹网站Kickstarter要求生成式AI项目披露更多信息
Kickstarter 近日宣布,对于使用生成式人工智能(AI)工具创作图像、文本或其他作品的项目,将要求其在项目页面上披露更多与 AI 相关的信息。
10.韩国AI大模型Upstage的LLM击败ChatGPT
韩国人工智能创业公司 Upstage 的最新人工智能模型Upstage在一项全球认可的开源语言模型评估中超过了全球知名的 AI 巨头 OpenAI 的 ChatGPT。Upstage 的其采用 Meta 的 LLaMA270B 模型训练的新 AI 模型在最新的 HuggingFace Open LLM Leaderboard 排行榜上获得了平均得分72.3。
11. AI打败AI!谷歌科学家用GPT-4击败AI防篡改系统
谷歌科学家使用 GPT-4聊天机器人来欺骗 AI-Guardian 图像分类器的防御措施,并提供了相应的代码。GPT-4成功击败了 AI-Guardian 的防御,并降低了其稳健性从98% 到8%。
12. Instagram 开发新的 AI 功能,包括 AI 生成的图像检测器
Instagram正在开发新的AI功能,包括一个AI生成的图像检测器。这些新的生成式AI功能不仅可以提升用户在 Instagram 上的体验,还可以帮助打击虚假信息。
13.Stack Overflow 推出 OverflowAI
Stack Overflow 在开发者社区和人工智能之间进行了整合,推出了 OverflowAI。OverflowAI 引入了语义搜索,通过矢量数据库提供智能的响应,为开发者提供准确的问题解决方案。
14.英语的人工智能使用费比其他语言便宜15倍
研究表明,对于类似 OpenAI 的服务,由于计算成本的计量和计费方式,英语输入和输出比其他语言要便宜得多,其中简体中文的成本约为英语的两倍,西班牙语为英语的1.5倍,而掸语则要贵15倍。
15.谷歌推AI控制机器人 RT-2模型:将文本和图像转化为机器人动作
谷歌推出了 Robotics Transformer2(RT2),这是一个视觉-语言-动作(VLA)模型,可以将文本和图像输出为机器人动作。谷歌表示,RT-2「让我们更接近机器人的未来。」「就像语言模型通过从网络上的文本进行训练来学习一般的思想和概念一样,RT-2通过从网络数据中传输知识,以指导机器人行为,」谷歌 DeepMind 的机器人主管 Vincent Vanhoucke 在一篇博文中解释道。「换句话说,RT-2能够与机器人交流。」
16. Photoshop beta 版添加Firefly驱动的AI画布扩展功能
Adobe 正在构建 Firefly,其生成式 AI 模型系列,在 Photoshop 中加入了一个功能,正如该公司所描述的:「将图像扩展到原始边界之外」。这个名为「生成式扩展(Generative Expand)」的功能,在 Photoshop 的 beta 版本中可用,用户可以通过单击和拖动裁剪工具来扩展和调整图像,从而扩展画布。
Part2产品
1. Meta发布AudioCraft,可帮助用户创作音乐和音频
Meta发布了一款开源人工智能(AI)工具AudioCraft(直译为音频技艺),该工具可以帮助用户根据文本提示创作音乐和音频。Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。
2.图像编辑工具EditAnything:可编辑图像中的任何元素
EditAnything 是一款基于 Segment-Anything、ControlNet、StableDiffusion 等技术的图像编辑工具。它能够编辑和生成图像中的任何内容,包括对图像中的物体进行修改、添加、删除等操作,通过调整细节和布局来生成不同风格的图像。
3.Faceswap.dev:一个免费开源的AI换脸工具 高效且安全
Faceswap.dev 是一个免费开源的AI 换脸软件,可以在视频或图片中进行人脸替换。该软件旨在提供易于使用、高效、安全的 Deepfakes 工具,并致力于提高用户的道德和法律意识,防止滥用 AI 换脸技术。
4.给自动驾驶AI上“外挂”!港大
转载请注明:每周AI大事件 | 苹果下多款AI应用、黑客版ChatGPT风靡暗网、通义千问70亿参数模型开源 | 666ChatGPT资源导航