ICML2023杰出论文奖得主:大型语言模型的水印研究
文章标签:大型语言模型, 水印, AI classifier, 文本生成
1、给大模型加水印研究获ICML 2023杰出论文奖
2、OpenAI已停用AI classifier工具
3、OpenAI正开发开源大模型,代号为G3PO
4、微软CEO:Azure OpenAI已有11000个客户
5、微软商店AI摘要功能已推出预览版
6、微软谷歌OpenAI等联合成立前沿模型论坛
7、开放算料联盟成立 深圳数交所、腾讯云等发起
8、Meta扩展Llama功能 可执行多语言语音识别
9、Android 14将包括生成式AI工具
10、安卓版ChatGPT正式上线
11、北交大开源交通大模型 免费可商用
12、清华本科生打造免费版桌面端Copilot
13、重庆AI产业三年行动计划发布
14、上海市消保委:妙鸭相机涉嫌侵害公平交易权
15、妙鸭相机回应争议 AI生成分身失败可退款
16、网易有道正式发布“子曰”大模型
17、钉钉12条产品线、40多项场景接入大模型
18、Runway AI视频生成工具全面开放
19、寒武纪联合中标7.53亿元智算项目
20、恒烁股份存算一体AI芯片预计将于3季度流片
21、IDC:到2026年50%终端将搭载硬件AI引擎功能
22、广联达:已构建建筑行业AI大模型层
23、用友网络申请大模型商标
24、Wayfair推出AI虚拟房间重新设计器
25、GitHub、Hugging Face等呼吁欧盟保护开源创新
26、美参议院通过修正案 要求通报对华技术投资
27、美国两党警告AI风险:或被用于开发生物武器
28、外媒推测OpenAI即将开源GPT-3.5
29、OpenAI主管工程师年薪660万 居世界第一
30、阿里云支持Llama2全系列训练部署
31、小红书上线AI文生图新功能“此刻”
32、美图秀秀上线AI移除功能
33、本地问答模型localGPT上线
34、英特尔推出34个开源AI参考套件
35、AI正影响2000亿美元游戏产业
36、合成数据公司光轮智能完成天使+轮融资
37、代码模型CodeGeeX2-6B开源
38、工信部:加强通用人工智能等未来产业前瞻布局
1、给大模型加水印研究获ICML 2023杰出论文奖
国际人工智能领域的顶级会议之一——ICML 2023于7月23日至29日在美国夏威夷会议中心盛大召开。根据ICML官方今天公布的获奖名单,共有6篇杰出的论文获得了奖项。其中,来自马里兰大学的《大型语言模型的水印》(A Watermark for Large Language Models)论文表现尤为突出。
这篇研究论文探讨了一种针对大型语言模型输出的水印添加方式,通过将信号融入到生成的文本中,使得这些信号对于人类是不可见的,然而却被算法所捕捉。这一方法的好处在于,我们无需对语言模型进行重新训练,便可以轻松地生成水印,同时也不需要访问任何API或参数。此外,该论文还介绍了一种具有可解释性的p值统计测试方法,以及一个用于分析水印敏感度的信息论框架。
论文地址:https://openreview.net/forum?id=aX8ig9X2a7
2、OpenAI已停用AI classifier工具
在一篇最新的博客文章中,OpenAI公司宣布从7月20日开始停止使用其AI classifier工具,该工具主要用于区分人类编写的文本和AI生成的文本。OpenAI公司表示,他们之所以做出这个决定,是因为该工具的准确率较低,且并不能完全保证其可靠性。目前,OpenAI公司正在积极研究更为有效的文本来源技术,并且已经承诺将开发和部署相关机制,以便用户能够更加明确地理解音频或视觉内容是否由AI生成。
3、OpenAI正开发开源大模型,代号为G3PO
The Information于7月24日披露了有关OpenAI正在研发的一款大型开源语言模型的信息。该模型目前被称作G3PO,其发布时间表尚未得到内部确定。
4、微软CEO:Azure OpenAI已有11000个客户
根据彭博社的最新报道,在微软公布2023年第四季度财报并举行的相关电话会议上,公司CEO萨蒂亚·纳德拉表示,Azure云计算服务在2023年的销售额已经超过了1100亿美元云计算收入的50%,这标志着Azure首次成为微软年度云计算业务的主要组成部分。这一增长主要得益于Azure OpenAI的推动。据悉,Azure OpenAI如今已拥有超过11000名客户,相较于五月中旬发布的4500名客户有了显著的增长。此外,微软智能云部门在第四季度的营收达到了239.93亿美元,预计在2024年第一季度的营收将在233亿美元至236亿美元之间。
5、微软商店AI摘要功能已推出预览版
根据IT之家的报道,微软商店近日已经推出了其AI摘要功能的首个预览版,该功能能够在一个应用数千条在线评论中迅速提炼出关键信息,并以精炼的文字形式呈现出来,从而突显出最重要的是观点。目前,这个功能仅限于美国Windows内测用户使用,同时,微软商店应用需要更新至22306.1401.x.x版本才能正常使用此功能。
6、微软谷歌OpenAI等联合成立前沿模型论坛
近日,谷歌、微软、OpenAI和Anthropic公司联合宣布成立了前沿模型论坛(Frontier Model Forum),这是一个专注于推动前沿人工智能模型安全与负责任开发的行业性组织。为了更好地开展相关工作,该论坛还将设立一个咨询委员会,以便在战略规划和优先级设定等方面提供指导和支持。
根据公告,该论坛的核心目标是:
为确保人工智能安全和推动前沿模型的负责任发展,我们需要采取一系列措施。首先,我们应该加强人工智能安全研究,不断探索新的安全技术和方法,以确保人工智能系统的安全性。其次,我们需要鼓励前沿模型的负责任发展,让这些模型在设计和应用过程中考虑到安全因素,避免出现潜在的安全风险。此外,为了更好地保障人工智能系统的安全性和可靠性,我们还需要实现对能力和安全的独立、标准化评估,确保评估结果的准确性和可信度。通过这些努力,我们可以最大限度地降低人工智能系统的安全风险,保障其安全和可靠运行。
(2)确定负责任的开发和部署前沿模型的最佳实践,帮助公众了解技术的性质、能力、限制和影响。
(3)与政策制定者、学者、民间社会和企业合作,分享有关信任和安全风险的知识。
7、开放算料联盟成立 深圳数交所、腾讯云等发起
财联社7月26日电,财联社记者从深圳数据交易所方面获悉,深圳数交所联合近50家单位成立“开放算料联盟”。共同发起机构包括腾讯云、华大基因、云天励飞、奥比中光、优必选、中国联通广东分公司、华傲数据等企业,深圳市人工智能学会等协会,国家超级计算深圳中心等智库及研究机构,以及北大深圳研究生院、哈工大(深圳)、港理工等大学。据悉,该联盟将围绕高质量中文训练数据和多模态训练数据,协调数据要素、数据治理、训练数据、数据标注、合成数据等相关标准制定,协助数据交易所增加大模型相关的新品类和新专区。
8、Meta扩展Llama功能 可执行多语言语音识别
Hugging Face页面显示,Meta AI在7月21日发表新论文,扩展其大型语言模型Llama的功能。研发团队通过直接附加一个小型音频编码器来扩展大型语言模型的功能,使其能够执行语音识别。通过直接在文本标记嵌入前添加一系列音频嵌入,大型语言模型可以转换为自动语音识别(ASR)系统,并以与其文本对应物完全相同的方式使用。多语言LibriSpeech(MLS)实验表明,尽管Llama主要是在英语文本上进行训练,但将一致性编码器集成到开源Llama-7B中,可使其性能比单语言基线高出18%,并能执行多语言语音识别。
论文地址:
https://arxiv.org/abs/2307.11795
9、Android 14将包括生成式AI工具
财联社7月26日电,Alphabet首席执行官桑达尔·皮查伊称,Android 14将包括生成式AI工具,80%的广告商至少使用一种AI驱动的搜索产品。
10、安卓版ChatGPT正式上线
OpenAI昨晚发推文宣布,ChatGPT安卓版现可在美国、印度、孟加拉国和巴西下载。OpenAI计划在下周将其推广到更多的国家及地区。
传送门:
https://play.google.com/store/apps/details?id=com.openai.chatgpt&pli=1
11、北交大开源交通大模型 免费可商用
北京交通大学等机构近日开源一款拥有70亿个参数的通用常识交通大模型TransGPT,不仅对学术研究完全开放,仅需邮件申请并获得官方商用许可后,即可以免费商用。
据介绍,TransGPT是国内首款开源交通大模型,能够实现交通情况预测、智能咨询助手、公共交通服务、交通规划设计、交通安全教育、协助管理、交通事故报告和分析、自动驾驶辅助系统等功能,可以为道路工程、桥梁工程、隧道工程、公路运输、水路运输、城市公共交通运输、交通运输经济、交通运输安全等行业提供通识常识。
代码地址:
https://github.com/DUOMO/TransGPT
12、清华本科生打造免费版桌面端Copilot
据机器之心7月25日报道,几位清华大学计算机系的本科生毕业即投身生成式AI创业,推出能配合任意软件使用的Copilot桌面端智能助手“灵羽助手”。无论是使用PDF阅读器、浏览器、微信还是VSCode,用户都能随时随地调用ChatGPT能力。该AI助手目前支持Windows和macOS下载,现版本搭建于GPT-3.5之上,对所有用户免费开放,付费版本有每月9美元专业版和每月19美元精英版,暂不支持图片输入,团队表示未来将引入GPT-4和Claude。
下载地址:
https://www.ai-anywhere.com/
13、重庆AI产业三年行动计划发布
7月25日,重庆市经济和信息化委员会官网公开发布关于印发《重庆市以场景驱动人工智能产业高质量发展行动计划(2023—2025年)》的通知。根据行动计划,其发展目标是到2025年,成功创建国家人工智能创新应用先导区,打造10个标杆场景项目,在重点领域、典型场景形成100个具有核心竞争力的人工智能产品,培育10家亿级以上人工智能龙头企业,集聚100家人工智能规模以上企业、1000家人工智能相关企业,建成3-5个人工智能产业集聚区。
文件指出的重点任务包括优化扩大人工智能产品供给,着力突破人工智能软件,实施人工智能软件“揭榜挂帅”,推进自主的人工智能框架、算子等根技术和AIGC(AI Generated Content )等关键技术研发;加快培育人工智能硬件,鼓励加强神经网络处理器芯片、图像处理芯片、语音处理芯片等研发和场景应用,促进高端智能芯片发展。
14、上海市消保委:妙鸭相机涉嫌侵害公平交易权
上海市消保委微信公众号今日发文,指出最近爆火的AI写真小程序妙鸭相机在付款页面以灰色小字标注的“一旦购买成功,不支持退款”,涉嫌侵害消费者的公平交易权。其服务协议中也没有退款相关条款。此外,该小程序的注册公司为未序网络科技(上海)有限公司所留电话不是无人接听就是空号。
15、妙鸭相机回应争议 AI生成分身失败可退款
今日,当红的AI写真小程序妙鸭相机针对服务引发的讨论做出了三点回应:“1、妙鸭相机提供的是基于算力的服务,因此照片生成后即视为服务完成。我们郑重承诺,如果因为技术问题,造成数字分身生成失败,可以退款,而且免费再次生成。2、AI算法具有一定不确定性,眼镜等配件有可能出现无法识别的情况。为此我们会优化算法,尽快解决问题。遇到类似问题的用户,可以咨询客服处理。3、由于下载照片涉及虚拟币充值,虚拟币和现金目前只能单向流转,充值协议已进行明确约定,因此目前不支持退款。”
妙鸭相机于今年7月1日正式开放,背后由阿里优酷土豆的相关团队操盘。用户上传20张照片,付费9.9元,即可制作专属的证件照、职场照、写真照或风格大片,合成风格与天真蓝、海马体等摄影机构的作品近似。
▲妙鸭相机回应争议
16、网易有道正式发布“子曰”大模型
据36氪报道,网易有道推出国内首个教育领域垂直大模型“子曰”,并发布了基于“子曰”大模型研发的六大创新应用——“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”。
17、钉钉12条产品线、40多项场景接入大模型
钉钉微信公众号7月25日发文,宣布目前钉钉已有12条产品线、40多项场景接入大模型。钉钉斜杠“/”现包括创建专属问答机器人、实时会议语音转文本、会中摘要、对话创建项目、智能推荐项目模板、智能写邮件、智能文档、对话插入图表、对话生成PPT、自动创建思维导图框架等功能。
18、Runway AI视频生成工具全面开放
7月24日,AI视频生成创企Runway发推文宣布Gen-1和Gen-2视频生成限制解除。注册账号即可免费尝试生成视频,每个生成视频的时长为4秒,每秒消耗5个积分。免费版本有125个积分,一共可用Gen-1生成8秒视频、用Gen-2生成25秒视频或生成25张图像。如果免费积分耗尽,付费标准为0.01美元/积分。
19、寒武纪联合中标7.53亿元智算项目
寒武纪7月25日披露项目中标公告,宣布寒武纪与中国移动通信集团浙江有限公司台州分公司、浙江省公众信息产业有限公司组成联合体,中标了“浙东南数字经济产业园数字基础设施提升工程(一期)”的项目,该项目预计中标金额为7.53亿元。根据联合体成员单位分工情况,寒武纪作为联合体牵头方,负责智算硬件部分的供货、安装和后续服务,预计公司所占金额约为该项目总价格的70%,实际金额以最终签订的正式合同为准。
20、恒烁股份存算一体AI芯片预计将于3季度流片
财联社7月26日电,存储芯片及MCU芯片公司恒烁股份在互动平台表示,公司的存算一体AI芯片预计将于3季度流片。
21、IDC:到2026年50%终端将搭载硬件AI引擎功能
IDC咨询微信公众号7月25日发文,预测到2026年,中国市场中近50%的终端设备的处理器将带有AI引擎技术。IDC认为,未来AI终端将在以下十大领域广泛落地发展:创作与创意、游戏和虚拟世界、语音合成与转换、视觉和图像处理、聊天机器人、个性化推荐、医疗辅助、人脸识别在终端领域广泛应用&电脑自动将图片进行分类、自动化内容生成、终端将变得更加安全。
22、广联达:已构建建筑行业AI大模型层
据界面新闻报道,建筑产业互联网平台服务公司广联达7月25日在投资者互动平台表示,AI是支持数字建筑的重要底层技术之一,公司早在2015年便专门设立了AI团队进行建筑大数据和AI相关技术的研究,目前已经构建了建筑行业AI大模型层、工具平台层、产品应用层三层AI技术体系。
23、用友网络申请大模型商标
据天眼查App,用友网络科技股份有限公司近日申请了“用友企业服务大模型”商标,国际分类为广告销售,商标状态为申请中。用友网络此前申请了YONGPT、YONYOUGPT等相关商标,国际分类涉及科学仪器、网站服务、广告销售等,均在申请中。用友网络成立于1995年,法定代表人为王文京,经营范围含电子计算机软件、硬件及外部设备的技术开发,企业管理咨询,数据库服务,销售电子计算机软硬件及外部设备等。
24、Wayfair推出AI虚拟房间重新设计器
据The Verge 7月25日报道,美国主流家居电商平台Wayfair推出了一款免费虚拟房间重新设计器Decorify。当用户上传房间的照片、选择想要的视觉风格、输入要装修的房间类型(目前仅支持客厅)后,它采用生成式AI展示用户想要的房间的重新装修版本。用户可以选择房间中的某个单品,让Wayfair的AI模型将其替换为下拉菜单中某种风格的物品。该网站可以在计算机或手机上运行。
传送门 :
https://www.wayfairnext.com/decorify
25、GitHub、Hugging Face等呼吁欧盟保护开源创新
据站长之家报道,Hugging Face、GitHub、EleutherAI、Creative Commons、LAION和Open Future等开源AI利益相关者组成的联盟呼吁欧盟政策制定者在制定《欧盟AI法案》时保护开源创新。他们在发布的政策文件中强调了开源AI的重要性,指出监管不应妨碍开源AI创新,建议AI法案的讨论过程中为开源开发者提供更清晰的信息,避免给开源AI生态系统带来不利影响。他们还希望通过欧盟的影响力,引领全球的技术监管对话,让开源开发者在政策制定过程中发挥更大的作用。
26、美参议院通过修正案 要求通报对华技术投资
据环球网援引路透社报道, 美国国会参议院7月25日以“压倒性多数”通过了一项“2024财年国防授权法案”修正案,将要求美国企业向联邦机构通报其对中国技术领域(例如半导体和AI)的投资情况。
据外媒此前报道,美国国会众议院“中国问题特别委员会”7月18日致函4家美国风投公司,对其在中国AI和半导体等科技领域的投资表示“严重关切”,并展开调查。报道还称,美国拜登政府正在考虑制定新规,限制美国对从事先进半导体、AI和量子计算的中国公司的投资。
27、美国两党警告AI风险:或被用于开发生物武器
据路透社报道,当地时间周二,美国民主党和共和党参议员都对AI被恶意利用的可能性发出了警告,重点放在了AI被用来制造生物攻击的可能性。
在参议院司法委员会一个小组委员会的听证会上,生成式AI独角兽公司Anthropic的CEO达里奥·阿莫代伊(Dario Amodei)谈道,AI可以帮助其他不熟练的恶意行为者开发生物武器。他说:“我们认为,通过使更多的行为者能够进行大规模生物攻击,这对美国国家安全构成了严重威胁。”
28、外媒推测OpenAI即将开源GPT-3.5
据外媒Analytics India Mag爆料,OpenAI的深度学习领域知名人物Andrej Karpathy最近在推特中表示,在Llama热潮中,所有这些对于Transformer语言模型来说都是非常通用的。“如果/当OpenAI将模型作为权重发布时(我既不能确认也不能否认!),那么这里的大部分代码都将非常相关。该外媒记者认为,根据Karpathy的说法,OpenAI很有可能将GPT-3.5开源。这一对话源于一封推特上的帖子,一位用户询问Karpathy为什么一直在玩Llama 2,而不是为OpenAI构建Jarvis。
29、OpenAI主管工程师年薪660万 居世界第一
据CSDN报道,数据收集网站Levels.fyi网站近日发布了2023年上半年的全球程序员收入报告。报告显示,上榜的主管工程师的总薪酬中位数均在66万美元以上,较去年有大幅度提升。其中,OpenAI以高达92.5万美元的总薪酬中位数位列第一,而去年它还只是个“无名之辈”。这一天价薪酬主要针对10年工作经验的软件工程师,其薪资结构包含:30万美元的基本工资+62.5万的“股权”。其中,“股权”并非按照每年度发放,而是员工以每4年为一个周期进行领取。
30、阿里云支持Llama2全系列训练部署
根据阿里云官方公众号,阿里云在国内率先推出针对Llama2全系列版本的训练和部署方案,欢迎所有开发者来阿里云上打造专属大模型。为方便开发者群体,阿里云机器学习平台PAI在国内率先对Llama2系列模型进行深度适配,推出了轻量级微调、全参数微调、推理服务等场景的实践方案。
开发者可在魔搭社区Llama2模型页面点击“Notebook快速开发”,一键拉起阿里云机器学习平台PAI,对模型进行云上开发和部署;在其他平台下载的Llama2模型,也可使用阿里云PAI进行开发。据了解,Llama2大语言模型近日宣布开源,覆盖70亿、130亿及700亿参数版本。
31、小红书上线AI文生图新功能“此刻”
小红书近期上线了一个名为“此刻”的AIGC功能。从创作入口“+”进“此刻”,用户可以输入文字,由算法根据文字生成对应的图片,包括记事本、聊感悟、吐槽等风格。如果不喜欢自动生成的图片,可以点击“换一张修改”。
32、美图秀秀上线AI移除功能
根据美图秀秀官方公众号,美图秀秀近日上线了AI移除功能,用户只需“框选”或“涂抹”简单操作,即可通过AI智能移除照片中不需要的元素,还可以智能填充背景,补齐周围元素,实现便捷、无痕、自然的移除效果。当移除后出现不自然的情况,用户可继续框选移除区域,AI将不断校正优化,直至用户满意为止。
33、本地问答模型localGPT上线
据站长之家报道,本地问答模型localGPT近期在代码托管平台GitHub上线。localGPT是一个完全离线的问答工具,旨在保护用户隐私。它使用LangChain和Vicuna-7B模型构建,可以在不联网的情况下,基于本地数据进行文档问答。用户可以将文本文档(如 txt、pdf、csv 等格式)导入工具中,并通过提问获取准确的答案,所有数据都不会离开用户的环境。该工具仍处于测试阶段,Vicuna-7B模型基于Llama模型,具有原始的Llama许可证。
项目地址:
https://github.com/PromtEngineer/localGPT
34、英特尔推出34个开源AI参考套件
英特尔7月24日宣布与埃森哲合作一年的新进展,现向社区提供34个开源AI参考工具套件。每个工具套件都包括模型代码、训练数据、机器学习流水线说明、库和oneAPI组件,以优化人工智能,并使其可供多架构本地、云和边缘环境中的组织访问。
35、AI正影响2000亿美元游戏产业
据彭博社今日报道,AI已经开始影响价值2000亿美元的游戏行业。日本一家大型工作室的负责人预测五年内其公司一半的程序员和设计师将被淘汰。行业分析师Serkan Toto认为:“AI最终可能会消灭游戏中的整个工作类别,例如质量控制、调试、客户支持或翻译。”
瑞银证券分析师Kenji Fukuyama称,AI可以将游戏大片项目的资金和时间投资减半。日本最大的AI创企Preferred Networks已经与动漫角色生成平台Crypko合作。通常每张角色插图的外包成本高达10万日元(约合5058人民币),而从Crypko获得,每张图像的每月固定费用为4980日元(约合252人民币)、商业许可费为980日元(约合50人民币)。
在香港上市的中国头部体育游戏厂商望尘科技(Gala Sports)要求部门负责人研究机器学习,并为新颖的AI想法提供7000美元奖金。其CEO贾小东认为:“过去三四个月AI对游戏行业的影响可能与过去三十、四十年的变化一样巨大。”望尘科技使用公开的AI服务来构建用于渲染逼真3D头部模型的内部工具包,从而大幅减少了以前外包时需要两周时间和高达20万元的任务成本,现在只需花半天的功夫。
36、合成数据公司光轮智能完成天使+轮融资
《科创板日报》25日讯,合成数据公司“光轮智能”近期完成了天使+轮融资。公司已完成种子轮、天使轮、天使+三轮融资,累计融资金额达数千万元人民币,投资方包括SEE Fund、奇绩创坛、辰韬资本、变量资本等。
光轮智能成立于2023年1月,位于北京市,致力于为企业落地AI提供合成数据解决方案,结合生成式AI和仿真技术,为行业提供3D、物理真实、可泛化的合成数据。
37、代码模型CodeGeeX2-6B开源
今日,GLM技术团队在官方公众号宣布代码生成模型CodeGeeX2-6B开源。同时GLM技术团队也将对该模型持续进行迭代升级,以提供更加强大的代码辅助能力。
CodeGeeX2是多语言代码生成模型CodeGeeX的第二代模型,基于ChatGLM2架构注入代码实现。与150亿参数的StarCoder-15B相比,CodeGeeX2-6B凭借60亿参数便具备了近10%的优势。以下是CodeGeeX2在HumanEval上的测评结果。
CodeGeeX2-6B的安装地址:
https://github.com/THUDM/CodeGeeX2
38、工信部:加强通用人工智能等未来产业前瞻布局
据财联社报道,全国工业和信息化主管部门负责同志座谈会7月25日在京召开。会议强调,切实保障重点产业链自主可控,加强统筹调度和督促督导,压实各方责任,完善产业政策,强化人才队伍建设,提升产业发展质量和全产业链优势。着力培育壮大新兴产业,抓好国家制造业创新中心建设,提升产业科技创新能力,加强通用人工智能、6G、量子科技等未来产业前瞻布局,打造竞争新优势。
大型语言模型, 水印, AI classifier, 文本生成