文章主题:ChatGPT, AI内容生产, 法律风险, 算法责任
文章转载来源:AI之势
文:赵志东 蔡佳雯
来源:财联社
2022年底,美国科技初创公司OpenAI发布的智能聊天工具ChatGPT一夜火爆。与过去一些AI聊天机器人对话时明显的机械感或内容复制粘贴感相比,ChatGPT给出的答复往往逻辑清晰,切中要点,并能与用户进行自然流畅的对话。出于对AI技术究竟发展到何程度的好奇,各行各业的人都开始用ChatGPT进行花式测评,从写代码到做高考数学题,从翻译学术论文到写命题小作文。而ChatGPT的完成度也确实令人感慨,过去仅能由人类完成的创造性工作,一定程度上可以由ChatGPT取代,完成相应内容生产。
🎉 ChatGPT引领AI内容革命🔥,人工智能生成内容领域正经历前所未有的热度飙升!微软已无缝集成这项创新技术到必应搜索和Edge浏览器,为用户带来更智能的搜索体验。.baidu.中国紧随其后,计划在3月将自主研发的ERNIE Bot“文心一言”进行全面内测,不久后面向大众开放,预计将再次引发行业震动。🚀 智能未来,AI内容生产正加速到来!
🎉🚀ChatGPT的崛起引发了全球热议,它以其强大的“魔法”展示了技术的进步,同时也引发了一系列关于AI内容生成的伦理、责任与法律挑战。💡📝接下来,让我们深入探讨其背后的法律风险及应对之道,从算法、数据安全和版权合规三个方面进行剖析。首先,算法层面的法律不确定性是关键。ChatGPT基于复杂的机器学习模型运作,潜在的偏见或错误决策可能导致法律问题。我们需要密切关注算法透明度和公正性,确保其决策过程符合法律规定。💡🔍其次,海量数据的收集与使用亦需谨慎。ChatGPT背后的训练数据可能涉及隐私,如何合法合规地处理用户信息是必须面对的问题。建议企业建立健全数据保护机制,遵守GDPR等数据保护法规。🛡️💻最后,内容版权问题不容忽视。生成的内容可能会侵犯原创者的权益,法律对此已有明确规定。对于ChatGPT的生成内容,应明确版权归属,并提供合法授权渠道。📝⚖️总的来说,面对ChatGPT带来的机遇与挑战,我们需要保持警惕,同时寻求合理的法规指导和技术创新,以确保人工智能的发展既能造福社会,又能规避潜在风险。🌐💼
一、ChatGPT生成虚假信息,谁来为答案质量负责?
🌟ChatGPT背后的科技魔法揭秘🔍:通过尖端算法与海量数据驱动,这款AI巨擘运用了卓越的自然语言处理技术,让机器也能流畅地理解和生成人类对话。它的秘密武器是基于用户偏好的强化学习模型(ReLUHF),由专业团队精心训练,用海量的语言输入喂饱它,然后通过人工标注的高水准反馈,为ChatGPT构建了一个奖励机制,让它在回答中不断追求卓越,修正错误并优化输出。就这样,ChatGPT逐渐掌握了语言的韵律和逻辑,实现了自然语言交流的无缝对接。🚀
🌟ChatGPT:语言艺术大师?🤔潜在风险与挑战并存✨ChatGPT以其强大的多语种处理能力,引领了自动化文本生成和问答的新潮流,仿佛成为智能对话界的魔术师。它在新闻、营销及客户服务等多个领域展现出潜力,但请注意,其内容准确性并非万无一失`(accuracy not guaranteed)`。协议中明确指出,用户需理解其“胡言乱语”的潜在风险`(disclaimer on absurdity)`。面对ChatGPT生成的看似合理实则误导的信息,各国监管机构正密切关注,警惕它可能带来的误导和法律问题`(watchful eyes on misinformation)`。相较于那些无害的废话,那些一本正经的错误陈述可能造成的危害不容忽视`(misleading vs. harmless chatter)`。在享受ChatGPT带来的便利的同时,我们也需理性看待其局限性和责任 `(benefits with caution)`,确保信息的真实性和有效性 `(verified information)`。🚀
🌟警惕!ChatGPT潜在风险🔥——ChatGPT,作为全球热门的AI聊天机器人,其无与伦比的语言生成能力引发了广泛关注。然而,正如OpenAI首席技术官米拉·穆拉蒂所警示的那样,这款强大的工具也可能被不良分子利用,制造出混淆视听的假信息。👀这不仅是大型语言模型面临的共通问题,也是我们必须警惕和应对的新挑战。当前,随着技术的进步,如何确保人工智能生成的内容真实可靠,成为了亟待解决的关键议题。 kode(代码段)——通过算法检测和验证内容的真实性,是保护用户不受虚假信息侵害的有效手段之一。💡同时,教育公众识别AI生成内容的特征,提高他们的媒体素养,也是防止谣言滋生的重要环节。ChatGPT的普及,无疑为我们的交流方式带来了革命性的变革,但同时也要求我们保持警惕,共同守护一个健康、公正的信息环境。🌍让我们携手,用智慧和科技的力量,防范潜在风险,让ChatGPT服务于更广泛的善意而非恶意。💪
🌟在专业人士眼中,ChatGPT的真假辨识并非易事。尤其是在法律与医学这些高度专业化的领域,每一份信息都关乎生死财产,不容有误。若不慎采纳错误或未经证实的内容,后果可能相当严重,对个人安全构成潜在威胁。🛡️
另一方面,不排除一些别有用心的不法分子,通过向ChatGPT输入虚假或误导性的信息来“训练”其产生虚假信息,严重者可能导致影响政治舆论或政治生态、煽动暴力和犯罪等破坏公共利益等严重后果。
我国出台的《互联网信息服务深度合成管理规定》,也是旨在应对深度合成技术给法律、社会秩序、公共安全带来的冲击。根据《互联网信息服务深度合成管理规定》给出的定义,深度合成技术是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术,其中包括篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术。ChatGPT这类人工智能内容生产产品,显然应受该法的规制。
按照《互联网信息服务深度合成管理规定》要求,深度合成服务提供者应当落实信息安全主体责任,建立健全用户注册、算法机制机理审核、科技伦理审查、信息发布审核、数据安全、个人信息保护、反电信网络诈骗、应急处置等管理制度。
首先,深度合成服务提供者应当以显著方式提示深度合成服务技术支持者和使用者承担信息安全义务。对于使用其服务生成的可能导致公众混淆或者误认的信息内容,应当在该信息内容的合理位置、区域进行显著标识,向公众提示该内容为深度合成,并在生成疑似违法信息时提示用户存在虚假信息的安全风险。
其次,深度合成服务提供者应当加强深度合成内容管理,建立健全用于识别违法和不良信息的特征库,采取技术或者人工方式对深度合成服务使用者的输入数据和合成结果进行审核。如果发现用户利用深度合成服务制作、复制、发布、传播虚假信息的,应当及时采取辟谣措施,保存有关记录,并向网信部门和有关主管部门报告。
与此同时,对发布违法和不良信息的相关深度合成服务使用者,要依法依约采取警示、限制功能、暂停服务、关闭账号等处置措施。
二、ChatGPT生成歧视性文本,算法盲盒如何监管?
除了《互联网信息服务深度合成管理规定》,ChatGPT等人工智能内容生产产品也受《互联网信息服务算法推荐管理规定》规制。《互联网信息服务算法推荐管理规定》中所称算法推荐技术,就包括利用生成合成类算法技术向用户提供信息。该法规的要点,是防止出现算法歧视或算法偏见,生成负面有害信息或低俗劣质信息等不符合主流价值导向的内容。
根据《互联网信息服务算法推荐管理规定》第七条规定,算法推荐服务提供者应当建立健全算法机制机理审核、科技伦理审查、用户注册、信息发布审核、数据安全和个人信息保护、反电信网络诈骗、安全评估监测、安全事件应急处置等管理制度和技术措施。
具体来讲,算法服务提供者应当定期审核、评估、验证算法机制机理、模型、数据和应用结果,确保算法模型不违背伦理道德。在此基础上,算法服务提供者同样应以显著方式告知用户其提供算法推荐服务的情况,并以适当方式公示算法推荐服务的基本原理、目的意图和主要运行机制等。
此外,如果是具有舆论属性或者社会动员能力的产品,算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。
以ChatGPT为例,尽管OpenAI在官网上声明,ChatGPT已通过算法设置和训练,能在一定程度上拒绝用户不合理的请求,例如生成可能包含种族歧视或性别歧视、暴力、血腥、色情等违反法律以及公序良俗的内容。但事实上,这样的违法信息传播风险仍然存在,其引发的法律责任和社会舆论,可能会对公司形象及商誉产生负面影响。
三年前在韩国十分火爆的人工智能聊天机器人Lee Luda,由于一些用户在对话交互时,故意输入污秽和暴力言语,导致Lee Luda在接收这些不符合主流价值观的内容后,开始输出一些涉嫌性别歧视、种族歧视、对弱势群体的歧视的内容,该产品因此广为诟病而于上线不到一个月就中断了服务。
三、用户的输入信息被用来训练ChatGPT,个人信息处理合规要点何在?
ChatGPT的前期训练、后期迭代和强化学习都需要海量的数据,最新开放版本GPT-3.5预训练数据量已达到45TB,其中就包括北京智源人工智能研究院建构的中文语料库WuDaoCorpora中约3TB的中文语料。
《互联网信息服务算法推荐管理规定》第十四条明确规定,深度合成服务提供者和技术支持者应当加强训练数据管理,采取必要措施保障训练数据安全;训练数据包含个人信息的,应当遵守个人信息保护的有关规定。
我国《个人信息保护法》明确了处理个人信息应当遵循的公开原则、诚信原则和最小限度原则,即个人信息处理者应当公开个人信息处理规则,明示处理的目的、方式和范围,不得过度收集个人信息,不得通过误导、欺诈、胁迫等方式处理个人信息。以ChatGPT为例, OpenAI公司为模型训练而收集或处理个人信息的,还需要取得用户个人的同意。
在OpenAI公司就ChatGPT使用常见问题的答复中,OpenAI明确承认,用户与ChatGPT的对话数据,将会被用于ChatGPT的迭代模型训练。并且,OpenAI特别提示,OpenAI暂时无法从输入历史中删除特定某条内容;如果想要删除数据,必须以注销此OpenAI账号的方式,而该账号所有的相关数据会被一起删除,故用户不要在使用ChatGPT时输入敏感信息或机密内容。
因此,在类似ChatGPT的人工智能内容生产产品开发和后期升级过程中,尽可能使用公开的非个人信息,或对收集的个人信息进行匿名化的处理。如果必须要使用个人信息,应当明确向用户告知并取得其个人同意,避免违法使用个人信息造成的侵权或损害。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!