如何获取更多保险知识？揭秘保险世界的那些事儿

ChatGPT与保险 2年前 (2023) lida

58 0 0

文章主题：

ChatGPTChatGPT热潮背后的冷思考

2022年11月30日，OpenAI公司发布了一款名为ChatGPT的软件，一经问世，ChatGPT的热潮顿时席卷全球。ChatGPT是一种基于生成式人工智能的聊天机器人，其对原有的人类自然语言文本生成模型进行大规模数据训练，从而能够学习和理解人类语言，高度模仿人类思考和行为方式，呈现出高流畅度和强逻辑性。ChatGPT的出现标志着人类突破了弱人工智能水平，迈入了强人工智能时代。ChatGPT的强大算力和高度智能，使得人们对其在各行业的应用前景充满美好期待。尤其是作为服务行业的保险业，在ChatGPT加持下，整个保险行业运营效率和智能化水平将呈现质的飞跃，保险行业原有的模式会被重塑，ChatGPT的出现给保险行业带来无限的想象空间。

然而，在“人人学编程，言必谈AI”的今天，以ChatGPT为代表的人工智能给人们带来极大便利的同时，潜伏在ChatGPT背后的各种隐忧也逐渐浮出水面。人工智能发展速度之快，使得人类难以在短时间内做好与ChatGPT的融合和衔接。ChatGPT本质上是一种工具，它自身没有感官，缺乏人类几千年来形成的道德观和价值观的加持。保险行业在ChatGPT落地之后会面临怎样的不确定性，是一个值得慎思的问题。本文站在一个旁观者的视角，透过ChatGPT热潮，思考ChatGPT可能带来的两大隐忧——“信任”和“安全”。

ChatGPT的运行机理具体分三个步骤：首先，收集人类对“问题+答案”的标注结果进行有监督的学习；其次，利用人类模型的多个输出结果进行排序，得到“答案+分数”集，以此训练出偏好模型（也叫奖励模型）；最后，通过强化学习算法，结合之前训练所得的奖励模型来更新生成模型。

将ChatGPT应用在保险行业中，要先解决产业对接的问题。其中一种可能是“预训练模型+微调”模式，其首先训练出通用大模型，在通用大模型基础上添加保险行业数据，进而训练出保险行业大模型；之后用单个公司或单个场景的少量数据，训练出针对单个公司或场景的大模型。这种模式大幅降低了开发成本和产业化门槛，大概率会成为未来ChatGPT产业化的一种主流模式。

一ChatGPT能否维系保险行业的“信任”

由ChatGPT的运行机理和训练过程可以发现，开发人员对其进行训练的“问题+答案”集和“答案+分数”集很大程度上决定了ChatGPT的认知，这两个集合受开发人员和数据标注人员的个人偏好、道德观和价值观的影响较大。这样的ChatGPT经过足够的训练，固然可以输出令使用者满意的答案，但是这个答案能否经得住行业共有的道德观和价值观的考验，着实是一个值得审慎对待的问题。以保险行业为例，保险公司作为负债经营的经济主体，“信任”无疑是奠定保险行业生存根基的共有价值观之一，而赢得消费者信任的关键，除了法律和公序良俗的约束之外，更多的是保险公司和消费者长期交互过程中产生的人类共有的情感。将ChatGPT引入保险行业之后，它能否延续保险行业苦心经营得来的信任，至少目前难以下结论。

ChatGPT输出的所有答案都是经过模型计算之后的“预测值”。类似于利用统计软件做回归分析，无论正确与否，统计软件总能输出回归结果和预测值。ChatGPT对人类所有问题也是“有问必答”，都能给出一个“预测值”。尽管大部分“预测值”从概率意义上具有较高的准确度，但仍有一定比例的答案是错误的。当ChatGPT对一个满怀信任的消费者给出一个错误答案，甚至给消费者带来损失的时候，消费者对ChatGPT的信任会大打折扣，并且这种信任的塌陷会迅速传染给其他消费者，造成整个社会对ChatGPT的信任危机，进而引发消费者对保险行业的信任危机。

退一步讲，即使ChatGPT输出的是正确答案，但是这种正确性是建立在开发人员和数据标注人员这一小众群体的认知和价值判断基础上的，因此，这个答案具有的是一种相对的正确性。当ChatGPT和保险行业对接后，ChatGPT对于正确性的判断很大程度上由对接的保险公司决定。以保险公司未来的ChatGPT客服为例，当消费者对保险公司的ChatGPT客服说出自己的保险需求请求ChatGPT推荐一款最优保险时，ChatGPT推荐的是保险公司利润率最高的产品，还是对消费者来讲性价比最高的产品，取决于保险公司对ChatGPT的训练数据，而这个数据里隐藏着保险公司灌输给ChatGPT的道德观和价值观。

更退一步讲，即使ChatGPT模型非常成熟，开发人员和数据标注人员秉持客观中性的立场，训练数据也是客观中性的，但是ChatGPT经过训练后输出的结果仍然具有某且这种负面影响会“反哺”ChatGPT，使其经受不良的训练，进而对其他“无辜”的消费者输出恶性结果。2016年，微软公司推出了聊天机器人Tay。刚上线时，Tay表现得彬彬有礼，但不到一天，Tay就被不良用户教坏，出言不逊、脏话不断，言语甚至涉及种族主义、色情、纳粹，充满歧视、仇恨和偏见，甚至Tay说过“‘9·11’事件是布什干的”“希特勒在世的话绝对比当今这位猴子一样的政客干得好多了”这样的话。不到一天，Tay就被迫下线。

二ChatGPT能否维系保险行业的“安全”

对于保险行业来讲，数据安全的重要性高于金融行业的其他分支，因为保险行业的数据不仅记录着消费者的个人财务状况，更记录着包括消费者健康状况在内的隐私信息，一旦保险行业的数据发生泄露，造成的恶劣影响可想而知。就目前ChatGPT涉及到的数据来看，训练数据安全状况令人担忧。

根据OpenAI的说法，ChatGPT使用的训练数据，都是公开可用的个人信息，其用户信息（用户的账号信息和用户提问的问题）也会受到很好的保护。然而事与愿违，2023年3月20日，ChatGPT宕机了几个小时，其间一些ChatGPT用户发现其他用户和ChatGPT的对话内容被暴露出来，甚至一些用户还看到了ChatGPT-Plus订阅者的付费信息。

OpenAI随即进行了调查并纠正了导致该问题的程序错误。尽管这个问题解决了，但并不意味着将来不会出现类似的新问题。很多数据在有意无意中都对ChatGPT进行了训练，ChatGPT是基于统计学习神经网络的黑箱模型，这让OpenAI的开发人员自己都无法准确回答ChatGPT未来的智能程度，更无法准确回答ChatGPT究竟有没有使用这些数据。用户使用ChatGPT过程中的每一步都充斥着数据泄露的风险，相应的监管措施很难对其作出严密的防范。

此前，三星公司内部允许员工利用ChatGPT进行辅助，以提高工作效率。结果不到20天，就有三起数据泄露的事件发生。经过调查，原因是有一些员工为了省事，直接把公司的机密代码复制到ChatGPT中，造成数据的泄密。

ChatGPT的开发者OpenAI是一个商业公司，在商业利益面前，难以保证其能始终秉持着严守数据安全的职业道德。对于用作产品开发的ChatGPT，当使用某一家保险公司的数据对模型进行训练之后，面对另一家保险公司的数据，是从原始模型开始对ChatGPT重新训练，还是在前一家保险公司已经训练好的模型基础上进行后一家数据的迭代训练？显然，吸收前一家公司数据信息之后再进行迭代训练的ChatGPT开发出来的产品更加优秀。但在职业道德和商业利益面前，OpenAI做何选择，不得而知。

鉴于ChatGPT在数据安全方面的巨大隐患，很多国家开始采取措施，对ChatGPT的使用进行干预。今年3月，意大利数据保护局宣布，从即日起禁止使用ChatGPT，限制其所属公司OpenAI处理意大利的数据信息，并着手开始针对OpenAI立案调查。随后，德国官方数据安全人员也表示，德国可能会直接屏蔽掉ChatGPT，理由是ChatGPT可能危害本国的数据安全。4月13日，西班牙和法国执法部门对ChatGPT可能存在的违法行为进行了调查。与此同时，欧洲数据保护委员会（EDPB）成立了针对ChatGPT危害数据安全行为的特别调查组，旨在促进各国之间的合作，分享ChatGPT危害的细节和执法行动的成果。

ChatGPT算法的逻辑是通过训练后输出最接近提问者意图的答案。提问者的问题越详细，ChatGPT越能精准地获取提问者的意图，输出的答案就越令提问者满意。这样会促使提问者尽可能详细地输入自己的个人信息，代价是数据泄露的风险就更大。正如同金融资产的风险和收益成正比一样，ChatGPT的风险同它的表现也成正比。

当ChatGPT在保险行业正式落地之后，ChatGPT的开发者OpenAI就成了保险行业事实上的信息和数据中枢，这也具有两面性：一方面，OpenAI可以充分利用数据优势，基于ChatGPT的强大算力，高效率完成一些工作，例如反保险欺诈、行业重疾发生率分析、死亡率分析、养老金测算、保险市场未来预测等；另一方面，OpenAI的高度开放性以及监管的真空，让这些包含商业机密和个人信息的数据处于高度危险之中，随时都有可能泄露。正因为如此，很多专家呼吁暂停ChatGPT的训练和使用，以等待数据安全方面的监管措施跟进和落地。

ChatGPT问世后引发的不确定性有很多，和其他事件的不确定性不同的是，ChatGPT作为一个新事物，我们无法提前预料ChatGPT的大规模使用会面临怎样的后果，这是ChatGPT的开发者无法控制的。等待我们的不是Unknown knowns，也不是Known unknowns，而是Unknown unknowns。信任，是保险行业存在的基石；安全，是保险行业平稳运行的保障。我们在迎接一种新的里程碑式的技术到来，在尝试、体验这种新技术的同时，更应该注重加固堤坝，在人类可控的范围内、在监管可及的范围内去迎接、拥抱新技术，使它真正为保险行业所用，真正能够造福整个保险行业乃至整个人类。

本文系《上海保险》2023年第4期文章《ChatGPT热潮背后的冷思考》改编而来。作者单位：宁波财经学院

“上海保险”微信公众号是上海市保险同业公会、保险学会联合打造的自媒体平台，专注于优质保险内容传播、保险常识科普、保险政策解读，并促进业内交流互通。

欢迎赐稿：chenxian@shia.org.cn

往期回顾

【保险供给策】网络安全保险在我国的发展和创新研究

【保险供给策】新冠隔离保险对未来保险产品创新的启示

【保险供给策】新模式新业态下的网络安全保险发展研究

// 扫码关注我们//

获取更多保险资讯

长三角微信矩阵

浙江省

保险行业协会