《评测人工智能大模型在保险行业的应用：元保与分子实验室联手发布报告》

ChatGPT与保险 2年前 (2023) lida

92 0 0

文章主题：保险, 大模型, 评测报告, 人工智能

中证网讯（记者赵白执南）据元保公司消息，该公司的互联网保险中介平台——元保保险经纪（北京）有限公司，与国内保险科技研究机构分子实验室共同发布了《人工智能大模型保险行业应用评测报告》。该报告指出，包括ChatGPT、百度文心一言等在内的10个主流大模型在医疗知识、保险常识、保险法律知识等领域都有不错的表现，而且每个大模型都展现出了自己独特的特点。值得一提的是，元保保险经纪（北京）有限公司成立于2020年，是一家专注于提供在线保险服务的平台。

《报告》的发布在某种程度上降低了保险大模型市场的信息不对称现象，从而为保险机构在选择大模型供应商以及在大模型应用方面的决策提供了有价值的参考。

图为《报告》评测框架。图片来源：《人工智能大模型保险行业应用评测报告》

根据《报告》的分析，10个主流大模型在医疗知识、保险常识以及保险法律知识领域的表现相对较为出色。然而，它们在智能核保、智能理赔以及话术优化方面的表现则显得不够理想。此外，这些模型的营销服务应用能力也呈现出一定的差异性。总体来说，这些大模型虽然在某些方面表现优秀，但仍需进一步提升其在其他方面的能力和应用价值。

在具体的领域中，我国的大模型在处理专业基础知识的问题时，其对我国的了解程度明显高于国外的大模型，同时其回答的表现也更为卓越。例如，在保险和法律的常识知识问答方面，文心一言和清华智谱都进入了前两名，其得分甚至超过了GPT-4。而在医疗知识的回答上，文心一言同样成为了各大模型中的佼佼者，其表现与科大讯飞相当，都优于GPT-4。

根据报告指出，头部大模型在专业知识问答方面已经展现出了相当强的应用潜力，可以直接应用到实际问题中。举例来说，当被问及“社保与商业保险的区别”时，文心一言能够从性质、建立基础、管理体制、对象、保障范围、资金来源、待遇给付、时间性以及法律基础这九个角度进行全面解答，内容详尽且准确，能够有效地帮助提问者消除疑虑。类似地，清华智谱也从保障对象与范围、性质与目的、保费承担者、保障程度与灵活性、管理机构这五个方面提供了有力的答案，具有很高的应用价值。

《报告》指出，当前的大型人工智能模型非常适合充当智能机器人，为客户解答关于保险、医疗等领域的疑问。此外，这些模型还能为保险代理人提供支持，成为他们的业务拓展工具之一，从而提高代理人服务客户的能力。在代理人渠道仍然有待加强的阶段，大型模型对于提高代理人工作效率、降低保险机构服务客户的成本以及推动保单成交等方面，可能产生积极影响。

《报告》指出，在本次评估过程中，不同的大型语言模型所表现出来的特性各有差异。具体而言，文心一言在国内大型语言模型中展现出了极高的综合性能，尤其是当中文语料库丰富时，训练出的大型模型在专业知识供应方面具有非常强的能力。然而，未来仍需在多模态理解和推理能力上进一步优化和强化。

虽然通义千问在专业知识问答方面并不出类拔萃，但在营销话术、智能核保和实时质检等领域，其表现却相当出色。其语言表达流暢自然、清晰簡潔，展示出了良好的逻辑思維能力和推理判斷能力。

清华智谱的GLM-130B最大的解答优势在于很多问题引入了生动的例子加以说明，这对于提问者而言，无疑是个亮点。

事实上，去年底以来，以ChatGPT为代表的AI大模型横空出世，大幅提升了AI尤其是自然语言处理技术解决实际问题的能力，在全球范围内引起极大关注。各个行业都在尝试探索大模型应用落地的路径，这其中也包括保险行业。

清华大学金融科技研究院副院长、中国保险与养老金研究中心主任魏晨阳表示：“对大模型的评测工作，在全球范围都是一个意义重大的事情。结合金融领域一个重要板块（保险）的大模型评测，其实更具有特殊的意义。包括AI在内的科技赋能，核心在于结合具体应用场景时，模型是否在实操层面、核心业务的前沿，真正有实用价值。”

保险, 大模型, 评测报告, 人工智能