近日,媒体报道阿里的AI一对多挑战人类律师,不到10秒审核百行合同,准确率达96%。实际上早在几年前,多家人工智能平台都已涉及到法律法务行业,笔者了解的都有超过10家。
从AI开始触及法律行业,人们就在讨论这样一个问题:“人工智能到底能不替代律师”。科技界对此很乐观,法律界也很恐惧。但现实中AI对法律服务行业的影响没有预期的那么大。
就笔者目前了解的AI律师平台的发展情况,不但无法取代律师,连取代律师助理的文字工作都很难。主要原因是技术上有瓶颈,无法突破。
我不妨从技术上分析下。AI要对法律问题的分析与判断,至少要完成三个步骤,理解事实问题并将事实问题提炼为法律上有意义的事实,列出法律问题,理清法律与事实的逻辑关系。即事实、法律、逻辑关系。
但是在第一个问题上,AI都遇到了严重的挑战,AI并不能很好地理解自然语言,更别说准确提炼出法律上有意义的事实了。
比如Ross法律机器人平台,它本质上还是一个智能检索系统。用户在ROSS平台输入问题,平台会问题分解成百上千个子问题,再去进行检索每个问题的答案,得到答案之后,对答案进行检索,寻找每个答案在数据库中的证据,相当于给每个答案进行证据打分,最后按照分值对每个答案排名,用户可以人工选择最优的答案,这样相当于对平台进行了一次训练,下次这个最优的答案在类似问题中就会排名靠前,这样系统会越来越准确。
所以对问题理解的准确性依赖问题与数据库的匹配度。将一段自然语言组成的事实问题输入到AI平台,平台要去通过算法进行检索才知道什么意思。而检索是通过自然语言检索的,这个检索本身就是不准确的,更别说数据库覆盖面的问题。不能准确理解自然语言,就不能准确地检索;不能准确检索,就更不能理解自然语言。这里面形成了一个逻辑悖论。
有这样的缺陷,AI平台进行案例检索都无法胜任,那么通过检索去找到匹配的案例去理解案件事实就更加不可能了。
为了克服这样的缺陷,现在一些平台采用结构化的语言。从阿里公布出的专利可以看到这一点。用户向AI平台输入法律资料,例如起诉书、证据材料、裁判文书;平台从法律资料中提取有意义的事实,得到特征要素集合;基于知识图谱中的逻辑关系和客观事实要素,分析得出结果。而关键的一步就是建立结构化的知识图谱,描述法律与事实之间的逻辑关系。平台利用机器学习的算法不断扩展语义知识图谱。而输入模块也可以通过结构化的方式避免AI对自然语言理解的缺陷。
所以关键的问题还是没有解决,AI无法进行准确的自然语言理解,无法进行准确的自然语言检索。最终结果的准确性取决于建立的语义库。这样应用的范围和程度就会受到很大影响。比如阿里这个平台在网购法律服务中肯定有优势。因为阿里在这个领域可以构建相对全面的知识图谱。
通俗地说,AI平台无法准确理解自然语言,用户输入一段文字,机器理解一定会产生偏差,而解决问题需要基于对自然语言的理解进行检索,不可能得到满意的检索结果,这一关过不了,后面的分析也就没有了基础。而法律服务是对自然语言理解要求最高的行业之一。法言法语是有限的,但是要用法言法语去提炼的事实问题是无限的,结构化的语义库无法替代自然语言理解。这个就成了AI律师的瓶颈,短期内无法解决。
欢迎加笔者微信patentlight交流专利问题。
历史文章:
首例基因技术药物专利授权案牵动亿万产业