01使用国内大模型(文心一言和讯飞星火)辅助数据分析(Excel篇)
2023年伊始至今,chatGPT让大模型火的一塌糊涂,由于国内需要方便使用chatGPT或GPT-4有诸多不便,故本系列将选择国内非常有分量的大模型(百度的文心一言和科大讯飞的星火认知大模型)来进行分享,通过一些简单探索其能否对数据小白上手数据分析有一定的帮忙。
数据分析的三大利器:Excel、SQL、Python(或R)。故本系列专题分享也将按照这三个利器来展开。
如果还没有这两个体验账号,可上各自官网申请,通过即可使用。
百度文心一言:https://yiyan.baidu.com/
星火认知大模型:https://xinghuo.xfyun.cn/desk
下面,先让我们简单看下两个大模型的概述:
文心一言:文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色
星火认知大模型:科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。(备注:不具备AI绘图能力)
账号登录后的文心一言界面如下:
科大讯飞星火认知大模型的界面如下:
至此,我们前期准备工作都准备好了,下一步让我们来体验下两个大模型是够能指导数据小白进行数据分析工作。
问题一:有一组数据:10,20,30,50,如何用excel找到最大值。
以下是文心一言的回答:
以下是讯飞星火的回答:
不难看出,两者对该问题给出的答案相对清晰,文心一言给出两种方式:一种是通过鼠标点击操作实现,另一种是通过写公式实现;讯飞星火给出的是鼠标操作方式实现,不过插入函数不在“插入”选项卡,而是在“公式”选项卡里面。数据小白按照步骤在Excel中自己捣鼓应该能统计出这组数据的最大值。下面让我们按照步骤试试在Excel中操作:
点击fx或“插入–fx插入函数”调出插入函数窗口:
选择MAX函数点击确定,在Number1中选择数据范围:
点击确定即可得到这组数据的最大值50。
可见,通过鼠标点击操作其实就是帮我们完成公式编写,得到结果。那也可以直接在单元格B1中写入=MAX(A2:A5)实现。
按回车即可得到结果50。
问题一太简单,对文心一言和讯飞星火,甚至读者都是小菜一碟,那我们试试第二个问题,看各自表现如何。
问题二:有两组数据,第一组为:机构1、机构2、机构3;第二组为:100,200,300,如何用excel公式找出第一组为机构2时对应的第二组的值。
以下是文心一言的回答:
以下是讯飞星火的回答:
初步从两者答案来看,文心一言的回答让人摸不着头脑,讯飞星火的回答看起来很靠谱,步骤讲解也算清楚,那两者是否都能给出我们想要的答案吗?
先按照文心一言的建议进行尝试:录入数据,在C列输入公式,得到以下结果:
下拉得到答案均为空,显然不是我们想要的。
那试试讯飞星火的建议:将第一组数据输入A列、第二组数据输入B列,然后在C列输入公式:
得到结果为NA,显然不是我们想要的,也许是讯飞星火说的对我们小白提示不友好,如果对excel有基础的童鞋,知道可进行以下调整:
假设在C2单元格输入需要查找的机构2,然后在D2单元格输入:=VLOOKUP(C2,A2:B4,2,FALSE)公式即可得到对应的数据。
所以针对问题二,不能直接从回答套用得到结果,还需要进行微调才行。大家知道Excel绘图很强,让我们试试想用excel绘图两者会给什么建议。
问题三:有一组数据:10,20,30,50,如何用Excel绘制柱状图。
以下是讯飞星火的回答:
对于简单绘图,两者给出的操作步骤类似,但讯飞星火给出的步骤时符合数据分析人员操作方式的,以下是按照讯飞星火建议绘制的柱状图:
选中数据范围A1:A4
点击推荐的图表,调出绘图界面:
看效果就是我们要的,直接点确定即可完成最简单的柱状图绘制。
以上是非常基本的用Excel写公式和绘图的尝试,初步对比来看,讯飞星火的理解能力比文心一言略胜一筹,给的建议更符合分析者的思路。
后续将探索下excel在其他方面的建议,比如计算数据间的相关性,做两组数据的线性回归模型等操作。