数据分析师会被ChatGPT取代吗

风险与机遇 2年前 (2023) lida

76 0 0

就在前两个星期，老板和我过工作，她见我面瘫而且佛系，恐吓我说数据分析师可能以后就要被ChatGPT取代了。

我一时竟有些惊喜，以为可以早下班，但细想便是黯然，表示只恨它不够智能，取代不了我的大部分工作。

这篇来聊一聊热度已经持续两个月的ChatGPT是否能替代数据分析师工作的问题，先说结论，以当前ChatGPT的产品模式，数据分析师的工作内容中能被ChatGPT覆盖的部分非常有限。

对于这个结论，我不知道该庆幸还是该遗憾，就我自己的想法来说，是很希望被打脸的。

数据分析师会被ChatGPT取代吗信息的交互

目前ChatGPT最普遍的运用方式，是在对话框中输入文字，等待一段时间，然后输出文字。

如果一个数据分析师只会这两样，那我就要怀疑他能找到工作是因着父辈的荫庇。因为在数据分析师实际工作的信息交互场景中，这只是非常基本和简单的一部分。

从输入端看，ChatGPT相比真人的第一个问题是信息来源单一。

公司里的任何一个员工都不可能只跟单一的人交流，作为数据和业务间桥梁的数据分析师更加如此，一个典型的数据分析师的交流对象至少有数据产品经理、数仓工程师、直属上级和业务人员，每一方能提供的信息都是完全不一样的。

从公司运行的规律来看，这非常必要，因为实际生产中面临的问题往往是复杂的，许多问题需要花费几个小时，与各方沟通交流后才能得到答案。

我们向AI提了一个不在AI数据库里的问题，这个问题需要综合多方信息再结合数据分析才能回答，AI是否能规划出执行步骤以及需要确认的信息，然后找到相关方提问？而相关方是否有动力回答？

输入端的第二个问题是沟通媒介的单一。

文字是一种可靠但低效的沟通媒介，公司内外部的交流中还有很大一部分来自电话语音以及面对面交谈。

图形、肢体语言、神态语气、说话的节奏和重音，这些作为辅助交流的工具都可能包含着信息，而这些信息如何才能被AI理解，似乎还看不到什么希望。

当然，也可以要求说话的人把信息全部无损转化成文字输入给AI，那个成本就很高了，直接影响就是人会变得不太愿意和AI交流。

输入端的第三个问题是复杂的沟通场景，这里主要指开会。

首先是会前准备，会议的主题，会议的文档，会议要解决的问题，这三项在大多数公司可能是不存在的，如果存在，那就要考虑由谁来提供给AI。

其次是AI识别了会议语音后，如何理解会议里大家在讲什么，哪些人是在推进会议进程，哪些人是在宣泄情绪，哪些人是在无意识地捣糨糊让话题跑偏，哪些人是在不懂装懂说些废话显示一下自己的存在感，以及其下的权力关系和利益博弈…………

然后是理解了会议内容后，是否能依照自身诉求提出问题、观点或者想法，会议是要有结论的，如果会议结论对后续数据工作造成影响，却又没有及时提出，潜在的成本就很高了。

最后是如果没有直接分配，能否从会议过程和结论中提炼出自己的待办，然后规划时间去完成。

再来聊聊输出端。

输出端的最大问题，是AI缺了点主动性。

你会希望你的下属是纯粹被动回答问题的人，还是能主动提出问题和建议，事事想在你前面的人？

不要小看这个差异，它直接影响在上级眼里你是一个单纯的工具还是一个能平等交流的活人。如果是那种天天在回答问题的数据分析师……与其担心被AI替代，不如先担心一下其他活人直接把你替代了。

第二个问题是，AI推动不了协同工作。

AI是为人服务的，这意味着它不具备独立人格，注定要低人一等，

而公司要发展，工作要推进，很多事情必然在表面上或者实质上会触动现有的利益，或者至少需要其他部门的配合。任何一个需要进行协同工作的人，如果总是担心这个担心那个，谨小慎微缩手缩脚，眼里有的不是目标而是瓶瓶罐罐，那他是做不成事情的。

AI恰恰是那个谨小慎微的存在，它几乎不具备说服他人的能力，任何一个真人，看到AI来和你提一个需求，第一反应都可能是受到了AI使用者的蔑视，第二反应则是：你不过是一条狗，有什么资格来指挥我？

唉，其实AI连狗都不如，你打了狗，狗还可能扑上来咬你一口，你把AI骂一顿，AI顶多要求你文明礼貌，这种老好人一样的存在，哪像是能推动得了工作的？

第三个问题，就要说到数据分析师最常见的工作场景。

数据分析师最常见的工作场景是啥？

——小A呀，帮我取个数据，明天开会要用。

就这么个简单的场景，真正要实现仿佛也很难。

这就牵扯到我要说的第二块内容：责任的归属。

数据分析师会被ChatGPT取代吗责任的归属

前些日子ChatGPT话题大热之时，有个段子十分流行，说ChatGPT并不能代替职场人士，因为它既不会敬酒，也不能背锅。

这当然是一个讽刺国内职场环境的笑话，但我想就此多说两句。所谓的不能背锅只是一个表象，实质性的问题在于增加了不可预见的潜在风险，具体一点说，是数据的安全性和准确性问题。

大领导们通常都有个习惯，只关心大势，不关心细节。

可是数据工作的一个特点在于事无巨细，一个简单的操作都有可能导致严重的后果，一个小小的数据专员犯错可能就会影响整个业务线的策略制定，抑或是造成关键信息的泄露。

就问一个最简单的，如果你是公司老板，你有这个胆子把公司数据库权限开放给AI吗？

大部分人是不敢的，因为这就像把钱存在一个陌生人手上，无法保证安全。如果哪天AI一不小心把财务信息、客户信息、人事信息披露出来，你能怎样？炒了AI的鱿鱼吗？

再说一点别的。

为什么有许多人，明明给了报表，给了下载路径，却偏偏喜欢问数据分析师要数据？这其中很重要的一点是责任归属给谁。

你从报表里取的数据有问题，责任人可以有很多，比如可能是数据库出了错，那就要找研发，也可能是旧版指标没有及时更新，那么就要找数据产品或者分析师，然后告诉你这个在排期中得等个三五天，更有可能是业务人员自己理解错误，那就无法可想，只能怪自己。

而如果是问数据分析师要数据，那么上述风险都可以转嫁，反正不管哪里出了问题，都可以归结为数据分析师的问题，数据分析师需要对自己出的数据负责，于是就有了闭环。

因为真人是能被理解的，对真人我们已经有足够丰富的管理手段，如果恶劣一点删库跑路，还可以诉诸法律，在没有明显故意的情况下，个人犯错带来的危害能被控制在一定范围之内。

AI则不然，AI没有动机和情感，所以也就谈不上是否故意，AI也没有欲望和痛苦，所以不知何为惩罚，AI如果犯错，对公司而言类似一种自然灾害，不可预见，也无从归因。

我们大致能理解人类是怎么思考的，但不能理解AI是怎么思考的，哪怕目前AI表现得很有人的样子，但不论从本质上还是表现上，都还不能认为AI和人有一致的思考方式，很有可能的是，AI并不是犯了错误，而只是以它自己的理解方式错判了真实的需求。

这就带来了无限的扯皮空间，哪怕你和AI服务商投诉说你们产品出了问题，服务商也能理直气壮说我们产品没有问题，是你自己没有把需求说明白，你应该如此这般提问，AI肯定会给你一个正确的答案。

唉，这下可真成了“非我也，AI也”。

数据分析师会被ChatGPT取代吗语境的塑造

在我和同事间，有时会出现一些极其抽象的对话。

——那个谁，表。

——啊？

——就之前说那个。

——哦，好的。

若没有上下文，便是孔明复生，阿基米德再世，怕是也读不懂这几句话的含义。

这于是就牵扯到我要说的第三个问题，语境的塑造。

企业内部的沟通成本之高远远超过一般人的想象，以数据分析师这个具体职位来说，你如果没有一定的前置信息，是根本不可能理解工作内容的。

举个例子，某司在23年4月的业绩比去年同期增长了1000%，问AI这是为什么，AI可能会通过数据从业务过程、产品变化等方面列举一系列理由

但如果我再增加一条信息，这个公司业务范围局限在中国上海，做的是连锁餐饮，那结论其实就很清楚：上海在22年4月全员自愿进行了静默管理，做餐饮的没有收入是再正常不过的事。

再举个更简单的例子，你问AI这个月的商机转化率是多少，那你是不是要先告诉AI什么叫商机转化率？

在没有任何前置信息的情况下，想要把一段含义清晰地传递给对方，哪怕只是一句话，成本也可能高到令人承受不起的地步。为了降低沟通成本，企业中对话的双方需要提前拥有一部分公共信息，然后才能使用相对抽象简洁的语言交流。这里的公共信息包含语言、文化、地域、时代、公司、业务、通用基础知识、上下文等。

我们知道AI有着巨大的数据库，但在数据库里的信息都属于通用的基础知识，而工作中需要用到的只是通用知识中极小的一部分，更多用到的则是企业和岗位的专属知识。巨大的数据库增加了用于限定的信息量和运算量，实际的工作中可能反而是负担。

对于真人，塑造一个语境是如吃饭喝水一样自然的事，人们可以通过文档、询问、测试、实践等方式获取碎片化的信息逐渐积累成语境。经历多次培训、信息沟通、实战过程，最终形成一个能快速理解业务语言并转化为一个具体的数据问题的数据工作者。

但AI的信息都有赖于使用者的手动输入，所以如果想要让AI获得和人一样的语境，那可能需要先知道数据分析师工作所需的所有基础信息，包含业务中用到的术语的精确定义，然后以文字形式输入给AI，并且维护这个数据库，一旦有新的信息进来就及时加入，否则AI就容易听不懂人说话。

然而这才是舍本逐末的做法，维护这样一个数据库消耗的管理者的时间精力远超过招一个应届生做数据分析的成本，根本不具有现实的可行性。

资深员工可能时常有这样一种感受，一些复杂工作与其费时费力教给新人，还不如由自己来做，因为教给新人需要先把前因后果、业务流程、关键注意事项说清楚，还要防备可能存在的错误，这个问题对AI来说也是类似的。

数据分析师会被ChatGPT取代吗自然语言的模糊性

ChatGPT最令世人震惊之处，在于它对人类对话中的模糊性有着极其拟人的把握。

但在数据工作中，这可能是一种劣势，因为数据工作不需要模糊，而恰恰需要精确。所谓garbage in，garbage out，你不能指望一个模糊的问题会得到一个精确的结果。

编程语言好，好就好在不会惯着任何一个领导，只要你敢少写一个逗号，它立刻就报错给你看。

而自然语言具有艺术性，艺术是朦胧和模糊的，它可以陌生化，可以一语双关，可以举类迩而见义远，但在简洁精确表达含义方面，它天然不如数学和编程语言。

数据分析师是真人，但处理数据时需要把自己代入编程语言的思考方式，先理解自然语言的需求，再翻译成数据操作，找到其中定义不够清楚的地方去做二次确认。而ChatGPT看起来是针对自然语言对话而设计的，它是否能在需要的时候兼顾自然语言的模糊判断和编程语言的机械精准，还未能有所验证。

如果是真的打算用AI来代替数据分析师取数，还想要力求精准，大致相当于试图用自然语言来定义所需的数据，我可以保证这是一场灾难。因为它要求需求方真正知道自己要什么，并用文字完整表达出来，类似于把数学公式里的符号全部换成文字——这根本不是自然语言擅长的领域。

通常一个业务人员来要数据，他会说：

——帮我取这个月的商机转化率

但如果他面对的是AI，他可能需要写：

——帮我取这个月的商机转化率，时间筛选用商机创建的时间，商机所在地取华东大区，颗粒度到行政区，分子分母都需要，另外城市也加上，再显示一下城市和区域的汇总值，A类产品的商机不计入，商机从表C里取，连接字段是K列，转化从表F里取，连接字段是M列，区域和城市的对应关系从表R里取……

我不知道这里面有哪些信息是可以省略的。

实际工作中，业务人员提需多半是只会说第一句，如果AI能和人一样，做起数据来如临深渊，如履薄冰，对需求方刨根问底，穷追猛打，那还好说，怕就怕AI人菜瘾大还自行其是，以模糊对模糊，给出一个不知道怎么算出来的结果，那么大家都是一团混沌的浆糊，算出来的东西准不准大概要看天意。

数据分析师会被ChatGPT取代吗数据基础建设

如果说自然语言的模糊性是主观上的表述不精准导致的偏差，那么数据基础建设的问题则是客观存在的。

举一些常见的例子吧。

当业务流程没有线上化，数据完全不存在，所谓巧妇难为无米之炊，AI也没有无中生有的本事。

当数据修改的日志没有保留，旧数据被新数据覆盖，同上。

当指标口径没有定义清楚，大家对同一个指标有不同理解，那你即使和AI说清楚了指标名称，你也不知道它究竟会用哪个口径来算。

当数据按范式建模分散在不同表里，缺少作为中间层的数据仓库，AI也不可能让你的查询更快一点。

当数据没有存在一个库里，对数据分析师来说需要下载之后做线下合并，AI也是一样。

这些问题作为真人的数据分析师或许可以推动着解决，但AI是不行的。

数据分析师会被ChatGPT取代吗一些补充

这篇文章想说的是，在目前的职场环境中，AI不太可能以完美替代的方式让真人数据分析师下岗，它无法替代的正是数据工作中最复杂而有价值的部分，而如果AI真能解决本文提出的一系列问题，那将要消失的也绝不止数据分析师一个岗位。

但危机未必会以我们预想中的方式到来，就像打败康师傅的是外卖而不是更好吃的泡面，我想如果AI真的要消灭一部分岗位，那可能会是在几次技术突破之后产生的新的业务或者组织形式。

我预想中的比较友好的形式是把AI工具化和公共化，变成企业内部的公共助手，不太友好的形式则是除了几个真人之外，完全由AI组成的公司。

这自然只是作者的异想天开，大家不必当真，不过未来的事情，谁说得清呢。

ChatGPT 场景提问文化

版权声明：lida 发表于 2023年6月29日 pm1:54。
转载请注明：数据分析师会被ChatGPT取代吗 | ChatGPT资源导航

「学AI不焦虑，让孩子从零开始懂ChatGPT？」

da, li

AI时代的挑战与机遇：ChatGPT对职场的影响

da, li

ChatGPT真的能替代论文吗？

da, li

数字健康｜ChatGPT火爆出圈多模态AI通用技术高速迭代医疗健康“数据源”问题如何破解？回顾：这一次，64岁的毕福剑，不再被“宽容”

🔥揭秘！ChatGPT背后的‘魔法大师’，如何让AI听懂人类话并写出代码？🚀

da, li

Apple差点错过AR黄金时代？库克：面对竞争，我们依然坚定

da, li

数据分析师会被ChatGPT取代吗

人工智能劳动价值论大揭秘：现代经济如何与AI共舞？

🎉科技巨头同时进军！London新址开启，OpenAI狂揽人才，这里将诞生什么？”

相关文章

相关文章