如何理解并利用语言的魔力?互联网上的情绪秘密揭示

风险与机遇 2年前 (2023) lida
53 0 0

文章主题:

666ChatGPT办公新姿势,助力做AI时代先行者!

钥坤Zeuspace在2023年2月26日成功举办了主题《ChatGPT应用趋势及技术简析》精品论坛。

我们邀请到了科技和金融界的行业大咖,共同探讨以 ChatGPT 为代表的 AIGC 在不同细分领域内的潜在应用方向,AI 技术进化的本质逻辑,以及面对已经到来的人工智能时代,公司和个人可以如何做好准备。 

论坛伊始,专家们对于ChatGPT是否具有自我意识展开了讨论。

专家们一致认为基于目前的呈现给公众的AI技术而言,ChatGPT还是不具备自我意识。

展开来说,其实米哈尔·科辛斯基(Michal Kosinski),斯坦福大学的组织行为学助理教授,早就研究过在AI与人的关系。

心理理论(Theory of Mind)能力,被译为“心理推理能力”,一般来说是指:“理解他人内心状态的能力,包括推断他人意图、信念、情绪等等”。

在人类社交的中,往往交流的双方都需具备推测他人思维的能力,不然会出现很多牛头不对的回答。那么这也是为什么,我们在使用ChatGPT的时候,很显然感觉到很多时候会有对牛弹琴的感觉。机器还是不具备情感,它更加无法完成有目的,引导型的交流。

在这里专家们也引入了一个非常有趣的议题:

ChatGPT可以被电信诈骗的团伙所利用吗?

但就目前应用层的呈现而言,电信诈骗中使用的人工智能,如果只是基于数据库的语料,那么它将只会机械重复问答库中事先设定好的语料,显然不具备心理理论能力。

而人类交流中最大的特质,就是目的性。人说的每一句话基于他所想达到的目的,而ChatGPT始终不具备在说服对方的目的下进行对话,它更多表现在你问我答,对于如何回答一个问题来搜刮它的数据库。

归根到底,它目前的模式还是你问我答,回答一些似是而非的东西,很简单的交流。也有观点表示它可以通过司法考试,但是他不能上法庭去帮人打官司。因为其知识组织和推理的能力很差,例如假如给它案例库里没有收录的例子,那么它肯定是无法回答的。

我想在这里也可以举个例子,例如百度推出的文心一言推出的画画功能:

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

可以看出它的底层逻辑更多的是用现存的元素去拼凑一个答案,但是它无法就事论事,在合适的上下文语境进行产出。

当然,我举得这个例子比较极端。但是也是非常标志性的展示了目前人工智能在解析和组合上的问题——在对话中的推理能力不符合人类思维世界。

而本身ChatGPT就是基于庞大的数据库来进行选择,组合,词条的呈现,提出和测试理论(Theory),在这个过程中,我们也对于ChatGPT如何校准自己的答案提出了疑问并且讨论。

因为ChatGPT目前收录2021年为止的数据库,所以可以看到在很多问题上的准确度并不高。

而这个问题,我直接询问了ChatGPT。那么我们看看它的回答:

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

“作为一个人工智能语言模型,我依靠各种来源的信息来为用户查询提供答案。对于GDP数字等事实性信息,我通常会咨询世界银行、国际货币基金组织(IMF)和其他值得信赖的数据提供商等知名来源。

在回答用户的询问时,我努力提供准确和最新的信息。然而,我不能保证我提供的每一条信息的准确性,因为数据和信息可能迅速变化,并可能被修改或更正。

如果你认为我提供的任何信息是不正确的,请告诉我,我将尽最大努力予以纠正。我感谢你的帮助,以确保我提供的信息尽可能的准确和可靠。”

看到ChatGPT的回答可以明白,第一,它不知道到任何问题的正确答案,它的问题答案来源于各大数据提供商,第二,它的回答准确性的提高,在于不断对话,在对话中我们作为提问者,不断的细化我们的问题。

就拿GDP这个指标而言,不断细分子分类,日期,地区等等一系列的过滤,可以提高其回答的正确性。所以这也是专家在我们论坛所说的,ChatGPT的答案很大部分来源于我们的提问。可能提问的前后半句话,就隐藏着答案,例如GDP,我们可能想知道的是某某机构公布的GDP,例如假如我们去澄清:请告诉我们IMF公布的巴西2021GDP。诸如此类的对话训练,有助于提高ChatGPT回复的有效性。

而在此议题之后,专家们也把焦点换到了ChatGPT对于各行各业的影响。来自金融界的大咖Zach也回答了ChatGPT会对投资决策起到重大影响吗?是否要从信息时代进入智能时代,完成科学范式的转换。

而关于投资决策:

Zach提到了ChatGPT对于内容创作这个领域会有很大的影响。

特别是这2年,降本增效的概念很火,在后疫情时代,实体经济遭受重创,各大企业都想着要降低成本,增高效率。而在应用上,我们可以试想,例如对知乎,这类文字互动社区类的应用。作为问答社区,知乎积攒了丰富的可供AIGC的优质内容。2022 年第三季度财报数据显示,知乎社区内的内容量已累计超5.79亿条,问答量累计超4.82亿条。

而对于消费互联网行业,例如淘宝、京东、拼多多来说,接入ChatGPT类似的聊天机器人对于智能客服提升这块的用户体验应该有很大的改善,他也提到搜索引擎行业。

而对于传统金融行业的影响:就拿商业银行举例子,客服和营业网点将会受到最大的影响,但是我认为这更多的是推进数字经济,智能银行的历程。就目前而言,通常商业银行的线上客服用起来体验都是很糟糕,经常是重复很多次问题,它们都无法领悟到客户的需求。而Zach也提到ChatGPT未来将在风险管理,自动化交易,AI模型等方向起到一定的促进作用。

而就回到二级市场表现而言,AI概念股也在近期疯涨,例如百度最近表现,自推出文心一言,百度股价攀升,很多客户就在第一时间与百度签约了文心一言战略合作的协议。

那么,我们回到我们的问题:ChatGPT会真正帮助到决策或者说可以相信ChatGPT的决策吗?

通过我们的圆桌讨论,我们一致认为目前的ChatGPT数据库老旧,只有2021的过往数据,回答没有实际效益。

Dr Xue也细分一级、二级市场回答了此问题,在一级市场中它可以帮助读者进行信息查询:例如进行所看标的的基本面分析,公司信息和行业景气程度的把控,对于大量资料搜集起到积极作用。

但是对于二级市场而言,目前ChatGPT做全自动量化投资,还有很长的路。因为他不是实时的。就拿它升级一次数据库需要3000W美金而言,它的input-output更多基于它们的dataset的质量。

就输入所有数据进去建立模型而言,这个很难实现;不具备决策能力,风险非常高。

就拿投资而言,各国的经济实际情况相差甚远,每个基金经理都是有着丰富的从业经验和投资策略,每个基金公司的投资风格都是不同。特别是在每个国家和地区行使着不同的政策和经济模式。而且很多因素都是不可控的,例如地缘冲突、突发疫情、行业暴雷,而资本市场最难控的就是人性。

所谓人心难料,作为AI智能,本身没有推理能力,它更加无法预测黑天鹅和灰犀牛事件,并且在目前国际形势严峻,特别是国际大国贸易脱钩,去全球化和重视国家安全这样的趋势之下,实际上想要收集一个庞大的全球数据库是很难的。而在资本市场,最大的特质就是全球的各类证券是联动的,如果无法做到7×24小时更新数据,这样的盯盘和市场监控,根本没有可能做到所谓的代替人类去做决策。

当然,这里还没有排除到,黑色和白色之间的灰色空间。这一块是人类的弹性,也是人性,它可以是人类因为情感或者各种内外部因素造成的失误或者超常发挥,也是机器最无法检测到的地方,而灰色空间也是真正最无法做风险管理的一块。归根结底,目前的世界社会还是一个由人类主导,人性为行事标尺的地方,机器始终和人类的制度是不一样的。机器也无法高于人类的判断,无法基于复杂的多方因素做出决策。

所以总结可以看到ChatGPT的回答有框架和逻辑,它可以实时生成高质量文本。但如果真的在投资决策中应用,数据准确率非常低。

人类专业知识和经验很难被AI替代,仅靠当前技术还不能够做任何投资决策,但是可以提高做决策的效率。资本市场的变量很多,无法被AI预测。例如公司策略是L/S,还是根据各国财政的解读,以及市场的把控,对于每个投资决策人都不同。但是展望未来AI驱动,数据驱动这个是有机会的。目前是人类分析师主导,如果是AI主导,那么世界会有不同。

那么学术界的专家也重新带我们复习了ChatGPT的发展历史

ChatGPT并不是一夜之间春风来,千树万树梨花开,而是已经有了10多年的基础研究,回到ChatGPT的模型-自然语言处理-Natural language processing | NLP,语言模型研究已经很久了。

自然语言处理(NLP)就是在机器语言和人类语言之间沟通的桥梁,以实现人机交流的目的。人类通过语言来交流,狗通过汪汪叫来交流。机器也有自己的交流方式,那就是数字信息。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

NLP 的5个难点

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

NLP

语言是没有规律的,或者说规律是错综复杂的。

语言是可以自由组合的,可以组合复杂的语言表达。

语言是一个开放集合,我们可以任意的发明创造一些新的表达方式。

语言需要联系到实践知识,有一定的知识依赖。

语言的使用要基于环境和上下文

NLP 的4个典型应用

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

情感分析

🎉💡在浩瀚的数字海洋中,📚🌐无数的文字篇章犹如繁星点点,各具特色却共通情感。它们或热情洋溢,传递着正面和积极的力量(🌟),或是深沉内敛,倾诉着负面与消极的情绪(😔)。无论是庆祝胜利的欢歌,还是面对挑战的哀鸣,互联网上的文字总能触动人心,引发共鸣(❤️)。SEO优化提示:使用”情感共鸣”、”正面/消极表达”等关键词,增加emoji符号如:”🌟”, “😔”, “❤️”以提升搜索引擎可见度。

通过情感分析,可以快速了解用户的舆情情况。

聊天机器人

过去只有 Siri、小冰这些机器人,大家使用的动力并不强,只是当做一个娱乐的方式。但是最近几年智能音箱的快速发展让大家感受到了聊天机器人的价值。

而且未来随着智能家居,智能汽车的发展,聊天机器人会有更大的使用价值。

语音识别

语音识别已经成为了全民级的引用,微信里可以语音转文字,汽车中使用导航可以直接说目的地,老年人使用输入法也可以直接语音而不用学习拼音…

机器翻译

目前的机器翻译准确率已经很高了,大家使用 Google 翻译完全可以看懂文章的大意。传统的人肉翻译未来很可能会失业。

参考:https://easyai.tech/ai-definition/nlp/

而学术界的专家也帮助我们更深的理解了什么是Transformer:

Transformer:理论和原理是什么:Transformer模型(直译为“变换器”)是一种采用自注意力机制的深度学习模型,这一机制可以按输入数据各部分重要性的不同而分配不同的权重。该模型主要用于自然语言处理(NLP)与计算机视觉(CV)领域。

与循环神经网络(RNN)一样,Transformer模型旨在处理自然语言等顺序输入数据,可应用于翻译、文本摘要等任务。而与RNN不同的是,Transformer模型能够一次性处理所有输入数据。注意力机制可以为输入序列中的任意位置提供上下文。如果输入数据是自然语言,则Transformer不必像RNN一样一次只处理一个单词,这种架构允许更多的并行计算,并以此减少训练时间。

Transformer模型于2017年由谷歌大脑的一个团队推出,现已逐步取代长短期记忆(LSTM)等RNN模型成为了NLP问题的首选模型。并行化优势允许其在更大的数据集上进行训练。这也促成了BERT、GPT等预训练模型的发展。这些系统使用了维基百科、Common Crawl等大型语料库进行训练,并可以针对特定任务进行微调。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

来源:

https://blogs.nvidia.com.tw/2022/06/21/what-is-a-transformer-model/

Transformer AI使用大型资料集建立模型,Transformer 模型可以做出的预测,以推动产生更广泛的使用、产生更多的资料,进而创造出更好的模型,这是一个循环过程。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

Transformer models herald era of transformer AI, says Stanford paper

斯坦福大学的研究人员也说到Transformer 模型是人工智慧发展的下一个阶段,有些人称之为 Transformer AI 时代。

NVIDIA 创办人CEO黄仁勋在 2022 年举行的 GTC 大会主题演讲中说。“Transformer 模型让我们可以做到自我监督学习,以及快速发展人工智慧。”

Transformer 取代 CNN、RNN

在许多情况下,Transformer 模型已开始取代五年前最热门的深度学习模型,即卷积和递归神经网路(CNN 和 RNN)。

事实上在过去两年,arXiv 网站上发表与人工智慧有关的论文中,70% 都提到了 Transformer 模型。其结果与 2017 年 IEEE 的一项宣称 RNN 和 CNN 为最热门之模式辨识模型的研究报告截然不同。

无标签且效能更高

在 Transformer 问世之前,用户必须使用加上标签的大型资料集训练神经网路,而产生此类资料集的成本很高,且需要耗费许多时间。Transformer 模型是透过数学寻找元素之间的模式,无须使用加上标签的大型资料集,即可妥善利用网路和企业资料库中的海量影像及文字资料。

此外,Transformer 模型使用的数学技术适合进行平行运算,使这些模型可以快速运行。

现在,SuperGLUE 等目前热门的效能排行榜都是由 Transformer 主导,例如 SuperGLUE 是 2019 年针对语言处理系统开发的基准。

Transformer 模型是使用位置编码器标记进出网路的资料元素。Attention 单元追踪这些标签,计算出一种代数图,说明各元素之间的关系。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

通常是在所谓的多头注意力(multi-headed attention)中计算一个方程式矩阵,以平行执行 attention 查询。

电脑使用这些工具,可以看到与人类看到的相同模式。

自我注意力(Self-Attention)发现意义

例如,在这一个句子中:

She poured water from the pitcher to the cup until it was full.(她将水罐中的水倒入杯子,直至它满了为止。)

我们知道此句中的“it”是指杯子,而在这一个句子中:

She poured water from the pitcher to the cup until it was empty.(她将水罐中的水倒入杯子,直至它空了为止。)

我们知道此句中的“it”是指水罐。

“意义是事物间之关系的结果,而自我注意力(self-attention)是一般学习关系的方式,”Google Brain 前资深研究科学家,带领进行 2017 年该篇开创性论文的 Ashish Vaswani 表示。

“您需要文字之间的短距离和长距离关係,而机器翻译是验证 self-attention 的绝佳工具。”Vaswani 说。

“现在,我们已看到 self-attention 变成一项强大、灵活的学习工具。”他补充道。

而Dr.Xue表示基础模型,各大公司都在搞。

未来的趋势很多是大公司把大模型搞好,AI实战芯片产业,模型封装。科技行业的颠覆改变。小公司不需要做尖端科研,大公司的地位会被加以巩固。

语言处理的:分词可能会消失。例如科技发言,科技,发言这种词的分类。搜索任务,就是任务可能不会细分了,之后的AI行业商业化程度大。所以智能科技行业受影响很大。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示如何理解并利用语言的魔力?互联网上的情绪秘密揭示

Dr.Xue也戏称将会是手工业时代向电气化时代的转换,在此之前程序员都是改改模型,改改track,以后肯定是大算力,大数据,批量生产,全产业模式。

徐老师也表示机械性的工作都会被取代,例如编程。

例如:

Codepanel(https://codepanel.io/)。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

而在回顾完ChatGPT的历史后,主持人又抛出了ChatGPT为什么火出圈的问题?

那么,专家也是就此做出了回应,原因有三:

第一,模型非常大,训练参数庞大。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

来源:

未尽研究

ChatGPT,这台学习的永动机,何时“耗尽”人类的语言

(https://mp.weixin.qq.com/s?__biz=MzkzMzI2ODAyNQ==&mid=2247486200&idx=1&sn=045c0429c991d7f53f1fb840c029491e&chksm=c24e55aef539dcb8da1c5544415bcf1cb54083398e96eabd3c562eb33cae3db30bbb564fce49#rd)

第二,语言模型:上游下游结合,以产生语言回答问题

第三,自然语言处理能力非凡

而除此以外,我们也可以引用360CEO周鸿伟的评论:关键就一条:高高在上的人工智能“接了地气”,不再曲高和寡,不再是小圈子里的自娱自乐,而是开始解决普通人切身的需求和问题。

ChatGPT最出圈,在于它的全民性,就好像苹果商店的汤姆猫也是火遍全球,极简的交互操作,人人都可以对话,这也是它火的原因之一。

在论坛的最后,专家们也回答了未来对于ChatGPT应用的思考,回到本期文章的标题:ChatGPT会让哪些人失业?

学术向来说,ChatGPT有助于消除不确定性,未来会呈现多模态:目前只有文字。

(但是据发稿日,已经有图片态。时下火热的ChatGPT迎来大升级,OpenAPI推出了GPT-4模型,该模型除了阅读文字外,还具备图像识别能力,这使得ChatGPT的能力得到了大幅提升。富有感情,价值观,审美等等人类的)

从政治上而言,它将会有助于科技大国巩固霸权,大规模的知识推理、数据驱动的决策会提高科技进步,创新的能力,从而达到大国军事霸权。

而ChatGPT也会是“冷战”时代的核武器,AI是不用吃饭睡觉上厕所的,它具备24小时庞大的数据处理能力,它能无休止的进行科技发掘,数据回测,数据清洗,不断计算,推演,产出。

从文化上来说,它会加大文化霸权的现象,因为大规模机械化的文化产出会夹杂价值观,会对未来世界产生很大的塑造影响。

那么又引出了一个分支问题ChatGPT到底是经济意义大,还是科学意义大

例如场景应用空间,在游戏中,RPG游戏NPC对话如果接入ChatGPT,例如如大片里演得那种沉浸式体验。相信大家都看过黑镜。肉眼可见,ChatGPT对于游戏的交互体验肯定是非常有帮助的。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

但是真正看到应用层,例如我们分析百度的商业模式:主营收入,还是以广告为主。所以ChatGPT的经济效益还需要拭目以待。所以我们认为科技意义更大。

而且专家们也补充说到真正的推理:机器很难下结论,行业内目前一致认为:AI处于哥白尼的阶段。Input – output,更加贴合于实验科学。

它的不断对话就是一场实验科学,它在不断地改进回复,里面的很多内容错误很多。而最近关于ChatGPT和必应的结合  miss information的情况会有改善。

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

ChatGPT的股票的可以投资吗?乱花渐入迷人眼。Metaverse的热潮刚刚消去,二级市场AI概念在此火爆。

从基础层评定:更多是炒作,这季度财报都没出,谁知道profit是怎么样的。而应用层来说:没看到EPS的增速。但是对于某些企业,线上客服确实可以有很多节省,对这些公司的利润表是有比较多的改善。

然而需要提醒的是,人工智能的春天在7年前出现过,横空出世的阿尔法狗席卷全球,也是AI热,一时之间很多公司估值都疯涨。但是AIGC的核心更多是数据,人类灌入互联网的数据,是它唯一的学习样本。所以它的能力就目前而言还是无法超越人类。AI智能是否可以蓬勃发展还需要静观其变。

而有句话作为本文的结束语,也回答一下本文的标题:ChatGPT会让哪些人失业?我想谁也不会失业,ChatGPT是意义非凡的,但AI始终不会结束人类,而会启发人类。

END

『声明:本文为原文作者独立观点,不代表钥坤科技Zeuspace的立场,本内容仅供广大读者科普学习和交流,不构成投资意见或建议,请理性看待,树立正确的理念,提高风险意识。』

A bridge to your cyberspace. 

如何理解并利用语言的魔力?互联网上的情绪秘密揭示

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

版权声明:lida 发表于 2023年4月7日 pm4:06。
转载请注明:如何理解并利用语言的魔力?互联网上的情绪秘密揭示 | ChatGPT资源导航

相关文章