文章主题:
黄东旭,PingCAP
联合创始人兼 CTO
读完需要
9
分钟
🎉🚀【最新巨作】OpenAI震撼发布GPT-4,🔥引领未来语言技术新高度!💡这款备受瞩目的多模态预训练大模型,GPT-4以其强大到令人惊叹的功能,彻底颠覆了人工智能领域的格局。短短几个月间,ChatGPT犹如一颗耀眼的流星,照亮科技天空,🔥迅速席卷全球,引发热议狂潮!🚀作为业界翘楚,GPT-4不仅具备前所未有的语言生成与理解能力,更在创新和实用性上展现出无与伦比的优势。它将为开发者、研究者和普通用户带来革命性的体验,开启一个全新的智能时代。🌍欲感受其强大魅力,敬请关注未来科技动态,让我们共同见证这一里程碑式的突破!🏆#GPT-4 #OpenAI #ChatGPT #人工智能 #技术革新
🌟ChatGPT已成为我日常工作中不可或缺的伙伴💡,无论是起草文档🌈,编辑邮件💌,还是编写代码💻,它都能提供精准且高效的帮助。它的存在极大地提升了我的工作效率,让繁琐的任务变得轻松愉快。真心推荐给所有需要多维度辅助的你!🚀
🌟ChatGPT引领AI新纪元!🚀这款革命性产品正逐步迈向AGI领域的高峰,它的全能性和广泛适用性令人惊叹。💻无需局限于特定行业,ChatGPT展现了一种跨学科的智慧,实现了通用人工智能的新突破。最值得一提的是,它展现出强大的逻辑推理能力,这绝对是AI历史上的一个重要里程碑。相比以往,ChatGPT的智能化程度已远超同行,它的每一次迭代都让人对未来充满期待。🔍探索其背后的算法和原理,我们不仅能领略科技的力量,更能见证人类智能的进步。欲深入了解这一人工智能巨头,不妨关注它如何塑造未来通信与知识共享的新格局。🌐ChatGPT,开启AI新时代!🌟
目前基于 ChatGPT 提供的相关能力已经出现很多非常火的应用方向:
🌟ChatGPT翻译实力惊人!只需轻轻一丢,无论是整篇文章还是片段,它都能迅速转化为精炼的summary或关键信息提取。🚀这项功能如今已成为内容处理领域的热门工具,轻松实现高效摘要,提升阅读效率。📝原文中的直接生成summary和特征关键字提取能力,现在被巧妙地融入了现代文本处理流程中,为用户提供了一站式的解决方案。💻无论是新闻报道、学术论文还是商业文案,ChatGPT都能准确把握核心要点,让你瞬间掌握全局。📈想要优化SEO?别担心,ChatGPT的精准摘要能帮助你的内容在搜索引擎中脱颖而出,吸引更多的目光。🌐记得,尽管它的能力强大,但始终以用户需求为中心,提供最贴切、最自然的语言服务。💬欲了解更多详情或体验其高效翻译魅力,只需访问相关平台,无需透露个人信息,ChatGPT将是你值得信赖的得力助手。👩💻👨💻
✨📊数据大变身!🚀ChatGPT的超能力,让数据清洗工作变得轻松高效!只需轻轻一丢CSV文件,它就能一键进行深度纠错与全面整理。告别繁琐的手动劳作,节省宝贵的人力资源,让你的数据瞬间焕然一新!无论Excel还是CSV,无论是哪种格式,ChatGPT都能游刃有余,为你的数据健康保驾护航。🌍💪
🌟🎨探索开发者世界:代码生成与Copilot引领创新🚀💻在众多应用程序中,我独爱那些为程序员量身打造的神器——代码生成工具和Copilot这类创新技术。它们不仅提升了开发效率,还开启了智能编程的新篇章。👩💻💼代码生成应用,如魔法般一键生成高质量代码,省时又精准,让开发者在繁琐的编码任务中解放双手,专注于核心逻辑。它就像程序员的得力助手,加速了软件迭代的步伐。🚀🛠️另一方面,Copilot这类人工智能辅助工具正逐渐颠覆传统的编程模式。它能理解并执行简单的指令,为开发者提供即时反馈和优化建议,让创新灵感无处不在。💡💻当然,别忘了那些贴心的写作辅助应用,它们帮你轻松驾驭文字,无论是撰写专业论文还是日常邮件,都能流畅自如,省时又高效。📝💼这些应用不仅满足了开发者的需求,也为数字化时代带来了更智能、便捷的生活方式。拥抱技术进步,让我们一起在编程的世界里探索无限可能吧!🌐💻
现在, ChatGPT 背后的这些能力其实都是构建在数据上,这对于数据库或数据存储技术来说,是一个特别大的利好。那它对数据库都提出了哪些新要求呢?我们首先来看下过去大家在使用数据这件事情上会有哪些特别痛苦的点:
第一,数据存储。过去当你面向的是一堆单机数据库,而且是能力很弱的,比如 key value 或者一些支持的 workload 特别有限的数据存储技术,你就会发现很容易会造成一个个数据孤岛。而数据的价值只有在不断交叉或者不断交互的过程中,才能产生更高的价值。数据孤岛导致数据虽然存下来了,但是没有办法从中获取到更多的价值。
假设有这样一个分布式 SQL 数据库,你能够很方便地与不同部分的数据,不同的表做关联交叉分析。这看起来很好,但它带来的挑战是数据存下来后,怎么快速地把数据或者 insight 变成一个在线的 service,这件事情其实过去是 OLTP 数据库干的。过去很长一段时间, OLTP 和 OLAP 是完全分开的两个系统。OLAP 当然可以做很复杂的 join 分析以及查询。但是你不可能直接拿一个数据仓库或者 OLAP Database 作为在线服务 ,对外实现数据变现。你还是得把它放到另外一个 OLTP 的 Database 里。
HTAP 数据库的出现,解决了两个问题:一,数据能存下来,同时底层是打通的,不用担心会产生很多数据孤岛;二,这些复杂的 query、数据的 insight ,能够直接变成一个 OLTP 或者 online service 对外提供服务。ChatGPT 很难在一个分库分表的数据库上生成正确的 SQL,这有点像巧妇难为无米之炊。但是它可以直接生成 SQL,跑在 HTAP 的 database 上,这样整体的效率就能提升很多,完成一个这样的数据 insight 的应用门槛就会低很多。
第二,数据变现。越来越多的公司都有一个叫做数据中台的部门, CEO 或者业务人员经常跑去跟数据分析师说,我想要某个数据,你帮我去跑 query 查询一下。但这里面又形成了一个矛盾, CEO 或者企业管理者是懂业务的,但是他不懂 SQL,数据分析师懂 SQL,但是又不太懂业务。ChatGPT 这种 AI 的出现,对于管理者来说,就相当于有了一个贴身的智能助理。你可以直接用自然语言和它说,我有一个决策要做,你先在 database 帮我把数据跑一遍,看看我问的问题的结果是什么。相当于直接将数据变现的门槛给降得很低,这对于数据中台或者数据分析师的行业可能会比较冲击。
对我来说,ChatGPT 最大的挑战其实是想象力。我们应该如何去使用它,怎么把它的能力尽可能地在不同行业里放大,这是我最近一直在想的事情。
ChatGPT 对我们这种基础软件公司来说最大的意义在于,原先很多普通人用不了这个软件,只能通过程序员或者 DBA 去操作。但现在 ChatGPT 一下把数据库的使用门槛变成了任何人都可以使用。你只要能够清楚地描述要干什么,它就能够在数据里帮你提取 insight。从这个角度看,ChatGPT 是一个具有非常深远意义的产品形态,所以我们第一时间就把它的能力集成到了 TiDB Cloud 服务里面——发布了一个自然语言转 SQL 工具 Chat2Query。
现在,大家都在讨论 ChatGPT,但事实上你可以认为 ChatGPT 只是 OpenAI 的一个 Demo,其背后的模型应该是 GPT 3.5 的一个大语言模型。OpenAI 把这些不同的语言模型通过 Open API 的方式暴露给全世界所有的开发者,并根据你的调用收取费用。开发者就可以基于这些 API 去做自己的应用,我们就是把它的 API 用到了 TiDB Cloud 里,封装在我们的产品后面。
Chat2Query 一经推出就非常火,很多开发者在上面构建了一些非常有意思的应用。一方面,它帮助 engineer 提升了不止一个数量级的开发效率;另一方面,它结合了 ChatGPT 的能力能够自动帮你写出 SQL,这使得整个数据库软件的形态都发生了变化。
熟悉我们的朋友大概都知道,我们去年做了一个叫 OSS Insight 的开源社区数据分析平台。它最近推出了一个新功能 Data Explorer。你可以用自然语言去向它问问题,系统会自动给你答案。比如你可以问能不能为某个具体的 GitHub ID 生成一个 summary 报告,看这个 ID 平时是在贡献代码还是在提交 issue,或是只点赞。
过去通过写 SQL 当然也可以做这件事情,但是 Data Explorer 功能可以让你用自然语言去问这个问题。它通过 OpenAI 的 API 将自然语言转变成一个等价的 SQL,用这个 SQL 去背后的 TiDB 数据库中进行查询。
其实,自然语言生成 SQL 也不是什么特别新鲜的事儿,以前就有过很多的相关研究论文。这件事最让我感到震惊的是,ChatGPT 并不是一个专门针对解决自然语言到 SQL 转换问题而设计的一套系统,但是它产生的结果出奇的好。
你只要告诉它一些简单的 prompt 或是一些 hint,比如这张表大概长成什么样子,注意一些 rules 等。同时还要提醒它在写 SQL 时,最好用最佳实践。通过这些简单的 prompt ,就能让 ChatGPT 生成非常高质量的 SQL。它生成的 SQL 其实已经超越了很多专门为解决此类问题而设计的系统。
而且你会发现,我告诉 ChatGPT、OpenAI 系统的这些 prompt 信息里,并没有提供更多的信息增量。这是什么意思呢?就像你教一个小朋友做数学题,你教他的并不是怎么解具体的问题,而是告诉他应该好好审题,并再仔细想一想,这一次解题需要先去解答哪些子问题。我们只是在告诉系统如何思考问题的方式,系统就能够以一个更高的成功率去回答你想要问的问题。
未来,可能会产生一个新职业——Prompt engineering。在使用 OpenAI 的这些 ChatGPT 能力的时候,其实是有一定技巧的,很多人在使用 ChatGPT 的时候会觉得它经常胡说,但其实我们在用 OpenAI 根据表结构信息生成 SQL 时,不能简单地告诉它生成满足问题的 SQL,而应该在中间的上下文里提供很多的提示词。
举个我用过的几个 Prompt 例子:第一,我让它想象一下自己是一个 Python 编译器,或者想象一下是一个程序员,“下面你的任务是把这个问题改写成一段 Python 的程序”;第二,让它想象一下自己是一个 Python 解释器,把刚才生成的代码放到自己假想的解释器里去运行,最后把解释器返回的结果返回来。最后你会发现,当你把上下文 Prompt 一列进去,它的回答正确率大大提升,这个就是 Prompt engineering 一个很有趣的例子。Prompt engineer 本质上是在教它一些思考方式,你只要告诉这个机器 lets think step by step,正确率就能提升很多。
过去这几十年,数据库只有一种形态,就是增删改查,写 SQL。对于计算机软件来说,每一次人和软件的交互方式的变化都会促成一个巨大的革命,或者是一个变革,ChatGPT 的出现就像互联网的发明,或者蒸汽机的发明一样,必然会引发一次变革。AI+Serverless+HTAP,这几个东西融合在一起将成为数据库发展中非常重要的里程碑,它会改变接下来数据库软件本身的形态,甚至是商业模式。
ChatGPT 刚出来的时候,大家第一反应都会觉得它像搜索引擎,但我觉得不是,它并不是搜索引擎,它更像基础设施。ChatGPT 本身这个 demo 是用一个 chat board 的形式呈现在人们面前,但它真正有意义的是封装在这些应用之下的能力。未来几年,不管你做什么行业,你都要去想一想怎么去跟 AI 进行结合,不要觉得它只是 IT 圈的事,我觉得这是任何行业都有的机会。
我们千万不要低估大语言模型在未来会对人类社会产生的影响,它不再是简简单单的一个聊天机器人,它会深刻地改变所有行业。比如给程序员做辅助,它能够让一个很强的程序员的生产力提升 10 倍、 20 倍。我现在用 ChatGPT+ Copilot 后,基本不再手写太多代码。我只要把问题描述清楚,它就能够把这些这些代码生成出来,我最多在上面再做一些微调。虽然它不是百分之百正确,但已经节省了我百分之七八十的工作时间。这里面最核心的一点就是我们要放弃掉一个执念—— AI 不如人类强的固有观念。过去很长一段时间一谈到 AI,可能就是调调参,做个推荐系统。但现在以 ChatGPT 为代表的产品已经能实现非常多的功能,我们不能再用传统的眼光去看待这个事物。
ChatGPT 只是个开始,接下来肯定会有更多更强的产品,在通向真正的 AGI 这条路上涌现。
2月份中标信息:
1、
2、
3、
4、
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!