ChatGPT能否颠覆AI?技术突破背后,行业落地仍面临哪些挑战?
文章主题:关键词: ChatGPT, AI影响, 技术突破, 国双技术布局
🎉🚀ChatGPT的火爆瞬间点燃了AI领域的热情,2022年11月OpenAI的创举让世界为之震撼——仅两个月,ChatGPT就以惊人的速度突破亿级用户大关,成为消费级应用史上增长最快的奇迹!相比之下,TikTok花了9个月才达到这个里程碑。这让AI从专业领域走向大众视野,普通人对它的关注度直线上升。🌍🔍ChatGPT的成功引发了行业内的深度探讨:它将如何重塑格局?开发者们纷纷揣测其潜力与挑战,是否能为个人职业发展带来翻天覆地的变化?💡💼对于潜在用户来说,如何巧妙利用这一技术成为热议话题——“ChatGPT能为我所用吗?”、“如何高效使用?”成为亟待解答的问题。📚🔍AI的未来,ChatGPT或许只是个开始,让我们拭目以待这场科技革命将带来哪些创新与变革吧!🚀🌈
🌟作为国双的首席技术官(CTO),刘激扬专注于引领公司的技术战略与产品研发方向。💡国双,一家专注于大数据与AI领域的技术导向型企业,其产品与解决方案深度融入人工智能,其技术支柱地位显而易见。💡对于公司未来的技术蓝图,这些问题的答案至关重要,它们关乎着国双在AI领域的战略布局和长远发展。🌐
ChatGPT突破在哪里?
🎓💻刘激扬,清华大学出身,美国匹兹堡大学计算机科学硕士,2014年12月起担任国双CTO,他的职业之路堪称科技界的精英。在此之前,他在微软的16年服务生涯中积累了丰富的经验。在微软亚洲研究院,他不仅亲手打造了微软搜索技术中心——这个后来成为微软亚洲互联网工程院重要前身的机构,还开创了苏州分院并亲力亲为,展现了卓越的领导与创新才能。他的专业背景和行业贡献,无疑对提升相关领域的搜索引擎SEO优化有着积极影响。
🌟💡技术巨擘刘激扬,始终热衷于探索人工智能的前沿动态。在他的专业生涯中,微软的舞台见证了他对AI技术的深度耕耘,而今在国双的引领下,他更是将科研触角延伸至尖端领域。凭借丰富的实战经验和深厚的技术理解,他洞悉AI价值所在,对当前技术发展中面临的挑战了如指掌。🚀
🌟ChatGPT的火爆并非源于技术创新的革命性飞跃,而是在已有的科技架构上实现了卓越的工程创新。🔥它巧妙地整合了现有的算法和数据资源,以用户友好的方式展现了强大的语言处理能力。💻这种对既有技术的深度挖掘和优化,使其在短时间内赢得了广泛关注。🌍无论何处,用户体验始终是王道,ChatGPT的成功证明了这一点。🌐
🌟ChatGPT并非技术创新者,而是深度学习技术的集大成者。得益于海量语料库的支持和强大计算能力的推动,它得以训练出更大规模、更智能的模型。尽管如此,它的出现更多是现有技术的整合与演进,而非革命性突破。🚀
刘激扬介绍,从自然语言处理(NLP)技术本身来看,ChatGPT属于文本生成领域,所用的技术和此前的文本生成一脉相承,目前看来,这样端到端的模型对于分词、语法相关的问题并没有解决,也就是说尚未产生真正的理解,还是基于统计的可能性进行文本生成。
OpenAI公司技术专家的说法证实了刘激扬的看法。根据这些专家们的说法,ChatGPT使用的技术都不是新的,ChatGPT使用的是微调后的GPT-3.5,GPT-3.5是2020年发布的GPT-3的更新版,OpenAI 在2022年1月就发布了GPT-3.5的预览,相关API也早就发布了。因为这些原因,当初OpenAI发布ChatGPT时并没有太多期望,目的只是想收集公众的反馈进行模型优化。
不过,刘激扬认为,ChatGPT还是有突破,它比前辈们更接近人的行为模式,更符合人类的需求。它在人机交互上更为自然、智能,尤其是它能表现出对上下文的理解和记忆,这种体验是此前的各种交互机器人所不具有的,这是一个惊人的进步,也是它能迅速出圈的重要原因。而这背后离不开大量的技术工作,其中的关键创新是ChatGPT采用了一种从人类反馈中强化学习的技术(RLHF),他们先训练了一个会生成各种内容的大语言模型,然后,通过人来教它人类希望它怎么回答来调整,这也是ChatGPT成功的真正秘诀。
落地到行业还有多远?
随着ChatGPT的走红,越来越多的人开始使用它,有人用它来写代码、招聘信息、文案、论文等。不过,目前这些应用主要还是消费领域。那么,ChatGPT能否真正进入行业?
刘激扬认为目前还有困难。ChatGPT主要是面向大众的,这和国双所从事的产业化落地完全不同,那需要在工业领域一个场景、一个场景地深耕。
“前者追求受众广泛,能够满足大多数人的一般需求,后者需要强化数据和知识双轮驱动,针对业务问题进行数据治理、知识治理、智能应用构建,结合专家的经验、数据及知识、智能决策算法,解决核心业务问题。”他说。
刘激扬认为,ChatGPT(或者类似的大模型)要落地到行业、赋能企业目前至少还面临以下挑战:
首先是答案的正确性。ChatGPT采用的大模型技术,数据主要来自网络,其本身并不存在真正的基础数据库、知识结构,在回答问题时它会犯错,甚至虚构,导致它常常“一本正经的胡说八道”,这对寻求专业性问题答案者会产生严重困扰。
其次,ChatGPT使用的大模型本质上是一种“黑盒子”,对于为什么给出这样的答案,ChatGPT无法给出解释。这在很多工业应用场景来说是不可接受的,很多时候我们不仅想知道答案,还希望知道为什么是这个答案。
第三是工程难度,也就是成本问题。ChatGPT采用的大语言模型,模型参数达到千亿级别。训练这种模型需要很大投入,有机构预测,GPT-3训练一次的成本约为140万美元,同时平时还需要不菲的运行费,显然不是一般的企业能够玩得起的。
另外,还有实时性的问题。目前英文版本的ChatGPT数据截至2021年,而中文版本的ChatGPT数据截至2020年,数据滞后的主要原因是由于语言类大模型的技术限制。而在很多工业场合,需要结合最新的数据做出决策,这一点也是难以接受的。
好的技术需要积累和打磨
虽然ChatGPT要真正落地行业还有一段距离,但它的成功让人们再次看到了人工智能技术的前景,尤其是生成式AI技术,刘激扬也在评估生成式AI技术在国双应用的前景。
刘激扬表示,国双所从事的行业非常需要生成式AI技术,比如知识管理就是其中之一。目前国双与某勘探开发研究院合作的知识智能管理平台,可以向科研人员提供文章内容摘要、问答、搜索和推荐,但缺少像ChatGPT这样的自然对话能力,接下来会重点研究这一领域。
另外,国双所从事的工业领域对答案正确性和实时性都有严格要求,目前单靠ChatGPT难以满足,但可以考虑通过其他技术的结合来弥补,比如与知识图谱相结合,国双也会研究生成式AI与其他AI技术的融合。
刘激扬坦言,让AI落地行业需要与行业深度结合,这需要长期积累,需要精心打磨产品,需要时间。“ChatGPT能有今天的成功,是几十亿、上百亿的投入,是连续八年默默无闻的改进、优化才有的,没有这份坚守的决心也不能有今日的成功。”他说。
对于这份坚守国双深有感触,国双也是这么走过来的。国双成立于2005年,第一个产品Web Dissector(互联网流量和用户行为监测与分析系统,以下简称WD)是2008年推出的,其早期的功能主要是网络流量和用户行为的统计、分析。为了满足客户在使用中不断提出的新需求,国双开始将AI技术应用于WD,并不断优化,因此其功能也从后台的全域营销监测拓展到前端的广告预算分配等。
国双与兰蔻的合作案例至今仍为老国双人津津乐道。兰蔻是国双创业初期的天使客户,当时想了解自己品牌在中国各地的认知度。传统方法是找人在全国进行面访和问卷调查,但这样做周期长、成本高,准确性也无法考证。于是,兰蔻决定运用大数据的方法进行分析,并把这件事委托给了国双。国双先是准备了一些关键字列表,然后利用WD收集通过搜索引擎查询这些关键词的流量以及访问兰蔻官网的流量,最后进行汇总分析,结果发现上海、北京、广西位列前三。广西的上榜让人意外,国双又做了进一步的深究,最后发现有人借助搜索引擎在作弊,骗取广告费。最终,国双经过与客户沟通运用大数据技术帮客户避免了不小的损失。
在上述案例中,国双行业专家的经验发挥了很重要的作用,但毕竟还是需要人工介入。于是,国双开始研究如何把这些专家经验融入WD,通过WD来自动识别异常流量,机器学习技术就是这样被引入进来。在与作弊者的不断较量中,国双一直在不断优化和改进,如今,已经形成了基于机器学习的系列产品。
“国双并非一家很大的公司,资源有限,我们不会盲目地去搞技术,更多地投入都是从客户那里看到行业、市场和需求。我们一直强调场景化落地,也就是帮助客户解决实际问题,过去如此,面对大热的ChatGPT也是如此。我们不会盲目抄作业,能否利用它来真正解决行业痛点是最重要的标准。”刘激扬表示。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!