《双模态GPT-3与GPT-4:地震与海啸的较量》
文章主题:地震, 余波, 海啸, 多模态 GPT-4
机器之心报道
作者:吴昕
在当前的科技环境中,我们可以看到各种技术的发展和应用都在不断地推动着我们的世界前进。其中,单模态 GPT-3 和多模态 GPT-4 就是两种备受关注的自然语言处理技术。它们各自的特点和优势使得它们在不同的领域中得到了广泛的应用。然而,最近发生的一件事情却让我们看到了这些技术的局限性,同时也让我们更加清楚地认识到了多模态技术的必要性和重要性。就在地震的余波尚未平息之际,多模态 GPT-4 却像海啸般突然席卷了朋友圈。这一事件的发生让我们不得不思考,单一的技术是否真的能够满足我们在面对复杂问题时所有的需求呢?答案显然是不确定的。因此,我们需要更多的多模态技术,以便更好地应对各种复杂的自然语言处理问题。总的来说,无论是单模态 GPT-3 还是多模态 GPT-4,它们都是我们自然语言处理领域的宝贵财富。但是,我们也需要意识到,单一的技术并不能解决所有的问题,多模态技术的重要性也在于此。因此,我们应该积极地探索和应用多模态技术,以便更好地应对各种挑战。
「这提醒我们,对人工智能的预测是非常困难的。」OpenAI CEO Sam Altman 曾在 DALL-E 2 发布后讲过这样一句话。事实证明他是对的。基于符号主义的专家系统的衰落,让人们一度认为人工智能已走到尽头,2012 年的深度学习又点燃了希望,如今它已统领 AI 领域。随着系统规模越来越大,训练时间和资金成本也在不断膨胀。就在大家担心向模型添加参数正达到边际效益递减时,GPT-3、GPT-4 相继昭告世人,更大规模、更加复杂的深度学习系统确实可以释放更为惊人的能力,而 ChatGPT 的诞生,更是让人看到了「颠覆性」的应用成果。
ChatGPT 的出现或许表明,在过去几年被逐渐认为到达产业化瓶颈的 AI 行业仍是一片最具创新性的沃土,蕴含着巨大的机会。而随着新生产力初显雏形,以工业制造为代表的行业或许将迎来更深入的 AI 变革,迎来属于产业的 “ChatGPT 时刻”,在这一过程中与技术趋势契合的科技企业也有望率先出圈。
一、通用性的胜利
迄今为止,主导 AI 领域的模型仍然是面向特定任务的。AI 企业开发的模型在特定范围内有不错的表现,但工程师们发现其泛化能力不足以支持部署到更广泛场景。用业内人士的话说,已经训练了很多模型,但仍然需要茫茫多的模型。
这一瓶颈在高度碎片化工业制造领域几乎被 N 倍放大。因为工业制造中细分领域众多,各领域在生产流程、工艺、生产线配置、原材料及产品类型上均具有较大差异性。锂电池生产可分为十几道工序,工艺点数以千计,一条产线至少有 2500 个关键的质量控制点;液晶面板生产涉及上百道工序,生产过程中可能出现的面板缺陷种类多达 120 种;手机有几百种零件,涉及几百个供应商,每个零件可能有几十种缺陷要做检测。
现有的深度学习模型泛化程度低,即使在同一行业,模型的可复用比例也比较低。比如,如果要服务一家全球领先的手机品牌的整个智能产线,可能需要打造几十万个算法模型(不包括后续软硬件的迭代升级)。
现在,这个棘手的问题成了 ChatGPT 背后所代表的基础模型(大模型)的典型场景。
在 2022 年,一篇来自谷歌、斯坦福大学、北卡罗来纳大学教堂山分校以及 DeepMind 等机构的研究论文 [1],介绍了大模型的「Emergent Ability(突现能力)」,即有些现象不存在于较小的模型中但存在于较大的模型中,他们认为模型的这种能力是突现的。虽然这种能力目前主要体现在语言模型上,但它也激发了在视觉模型、多模态模型上未来的研究。
根据斯坦福大学以人为本人工智能中心(HAI)基础模型研究中心(CRFM)的说法,「它(大模型)代表着构建 AI 系统的一种新的成功范式,在大量数据上训练一个模型,并使其适应多种应用」[2]。
这种通用能力正是工业制造所需要的。工业制造面对的场景五花八门,如何通过稳定的技术体系,在高度碎片化的需求中打造通用的技术能力,成为任何一家试图在此大展身手的科技企业的最大挑战。
思谋科技创始人贾佳亚在公司成立之初曾提到 AI 2.0 概念,其与在当下广泛采用 AI 1.0 的 AI 公司有所区别的一个核心要点,就是对通用性的强调。「我们想做新一代的 AI 体系架构,把以前别人在单个场景做的事情,用统一的架构去解决它,在不同场景里做到通用」,贾佳亚说,「从底层构建更智能的算法,用标准化的手段解决分散的工业场景,克服可复制性和标准性等关键性问题。」
思谋科技最受欢迎的产品 SMore ViMo 工业平台,就是通用性设计思维的典型例子,它是针对工业场景打造的首个跨行业中枢平台,具有多场景通用性。不仅满足新能源、半导体、汽车、消费电子等多个行业领域超过 1000 种细分应用场景需求,还灵活支持多种高难度工业视觉方案设计需求,比如产线的物料追踪、缺陷定位、工件计数、外观瑕疵检测等等。
地震, 余波, 海啸, 多模态 GPT-4
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!