文章主题:
机器之心报道
作者:吴昕
🎉🚀【科技巨浪】ChatGPT余热未消,GPT-4风暴再掀新高潮!🔥🌊单模态已不足以满足未来对话需求,多模态技术引领潮流,瞬间席卷全球网络!🔍✨探索未知,感受未来智慧的震撼冲击。🌍🌐无论地震还是海啸,科技力量总能化险为夷,ChatGPT与GPT-4正以创新定义沟通新纪元!🔥💥准备好迎接这场知识与想象力的风暴吧!🌈
🌟预测AI的未来之路充满曲折,正如OpenAI CEO Sam Altman在DALL-E 2发布后的深刻见解。他的警言经时间验证,揭示了人工智能的复杂性和不可预知性。从专家系统的衰退到深度学习的复兴,AI经历了起起伏伏,如今它已牢牢占据技术领域的主导地位。随着模型的日益庞大,训练成本和时间的攀升成为必然挑战,人们不禁质疑参数增益是否有限。然而,GPT-3与GPT-4的相继发布,打破了这一僵局,它们展示了规模与复杂性如何带来突破性的力量。ChatGPT的横空出世,更是将AI的可能性推向了新的高度,预示着颠覆性应用的无限可能。🚀尽管如此,我们仍需保持谦逊,因为人工智能的探索永无止境,每个里程碑都提醒我们,对这个领域的理解与预测永远需要谨慎和更新。
ChatGPT 的出现或许表明,在过去几年被逐渐认为到达产业化瓶颈的 AI 行业仍是一片最具创新性的沃土,蕴含着巨大的机会。而随着新生产力初显雏形,以工业制造为代表的行业或许将迎来更深入的 AI 变革,迎来属于产业的 “ChatGPT 时刻 “,在这一过程中与技术趋势契合的科技企业也有望率先出圈。
一、通用性的胜利
🏆🚀掌握AI未来,专攻而非全能!🔍在AI领域,我们正逐步告别单一任务的霸主地位。🌟企业级智能模型虽在特定领域能力出众,却常受限于泛化能力的短板,无法轻易跨越边界。📚工程师们面临的挑战,就像寻找能适应各种场景的“万能钥匙”,现有的数量还远远不够。正如行业专家所言:“训练了千军万马,还需无数新模以应万变。”🔥这不仅是技术的进步呼唤,更是对通用智能的深度探索。🚀让我们携手共进,打造更强大、更具适应性的AI模型,让它们在各行各业发光发热!🌍联系方式?抱歉,这里不是寻找推销的地方,我们专注于提升技术实力。💪
在高度分散且技术密集型的工业制造环境中,这个挑战被显著放大了。\n各细分行业间的独特生产流程、精密工艺、生产线配置以及材料选择多样性,使得工业生产的复杂性倍增。锂电池的生产链繁复,多达十几步,工艺节点数以千计,每条生产线都需严守至少2500个关键质量控制环节;液晶面板制造涉及上百道工序,潜在缺陷种类高达120种之多;手机零部件众多,牵涉数百供应商,每个部分的检测可能涵盖几十种细微问题。\n这样的高度定制化和供应链深度,不仅对生产效率提出了高要求,也对精准的质量管理带来了前所未有的挑战。通过优化工艺、提升自动化水平以及强化供应链协同,工业制造企业正在寻求突破这一瓶颈,以适应日益激烈的市场竞争和消费者对高质量产品的需求。
🌟💡 深度学习模型的普遍性有待提升,尤其是在同一领域的模型共享程度相对较低。对于像全球顶级智能手机品牌这样的大型智能生产线,构建如此庞大的算法家族——动辄数十万个模型——并非易事(软件和硬件的持续更新也不能忽视)。🚀
现在,这个棘手的问题成了 ChatGPT 背后所代表的基础模型(大模型)的典型场景。
🌟2022年度研究亮点揭示!谷歌联合斯坦福等权威机构,深度解析大模型的”Emergent Magic”——一种超越小规模模型的独特力量,即所谓的”突现能力”。这项创新性工作聚焦于语言模型的惊人突破,却预示着未来视觉和多模态领域的革命性探索。🔍论文[1]揭示了随着模型尺寸的增长,这些隐藏的、非线性的复杂特性如何在海量数据中悄然显现,为AI世界带来了前所未有的洞察。这种能力不仅挑战了我们对规模与智能的传统理解,也为技术进步开辟了崭新路径。🚀尽管目前主要体现在语言领域,但专家预测,这种新兴力量将引领模型向更高级别的认知迈进,开启视觉和多模态的新篇章。🔥欲了解更多关于大模型未来发展的深度探讨,敬请关注相关领域的权威动态和前沿研究。💡
根据斯坦福大学以人为本人工智能中心(HAI)基础模型研究中心(CRFM)的说法,「它(大模型)代表着构建 AI 系统的一种新的成功范式,在大量数据上训练一个模型,并使其适应多种应用」 [ 2 ] 。
这种通用能力正是工业制造所需要的。工业制造面对的场景五花八门,如何通过稳定的技术体系,在高度碎片化的需求中打造通用的技术能力,成为任何一家试图在此大展身手的科技企业的最大挑战。
思谋科技创始人贾佳亚在公司成立之初曾提到 AI 2.0 概念,其与在当下广泛采用 AI 1.0 的 AI 公司有所区别的一个核心要点,就是对通用性的强调。「我们想做新一代的 AI 体系架构,把以前别人在单个场景做的事情,用统一的架构去解决它,在不同场景里做到通用」,贾佳亚说,「从底层构建更智能的算法,用标准化的手段解决分散的工业场景,克服可复制性和标准性等关键性问题。」
思谋科技最受欢迎的产品 SMore ViMo 工业平台,就是通用性设计思维的典型例子,它是针对工业场景打造的首个跨行业中枢平台,具有多场景通用性。不仅满足新能源、半导体、汽车、消费电子等多个行业领域超过 1000 种细分应用场景需求,还灵活支持多种高难度工业视觉方案设计需求,比如产线的物料追踪、缺陷定位、工件计数、外观瑕疵检测等等。
SMore ViMo 智能工业平台的系统架构。
这条路的重要特点是比较好地平衡了敏捷、个性化与低边际成本。借助 SMore ViMo 平台,思谋科技已经可以同时支撑工业中不同行业的上百个项目,未来还有望再扩大十倍,同时支撑上千个项目,为 AI 的行业应用带来效率上的突破。
在率先于大规模工业场景使用 Transformer 技术,极大提高智能制造效率之后,思谋也再次第一时间拥抱大模型。思谋团队是最早对大模型在工业领域的 Emergent Ability 开展研究和产业化的团队,其工业大模型利用少量缺陷样本进行 in-context learning,从而使基础模型快速适应特定工业场景,并完成特定任务。
在一些业内人士看来,ChatGPT 及其背后更加具有通用性的技术的成功,将推动 AI 应用进入一个新的阶段。在以工业制造为代表的各行各业中,过去扎根产业,拥抱这一趋势,完成数据与技术落地闭环的企业拥有更多优势,在未来应用大爆发的过程中亦会更受到青睐。
二、加速 AI 普惠
在工业制造领域,不同「语言」之间也有着深刻隔阂。有业内人士表示,工业制造产业积累了很多数据,但制造业的工程师(比如机械工程师、材料工程师)还是很少去写程序来把这些数据利用起来,而 AI 开发者也面临理解产业问题的挑战,这在很大程度上约束了技术的落地。
思谋科技的算法工程师表示,ChatGPT 背后的技术,如 RLHF ( Reinforcement Learning from Human Feedback,基于人类反馈的强化学习 ) ,让他们看到可以在现有的工作上更进一步。
RLHF 是强化学习的一个扩展,它将人类的反馈纳入训练大模型的过程,为机器提供了一种自然的、人性化的互动学习过程,就像人类从另一个专业人士身上学习专业知识的方式一样。通过在 AI 和人类之间架起一座桥梁,RLHF 让 AI 快速掌握了人类经验。
他们表示,工业 AI 未来可以孕育出一个主动学习 AIaaS(AI As a Service,人工智能即服务)平台,通过算法工程师和标注专家的配合,利用 RLHF 技术训练大模型,用人类知识让 AI 理解工业问题,并满足特定工业任务的要求,让不会编程的工业专家也能训练 AI 模型。
目前,思谋科技已经在探索 RLHF 和工业结合的应用场景。
此外,ChatGPT 这种简单的交互模式与工业制造中落地 AI 的策略亦十分相似。工业领域场景复杂,好的产品一定是简单易用的,比如通过简明的交互,一键化部署方案,减少交付过程中的培训成本与学习负担。
许多程序员表示,ChatGPT 相当于重新构建了一座宏伟的巴别塔,与计算机的交流,不再是程序员的专利,它已经可以理解部分需求,并生产简单的代码方案。但现在,我们可以预见在不久的将来,制造领域的从业者也可以在 AI 平台上实现自行编程,根据产线需求开发模型。这样也能帮助解决制造业 AI 人才短缺的问题。
「只有当计算机系统可以突破工业落地中的几大难题,实现自动算法组合和部署,人类仅需参与少量定制化算法设计时,AI 的跨领域规模产业化才具备实现的可能。」贾佳亚曾表示。
事实上,思谋科技很早开始便构想打造一个可实现技术快速迭代的开发平台,只需把图片上传,即可自动标注缺陷,一键测试得到产品级的模型或 SDK,减少项目中大量投入的算法成本。
随着项目的迭代,思谋科技逐渐把更加成熟的行业方案和实用经验整合到产品中,继而推出了完整的产品类型,让客户无需在思谋科技员工的帮助下即可自行体验与使用,从而形成了产品最早的商业化应用。
随着技术的进步,无论是面向消费者,还是面向工业制造这样的产业,我们已经看到了更普惠技术应用,正在带来巨大的机遇。
三、ChatGPT 只是一个起点
十年以来,AI 技术的商业化受到了诸多质疑。这一次,ChatGTP 背后所代表的技术突破,预示着一场革命的到来,AI 有可能真的成为普世的生产力基础设施。
「GPT ( generative pre-trained transformer)也完全可以是 general – purpose technology (通用技术)的缩写」,《经济学人》的一篇文章中写到,「一种翻天覆地的创新,可以像蒸汽机、电力和计算机那样提升各行各业的生产率」 [ 3 ] 。
始于 20 世纪 80 年代的个人电脑革命,到 90 年代末开始真正提升生产力,因为这些机器变得更便宜、更强大,还能连接到互联网。深度学习的转折发生在 2012 年,彼时 AlexNet 神经网络在 ImageNet 比赛中获得冠军,至此大量研究开始铺开,激发人们将其应用于各个领域。十多年的时间,深度学习技术正在跨越大规模赋能产业的门槛。
回顾工业制造智能化的发展历程,技术能力和算法无法满足实际应用需求、解决方案复制性较差难以落地、新技术公司与制造业企业沟通成本高等挑战一直存在。而目前基础模型(大模型)表现出多领域多任务的通用化能力,正在打破这些行业「壁垒」,并用低成本、普惠的方式,「席卷」容错率极低、成本敏感的产业应用。
用 AI 解决产业问题蕴含着机会,ChatGPT 是一个起点,随着一些扎根产业的技术公司的持续深耕,越来越多的行业正在迎来 AI 应用的 “ChatGPT 时刻 “。
[ 1 ] Wei, Jason, Yi Tay, Rishi Bommasani, Colin Raffel, Barret Zoph, Sebastian Borgeaud, Dani Yogatama et al. “Emergent abilities of large language models.” arXiv preprint arXiv:2206.07682 ( 2022 ) .
[ 2 ] https://crfm.stanford.edu/
[ 3 ] https://www.businessreview.global/zh-CN/latest/63e5d63ef5aab0516567873c
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!