文章主题:
来源:火讯财经
文章转载来源:元宇宙与碳中和研究院
🌟自然语言处理技术的革新引领了NLP领域的繁荣,大模型如GPT系列正逐步颠覆传统,为各行业带来革命性突破。🚀在文本生成、机器翻译和代码编写等多场景中,它们展现出卓越才能,成为效率提升的秘密武器。💡OpenAI的ChatGPT是这一创新潮流中的佼佼者,它通过预训练奠定基础,再以用户反馈为导向进行迭代升级。💬这款生成式模型以其强大的交互性著称,无论是文字创作还是编程任务,都能轻松应对,为用户提供无缝体验。👀微软已开始展望未来,计划将ChatGPT的智能应用扩展至机器人领域,引领一场人机协作的新革命。🚀期待ChatGPT如何以无可匹敌的方式,重塑我们的工作和生活方式!🌐 #NLP进步 #ChatGPT机器人 #技术革新
图片来源:由无界 AI 生成
微软的探索
微软引领潮流,现代机器人技术革新于此!🚀闭环体系,让编程与观察无缝对接:初始设置任务,👀 ChatGPT即时响应,根据机器动态调整程序。🌟ChatGPT的出现,打破专业壁垒,让非技术也能操“代码”于手。只需简单的人类语言指令,描述工作,它就能将其转化为机器人能理解的语言。🤖然后,观察执行,提供反馈,ChatGPT智慧转化,优化行为。无需担心复杂,一切以用户为中心。💻ChatGPT,你的任务专家,让编程变得触手可及!🌟#微软技术 #ChatGPT #未来工作新方式
Microsoft’s expert team has innovatively employed experimental techniques to create a range of practical applications, such as drone inventory management in supermarkets, precise stock auditing, robotic arm operation, and advanced API-driven object recognition for seamless search operations. These cutting-edge solutions streamline processes and enhance efficiency through innovative technological implementations. 🎉🔍
具体应用
Microsoft is driving ChatGPT’s potential for advanced robotics applications by focusing on three key research domains. These interrelated areas form the core strategy for integrating ChatGPT into robotic technology. 🤖💻🚀 #Robotics #ChatGPT #AIProgress
1、用户指定ChatGPT应采用的一系列API或功能编码库。
2、根据可访问的API或功能编码,用户描述对工作的预期结果。
3、最后,用户在用模拟器评估ChatGPT撰写的代码后,提供反馈意见。
🎉 若要让机器人按预期行动并感到满意,可巧妙运用那些成功的代码指导!🔍 这背后的逻辑,其实与机器学习里的”监督式学习”不谋而合,毕竟两者在智能领域的角色如此相似。💡 通用的理论框架,就像AI和机器人世界的共识知识,自然存在且至关重要。🏆
Microsoft has introduced an open-source collaboration platform where all their research and interaction patterns are accessible to the public. This platform serves as a testing ground for ChatGPT’s algorithms, as they aim to incorporate it into their robot simulations and APIs. 📡💻🌐️ The company is committed to making its research resources available for everyone to explore and contribute to the advancement of collaborative technology. #MicrosoftOpenSource #ChatGPTIntegration #CollaborativeTech
ChatGPT与机器人
与ChatGPT的纯文本应用不同,机器人作为复杂系统,需要有能力理解现实世界的物理学、解读周围的环境,并采取对应的行动。在与用户互动时,要以符合物理学的方式理解和执行命令,就需要兼顾一个具备丰富知识的生成式机器人模型和一个复杂的世界模型。这意味着模型必须能破译文字,并将其转化为实际行动指令,这无疑都已经超出了语言模型最初设想的范围。
ChatGPT有能力适应各种物理表现形式,通过对话进行闭环推理,并解决机器人技术中的各类“零点翻译问题”(Zero-shot,指不借助中间语的直接翻译。如谷歌曾经的翻译系统都依赖英语做中间语,先将源语言翻译为英语,再将英语翻译为目标语)。由于机器人的很多相关技术的成熟度相对更高,有多个开源或闭源的编程库存在,可帮助设计机器人在认知和行动领域的基本行动,如物体检测和分割、映射、运动规划、控制和抓取等。
至于机器人的推理和执行能力,大语言模型在获得适当提示词的情况下,可以采用预置的机器人编程路径,不过API的名称必须准确地反映机器人功能的整体目的和操作。这些术语要尽可能清晰,以便模型解释API之间在机器人功能上的联系,并提供预期的结果。
自2010年,智能手机和移动网络流行以来,曾经风头无两的机器人或多或少的也受到了冲击,毕竟手机比机器人可便宜多了,用起来也更方便。现在机器人的应用正日益精细化,如医用和工业等领域都有相关应用,家用扫地机器人也已走进千家万户,这些都可以视为先进生产力和科技水平的体现。这几年AI正以前所未有的速度进化,时常做出一些引发世人惊呼的行为,虽然对它们而言那不过是本能。当年的“阿尔法狗”(AlphaGo)面对全球一众围棋高手,一路过关斩将,克敌制胜,“人类智慧最后的堡垒”被攻克时的景象,相信很多人至今仍记忆犹新。
然而很多人在惊呼时都有意无意的忽略了两个事实。其一,围棋之所以被称为“人类智慧最后的堡垒”,很大程度上是因为其内在逻辑、推理走法、棋谱规律等都很复杂,且都可能影响到最终结果,对常人而言就是“入门难精通更难”,这与象棋(不论中国象棋或国际象棋)、军棋、将棋等其他棋类运动普遍存在的“入门容易精通难”不同。因此上世纪90年代IBM的“深蓝”就能在国际象棋上战胜顶级高手卡斯帕罗夫,比“阿尔法狗”早二十多年就战胜了人类。这期间还经历过摩尔定律的加持,AI的性能和计算速度突飞猛进,“阿尔法狗”的出现在某种意义上来说更像是科技发展的必然结果。
其二,不论“深蓝”还是“阿尔法狗”,它们都是专家特化型AI,换句话说它们都只会下国际象棋或围棋。从运行逻辑的角度来说,它们要学会新技能就必须换新的数据库,类似手机刷机或电脑重装系统。但即使成功换装,还是没有改变它们只会一种技能的本质。当前的ChatGPT也有差不多的情况,这与预期中的人工智能还差得远。
用ChatGPT驱动机器人是前所未有的大胆设想,或许微软是看中了ChatGPT强大的知识和推理能力,期待用在机器人上能实现1+1>2的效果。微软做得好肯定能引起新的欢呼,做不好无非是给外人来点茶余饭后的谈资。对旁观者而言倒也不失为好消息,毕竟谁不喜欢吃瓜看戏呢?
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!