微软的ChatGPT开启机器人新纪元?无需代码,人话操控未来已来!🔥
文章主题:微软, ChatGPT, 机器人
原文标题:《ChatGPT 已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?》
当我还在跟 ChatGPT 吹牛尬聊时,有人已经在拿它操控机器人了。
不是别人,正是 OpenAI 的金主爸爸、不久前刚拿 ChatGPT“重新发明搜索引擎”的微软。

到目前为止,开发者调教机器人不仅技术门槛高,还道阻且长:
🌟作为一位资深软件开发者,优化机器人行为是工程师日常的关键挑战💡。他们必须熟练地在复杂的系统循环里,灵活运用代码与规则,对机器人的动态行为进行微调。\👨💻不同类型的机器人可能呼唤着各自特定的编程语言与配置,这就要求工程师具备多语言和跨平台的技能,就像驾驭多种工具一样娴熟。\💼值得注意的是,这不仅关乎技术,更是创新思维与问题解决的艺术。

🌟ChatGPT引领革命!💻无需亲笔编程,只需清晰表述需求,AI智慧瞬间转化为高效代码。🌍人机无缝对接,技术语言不再是难题,创新速度飞速提升!👩💻👨💻🚀体验科技的力量,让代码随心所欲,ChatGPT开启编程新时代!🏆

🌟专业人士与机器人互动速度飙升!🚀技术革新让门槛大降,连新手也能一展编程才华,解锁无限可能!💡不再局限于专家手中,创新思维遍地开花!🌍
举个简单的例子:让无人机自动检查货架。
🌟通过简单的交互,文章写作大师来敲门!🚀只需向 ChatGPT轻轻一点,就像与智慧对话一样,你的想法瞬间转化为高效的代码。🤖接着,这些代码会转化为无人机的指令,让它按照预设的航迹翱翔。🌐不仅如此,你还可以自由设定飞行路径,让创新无处不在,探索无限可能。🌍不论是复杂的编程任务还是无人机操作,ChatGPT都能轻松应对,让你的技术之路如虎添翼!💻💪

难怪特斯拉前 AI 主管 Andrej Karpathy 会调侃:

实际上,ChatGPT 会玩儿的花样可多了。
比如,一位操作者跟 AI 说:“我渴了,请帮我找个喝的。”
此时 AI 并不会直愣愣地就去找水了,而是会很机灵地反问:

原文改写:健身爱好者无需明示,只需轻声一句“归来一身汗,求个健康饮品”,AI就能迅速理解需求,推荐相应选择。这样的互动,既保留了用户的个性化,又巧妙地避免了直接指定,实现了智能与健康的无缝对接。让科技服务于生活,而非反之,这就是高效的人机交互之道。💪🏃♀️🌿
然后更神奇的操作就开始了:
AI 先是猜测他想喝椰子水,然后自己噼里啪啦写出一段代码(甚至还有注释):

写完就自己指挥无人机去找椰子水:

除了无人机,ChatGPT 还能轻松操控别的小机器人,包括摄像头、机械臂等等。
比如让摄像头在房间里找出能加热午饭的东西。

还有指挥机械臂拼出一个微软的 Logo。(悄悄夹带私货)

看到这些,有网友脑洞大开,有人发问:

还有人甚至调侃称,AI 可能连发射核弹的指令都会写:

不过话说回来,其实离网友说的这些还差得远,毕竟现在还是需要人类参与的。
从前文可以看出,这只灵活的 AI 不仅与人交流畅通无阻,而且和机器也能快速沟通。
这主要得益于微软团队专门开发的一系列 API 和高级函数库。

🌟ChatGPT虽强大,但并未被赋予单一编码指令。💡LLM的语言魔力虽显著,却需灵活应对多领域挑战。🤖机器人世界并非一成不变,微调调整必不可少以适应各类情景。代码编写,就像绘画,需要细致入微的手法和对细节的精确把握。🎨定制化路径,而非通用模板,才是实现智能化与专业性的双赢之道。
而在新颖的操作框架下,不同机器人,都有自己对应的特定函数库。
—— 一个 AI,就能适应不同的对象、不同的任务。
一方面,这些函数库,能够连接到机器人控制系统中管理底层硬件,以及执行基本运动的代码和功能模块。
另一方面,为了让 ChatGPT 也能遵循函数库的规则,预定义函数命名就很关键。清晰的函数名,能让各 API 之间建立良好的功能连接,最终生成高质量的回答。
其中一项要求,就是所有 API 名称必须描述整体功能行为。例如,detect_object (object_name) 函数可以在内部链接到 OpenCV 函数或计算机视觉模型。
设计好库和 API 后,微软给 ChatGPT 编写了一个文本提示(prompt),描述目标任务,并明确说明函数库中哪些函数可用;另外,这还能规定 ChatGPT 生成代码用哪种编程语言。

值得一提的是,AI 生成内容效果,和人为提示的质量呈正相关。为此,微软还开发了一个协作开源平台 PromptCraft,任何人都能在此分享不同类机器人的 Prompt 策略。

到此,幕后部署基本完成,然后用户就能通过“说人话”间接操控机器人了。
如果想要检查 AI 生成的代码是否有 Bug,随时都能在聊天框直接检查,或通过模拟器测试,人类可以用自然语言指导 AI 进行修正。
另外,还能到等到用户对解决方案满意为止,再在将 ChatGPT 生成代码部署到机器人上。
最后,如果是你,会想用 ChatGPT 操控机器人做些什么呢?
论文地址:
https://www.microsoft.com/en-us/research/uploads/prod/2023/02/ChatGPT___Robotics.pdf
参考链接:
本文来自微信公众号:量子位 (ID:QbitAI),作者:Alex

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!