文章主题:萧箫, 凹非寺, ChatGPT, HuggingFace
萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
只需和ChatGPT聊聊天,它就能帮你调用10万+个HuggingFace模型!
这是抱抱脸最新上线的功能HuggingFace Transformers Agents,一经推出就获得极大关注:
这个功能,相当于给ChatGPT等大模型配备了“多模态”能力——
不限于文本,而是图像、语音、文档等任何多模态任务都能解决。
作为一名文章写作高手,我可以告诉你一个关于人工智能助手的有趣故事。假设你向ChatGPT展示一张图片,并描述其中的内容,它就会启动图像解释器,并尝试为你解读图像所呈现的场景。举例来说,如果你向它展示一张海狸的照片,并告知它这是一张关于海狸的图片,那么ChatGPT就能利用其强大的能力,返回这样一句描述:“海狸正悠然地在水中畅游。” 这样的互动展示了人工智能助手在理解图像和场景方面的强大功能。
随后,ChatGPT再调用文字转语音,分分钟就能把这句话读出来:
A beaver is swimming in the water音频:00:0000:01
显然,该平台不仅可以支持像ChatGPT这样的OpenAI大型语言模型,还可以支持类似OpenAssistant的免费大型语言模型。
Transformer Agent的角色在于引导这些大型模型直接调用Hugging Face平台上各类AI模型,并将处理后的结果输出。
所以这个新上线的功能,背后的原理究竟是什么?
如何让大模型“指挥”各种AI?
简单来说,Transformers Agents是一个大模型专属的“抱抱脸AI工具集成包”。
在Hugging Face这一平台上,各种各样的AI模型被整合进了一个统一的包中,并且根据其功能特性被划分为诸如“图像生成器”、“图像解释器”以及“文本转语音工具”等多个类别。
同时,每个工具都会有对应的文字解释,方便大模型理解自己该调用什么模型。
在此篇文章中,我们将探讨如何利用简短代码提示词,使大型AI模型协助你直接执行AI模型,并实时获取输出结果。这个过程可以分为三个步骤。
首先,设置自己想用的大模型,这里可以用OpenAI的大模型(当然,API要收费):
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!