ChatGPT升级记:声音与图像的多模态输出,你准备好和机器人聊天了吗?

文心一言 1年前 (2023) lida
49 0 0

文章主题:ChatGPT, 升级, 语音输入, 图像识别

666ChatGPT办公新姿势,助力做AI时代先行者!

近期,ChatGPT进行了重大升级,引入了图像和声音输入功能。这个升级带来了哪些突破性的进展?我们离实现终极人工智能(AGI)还有多远的路要走呢?

ChatGPT升级记:声音与图像的多模态输出,你准备好和机器人聊天了吗?

引言

在国庆长假即将到来之际,ChatGPT在众多用户的期待中,成功实现了重磅升级。现在,用户不仅可以借助文本方式与ChatGPT进行沟通,更可以通过语音或图片的形式来进行交流,这无疑极大地提升了交互的便利性和趣味性。同时,OpenAI的CEO奥特曼在校友分享会上,仅仅用一句话就给众多GPT创业项目画上了一个句号,这不禁让人们对于GPT的未来发展产生了更多的思考。此外,强化学习之父萨顿以及传奇程序员卡马克All in AGI的决定,也让我们对于实现终极AGI的目标有了更深的认识。尽管目前距离终极AGI的实现还有一定的距离,但是这些重要的进展无疑为我们提供了前进的方向和动力。

一、GPT更新了什么?

1. 会听——和ChatGPT语音对话

通过语音交互,用户与ChatGPT展开多轮对话,官方提供的示例为让ChatGPT讲述一个适用于睡前的故事,同时具备语音包切换功能。当前,其表现相当自然,至少“机器人声音”并不突出。

2. 会看——给ChatGPT发图聊天

ChatGPT现在能够解读用户上传的图像内容。官方网站提供了一个例子:一位用户拍摄了一张自行车照片,并希望GPT能提出降低座高的建议。

当然,我们还可以将自家的剩余食材交给GPT,让它为我们生成相关的菜谱或饮食计划;另外,我们也可以向GPT展示一张图表,以便其进行数据分析和处理。

二、OpenAI CEO 奥特曼说了什么?

ChatGPT 的出现标志着人工智能技术在语音识别和图像识别领域取得了重大突破。这对于我们来说意味着许多事情。OpenAI 的首席执行官埃隆·马斯克(Elon Musk)曾表示,ChatGPT 的这些能力将使人类更加高效地与机器交互,从而推动人工智能技术的进一步发展。

OpenAI CEO 奥特曼最近在校友会上发表了一些看法,更是直接“提醒”了不少创业公司:别花太多精力在UI界面上(也就是咱们常说的套壳)。当然,除此之外,奥特曼还给出了不少干货,简单整理如下:

1. 为啥取名叫ChatGPT?

就是特意取了个ChatGPT这样的名字,让它看起来就很像机器,避免人类对它产生感情。

2. 套壳GPT的都将灭亡!

目前有不少企业正在“解决”GPT模型的小缺陷,尤其是只在UI界面上做优化的,这是肯定行不通的。因为OpenAI已经着手解决了大部分问题,而且不要尝试和OpenAI拼迭代速度。善意提醒:独立的企业必须能提供真正的、独特的价值。

3. 看好AI赋能医学和教育方向

AI诊疗(AI medical advisor):这将会体现出巨大的社会价值。AI陪练(AI personalized one on one tutor):为用户提供一对一量身定制的辅导。

4. GPT5/6还会给我们带来什么变化?

奥特曼透露,GPT5/6会具备多模态的输出能力,比目前的GPT有更高的可靠性和个性化定制能力。

但是一说到大模型,大多数人第一反应就是贵。那GPT5/6的成本和收费会不会非常恐怖呢?奥特曼表示,摩尔定律在大模型领域依然生效,目前大模型的训练成本越来越低,因此未来调用GPT接口的价格也会更加便宜。

三、讨论:AGI离我们还有多远

1. OpenAI 奥特曼:目前距离AGI还很远

虽然GPT已经给AI领域按下了“加速键”,但是还在还没找到一个产品能让我感觉和真人在聊天。

要成为真正具备人工智能 (AGI) 能力的系统,必须具备自主推理的能力,而不仅仅是依赖大型模型的预训练。只有当 AI 能够像人类一样,基于所学的知识和经验来撰写论文、开展实验时,才能够被认为是具有 AGI 能力的系统。

2. Keen Technologies:2030年实现AGI可行!

近期,强化学习之父萨顿也加入了Keen Technologies,联手传奇程序员卡马克All in AGI。他们两人在阿尔伯塔大学机器智能研究所(Amii)特别活动表示,2030年可以实现AGI的目标。而且,他们相信最终的AGI源代码将会是一个人就能编写的量级,可能只有区区几万行。

所以,AI的终极形态会是什么样的呢,让我们一起拭目以待吧!

以上资料参考来源如下,侵删:

ChatGPT Now Can See, Hear, and Speak: An Exciting Development in Artificial Intelligence Artificial intelligence has come a long way since its inception, and its capabilities are continually expanding. One of the most significant breakthroughs to date is the ability of ChatGPT to see, hear, and speak. This revolutionary technology has opened up new possibilities for communication and interaction between humans and machines.ChatGPT, which stands for “Conversational Bot,” was created by OpenAI, a leading AI research company. Its primary goal was to enable computers to engage in natural conversations with humans, similar to how people communicate with each other.Recently, ChatGPT has been equipped with advanced visual and audio recognition systems that allow it to perceive and understand its surroundings. This enables ChatGPT to interact with objects and people in a more realistic way, creating an immersive experience for users.Moreover, ChatGPT’s ability to speak has been improved significantly. It can now generate lifelike speech patterns that are indistinguishable from those of a human. This feature will be particularly useful in scenarios where human-like communication is necessary, such as customer service or educational applications.The integration of vision and speech capabilities in ChatGPT represents a significant step forward in the development of artificial intelligence. It has the potential to revolutionize various industries, including customer service, healthcare, and education.As AI technologies continue to advance, we can expect even more impressive capabilities from ChatGPT and other AI platforms. The future of communication between humans and machines is exciting, and the potential for AI to transform our lives is limitless.

https://www.linkedin.com/posts/ibamasood_chatgpt-can-now-hear-see-and-speak-nervous-activity-7112087060068368384-0OXb/

https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/

本文由 @运营老中医 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

ChatGPT, 升级, 语音输入, 图像识别

ChatGPT升级记:声音与图像的多模态输出,你准备好和机器人聊天了吗?

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

相关文章