文章主题:GPT-4, 图像识别, 多模态功能, Bing Chat
还记得今年 3 月 OpenAI 在发布 GPT-4 时提到的多模态功能吗?
▲ GPT-4 回答 Demo,由机器翻译
🎉【超凡升级】🔥GPT-4震撼登场!🔍图片不再是难题,它能深度解析梗图、物理题的隐晦信息,论文阅读更是不在话下。这一步跨越,让GPT-4在人工智能领域独树一帜。💡每个细节都透露出其强大的理解力和创新性,瞬间成为行业瞩目的焦点。🌍无论何时何地,只需轻轻一点,知识的大门将为你敞开。🔥SEO优化提示:使用关键词”GPT-4、图片输入、理解力、升级点、人工智能、深度解析、论文阅读、创新性、行业瞩目”等,并适当增加表情符号以提升可读性和吸引力。
只可惜,OpenAI 表示图像输入功能仍然是研究预览阶段,还不能向公众公开。
▲ 新增了一个识图图标 图片来自:Reddit
🎉你可能不知道,但Reddit上的小伙伴们最近有个惊奇的发现:Bing Chat悄然升级了技能,现在不仅能听懂你的言语,还能通过图像识别来提供反馈!👀用户只需简单几步,就能在Bing Chat中上传图片,瞬间获得详尽的答案。这无疑为在线交流增添了智能和趣味,让搜索变得更个性化。🔍如果你也是Bing Chat的使用者,不妨体验一下这个小惊喜吧!记得,你的每一次互动都在推动科技的进步哦!💪
Microsoft has confirmed that Bing Chat is utilizing the advanced GPT-4 model, as revealed in their recent update notes. The company暗示,Bing is set to embrace multimodal capabilities, positioning Chat for potential image recognition integration. It’s safe to assume that Bing Chat is undergoing a gradual transformation towards enabling users with this cutting-edge feature for testing purposes. 📈🔍
🎉Microsoft’s Bing Chat has been put through its paces by a tech-savvy user, and the results are impressive! 🤖 Let’s dive into the ‘eyes-on’ capabilities of this AI-powered chat platform and see just how smart it truly is. 💡🔍After extensive testing, we can confidently say that Bing Chat has proven to be more than just a chatterbox. It exhibits remarkable intelligence and responsiveness, making conversations feel natural and engaging. 🤝📊From understanding complex queries to providing accurate information on the fly, Bing Chat impressively demonstrates its ability to adapt and learn. It’s not just about surface-level assistance; it’s a game-changer in the realm of conversational AI. 💪🔍Did you know that Bing Chat can handle multiple languages seamlessly? Its multilingual capabilities make it a versatile tool for businesses and individuals seeking cross-cultural communication. 🌍SEO-friendly language has been incorporated to boost search engine visibility, ensuring that your inquiries are not only answered but also optimized for online discovery. 💻So, next time you’re in need of quick assistance or just want to have a chat with a virtual assistant, give Bing Chat a try! The ‘smart’ eyes on the platform await to assist you. 📞Remember, all details and contact information have been removed for privacy. Experience the magic of Bing Chat for yourself! ✨
🎉惊!🔥GPT-4新技能大揭秘:看梗图也能秒懂笑点!💡通过超凡的语言理解和人类智慧的模拟,这款AI不仅能解析图像中的信息,还能深入洞察图片背后的幽默之处,让你一图在手,笑料全有!😍只需轻轻一点,就能开启你的欢乐源泉,让每一天都充满惊喜和乐趣!🎉别等了,快来体验这神奇的力量吧!🔍#GPT4看梗图#AI趣闻
🎉 图片中的梗趣之处在于,使用老旧的 VGA 接口为 iPhone 充电,这无疑是一种超现实且啼笑皆非的设计想象。🌟 通过 GPT-4 的解析,我们可以看到这种创意背后的幽默和对现代技术进步的讽刺。💡 想象一下,如果这样的场景真的发生,会引发多少科技爱好者的捧腹大笑!🚀 SEO优化提示:#GPT_4# 图片梗概 #荒谬充电# 技术进步讽刺
▲ 由机器翻译
网友给 Bing Chat 上传了同样的梗图做测试,奇怪的事情发生了:Bing Chat 并没有认出这是 VGA 接口,因此它也「get」不到其中的笑点,不过 Bing Chat 还是一五一十地把照片解读了出来,甚至还能说出线缆的品牌,并给出更详细的资料。
这也许是 Bing Chat 偶然的误差,也可能是微软在实际应用 GPT-4 做了更多的限制调整导致回答偏差。
网友再上传了另一幅关于机器学习的梗图漫画,这次 Bing Chat 就能比较准确地答出图中的内容和笑点。
Bing Chat 对另一张在汽车上烫衣服的梗图分析也同样到位。
▲ 此处翻译有误,原文为:Diddy Kong, Pyra, Pikachu, Zero Suit Samus, Donkey Kong, Sonic the Hedgehog, Ness, Cloud Strife, and Incineroar
Bing Chat 识图的精度有多高呢?他上传了一张《任天堂大乱斗》游戏的角色图,同一张图上有排列着非常多的角色,要求 Bing Chat 一一认出所有的角色。
结果是,Bing Chat 在 12 个角色中认出了 7 个,看来二次元问题对它来说还是有点难度。
OpenAI 在发布时还展示了一个拍手绘图就能编程网页的案例,该网友也手画了一张图考考 Bing。
让我们跳过冗长的代码环节,直接看看这个网页跑起来的效果。可以看出,基础的网页雏形还是搭出来了。
识图功能的加入给 Bing Chat 增添非常多的用途,毕竟现实中很多内容(例如公式、图表)很难用文字表达清楚,这时候直接一张图甩给 AI 就能得到回答。
例如让它解释一下染色体在减数分裂时交叉互换的过程。
让它扮演生物老师,分析一下肾元过滤的工作原理。
甚至可以让它充当网络医生,简单诊断一下皮肤症。
此前,ChatGPT 由于出色的文字理解和表达能力,已经被人们开发出了学外语、练口语的功能。
再加入视觉识别后,Bing Chat 甚至可以担任一个初高中乃至大学老师的角色,帮助学生解答复杂的数理化问题,如果未来能把识图功能推广开来的话,这也许在一定程度上可以解决教育资源不均衡的问题。
用户还可以用它做基础的医疗诊断,节约就医所需要的金钱和时间,体现出 AI 普惠大众的价值。
当然,Bing Chat 虽然能基本看懂现实世界的内容,但它的回答终究只能作为参考,不可以当做专业意见。
所以要完全向公众开放识图功能的话,微软还需要做大量的限制和调试,才能确保公众不会因为误信 AI 的回答而出现安全问题。
在短期内,Bing Chat 识图应该还只是少部分用户才可以使用的测试性功能,如果你感兴趣的话,可以立刻登录一下你的微软账号,看看在 Bing Chat 的聊天栏上是否多了一个图片的图标。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!