文章主题:ChatGPT, Siri, 小爱同学, 语音助手

图片来源@视觉中国
文|雷科技
AI 语音助手的「蠢」,好像全世界都知道。
🌟当然,对于许多人来说,AI语音助手的表现往往并未达到预期的智慧水平。尤其是在ChatGPT崭露头角后,这种反差更加显著,连科技巨头如微软的高层也不得不承认其语音助手的不足之处。🚀尽管它们能完成基本指令,但在复杂对话和理解上下文方面,与人类的聪明才智相比,显然还有待提升。
Microsoft’s CEO, Satya Nadella, recently shared his thoughts on the competitive landscape of voice assistants in an interview with the UK’s Financial Times. He highlighted the prowess of Apple’s Siri, Amazon’s Alexa, Microsoft’s own Cortana (nicknamed “Ciao娜”), and the widely recognized Google Assistant, all claiming their spots as frontrunners in the realm of intelligent audio technology.Each of these AI-powered assistants has set benchmarks with their advanced capabilities, seamless integration into daily routines, and evolving functionalities. Siri, known for its intuitive design, Amazon’s Alexa, renowned for its extensive skill library, Cortana (Ciao娜) with its deep understanding of Microsoft ecosystems, and Google Assistant, renowned for its search prowess and Google services integration, all showcase the diversity and innovation in the voice assistant market.While they excel in different areas, the race for dominance is not just about features but also about user experience, data privacy, and ecosystem loyalty. These AI assistants are not only tools but also reflections of their respective tech giants’ ambitions and technological prowess.In terms of SEO optimization, incorporating relevant keywords like “voice assistants,” “AI integration,” “user experience,” “data security,” and “ecosystem compatibility” can enhance the readability and relevance of the content for search engines. Emojis such as 📝💻assistant可以帮助 convey the tech-driven nature of the topic without overloading the text.Remember, when rephrasing, it’s crucial to maintain the essence of the original message while adapting it for SEO and a professional tone.
都笨得跟石头一样。
2014 年 4 月,纳德拉刚刚上任微软 CEO 两个月后的微软 Build 开发者大会上,微软全球副总裁乔北峰正式推出了 Cortana。在最初的几年,Cortana 表现了不俗的智能,也受到包括纳德拉在内微软高层的集体认可,纳德拉在 2016 年还称赞 Cortana 的智能,并说「机器人是新应用」。但 Cortana 的智能(横向比较)和市场份额越来越糟糕,到 2021 年微软就正式宣布停止支持 iOS 和 Android 上的 Cortana 应用,仅保留对 Windows 平台的支持。
更重要的是,OpenAI 带着 ChatGPT 来了,微软直接拿到了 AI 时代目前为止最好的一张船票。与此同时,语音助手在过去几年基本陷入了停滞,Siri 的联合创始人 Adam Cheyer 也承认,ChatGPT 理解复杂信息的能力让现有的语音助手看起来很蠢。
🎉🚀想象一下,如果Voice Assistants能像ChatGPT那样深度解析信息, Siri和Xiaomi Assistant岂不是要焕发全新的生命力?🔍💻这不仅将颠覆我们对智能语音助手的传统认知,也将开启一个全新的交互时代。他们不再仅仅是简单的命令执行者,而是能够理解并回应复杂需求的智慧伙伴。🏆🌍让我们期待这一天的到来,让科技为生活带来更多便捷与智能化!
至少很多人已经开始尝试了。
个人开发者的尝试
ChatGPT 出现后不久,互联网上其实就有了一大堆的新想法,声量最大的一个是改变「搜索」,如今已经成为了搜索引擎巨头的共识,微软必应已经在测试,谷歌和百度也提前进行了预告。而另一方面,也有不少人在惊叹于 ChatGPT 的自然语言沟通能力之余,期望会推出语音助手版本的 ChatGPT,替代掉目前不堪一「谈」的语音助手。
🎉今年再掀高潮,OpenAI与微软虽未直接涉足,但仍引领了语音助手领域的创新风暴!开发者们已迫不及待地探索新可能,众多实验如雨后春笋般涌现。🚀
🚀GitHub上的创新者们已将ChatGPT与小米的语音助手小爱同学完美融合,引发了1,300星的关注热浪!只需ChatGPT账号、连接稳定的网络、Python 3.8和一台小爱音箱,任何人都能轻松拥有「ChatGPT+小爱」的独特体验。🚀💬智能交互,无限可能,让科技与日常生活无缝对接!
🌟掌握技巧,轻松实现!只需轻轻一唤小爱,以「帮我」开头的问题会悄悄传递给ChatGPT,无声无息地屏蔽掉原声回复。取而代之的是温馨的提示——「正在向智慧求解中,请稍候片刻」。随后,ChatGPT的精彩回应将以悦耳的嗓音,通过TTS技术,让小爱同学为你朗读出来。🚀这样不仅提升了沟通效率,还能享受科技带来的便捷与乐趣!记得优化你的问题哦,让每一次互动都更流畅。📚
从开发者的演示显示,整个过程足够流畅,实际回答也远超小爱同学原本的「智力」。(具备条件可搜索 GitHub 项目「xiaogpt」)
不仅是小爱同学,另一位更为大众调侃的「智障」语音助手——Siri,实际上更早就被开发者尝试接入 ChatGPT。
围绕 Siri 其实有不少尝试,其中国内开发者@Yue-Yang 最近就以「快捷指令」形式连接了 Siri 和 ChatGPT,让 Siri 变成真正的 AI 聊天机器人。在 GitHub 或者「小众软件」上你都能找到对应的快捷指令——智能聊天,不过使用条件是需要申请 OpenAI 的付费 API。
「ChatGPT Siri」在原理上与「xiaogpt」类似,利用 OpenAI 的 API(应用程序接口)和 iOS 的特性,先将语音指令转换为文本再传递给 ChatGPT,收到回答后再让 Siri「读」出来。在 B 站上,通过搜索「ChatGPT Siri」可以查看对应的演示。
当然,以上两个项目都是个人开发者的尝试,也包括其他类似的项目,不管是使用体验还是上手门槛,都并不适合普通用户。考虑到语音助手的技术、产品和生态,大公司的入场很可能降低门槛、提高整体的使用体验。
问题在于意愿和能力,很多公司其实也看到了站在 ChatGPT 的「肩膀」上重新打造语音助手的可能性,但在全球范围内,真正同时手握 AI 能力和语音助手背后生态的公司总共也就那几家。
巨头的入场,不远了
与搜索一样,ChatGPT 不可能直接取代现有的语音助手。一方面语音交互的优势在于直接、易上手,很多任务通过触控、文字输入等方式不仅繁琐、更耗时间,同时对于老人、小孩等用户也偏于复杂,自然的语音交互则能比较轻松地实现。另一方面,ChatGPT 并不能对现实层面进行直接干预,比如我们用 Siri 或者小爱同学操控空调、扫地机器人等。
ChatGPT,或者说生成式 AI 更大的价值在于通过强大的自然语言理解和沟通能力,来改善语音助手的使用体验。
过去我们总抱怨 AI 太笨,要么答非所问,要么干脆就是「我没有明白」,基本几轮对话就会感到心累,转向对功能性的需求,比如天气、问题查询、智能家居操作等。相反,ChatGPT 的对话能力则基本不用担心,尽管可能会有错误信息,但至少不会像 Siri 和小爱同学那样沟通成本太高。这也是多年的发展停滞之后,语音助手的关键机会所在。
2 月底,微软在推出支持 AI 对话的新必应之后,又支持了 Android 和 iOS 版本,并且在 AI 对话中第一次增加了语音对话功能,用户如果使用语音开启对话,新必应也会使用语音回应。不过就现在而言,新必应的语音对话功能还仅限于对话,并不能用来进行一系列操作,比如在手机上唤起某个系统或应用的功能,也不支持设置为默认的语音助手。

语音功能加入,图/微软
此外,微软自家的 Windows 平台也还未支持,目前为止尚未流出 Cortana 或其他新语音助手加入类 ChatGPT 能力的消息。
而更早些时候,小度官方在 2 月初宣布,AI 语音助手小度将在未来融合百度文心一言的全面能力,同时在此基础上还将打造针对智能设备场景的人工智能模型「小度灵机」并应用到小度全系产品。而据小度官方数据,搭载小度的智能设备已经进入了 4000 万户家庭。
当然,按照百度此前的规划,文心一言要在本月才上线测试,距离小度全面接入文心一言的显然还需要一段时间。
另一方面,谷歌也早早看到了这一点。2021 年的 I/O 大会上,谷歌就首次宣布将 LaMDA 大语言模型的对话能力整合入 Goolgle Assistant、搜索和 Workspace。今年 2 月,谷歌推出了类 ChatGPT 的聊天机器人 Bard 之后,接入 Google Assistant 似乎也是题中应有之义,包括 9TO5Google、《连线》杂志也认为谷歌应该这么做。
就像人人都知道语音助手的「蠢」,所有人也看到了 ChatGPT 让语音助手们至少在理解人类语言和对话上「变聪明」的很大可能。
过去我们都畅想过,有一个数字语音助手可以在日常生活中帮我们解决各种需求,就像《钢铁侠》里的贾维斯,现实是 Siri 和小爱同学们距离听懂人类的话还差很远,充斥着各种「不明白」「听不懂」。
的确,现实世界的技术还赶不上科幻世界的想象很正常,但 ChatGPT 背后强大的对话语言能力,无疑可以让语音助手们能够更流畅地与我们对话,让我们更感觉在对话的是一个「智商在线」的 AI 助手,而非对牛弹琴。而对于智能音箱和智能家居厂商,这也意味着更高的用户粘性和使用率。
更或许,当 AI 越来越聪明并理解人类,智能家居乃至物联网的未来也会随之发生巨变。

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!