文章主题:OpenAI, ChatGPT, Siri, 智能语音助手
在经历了权力争夺的风波之后,OpenAI正在逐步恢复正常运行。近期,这个人工智能公司面向所有用户开放了ChatGPT Voice服务,允许用户进行语音聊天。OpenAI的前总裁Greg Brockman在接受采访时表示,这次开放是一个“尝试”,旨在彻底改变ChatGPT的使用体验。在此之前,OpenAI于九月份推出了基于ChatGPT的文本转语音功能,利用神经网络模型从文本中生成类似于人类的声音。值得一提的是,这项功能现在对所有免费用户开放,而不再是只有ChatGPT Plus订阅用户才能使用。
尽管Siri曾作为苹果产品中的智能语音助手引领潮流,展示出通过语音控制设备的无限可能,但随着时代的变迁,其影响力却逐渐减弱,甚至陷入了被超越的困境。这其中的原因,一方面是由于市场竞争的加剧使得Siri的优势不再突出,另一方面则是由于技术的飞速发展使得人们对于语音控制的需求日益增强,而Siri并不能完全满足这些需求,导致其地位逐渐被竞争对手所取代。
在大型模型的助力下,更加智能且自然的人机交互体验逐渐浮现,这引起了我国国产手机品牌的重视,纷纷开始采用大模型技术,旨在优化产品用户体验,从而在市场竞争中占据有利地位。
天下苦 Siri 久矣
Siri,作为苹果公司的智能语音助手,虽然在某些领域有所建树,但在某些方面仍有待加强。首要的问题在于,Siri的语音识别能力有待提升。在某些情况下,Siri有可能无法精准地识别用户的语音,从而使得用户无法获取他们所需的信息或服务。其次,Siri的理解能力也有局限性。尽管Siri能够回答部分日常问题,但对于复杂的问题或者较为生僻的词汇,Siri可能无法完全理解,这可能会让用户在使用过程中产生无助和困惑的感觉。
Siri作为苹果设备的重要语音助手,其用户体验仍有待进一步提升。在使用过程中,用户有时会感受到Siri反应速度较慢,或当需要时无法给予有效的帮助,这无疑给用户带来了不便与烦躁。虽然Siri能够根据用户的偏好与习惯进行自我学习,但在某些方面仍无法实现高度个性化的服务,满足部分用户对更高级别智能助手的需求。
在 OpenAI 的 ChatGPT 语音功能向所有免费用户开放的消息宣布后,许多用户开始考虑是否要更换他们的 iPhone 语音助手——尤其是那些配备新操作按钮的 iPhone 15 Pro 系列用户。这些新操作按钮取代了自 iPhone 首次亮相以来一直位于 iPhone 上的静音按钮,这无疑将对用户的语音交互体验产生重大影响。对于那些习惯使用 Siri 的人来说,这个变化可能会让他们感到陌生,但考虑到 ChatGPT 强大的语音识别和自然语言处理能力,他们可能会发现这个新助手实际上比 Siri 更加智能和实用。因此,尽管用户可能需要一些时间来适应这个变化,但他们最终可能会发现自己更愿意使用 ChatGPT 作为他们的主要语音助手。
用户可以通过新的设置菜单将按钮用于除静音以外的其他功能,如打开相机、手电筒、录制语音备忘录等。此外,该功能还可作为ChatGPT的触发器。考虑到人工智能聊天机器人在许多日常查询中的实用性和Siri所不具备的能力,为ChatGPT添加语音支持已经成为许多海外用户默认可决的举措。
国产手机品牌齐发力
GPT等大型模型的发展不仅风靡了AI领域,也为硬件智能化开辟了新的途径。其中,大型模型技术在提升手机语音识别能力方面表现尤为突出。相较于传统的语音识别技术,它们能显著增强语音识别的准确性和稳定性,这一优势对于需要频繁使用语音输入的用户而言尤为重要。
另一方面,大模型还可以提升手机的理解能力。通过应用大模型技术,手机可以更好地理解用户的意图和需求,从而提供更加个性化和高效的服务。这对于用户体验的提升也是非常重要的。
华为终端BG AI与智能全场景业务部总裁贾永利指出,大语言模型具备泛化能力,能够帮助手机智能助手提升理解能力。另外,大模型Plug-in的插件能力,可以在手机内部打通各应用之间的壁垒,借助工具拓展能力。
在华为盘古L0基座大模型的基础上,华为针对终端消费者场景构建了大量的场景数据与精调模型后的L1层对话模型,并将该模型用在了语音助手“小艺”中。全新的小艺在今年夏天的华为开发者大会上正式亮相。
基于大模型,小艺的智慧体验迎来升级,实现了基于自然语言理解的设备控制、本机数字内容搜索、对话识别屏幕内容;帮助用户快速摘要、文案内容辅助、图片二次创作;实现了随口说随时记、贴心的组合服务建议提醒等。随着更长时间的使用,小艺也会通过不断学习,成为熟悉用户个性、偏好、习惯的日常助手。而这些新体验,今后也将进一步扩展至华为的产品生态中。
11月16日,在2023 OPPO开发者大会上,OPPO正式推出安第斯大模型(AndesGPT),并接入最新发布的操作系统ColorOS 14上。OPPO方面介绍称,在AndesGPT加持下,OPPO手机助手“小布”能实现更加自然流畅的对话,以及提供对话式内容创作、日程管理与通话摘要等服务。
OPPO还表示,2022 年发布的潘塔纳尔系统全面商用,此次将在ColorOS 14上与AndesGPT深度协作。这一系统有望提供更多元化的泛在服务,即根据地点、时间、事件、习惯,在通勤、打车、外卖、差旅等高频场景中提供服务。以国内游为例,当识别到用户购买旅游地机票、火车票后,ColorOS会在用户授权情况下,通过主动感知位置,主动智能推送城市游玩榜单卡片,以及推荐相关酒店住宿。
11月1日,2023 vivo开发者大会期间,vivo正式发布自研蓝心大模型Blue LM。该大模型通过大参数AI算力的端侧部署与云端服务,将全面覆盖核心应用场景。其蓝心小V智慧助理功能,将提供超能语义搜索、超能问答、超能写作、超能创图和超感智慧交互五大体验。vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围表示,希望端侧大模型能成为用户的贴身助理。
荣耀 CEO 赵明则很早就强调了大模型端侧部署的趋势和重要性,在6月上海举行的MWC 2023上他指出,手机端侧的个人大模型是未来探索方向。
天风证券也指出,C端AI应用落地阶段场景重要性凸显,聊天机器人、AI伴侣和内容生产工具场景最先落地,这些场景中的AI应用开发速度和商业化进展或超预期。
机遇与挑战并存
DeepMind联合创始人Mustafa Suleyman此前受访时表示,现阶段的生成式AI只是一个过渡性的技术阶段,接下来将进入交互式AI时代,AI将根据用户的不同任务需求,安排其他软件和或联系真人来完成工作。
他认为,第一波AI浪潮主要聚焦于分类。深度学习表明,人类可训练AI,对图像、视频、音频、语言等输入数据分类。目前人类正处于第二波浪潮“生成式AI”中,即“输入数据并生成新数据”。而未来的第三波浪潮将属于“交互式AI”,“对话才是未来的交互界面”,用户不仅仅是点击按钮和键入文字,而是与AI直接对话,届时交互式AI将能自主采取行动。
毋庸置疑,未来的手机语音助手将更加智能化和个性化,通过与用户的对话和交互,提供更加更精准的建议和服务。但是,由于生成式 AI 和交互式AI需要处理大量的对话数据和实时数据,因此需要更高效的数据处理和存储能力来支持这种交互。这对于手机语音助手的性能和技术要求将是一个巨大的挑战。
另外,生成式 AI 和交互式AI“呼唤”更强大的安全性和隐私保护能力。由于二者需要大量收集和处理用户的对话数据,因此需要手机厂商和技术提供商加强数据安全和隐私保护的措施,以确保用户的数据安全和隐私不受侵犯。
总之,随着AI技术的进一步发展,手机语音助手将面临新的变革。为了迎接这些利好,手机厂商需要不断提升技术水平和创新能力,以应对技术巨变带来的相关问题,并满足用户的需求和期望。
OpenAI, ChatGPT, Siri, 智能语音助手
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!