谷歌IO大会:AI-first公司的科技盛宴
文章主题:谷歌, IO 大会, 硅星人, 搜索引擎
时隔三年,品玩 / 硅星人终于又回到了谷歌 IO 大会的现场。
在谷歌硅谷总部的对面,Shoreline Amphitheatre 的露天剧场早已成为了开发者与媒体们聚集的热门场所。与过去两年相比,今年的IO大会显得更加紧张和期待,因为谷歌已经做好充分的准备,无论是AI的升级还是全新硬件产品的发布,都将给人们带来前所未有的惊喜。与过去两年来的人文气息和产品重量级不足相比,今年的谷歌IO无疑是一场科技盛宴,令人翘首以盼。
尤其突出的是,谷歌此次重磅打出了一系列 AI 组合拳,旗下几乎所有产品都开始跟 AI 进行全面集成、并进行跨越式升级。在当前 AI 竞赛中起跑慢了一步的谷歌似乎已经不再藏着掖着,作为 AI 领域的长期领导者,在本次 IO 上,谷歌充分向大众展现了其巨大的 AI 能量和潜力。
在Keynote正式开启之前,现场首先进行了预热,的几首由谷歌全新音乐AI工具MusicLM和Bard参与创作的迷幻电子音乐,为整个活动营造出独特的氛围。
现场播放的 AI 制作的音乐《ducks with lips》,硅星人现场拍摄
在欢乐的氛围中,谷歌首席执行官皮查伊步入舞台,进行了简短的问候后,他直接进入主题,”众所周知,今年人工智能的发展非常迅速,作为一家以人工智能为基础的公司,我们有诸多事情想要分享。现在,让我们开始吧。”
Gmail、Maps 等 AI 升级,创造更智能的生活体验
在活动启动时,谷歌率先推出了几款“开胃前菜”。皮柴透露,实际上谷歌的AI技术已经广泛应用于许多与用户日常生活紧密相关的软件中,例如我们熟知的Gmail、Google地图以及图片编辑工具等。
首先,大家期盼已久的 Gmail 自动写邮件功能终于来了。早在 2017 年 Gmail 就推出了邮件的 Smart Compose 一键简短回复功能,而今天,谷歌在此基础上推出了一个名为 “Help Me Write” 的全新功能,能够帮助你快速撰写完整的邮件和回复。
在IO平台上,谷歌提供了一种申请航空退款的示例。只需向Gmail说明您的退款意图,系统将根据您的航班信息自动生成一封完整的邮件,并允许您调整邮件的语气。
谷歌 Map 则引入了一个全新的 3D 沉浸式路线视图功能。在 AI 和计算机视觉技术的帮助下,谷歌将数十亿张航拍和街景图像融合在一起创建了空间 3D 模型。也就是说,未来你用 Google Maps 进行路线导航时,你看到的不仅只是从 A 到 B 的 2D 路线,而是能够以可视化的形式看到道路和周边的建筑情况,甚至包括当地实时天气、交通等。
谷歌宣布,该功能将于今年迅速投入使用。初期将在包括阿姆斯特丹、柏林、都柏林、佛罗伦萨和拉斯维加斯在内的15个城市启动。
此外,名为 Magic Editor 图片编辑功能让小白也能轻松改图。跟苹果此前的图片功能类似,Magic Editor 可以对照片中的不同事物进行识别,并允许你用拖拉拽的方式进行编辑。比如把人往左边右边拉一下,让构图更加符合你的想象。最强语言模型 PaLM2 亮相,Bard 能力爆炸跃升
几个小功能热身之后,接下来,谷歌此次真正的硬菜开始接连登场。首先,像此前大家猜测的一样,谷歌推出了下一代超强语言模型 PaLM 2。
2022年4月,Google 发布了一款名为PaLM的大语言模型,其采用了5400亿参数的训练数据,这一数字约为GPT-3的三倍。最近,PaLM 2在PaLM的基础上进行了进一步提升和改进,使其具备了多语言处理、推理以及编码的能力。
经过大量的多语言文本训练,PaLM 2 在理解和生成各种语言的微妙差异方面表现尤为出色,其覆盖的语言种类高达100多种。此外,该模型还成功通过了高级语言能力考试,展现出了强大的语言理解、生成和翻译能力,包括成语、诗歌以及谜语等复杂文本类型。
在推理方面,PaLM 2 的数据集包括科学论文和带有数学表达式的网页,拥有超强的逻辑、常识推理和数学能力。同时,PaLM2 在大量公共源代码数据集上进行了预训练,写代码能力更强了。除了 Python 和 JavaScript,还包括在 Prolog、Fortran 和 Verilog 中生成专用代码等。
值得注意的是,PaLM 2 已经被开发出了不同的版本,可以面向不同的客户、部署在不同企业环境中。
目前,PaLM 2 有四种规格,从小到大依次为 Gecko、Otter、Bison 和 Unicorn,其中,体积最小的 Gecko 可以在手机上运行,每秒大约可处理 20 个 Token,也就是约 16 或 17 个单词。也就是说,开发者们不用花费大量的时间和资源来创建和调整 PaLM 2,而是能够直接拿来就用进行部署。
在谷歌内部, PaLM 2 也早已经被用在了自家的 25 项功能和产品之中,其中也包括 AI 聊天机器人 Bard、谷歌的全线办公套件等。
在 PaLM 2 的加持下,此次 Bard 也开始真正的显现出 “ChatGPT 杀手 ” 的实力。
此前 Bard 是基于 LaMDA 开发,该模型拥有 1370 亿种参数,但现在 Bard 已经全面转用 PaLM,在答案生成的数据组和更多元化的内容方面能力飞升。同时,谷歌将 Bard 跟旗下和外部产品的集成,让 Bard 也跳出了聊天机器人的范畴,而是真正让其成为了一款实用性工具。
比如现在 Bard 为你提供答案时,除了文字之外,还能提供包括图片、视频、外部链接等多元化的信息。
比如你在问了 Bard 问题之后,你现在可以将这些问题答案一键导出到 Gmail、谷歌文档、表格之中,Bard 还可以动帮你给图片、文档等做加标注。未来也将支持更多谷歌应用程序和 Bard 的集成体验,包括 Drive、地图等。
对于软件工程师们来说,Bard 提供了改进后的代码引用功能,在提供来源的同时还能解释代码片段。此外,现在开发者们也可以把 Bard 生成的代码进行导出,不仅能发送到谷歌的 Colab 平台,还能和另一个基于浏览器的 IDE Replit 一起使用(目前支持首先 Python)。
目前 Bard 能支持 20 多种编程语言,基本涵盖了工程师们所有编程开发需要,并为开发者们提供了新的深色界面。开发者们只需输入 prompt 就能得到完整的代码片段。
此外,跟 ChatGPT 类似,Bard 现在也可以跟其他外部工具进行集成使用。在 IO 上谷歌也展示了一个 Bard 跟 Adobe Firefly 合作生成图片的例子,比如你想给孩子办一个生日派对需要做一个请柬照片,所要做的就是给 Bard 说 ” 制作一张在儿童派对上独角兽和蛋糕的图像 “,接着在 Adobe 的支持下它会在几秒钟内生成四张图像。这不就是 Midjourney 复杂操作方法的替代吗?除了 Adobe 之外,Bard 目前还在推进跟更多外部工具的集成使用,包括 Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academy 等。
尤其重要的是,现在人人都可以用上 Bard 了。谷歌此次取消了等候队列,Bard 将面向 180 多个国家和地区的用户全面开放。此外在英语之外,还增添了日语和韩语两种语言,未来将逐步支持 40 种语言的交互。
回击微软 Copilot,谷歌工作套件迎来 “Duet AI”
今年 3 月,微软宣布推出 Copilot 之后,在生产力工具领域掀起了一场革命。谷歌当时马不停蹄地也为其 Workspace 应用程序套件宣布了一系列人工智能功能,争取在跟微软的竞争中不掉队。当时,这些人工智能功能还比较零散,并没有一个类似于 Copilot 这样系统性的工具。
但在今天的 IO 上,谷歌终于给出了它的对标方案—— Duet AI。
跟微软 Copolit 类似,Duet AI 将被全面集成至谷歌旗下的 Work Space,包括谷歌文档、表格、幻灯片、会议、GmailMeet 的自动会议摘要等等。同时还推出了一项名为 Sidekick 的新功能,能够跨不同的谷歌应用程序进行阅读、总结和回答文档中的问题。
比如在文档之中,直接输入文章主题就能完整的生成一篇文章。
在谷歌表格中,仅需输入一句话 ” 遛狗业务客户和宠物统计 ” 就能自动生成完整的表格,包含狗、地址、电子邮件、日期、时间、持续时间和费用等,还可以通过自然语言命令来对表格进行编辑。
在演示文稿中根据你的在侧边栏输入的要求自动生成 PPT 和插图,并且按时间要求帮演示者总结每一页的演讲稿的讲话内容等等。虽然这些功能我们在微软此前办公套件中都多多少少看到过,但对于谷歌来说,此次 Duet AI 的推出,让我们看到了谷歌在面对 Copilot 等竞争对手时的应对能力。
而除了应用于办公套件中之外, Duet AI 也将被应用于谷歌云业务之中。借助 Duet AI,谷歌云推出了一系列开发者工具,包括可以提供实时代码帮助,指出错误的同时推荐生成的代码块,以及回答代码和谷歌云相关的问题等。该功能支持 Go、Java、Javascript、Python 和 SQL 等多种语言。谷歌表示,目前在谷歌云上进行 AI 的训练速度提高了 80%,成本降低了 50%。
但目前,谷歌办公领域的 Duet AI 功能还没有对公众进行开放,如果想试用这些新工具,需要先注册 ” 工作场景实验室(Workspace Labs)” 并加入等候名单。
生成式 AI 上线谷歌搜索,数十亿用户即将开启搜索新旅程
面对 Bing 的步步紧逼,作为谷歌的立身之本,搜索业务此次也迎来了重大的 AI 更新。
跟 Bing 类似,在用户搜索问题之后,搜索栏的下方会首先出现由 AI 提供的更直接的答案,以及与这个问题相关的图片、链接、视频等。根据第一次提问返回的信息,你还可以进一步进行交互查询更多的信息,知道你得到最需要的答案。
而当你打算通过谷歌搜索并购买一款产品时,AI 不仅能够为你返回你需要的产品链接还能够为你想购买的产品提供摘要,包括提醒你购买时需要注意的事项、产品的特点、最新的评论等等。
这种新的基于搜索的 AI 购物体验建立在谷歌的 Shopping Graph 之上的,该 Shopping Graph 拥有超过 350 亿个产品列表,是目前世界上最全面的、且动态更新的产品、卖家、品牌、评论和库存数据集。但谷歌同时也强调,广告与自然搜索结果将被区分开来,不会影响用户的使用体验。
虽然 AI 功能登陆谷歌搜索令人振奋,但在全球数十亿用户面前,谷歌的推进步伐仍然相对谨慎。跟 Duet AI 的工作场景实验室(Workspace Labs)” 类似,为了测试全新的搜索功能,谷歌也设立了一个新的 ” 搜索实验室(Search Labs)”,用户如果想要访问这新的搜索功能,必须选择一个名为 Search Generative Experience(简称 SGE)的功能。
此外,谷歌也强调并非所有搜索都会引发 AI 答案,只有当 Google 的算法认为它比标准结果更有用时 AI 才会出现,而有关健康、财务等敏感主题的信息则不会出现。
一些全新的硬件亮相,首款可折叠的 Pixel 手机问世
除了一系列 AI 更新之外,一些谷歌硬件粉也非常关注谷歌今年的产品更新,此次谷歌也诚意满满,拿出了首款折叠手机、新的平板电脑和更亲民的 Pixel 手机
Google 的首款折叠屏产品亮相,售价 1799 美元起
而今年的硬件产品中,关注度最高的当属 Google 的首款折叠屏产品 Pixel Fold。该手机的造型非常类似 OPPO 发布的 Find N 系列,也采用 ” 翻开即横屏 ” 的操作理念,让用户在使用折叠屏内屏时无需在旋转 90 度才可以达到全屏显示的效果。
该机器的内屏使用了一块 7.6 英寸 120Hz OLED 柔性显示屏,屏幕比例为 5:6,分辨率为 2208*1840,官方宣称峰值亮度可达到 1450nit。而外屏则为 5.8 英寸 120Hz OLED 外屏,屏幕比例为 9:17.4,分辨率 2092*1080,峰值亮度可达到 1550nit。
Pixel Fold,硅星人现场拍摄
性能方面,Google Pixel Fold 搭载了与 Pixel 7 系列相同的自研 Tensor G2 处理器 + Titan M2 协处理器,配合 12GB LPDDR5 内存 + 256/512GB UFS 3.1 存储组成 Google 的 ” 性能铁三角 “。Pixel Fold 拥有 4821 毫安时电池,支持 30W 有线快充,但不出意外的话 Pixel Fold 应该算是今年售价超 1 万元的旗舰产品中充电速度最慢的产品了。
在发布会之前,Google 宣称 Pixel Fold 会拥有 “Pixel 级别的影像系统 “,与爆料不同的是,Google Pixel Fold 的后置镜头模组选择了 48MP 广角(支持 OIS)+10.8MP 超广角 +10.8MP 5 倍长焦的三摄组合。
Pixel Fold,硅星人现场拍摄
该机拥有黑白两个配色,12GB+256GB 的版本售价 1799 美元(约 12450 元人民币),12GB+512GB 版本售价 1919 美元(约 13280 元人民币),现在预定购买可免费获赠一支 Google 在去年发售的 Pixel Watch 手表。
平板电脑终于回归,但不跟 iPad 抢市场
除去 Pixel Fold 之外,Google 还在这届 I/O 上正式发布了另一款大屏产品:Google Pixel Tablet。这也是 Google 沉寂多年后重返平板电脑市场的第一款产品,它的定位与目前市面上的平板电脑不同,更像是一个家庭智能终端设备。
Pixel Tablet 图源:Google
Pixel Tablet 并不是一款刚公布的产品,它的首次亮相是在一年之前。Google 认为平板电脑更多的使用场景是在家中而非室外,它是智能家居中枢,也是用于流媒体播放及视频通话的多媒体终端。为此,Google 为 Pixel Tablet 配备了一个磁力吸附的充电底座,让它可以长时间处于有电的状态。
Pixel Tablet 依旧使用 Google 自研 Tensor G2 处理器,搭配 8GB 运行内存,128GB/256GB 存储,售价 499 美元起(约 3450 元人民币),不含底座。
入门级 Pixel 7a 发布,新增红蓝 CP 双色
廉价版的 Google Pixel a 系列一直都会在正代 Pixel 发布的次年推出,Google Pixel 7a 也不例外。该手机的外观与 Google Pixel 7 采用了相同的设计语言,新增了更加活泼的珊瑚色和海洋蓝两个配色,更加适合有活力的年轻用户。
硅星人现场拍摄
相比去年发布的 Pixel 6a,7a 的升级主要体现在处理器与摄像头方面。Pixel 7a 使用了与 Pixel 7 系列相同的自研 Tensor G2 芯片,并且将镜头模组升级为 64MP 广角 +13MP 超广角的组合,成像质量将会有非常明显的进步。
与 Google Pixel 7 系列不同的是,Pixel 7a 仅有 8GB+128GB 存储这一个容量可选,但却分为支持 Sub 6 5G 与 mmWave 5G(毫米波)两个版本,其中 Sub 6 5G 版本的售价为 499 美元(约人民币 3450 元人民币),而 mmWave 5G 版本的售价稍贵,为 549 美元(约 3800 元人民币)。
总体来看,今天谷歌 IO 是一场诚意满满的大会,在整个开幕演讲中,谷歌多次提到” 大胆而负责任(bold and responsible)” 这个词,试图证明谷歌可以在对社会和业务负责任的同时仍然可以快速行动。
在此前的访谈中,皮柴曾表示谷歌并不担心推出语言模型的步伐较对手慢,把事情做对比抢快更加重要。而现在,谷歌似乎已经做好了一切准备。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!