失望中的惊喜?百度文心一言背后的情绪与技术对比
文章主题:,失望, 演示
🚀对于最近的发布会,我虽无过多期待,却以开放心态全程关注。观看后,内心并无强烈波动,就像平静的湖面,波澜不惊。🤔转至投资平台雪球,百度的股价确实遭遇了大幅下挫,此刻正经历着一波三折的行情。恰巧笔触触及这一节点,股价又跌回谷底,不禁让人扼腕叹息。📊然而,这波动背后的故事与市场动态,或许正是我们深入探讨的焦点。记住,投资有风险,理性分析为上。
微信群、朋友圈乃至微博和即刻,也是负面的声音居多,各种梗图又都出来了。这是市场的整体情绪:很失望。
为什么失望呢?我观察了一下,大概有几方面。
第一,没有新东西。
🎨✨文心一言新体验:ChatGPT式对话与UI设计,独特而不失创新💡🌈🚀在文心大模型的卓越技术支持下,我们惊喜地推出了全新的对话产品——文心一言,它不仅沿袭了ChatGPT的核心交互体验,还以独特的设计理念引领潮流。🎨每一个按键,每一行代码,都透露着对用户友好的深深关怀,旨在提供最流畅、自然的对话互动。👩💻界面设计上,我们摒弃了传统的刻板印象,采用了简洁而富有现代感的布局,让每一次沟通都如同与知心朋友交谈。不像其他产品那样一味模仿,文心一言坚持自我,展现出独特的个性魅力。🌈📝尽管ChatGPT曾是对话界的热门话题,但文心一言以其原创性和人性化,正在为用户带来全新的互动享受。我们坚信,这样的创新不仅能满足当下需求,更能引领未来趋势。🚀欲了解更多关于文心一言的细节与优势,敬请关注我们的官方网站或社交媒体平台,让我们一起探索这个对话新世界的无限可能!🌐✨
但这里面演示的内容,都是旧的,别人已经做过的。
比如多模态,输入图片或者输出声音,本是挺亮眼的,可惜昨天 GPT-4 发布的内容里,也有了多模态。本来微软那篇多模态的论文在小范围已经火了,GPT-4 的发布会上的演示让人有更直接的冲击(可以参考这篇:GPT-4 有哪些进步,以及问了它 6 个关心的话题)。
🌟在发布会上,AI语音技术并未缺席,它已然是内容平台上的常见应用。短片段中那些引人注目的无声提醒——“别忽视那个无手的男人”,背后的声音大多出自AI之手,这是科技快速迭代下的便捷产物。🚀
✨转换瞬间,魅力无限!🚀使用一键视频工具,让你的作品瞬间跃动屏幕,展现不凡风采。但这并非偶然,而是技术实力的体现,许多平台如@aigc.yizhentv.com已熟练掌握并提供这项服务。无需担心版权或联系方式,专注于创作,让每一次转换都成为艺术的升华。🌍SEO优化提示:关键词加入”一键视频”、”技术实力”和”创新平台”,提升搜索引擎可见度。
而作为搜索引擎公司,没有 New Bing 这样的功能介绍,更没有新的与现有业务结合的新产品出现,就难免让人的高预期落空了。
相当于百度总结了一句:他们有的,我们也都有。他们没有的,我们也没有。
第二,没有显著的亮点。
亮点指的是,哪怕是同样的功能,或者同样的服务,是不是能有格外出色的表现?目前看,也没有。
假如说 ChatGPT 只能使用英文,或者说中文特别拉胯,那也就罢了。重要的是,GPT-4 的多语言加强之后,语言之间几乎没有壁垒了。这样百度的中文优势就不存在了,且他们自己都讲过,模型在英文领域还比较缺乏数据。
所以中文没有优势,在回答的水平上就很难比较了。再者,在 demo 里呈现的效果,由于是录制好的,是否能真实给出好的结果,这也是存疑的。这也就来到了第三点。
第三,没有诚意。
🌟发布会亮点聚焦于实际操作演示,这是从乔帮主时代起就沿袭的传统。罗永浩的那句“李姐万岁”至今仍让人记忆犹新。👀百度这次采取全录制方式,背后透露出的无疑是对于可能出现技术问题的担忧,以及对自身实力的不安全感。或是被Google演示中微小失误的阴影所震慑,他们显然在力求完美。🔥
🌟改写内容:虽然难以确证对话中是否只展示了优质答案,一键视频制作的快速便捷确实让信任度遭遇挑战。哪怕短暂的延迟展示出来,也能揭示真相,对不明就里者来说,这无疑像是在用科技幻灯片蒙蔽视听,略显浮夸。🚀原内容:我们提供定制化的服务,价格公道,联系方式在页面底部,如有需要请随时联系我们。🌟改写内容:💡专为需求打造的个性化服务,价格透明,无需找寻,底部触手可及。如有疑问,随时咨询,我们随时待命。💌
整体的时间很短,而且在讲产品不久后,立马就开始聊商业合作了。就像手机发布会刚开一会儿,就说在哪能买到了,而手机的实机还没给大家伙看过。
第四,姿态有些急。
在发布会之前,就听身边很多朋友讲,百度的市场来联系,期待能接入。当然实际上是在队列里,相当于有了很多潜在合作对象撑场子。
这次发布会,也很明显是背着很重的销售 KPI 的(虽然不知道是谁,以及为什么要背这么重),在聊后面的部分,都是 toB 销售的话术,讲技术的抽象概念和商业合作的价值。
听不出一丁点对产品的自豪感,和对真实需求的兴奋表述,这跟 OpenAI 的总裁 Greg Brockman 在 GPT-4 发布会上很兴奋地说它可以画网页、可以帮自己解决某些生活上的问题,形成了鲜明的对比。(再次推荐这个发布会:
www.bilibili.com/video/BV1gv4y177rX)
总的来说,还是没有真正的让大家用上的产品(目前文心一言的 toC 都还没有开放),难免会让人往负面去猜测。就像 ChatGPT 也不是在捧得很高,自称是全球最吊的对话机器人之后才给大家用的,而是开放后,被惊讶到的用户人传人推到如今的热度的。
文心一言还没有开放,不过基于文心大模型的文心一格,这个画图的工具是可以用的。正好 Midjourney 在今晨提供了全新的 v5 版本,这个对比就更加强烈了。
需要说在前面的是,文心一格是在去年 8 月就发布的绘图工具,很可能中间没有任何迭代,用的还是旧的模型。不过它也自称是当时很先进的模型了:
「当前该领域世界最好效果。在语义可控性、图像清晰度、中国文化理解等方面展现出了显著优势。」
这是我用这个模型画的一批图:
我的绘画群的群友分享了移动端的这张图,不太确定是不是最新的文心大模型:
同样的提示词,在最新的 Web 端是这样的,效果略好一些:
那我们看 Midjourney v5 的效果:
说到 Midjourney V5,他们的新版本已经可以消除所谓的「AI 感」了,写实方面有很大的提升。这里有几张示意 ,都是我自己刚画的:
话题扯得有点儿远了。还是想表达,作为用户,我们期待真正落地的、效果好的产品出来。
我不是旗帜鲜明要反对百度,更不是觉得国内做不出大模型。我作为用户和潜在的创业者视角,当然很期待国内有自己的大模型。从更善意的视角出发,也许百度这次是发布会准备失当,也许产品本身是质量过硬的,都说不好。我们也期待最新的产品效果的体现,也期待国内有更好的大模型出现。
祝各位周五愉快。
题图由 Midjourney v5 绘制。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!