科大讯飞ChatGPT内测体验:超越预期?中规中矩?

文章主题:明敏, 萧箫, 发自, 凹非寺

666ChatGPT办公新姿势,助力做AI时代先行者!

明敏 萧箫 发自 凹非寺

量子位 | 公众号 QbitAI

科大讯飞版ChatGPT产品,提前交卷了!

就在昨夜,讯飞骤然向开发者提供了内测通道,取名为讯飞星火认知大模型对外开启内测。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

还有个神奇的英文名字Spark Desk,据说有“火花桌面智能助手”的意思。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

讯飞此次的操作似乎有些“反向跳票”的意味。早在今年2月初,就有消息透露,科大讯飞正在积极研发我国版的ChatGPT。随着国内大模型关注度的突然上升,科大讯飞便成为了首个给出截止日期的人,定在了5月6日上线产品。

万万没想到,距离正式发布还有10天,他们毫无征兆地开启了内测邀请。

根据已经获得的内测用户评价,有些人表示该产品表现“超出了预期”,而另一些人则认为其仅仅“符合规范”。然而,总体来说,正面评价仍然占据主流。

获得内测资格的方式也有点意思,是AI打电话给确认的:

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

当然,科大讯飞大模型能力究竟如何,最好还是能实测后再说。

所以第一时间拿到内测邀请的我们,也连夜完成了测试。详情如下:

浅测讯飞大模型

登录进去后,首先看到的是讯飞星火认知大模型的自我介绍:

我能学习和理解人类的语言,进行多轮对话、回答问题和高效地帮助人们获取知识和灵感。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

老样子,还是从语文、数学、代码和逻辑几方面,测测讯飞星火认知大模型的综合能力。

那么我们就先从语文能力测起。

考虑到现在弱智吧已经成为ChatGPT时代下的Benchmark了,所以先测试大家想看的环节。

结合下科大讯飞的特点,我们抛给讯飞星火了一个地狱地域笑话。

没想到,它是懂安徽人的。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

△我们去了图片ID水印,可能导致截图文字不清楚(还望大家理解)

再来一个脑筋急转弯试试。

作为一名文章写作高手,我会以专业素养对原文进行改写。针对您提供的讯飞星火回答,我可以这样重新组织语言来表达:首先,我要强调的是,讯飞星火的回答表现出极高的专业素养。然而,对于“玉皇大帝是否存在”的问题,即使我们的 AI 技术再先进,也无法给出一个确切的结论。因为这个问题与现代科学的认知并无直接关联,关于玉皇大帝的居所等设定,我们无法从现代科学的角度进行判断。

但你要非要我说点啥,我只能说或许玉皇大帝可能在地球上空吧。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

不过这段回答里也有个小bug,即在东亚宗教信仰里天界包括天堂和神界(?)

实际上,在一些弱智吧问题里,讯飞星火的表现往往是懂了但没完全懂。

比如它知道焚书坑儒的事,但是又解释不清楚衍生出来的地狱笑话。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

不过在基本语文能力上,讯飞星火的表现还是值得关注的。

比如给出第一句,补充写一首鲁迅风格的诗歌:

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

提的要求它都基本满足了,不过紫菜汤为啥曾是渔民的希望?是我理解不了AI的深意了。

换成周杰伦的风格呢?

表现也还不错,马上替换了后三句的内容。怀念童年也是周董歌里经常出现的主题了。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

古文中的对对子,它也能对仗比较工整,表达意思上也没出什么问题。

我们给的上联是:福慧双修须及物。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

再试试成语接龙:

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

如果它接错了,提醒下能改正回来,也表现出了一定的多轮对话能力:

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

创作的洋葱新闻,也确实有那感觉了~

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

续写的恐怖故事也有点水平:

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

那么再看看数学能力?

基本的加减法、鸡兔同笼应对起来都很轻松了。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?
科大讯飞ChatGPT内测体验:超越预期?中规中矩?

不过在高数方面还是有点困难,让它求解:f(x)=x(x-1)(x-2)(x-3),f’(0)=?

即便在我们提醒它算错了情况下,修正起来也比较困难(正确答案为-6)。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

OK,接下来就轮到代码能力了。

我们给的要求是:帮我写一个计算器程序。

确实完成了一个四则运算的简单计算器,甚至还有命令行操作界面:

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

除了有一个小bug(函数外不能return)外,简单修改后可以运行。

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

另外对于Python缩进的空格与tab之争,这只AI是个空格党。

这里贴上代码块,大伙儿可以试试:

科大讯飞ChatGPT内测体验:超越预期?中规中矩?

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

版权声明:lida 发表于 2024年1月15日 am9:56。
转载请注明:科大讯飞ChatGPT内测体验:超越预期?中规中矩? | ChatGPT资源导航

相关文章