科大讯飞版ChatGPT内测火爆，超预期还是中规中矩？未来智能助手何去何从？🔥

文心一言 3年前 (2023) lida

78 0 0

文章主题：量子位, 科大讯飞, ChatGPT

666ChatGPT办公新姿势，助力做AI时代先行者！

明敏萧箫发自凹非寺

量子位 | 公众号 QbitAI

科大讯飞版ChatGPT产品，提前交卷了！

就在昨夜，讯飞骤然向开发者提供了内测通道，取名为讯飞星火认知大模型对外开启内测。

还有个神奇的英文名字Spark Desk，据说有“火花桌面智能助手”的意思。

🚀【科大讯飞引领潮流】智能语音巨头的最新动态，无疑是近期科技领域的焦点🔥。早在年初的2月，消息就已经悄悄流传——科大讯飞正全力研发本土版ChatGPT，意图抢占人工智能先机🌈。随着国内对大模型的关注度急剧攀升，这家行业领导者迅速给出了时间表——5月6日，他们将正式推出这款创新产品，引领市场风潮。\n无需过多猜测，这样的速度与决心，无疑是对其技术实力和市场洞察的有力证明🔍。ChatGPT的中国版，无疑将在人工智能领域掀起一场革命，让我们共同期待它的精彩表现吧🎉！#科大讯飞 #ChatGPT #智能浪潮

万万没想到，距离正式发布还有10天，他们毫无征兆地开启了内测邀请。

🌟根据首批内部测试用户的反馈，部分体验者对产品的表现给出了”超乎期待”的高度评价，而少数则持较为保守的态度，形容为”常规操作”。不过，总体上积极的反馈占据了主导地位，显示出强大的潜力和市场接受度。SEO优化提示：#产品好评如潮 #超出预期体验 #多数反馈积极

获得内测资格的方式也有点意思，是AI打电话给确认的：

当然，科大讯飞大模型能力究竟如何，最好还是能实测后再说。

所以第一时间拿到内测邀请的我们，也连夜完成了测试。详情如下：

浅测讯飞大模型

登录进去后，首先看到的是讯飞星火认知大模型的自我介绍：

我能学习和理解人类的语言，进行多轮对话、回答问题和高效地帮助人们获取知识和灵感。

老样子，还是从语文、数学、代码和逻辑几方面，测测讯飞星火认知大模型的综合能力。

那么我们就先从语文能力测起。

考虑到现在弱智吧已经成为ChatGPT时代下的Benchmark了，所以先测试大家想看的环节。

结合下科大讯飞的特点，我们抛给讯飞星火了一个地狱地域笑话。

没想到，它是懂安徽人的。

△我们去了图片ID水印，可能导致截图文字不清楚（还望大家理解）

再来一个脑筋急转弯试试。

🌟当然，关于玉皇大帝的存在与否，这确实是个引人深思的问题。虽然作为AI语言模型，我的知识库并不涉足神话传说的验证，但这不妨碍我们探讨其背后的哲学意义。🤔现代科学与古老的信仰虽有分野，但两者并非水火不容。这类超自然现象或许更多地属于人类对宇宙和生命本质的想象与探索。🚀所以，让我们以开放的心态，理性看待这些传统故事，它们也许在无形中启发了我们的思考。😊

但你要非要我说点啥，我只能说或许玉皇大帝可能在地球上空吧。

不过这段回答里也有个小bug，即在东亚宗教信仰里天界包括天堂和神界（？）

实际上，在一些弱智吧问题里，讯飞星火的表现往往是懂了但没完全懂。

比如它知道焚书坑儒的事，但是又解释不清楚衍生出来的地狱笑话。

不过在基本语文能力上，讯飞星火的表现还是值得关注的。

比如给出第一句，补充写一首鲁迅风格的诗歌：

提的要求它都基本满足了，不过紫菜汤为啥曾是渔民的希望？是我理解不了AI的深意了。

换成周杰伦的风格呢？

表现也还不错，马上替换了后三句的内容。怀念童年也是周董歌里经常出现的主题了。

古文中的对对子，它也能对仗比较工整，表达意思上也没出什么问题。

我们给的上联是：福慧双修须及物。

再试试成语接龙：

如果它接错了，提醒下能改正回来，也表现出了一定的多轮对话能力：

创作的洋葱新闻，也确实有那感觉了~

续写的恐怖故事也有点水平：

那么再看看数学能力？

基本的加减法、鸡兔同笼应对起来都很轻松了。

不过在高数方面还是有点困难，让它求解：f(x)=x(x-1)(x-2)(x-3),f’(0)=?

即便在我们提醒它算错了情况下，修正起来也比较困难（正确答案为-6）。

OK，接下来就轮到代码能力了。

我们给的要求是：帮我写一个计算器程序。

确实完成了一个四则运算的简单计算器，甚至还有命令行操作界面：

除了有一个小bug（函数外不能return）外，简单修改后可以运行。

另外对于Python缩进的空格与tab之争，这只AI是个空格党。

这里贴上代码块，大伙儿可以试试：

#coding=utf-8
#量子位注：AI没生成这句，根据不同运行环境可能需要加一下
# 定义函数，实现加法运算
def add(x, y):
return x + y

# 定义函数，实现减法运算
def subtract(x, y):
return x – y

# 定义函数，实现乘法运算
def multiply(x, y):
return x * y

# 定义函数，实现除法运算
def divide(x, y):
if y == 0:
print(“除数不能为零！”)
return
else:
return x / y

# 主程序

print(“欢迎使用计算器！请选择需要进行的操作：”)

print(“1. 加法”)

print(“2. 减法”)

print(“3. 乘法”)

print(“4. 除法”)

choice = input(“请输入操作编号(1/2/3/4)：”)

num1 = float(input(“请输入第一个数字：”))

num2 = float(input(“请输入第二个数字：”))

if choice == 1:

print(num1, “+”, num2, “=”, add(num1, num2))
elif choice == 2:

print(num1, “-“, num2, “=”, subtract(num1, num2))
elif choice == 3:

print(num1, “*”, num2, “=”, multiply(num1, num2))
elif choice == 4:

if num2 == 0:
print(“除数不能为零！”)
# return （量子位注：这里有bug，注释掉就可）
else:
print(num1, “/”, num2, “=”, divide(num1, num2))
else:

print(“非法输入！”)

生成表格能力也是有的，同时可以按照要求修改表格：

分析基本逻辑问题也OK：

而且我们感觉讯飞星火的回答，总是很正经，对于脑洞大开的问题也是淡定的“总分总式”回答。

当然也被绕到过沟里，回答出了“贾母找人搬机器”的瞎话：

以上就是我们对讯飞星火的一个浅浅测试。

能力水平已经看到了，而大模型本身让人好奇的，还有它的技术细节~

提前扒扒它的“模型底细”

毕竟讯飞大模型还没正式发布，所以我们试着先从它自己这里“探探口风”。

看看能不能通过问相关问题，提前摸出一些关于它的资料来。

先是名字由来。讯飞星火认知大模型给出了技术向、公司向和文化向三个方面的回答，有议论文内味了：

再仔细追问一下为什么“星火”和“心宿”有关，好家伙，话题逐渐占星学了起来：

这里我们调戏一下大模型，问问科大讯飞CEO是否喜欢占星学

回到正题。那么，讯飞星火认知大模型的训练数据来源、模型参数量、联网状态如何？

首先是关于模型训练数据的来源。看起来资料还比较丰富，目前也还在不断更新中：

所以，讯飞大模型是否和ChatGPT一样，用了RLHF呢？它自己的回答竟然是没有：

那么接下来，是关于模型参数量的问题，这里讯飞大模型回答得也比较模糊。

而且，给出的模型参数量竟然只有数亿个？（要知道，GPT-2模型参数量都有15亿）

最后，是关于模型能否联网的问题。

看起来，它还不会实时联网，关于网易和暴雪的新闻只能追溯到几年前的消息：

用户也不能通过指令直接让它访问某个网站，查询特定信息，应该是加了某些限制：

不过有意思的是，它还是声称自己需要联网工作，以访问特定信息数据：

据讯飞星火认知大模型介绍，目前它的训练数据还在继续更新。

换而言之，就是还在继续迭代，估计在正式发布前还会更新一版模型。

目前来看，科大讯飞的这个讯飞星火认知大模型，表现已算不错。

而且要知道，讯飞原计划给出的交卷时间是5月6日，现在突然发布内测，相当于不仅没跳票，还“反向跳票”了一波。

🌟科大讯飞的深度技术实力在NLP和认知智能领域无疑是领头羊，他们的技术研发及工程团队的实力不容小觑！🏆每项技术都能落地生根，转化为实实在在的产品和服务，这不仅是技术实力的体现，更是执行力和承诺力的直接证明。💪无论遇到何种挑战，讯飞总能以实际行动解决问题，让人信服。🌟SEO优化提示：#科大讯飞技术积累 #实战能力 #产品落地

现在距离正式发布还有10天，你期待讯飞的大模型迭代出什么新效果？

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！