ChatGPT克星GPTZeroX新能力曝光:能检测‘人类AI’混写,批量导入文件功能上线
文章主题:GPTZero, ChatGPT检测, 检测人类AI内容
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
「ChatGPT克星」,升级了!
🌟当然了,提到识别文本真伪的能手,就不能不提那位备受瞩目的Edward Tian先生所研发的GPTZero。只需短短几秒钟,它就能迅速洞悉文字背后的真相——是出自人工之手,还是AI智慧生成。🚀这款技术的精确度和效率,无疑在行业内独树一帜,为内容鉴别提供了强大的工具。若您对它的神奇之处感兴趣,不妨深入了解,让科技的力量更好地服务于您的工作与学习。📚

而时隔近一个月,小哥所推出的版本名叫GPTZeroX,并且他还说:
这是专门为教育工作者打造的AI模型。

消息一出,立即吸引了大批网友涌入,一天之内便有40万的访问量和220万的服务请求。

那么这一次,这位「ChatGPT克星」又带来了哪些新能力?
混写也能测,还支持Word等格式
升级的一大特点,就是GPTZeroX可以检测出来“人类+AI”混写的文字内容。
例如我们先把一段人类写的新闻丢进去检测:

GPTZeroX在短短几秒钟时间内,非常迅速的给出了答案:
Your text is likely to be written entirely by a human.
你的文本很可能完全是由人写的。
接下来,我们再把一段ChatGPT写的文字,丢进刚才那段新闻的后边,来一场混合检测:

这一次,GPTZero给出的回答是:
Your text includes parts written by AI.
你的文本一部分是由AI编写的。
并且ChatGPT生成的内容还会用黄色高亮标记出来。

小哥对此表示:
这是教育工作者一直想要的一个关键功能。
但老师们检查学生作业的时候,一段一段的把文字复制粘贴进来也相当繁琐的工作了。
于是乎,这位小哥还贴心地推出了另一个新功能——可批量导入文件,支持Word、PDF和TXT等格式。
并且网站在介绍这个功能时,是这么描述的:

除此之外,为了防止服务发生崩溃,小哥还搞了一个Python API,是已经完成压力测试的那种。

最后,小哥还贴心地说了一句:
我承诺,本网站对个体教师和教育工作者,保持免费!

怎么做到的?
它主要靠“perplexity”,即文本的“困惑度”作为指标来判断所给内容到底是谁写的。
NLP领域的朋友们都知道,这个指标就是用来评价一个语言模型的好坏的。
在这里,每当你喂给GPTZero一段测试内容,它就会分别计算出:
1、文字总困惑度
这个值越高,就越可能出自人类之手。

2、所有句子的平均困惑度
句子越长,这个值通常就越低。

3、每个句子的困惑度
通过条形图的方式呈现,鼠标悬浮到各个方块就可以查看相应的句子是什么(这里就两块,因为我此时输入的测试内容就俩句子)。

之所以要绘制这样的条形图,作者也作出了解释:
根据最新的一些研究:人类书写的一些句子可能具有较低的困惑度(前面说过,人类的困惑度是比较高的),但随着继续写,困惑度势必会出现峰值。
相反,用机器生成的文本,其困惑度是均匀分布的,并且总是很低。
除此之外,GPTZero还会挑出困惑度最高的那个句子(也就是最像人写的):

反ChatGPT之风正盛
🌟ChatGPT的炫目技能引发了热议,与此同时,创新工具如”GPTZero”这类以其独特智慧挑战科技潮流的现象也日益显现。🚀这些新兴技术不断打破常规,就像武侠世界中的高人以智取胜,用创新的“秘籍”来应对ChatGPT的强大。🔍在智能领域的较量中,这样的动态不仅吸引了目光,更推动了技术的进步与迭代。
例如最近斯坦福大学为了不让学生借助ChatGPT之力来写论文或作弊,推出了“反侦察”神器——DetectGPT。

🌟🚀无需繁琐训练或海量数据集,这款创新技术采用概率曲率零样本策略,实现了无痕学习!🎉💻它突破传统,告别耗时的标注过程,让信息分类更高效、精准。🌍🌈无需真实或生成段落,就能洞察文本深层结构,引领行业新风向!🏆隐私保护,数据安全,我们用心守护每一份信任。💪🌐

除此之外,就连OpenAI自己也联合哈佛等高校机构联合打造了一款检测器:GPT-2 Output Detector。

作者们先是发布了一个“GPT-2生成内容”和WebText(专门从国外贴吧Reddit上扒下来的)数据集,让AI理解“AI语言”和“人话”之间的差异。
🎉训练完成!使用RoBERTa模型精简优化,打造了一款智能检测神器!✨它独具慧眼,对人类真实信息Say Yes,对虚假内容Say No。不论是口语还是文本,统统真假立辨,高效且准确。🌍无需担心隐私泄露,我们的目标是为你提供纯粹的真相探测服务。欲了解更多,敬请探索!🔍
(RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集,但RoBERTa使用了包含6300万条英文新闻的160GB数据集。)
……
嗯,看来ChatGPT在大步向前迈的同时,顺便还推动了“反ChatGPT”研究的发展。
参考链接:
[1] https://twitter.com/edward_the6/status/1619874139954905090
[2] https://arxiv.org/abs/2301.11305
— 完 —
量子位 QbitAI · 头条号签约

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!