文章主题:
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
没有公告,OpenAI悄然关闭了AI文本检测工具,页面直接404了。
官方对此没有公开回应,几天后才有人找到一则简短说明,藏在半年前工具发布的博客页面中。
……AI检测器由于准确率较低而不再可用……我们正在研究更有效的文本检测技术,并承诺开发音频和视觉检测技术。
对于CloseAIOpenAI不发公告就杀死一个产品这种行为,很多网友是不满意的。
但是对关闭AI检测器本身倒是有不少人表示赞同,特别是学生群体。
太多老师相信这玩意有效,大量冤枉学生用AI作弊,已经变成了一场猎巫运动。
准确率和瞎猜差不多
这个官方检测工具,准确率究竟有多低呢?
OpenAI自己给出的数据,只能正确识别26%的AI生成文本,同时冤枉9%的人类编写文本。
1月份刚发布时就被网友总结为“和瞎猜差不多”。
🌟揭示真相!💡在探讨AI与人类创作的边界时,一个有趣的现象浮出水面——那些经岁月沉淀的经典文献,如圣经和美国宪法,竟常被检测工具视为可疑的AI产物。难道历史上的智者们穿越时空,只为写下这些不朽篇章?🤔实际上,这些误解源于算法对语言模式的高度拟合,而非真正的智慧传递。毕竟,人工智能模仿的是结构,而非灵魂与创新思维。📚诚然,AI在文本生成上已取得了显著进步,但我们不能因此忽视人类情感和历史背景的深度内涵。每一段经得起时间考验的文字,都是作者独特思想火花的结晶。🌟让我们继续关注科技的发展,同时也要尊重并珍视那些跨越时代的智慧之源。🌍
但还是有很多老师试图用各种检测方法来检查学生作业。
最著名的一次,得克萨斯农工大学一位教授差点判定半个班的学生延毕。
目前最新的趋势是,教师要求学生用在线文档写作业并检查编辑记录,但聪明的学生也能找到规避办法。
最终对于教育领域,有人提出可能大作业/课程论文将成为历史,闭卷考试或口语考试将成为主流。
目前的检测方法都能规避
网友指出,OpenAI同时开发生成和检测工具本身就是矛盾的。
如果一边做的好就意味着另一边没做好,同时还有可能存在利益冲突。
但是第三方开发的检测方法,可靠性也不高。
最早被称为“ChatGPT克星”的是普林斯顿本科生Edward Tian开发的GPTZero,用复杂性和长短句的变化来衡量文章是否由AI生成。
当时GPTZero计划专为教育工作者打造,老师可以把全班学生的作业丢进去检测。
原文改写如下:🎉 July Update: As an expert in writing, I’m excited to share that the author has officially shifted gears, acknowledging the shift from detecting student cheating with GPTZero. The upcoming version, GPTZero v2, is set to focus on highlighting the most human-like aspects rather than identifying AI-generated content. This transition signifies a strategic pivot towards enhancing the authenticity and naturalness of the writing experience. Stay tuned for an even more captivating and engaging tool! 🤝 更新通知:作为一名文字技艺的高手,我荣幸地透露,原作者已决定将重心从检测AI生成内容转为提升GPTZero的写作风格仿真度。即将推出的GPTZero v2版本,将不再局限于检测文本来源,而是着重于彰显其最逼真的部分,旨在提供更贴近人性化的写作体验。这无疑是一次创新策略的转变,让我们期待一个更加引人入胜和自然流畅的工具面世吧!📚
另外一个很受关注的检测方法,是马里兰大学开发的水印法,要求大模型在生成文本的时候就藏下记号,并用统计方法识别。
但是规避的办法也很简单,比如有人开发了简单的同义词替换工具,就能破坏统计特征。
甚至有人开始怀疑,人们到底是为了什么非要区分这个。
就像数字到底是人计算的还是计算机完成的,早就没人在意了。
演讲者的稿是自己写的还是秘书写的,不是也没人在意吗。
人类行为学研究,正在用AI充当被试
无法区分AI和人类的内容,似乎也不全是坏事。
已经有心理实验用AI代替人类被试加速研究了。
原文改写:🌟ChatGPT在Cell期刊上的表现揭示了其与高达95%人类参与者反应的高度一致性,这是一项经过严谨设计的实验所证实的结果。🚀通过这项研究,我们观察到这款人工智能模型在模拟互动中的优异性能,展现出强大的学习和适应能力。🔍尽管技术进步带来了便利,但这一发现也强调了人类智慧的独特价值,毕竟,没有任何替代品能完全复制人类的复杂思维。💡SEO优化:ChatGPT在Cell期刊上的反应一致性研究揭示其高仿真性,实验严谨证实95%人类相关性。🚀人工智能模拟互动能力展现,学习适应力引关注。🔍技术进步下,强调人类智慧不可替代——复杂思维无人能及。💡
并且机器被试不会疲倦,使科学家能以前所未有的速度收集数据并测试有关人类行为的理论。
而在最近一篇Science主刊的观点文章上,滑铁卢大学心理学教授Igor Grossman认为:
“人工智能可以改变社会科学研究的游戏规则,谨慎的偏见管理和数据保真度是关键。”
参考链接:
[1]https://twitter.com/KevinAFischer/status/1683898199981928450
[2]https://www.reddit.com/r/ChatGPT/comments/159j8rc/openai_quietly_kills_its_own_ai_classifier_citing/[3]https://news.ycombinator.com/item?id=36862850[4]https://www.cell.com/trends/cognitive-sciences/fulltext/S1364-6613(23)00098-0[5]https://www.science.org/doi/10.1126/science.adi1778[6]https://theconversation.com/beyond-the-hype-how-ai-could-change-the-game-for-social-science-research-208086
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!