上周闹出「用作者的小说训练 AI」的番茄,有了新动作。
因为作者们铺天盖地的抵制和反对,番茄小说平台上线了合同条款解除功能,针对之前发出的「AI 训练补充协议」,支持解除操作。
给不了解情况的群众们快速回顾一下:番茄是一个网文平台,早在 2023 年,就有作者在准备和平台签约时,发现合同中出现涉及 AI 训练的条款。而上周它又针对 AI 训练,发布了补充协议,条款如下:
换句话说,番茄的作者不仅要面对自己的小说被拿去训练 AI 模型的可能,还一无所获,最多获得一个新功能内测资格。
即便是提供了解约选项,也很麻烦:有作者发现,解约的操作入口很深。
以及其他条款仍有隐患。
可以看到,番茄并没有明说自己不会再继续训练 AI,也没有放弃寻求作者们的同意,甚至是引导作者,让渡自己的权益。
无独有偶,Perplexity 前阵子也在遭受版权争议,只不过 battle 的对象是老牌媒体集团康泰纳什,显然更加硬气。
在自家内容反复被强取的情况下,康泰纳仕发出了警告信,让 Perplexity 速速停手。
但 Perplexity 只是抓取,它犯的错,在于强行翻过媒体设置的付费墙和反爬虫程序,强行取用。
不过,它本身并不训练模型,同时也在返送时,力所能及地做了引用来源标注,只是受限于模型能力,仍然有幻觉,导致出错。
番茄最让作者们感到威胁的,恰恰是抓取内容用来训练模型,而且目的完全不清楚。
训练模型?训练来做什么呢?新技术?新技术又是想完成什么目的?
不会是直接取代作者吧?
AI 的身影,一直都在
实际上,早在一年多以前,就有网友用 chatGPT 生成小说,然后放到番茄上。因为是出于测试的意图,所以主题非常离谱……
作者说自己花了很多时间调试和修改,未必比自己写省事儿,但是效率显然更高。
另外还有用不同 AI 出梗,选好之后继续写,然后直接申请签约,番茄也给通过了。
一年多前,这些没有引起太大的讨论,大部分是惊讶,另外就是吐槽番茄毫无门槛,小学生作文都能过。
但这就是番茄的性质:量大、管饱。
跟起点、晋江等老牌平台不一样,番茄成立不过 5 年。尽管如此,它成长得很快,2020 年 4 月,番茄的 DAU 首次突破 1000 万;同年 9 月,直接突破 2800 万,一跃成为用户最多的免费小说阅读平台。
没错,免费。
番茄盈利的方式是从广告商手里挣钱,用户本身不仅不用花钱,而且还会因为时长获得积分金币、返现奖励。
这也是最经典的「用户没有花钱买商品,因为用户就是被卖掉的商品」,考虑到番茄出身字节跳动,这和抖音一脉相承的做法,不足为奇。
打法虽然老套,可挣钱也是真的挣钱。2023 年晚点报道,番茄小说的收入已经超过 100 亿。
图片来自:上观数据
在番茄一路高歌猛进的过程中,一直有 AI 的身影。
首先是引流。番茄在 2023 年,借助抖音的算法和流量,吸引了大量用户。
但抖音是个短视频平台不是吗?
没关系,在网文里挑一点段落,补充一点故事背景,然后直接交给 AI 配音、配画面,稍微组合剪辑一下,一条推书短视频就好了。
这些视频本身很短,做得也不精致,目标只是为了引流,所以制作成本越少越好,量也是越多越好 ——AI 配音、配图,自然是最好的工具。
如果说这不能算是番茄所为,只是引流方式,那曾经试水的 AI 写作功能,总是跑不掉的。
今年 3 月,番茄曾经测试过 AI 续写功能,还有番茄作家助手的 AI 智能客服。
在当时,这些都没有太多水花,因为作者们普遍反馈觉得不好用。
尽管如此,5 月时,番茄还是上线了完整的 AI 工具箱,从大纲,到扩写、改写、起名,覆盖了大部分环节。
所以,即便在前几天补充条款的风波出现时,番茄曾经澄清过,表示不会用 AI 直接成文,或是做这一类的产品,而是会尊重作者的创作与心血。
但是以上半年发布 AI 类功能的速度来看,很难有说服力。
可拆、能用,网文天然就好复制
番茄的网文是最「网文」的,更甚于其它平台。传统小说讲灵感、文笔,这里只讲一个:稳定更新。
网文本身是规则非常明确的体裁,甚至可以做到模块化。
比如修仙小说的公式,「升级 – 打怪 – 压制 – 升级」,这就已经定好了大框架,往里面放一个背景(仙境),再放一个人物(废材流,落魄仙门的弟子),这就差不多可以动手了。
「凡人流」的开创作品《凡人修仙传》
每一次升级、打怪,都可以安排一个新的人物出场,帮助主人公成长进入下一阶段。至于情节,也有很多现成素材挑选。
从作者的角度看,有套路就好模仿,学一学就会了。但反过来,有套路就意味着可拆解。
恰好,基于RAG的 LLM-AI,最擅长做拆解和套用。
在模型预处理阶段,处理文本材料的时候,首先就是清洗和分词,把文本分割成段落、短语、单词,或是更小的单位,再根据词频信息搭建词汇表。
随后则是到特征工程发挥作用了,这一步包括选择、提取、构建、转换数据集中的特征,让模型更好地学习和预测。
可以说,处理数据的过程,就是机器「学习写网文」的过程,它对文本的分解可以无限细致,对规则套路的提炼也可以无限细致。
如果说「100 个爽点总结」「62 个常见套路」「女频文的十种写法」「男频爆款五大步」和「网文套路精髓」这样的教程,是属于人类作者们的训练;机器可以直接用已有材料,自己总结,自己训练。
然而这里面的问题是,那些已有的套路、素材,从哪儿来?当然是兢兢业业写网文的现役作者们。
路径闭环了:网文明确可寻的规则,使得它的制作过程,可以最大程度的标准化、商品化。
作者们不是在写作,而是在生产。只要是生产,能够标准化,就可以让机器模仿和学习。
比拼流水线作业,机器当然比人快。
写网文是一份工作
对于不了解网文写作的人而言,可能会以为写网文约等于卖书。写得好,卖得好,才能有更好的收入。
如果 AI 能够提升作者水平,提高作品质量,获得更好的收入,为什么要抵制它?
实际并非如此,写网文,也是在打工。
不同的网文平台,在作者群体里有不同的「人设」,这一点从攻略里经常能看出来。
比如晋江、起点、阅文,乃至长佩,攻略和教程侧重点在于怎么申签过签;而番茄,在于怎么赚钱。
所有的网文平台都有自己的签约福利制度,只是力度不一样,条款不一样,在番茄挣钱是最容易的。。老牌的网文平台签约,不仅有基础字数要求,有些还有附完整的大纲、细纲,再由编辑人工评定。
番茄的特点是「签书不签人」,自由度高,签约门槛又低番茄则是出了名的好过,直发的审核直接就是机器人,24小时在线,几个小时就审完过稿。
一旦签约,根据写书的进度和体量,可以享受相应的签约福利:首先是不同层级的全勤奖,然后是站内的收益分成(通常是广告),外部渠道的收益分成,最后是累计字数、版权收益等。
只要踏实肯写,哪怕从来没写过书,把教程翻一翻,套路用一用,总是可以上手的。
而番茄巨大的用户池,也保证了受众的多样性:不是非要写得好才有人看,连上面用 GP T生成的小说,也有百来个订阅。用户池子大了,什么样的口味都有。
因此,作者们来番茄,就是来把写作当工作,挣一份工资,不是冲着实现文学梦想来的。
也是这个原因,AI 给网文作者们造成了巨大的焦虑。顶级作者只有一小拨,大部分是用有限的天赋和能力,利用相应的资源,加上足够的勤劳,挣一份稿费的普通作者。
有人说,网文反正都是套路的复制粘贴,机器写也是看,人写也是看,只要能看,生产者不重要。
套路只是一个衍生于网文生态的词语,在传统小说写作里,它的近义词是「故事原型」;在剧本写作里,它的近义词叫「剧作结构」。它们都在指向「规律性」的东西,并通过明确其中的规律,达到可以复制、再创的程度。
你甚至可以说,早在几个世纪前,莎士比亚就已经把故事套路写尽了,后来的人,不过是旧饭新炒。
然而不是所有的旧饭新炒,都能让人吃得下。故事写作仍然是一个需要下力气、花功夫的事情——即便有了 AI,也需要人工调试。
更重要的是,没有谁的工作成果,天然就应该被看扁看低。