“你的文章确实不错,但我们只接受真人创作。”对于内罗毕某间网吧里盯着屏幕的年轻撰稿人来说,这句话比拒稿信更令人窒息。这不仅是否定,更是一种荒谬的存在主义打击。
他明明就坐在那里,手指敲击着甚至有些掉漆的键盘,窗外是肯尼亚首都喧嚣的Matatu(小巴)鸣笛声和尘土飞扬的街道。他刚刚花费了四个小时,查阅资料,斟酌词句,甚至为了让客户满意,特意使用了那些在学校里被老师用红笔圈出来的“高级词汇”。然而,在大洋彼岸的客户眼里,这篇文本太完美了,太工整了,太像那个名为ChatGPT的硅谷造物了。
这是一个关于误解、偏见与隐形劳动的现代寓言。在人工智能席卷全球的浪潮下,我们习惯讨论机器如何通过图灵测试,变得越来越像人。却极少有人注意到故事的另一面:在这个世界的某个角落,一群真实的人类,因为受过某种特定的教育,又或者因为参与了某种特定的劳动,正在被迫证明自己不是机器。
维多利亚时代的余晖与内罗毕的教室
要理解为什么肯尼亚作家的文字会被判定为AI,我们不能只看代码,得先看历史。
在肯尼亚,英语不仅仅是一门语言,它是一张入场券,一把标尺,甚至是一套阶级规训的刑具。从内罗毕的精英私立学校到裂谷省的乡村教室,英语教学遵循着一种近乎古典的严苛传统,但这种传统并非来自当下的欧美互联网,而是直接继承自大英帝国的殖民遗产。
想象一下肯尼亚初中生面对的作文本——他们被教导的英语,是属于莎士比亚、狄更斯以及早期英国传教士的英语。老师们推崇复句,推崇被动语态,推崇那些能够展现“受教育程度”的大词。
在西方现代写作提倡“简洁”、“口语化”、“像说话一样写作”的几十年里,肯尼亚的教育系统像一座时间胶囊,完好地保存了维多利亚时代的修辞美学。学生们被告知,文章必须有严谨的“三段式”结构:引人入胜的开头、逻辑缜密的主体、铿锵有力的结尾。
如果你在文章里写“I went home”(我回家了),你可能只能拿及格分。但如果你写“I proceeded to my abode”(我前往了我的住所),或者使用“In conclusion”(综上所述)、“Furthermore”(此外)、“Consequently”(因此)这样的连接词,你会得到老师的赞赏。
这种对形式感、逻辑连接词和书面语汇的极致追求,造就了一种特殊的“肯尼亚英语写作风格”:它礼貌、克制、结构平衡、甚至有些过于完美。
这听起来是不是很耳熟?这恰恰是早期大型语言模型(LLM)被训练出来的理想语调。当ChatGPT刚问世时,它那种不偏不倚、四平八稳、甚至略带说教气的口吻,与肯尼亚学生在考场上极力模仿的“高分作文”不谋而合。
于是,荒诞的一幕发生了。当一位肯尼亚自由撰稿人,试图用他毕生所学的、最得体的英语为西方客户服务时,他引以为傲的“完美语法”和“丰富词汇”,在AI检测软件的算法里,瞬间变成了“非人类”的铁证。那些在内罗毕教室里被视为优点的特质——连贯性、逻辑性、书面化——在硅谷定义的“人性化写作”标准下,成了机器人的特征。
西方客户渴望的“人味儿”,往往意味着随意的俚语、不经意的语法瑕疵、跳跃的思维。而这些,恰恰是肯尼亚教育体系试图从学生身上抹去的东西。
硅谷大草原上的隐形驯兽师
如果仅仅是教育背景的巧合,这只是一个文化误读的故事。但现实远比这更深层,也更具讽刺意味。肯尼亚人不仅写得像AI,事实是,正是肯尼亚人教会了AI如何写作。
过去几年,肯尼亚成为了全球人工智能产业链中至关重要、却又隐秘的一环。在内罗毕拥挤的办公楼里,成千上万的年轻人受雇于Remotasks、Sama等外包公司,他们的工作是为OpenAI、谷歌、Meta等巨头训练它们的人工智能模型。
这种被称为“数据标注”或“基于人类反馈的强化学习”(RLHF)的工作——听起来很高科技,但工作现场更像是一个现代化的纺织厂。年轻的大学毕业生们坐在电脑前,面对着数以万计的文本片段。他们的任务是阅读AI生成的不同回答,然后进行打分和修改。
哪一个回答更礼貌?哪一个更安全?哪一个逻辑更通顺?
当AI输出一段充满种族歧视或暴力的文字时,是这些肯尼亚工人为它们打上“不安全”的标签。当AI的逻辑混乱时,是他们写下标准的示范答案。这些工人不仅是在筛选数据,他们是在将自己的价值观、语言习惯和思维方式,一点一滴地“喂”给算法。
这就是关键所在。这群数据标注员,恰恰就是刚刚提到的、在“维多利亚式英语教育”中长大的一代人。
当他们被要求判定——什么是“好”的英语回答时,他们会本能地选择那些符合他们教育标准的答案:正式、客观、没有语法错误、使用恰当的连接词。同时,他们会惩罚那些过于口语化、松散或带有攻击性的表达。
数以亿计的参数在运转,每一次点击都是一次微小的塑造。日复一日,硅谷的超级大脑学会了内罗毕年轻人的说话方式。ChatGPT那著名的“礼貌但略显疏离”的语气,那标准的“总分总”结构,那永远不会出错的语法,其实是无数肯尼亚隐形劳工集体创作的成果。
所以,当西方用户感叹AI写出的文章太“平淡”、“太像公文”时,他们实际上是在阅读一种被剥离了肉身的肯尼亚精英英语。
这种因果关系的倒置令人咋舌。不是肯尼亚作家模仿了AI,而是AI窃取并内化了肯尼亚人的语言风格,然后回过头来,剥夺了肯尼亚作家的饭碗。
算法偏见:一场关于“人味”的定义权争夺
现在,让我们把目光投向那些判定生死的判官——AI检测器。
Turnitin、GPTZero等工具声称能分辨人类与机器。它们的工作原理主要基于两个指标:“困惑度”(Perplexity)和“突发性”(Burstiness)。简单来说,人类的写作通常比较混乱,充满了不可预测的词汇选择(高困惑度)和长短句交错的节奏(高突发性)。而机器生成的文本则倾向于平滑、可预测、节奏单一。
这套标准本身就带有强烈的文化偏见——它预设了“标准人类写作”应该是随性的、甚至是略带混乱的。这是一种典型的以英语为母语、且深受互联网文化影响的西方写作审美。
对于一位母语非英语、但在严格语法训练下成长的肯尼亚(或印度、尼日利亚)作者来说,他们的写作目标恰恰是降低“困惑度”。他们力求清晰、准确、避免歧义。他们努力让句子结构工整,这导致了低“突发性”。
于是,在算法的黑箱里,严谨等于机器,随性才等于人类。
斯坦福大学的一项研究已经证实了这一点:AI检测器将非英语母语者的各种原创写作误判为AI生成的概率极高。这不仅是技术的失误,更是系统性的歧视。它在告诉世界:只有像美国人那样说话,才算是“人”。如果你说话像个受过传统教育的肯尼亚人,那你就是个机器。
对于依靠写作赚取微薄美元的肯尼亚自由职业者来说,这不仅是尊严问题,更是生计问题。为了通过检测,他们被迫去“劣化”自己的写作。他们必须刻意加入语法错误,刻意打断逻辑链条,刻意模仿那种他们从未真正生活过的美式随性。他们必须假装自己没受过那么好的教育,才能被承认是人类。
这是一种何其荒谬的“图灵测试”。为了证明自己是人,你必须表现得不够完美。
结语:机器里的幽灵在用斯瓦希里语叹息
在内罗毕的夜色中,光缆传输着这里的数据,越过大西洋,喂养着加州的服务器。
我们正处在一个奇怪的历史时刻。资本追逐廉价的智力劳动,来到了东非高原。这里的人们贡献了自己的语言规范,训练出了强大的模型,然后,这个模型转身成为了全球通用的标准,并被用来指控它的创造者们是冒牌货。
这不仅仅是关于肯尼亚的故事,这是全球南方(Global South)在人工智能时代命运的缩影。他们的资源被开采,只不过这次开采的不是咖啡豆或铜矿,而是语言、逻辑和认知劳动。他们的文化特征被算法吸收,混合成一种无法辨认的“通用智能”,而他们具体的肉身存在却被抹去。
下次,当你看到一段文字结构严谨、语气谦和、逻辑完美,并被各种检测器标红警告时,请停顿一下。不要急着断定那是冷冰冰的算法。
在那行云流水的从句背后,在那完美得近乎虚假的过渡词之间,可能隐藏着一位内罗毕青年的呼吸。他正坐在屏幕前,试图用他被教导的最好的方式与世界对话,而在他身后,是整个被忽视的、为人工智能奠基的人类世界。
AI或许没有国籍,但它那标准的英语里,确实藏着一种看不见的“肯尼亚口音”。

