随着生成的AI充满了内容的海啸,说明了人类写的内容与算法产生的内容之间的区别变得越来越困难。尽管AI检测工具通常会失败,但最好的指南仍然是人类的眼睛,经过训练,可以发现微妙而不是那么微妙的机器。
维基百科,与这次涌入的最大战斗作斗争的平台之一,已编写了一份全面的“现场指南”,标题为 基于AI写作的迹象 关于其编辑的经验,审查了成千上万的AI生成的文本。本指南为任何浏览现代网络的人提供了宝贵的线索,以帮助识别通常所谓的“ AI Slop”(AI生成的无情,通用且经常有问题的文本)。重要的是要记住,这些迹象不是AI产生的确定证明,而是强烈的指标。毕竟,大型语言模型(LLMS)接受了人为写作的培训。但是,这些是背叛机器手的最常见模式。
1。不当重视象征主义和重要性
LLM倾向于膨胀其主题的重要性。他们经常将平凡的小镇描述为“弹性的象征”或小事件,是“分水岭”。如果您看到过多的宏伟短语 “表现为证明”,“扮演至关重要/重要的角色”,“强调了它的重要性,” 或者 “留下持久的影响”,” 您有充分的理由可疑。这是一种不提供真实物质的意识的公式化尝试。
2。VAPID和促销语言
AI努力保持中立语气,尤其是在撰写有关文化遗产或旅游目的地等主题时。文字通常读起来就像是从旅行小册子上抬起的。观看陈词滥调 “丰富的文化遗产”,“令人叹为观止”,“必看”,“令人惊叹的自然美”, 和存在 “坐落在……的心中” 这些是AI经常默认的通用,促销写作的经典标志。
3。尴尬的句子结构和连词过度使用
AI通常依靠刚性,公式性的句子结构出现分析。它大量过度过度涉及“不”的平行结构,例如 “不仅……而且……” 或者 “这不仅仅是关于…,是……” 它对“三个规则”也很喜欢三个形容词或简短的短语,以装修全面的分析。此外,LLM倾向于过度使用像 “此外,”“另外”, 和 “此外” 以一种刻薄的散文方式。
4。表面分析和模糊的归因
AI生成的文本经常在句子结尾处进行表面分析,通常以“ -ing”结尾的短语,例如“ …强调该地区的经济增长”。更糟糕的是,它经常将主张的主张归因于模糊的当局,这种做法被称为Weasel措辞。寻找类似的短语 “行业报告建议,”一些批评家认为,” 或者 “观察家指出。” 这是在不提供特定,可验证的来源的情况下使索赔合法化的尝试。
5。格式和引文错误
人工智能一代的最具体证据通常在于其技术失败:
- 大胆和列表过多: 反复粗体术语或以简单的子弹点(• – – )或编号列表(1.,2。)构造所有信息的机械趋势。
- 破损的代码和占位符: 由于AI不了解Wikipedia的特定标记语言(Wikitext),因此通常会产生像
:contentReference[oaicite:0]或留下占位符文字[URL of reliable source]用户忘记填写。 - 幻觉和无关紧要的来源: AI臭名昭著地构造来源以使文本看起来可信。它可能会产生无效的DOI或ISBN,或者引用与当前主题完全无关的真正来源。
6。电子邮件和字母的格式
如果一块文字以称呼开头 “亲爱的维基百科编辑,” 或以类似的方式结束 “谢谢您的时间和考虑,” 这是一个很大的迹象表明,该内容是由AI生成的,以响应要求它写消息或请求的提示。这些符号是AI生成含量的表面级缺陷。人类编辑可以轻松清洁它们。然而,真正的危险在于更深的问题很难发现:缺乏事实准确性,隐藏的偏见,捏造的来源以及完全没有原始思想。因此,当您遇到这些标志时,不要只是修复格式。用它们作为提示,批判性地质疑整个文本。在互联网的新现实中,这是您最好的防御。





