|
◎本报记者 刘 霞 人工智能(AI)正在重塑诸多行业,新闻业亦在其中。凭借快速、高效生成内容的本领,AI已成为全球新闻机构的重要工具。然而,当越来越多的新闻、网络帖文和社交媒体文本交由AI代笔时,我们的语言会变成什么样? 一个令人忧虑的趋势正浮出水面:AI可能使新闻语言变得更加重复和可预测。这不仅会侵蚀语言的创造力,还可能恶化公共语言生态,甚至动摇人们用以理解、描述和讨论现实的那份丰富与微妙。 偏爱“常见项”让语言渐趋“模式化” AI影响新闻语言的首要途径,便是模板与算法的泛滥。 AI工具日益强大,能分析海量数据、预测趋势,还能为特定受众量身定制内容。这听起来高效而迷人,但背后却暗流涌动,潜藏隐忧。 驱动这些工具的大语言模型,其工作原理往往是预测下一个最可能出现的“词元”或词语。这固然让它们能生成流畅、可信的文本,却也使其天然地偏爱统计上的“常见项”,即那些司空见惯的论点与表述方式。 正因如此,许多新闻机构已在体育、金融、天气、选举等报道领域,用AI工具沿着预设的模板和结构自动生成文章。这种现象非昙花一现,其规模在2026年正急剧扩大。美联社的AI战略也明确表示,正在探索用AI简化新闻的采写、制作与分发流程。其新闻编辑室的AI应用已涵盖自动化公共安全事件报道、天气预警翻译、视频转录摘要、选题邮件排序,乃至会议记录的关键词提醒。 不过,此举虽能为媒体节省时间和资源,在个性化和定向传播上有利,但代价是,AI更可能产出遵循熟悉模式和老套公式的内容。这最终将导致不同媒体之间语言和风格的同质化,让新闻语言变得空前重复、易被预测。 自产自用让语言创新能力凋敝 更令人警惕的是,这种同质化的风险还在加剧。研究人员提醒道,当AI系统开始用其他AI生成的文本进行训练时,一场名为“模型崩溃”的连锁反应便会开始。 “模型崩溃”的概念描述的就是这样一种恶性循环:生成式AI在迭代训练中,若不断以先前模型生成的合成文本为“食粮”,其输出质量便会逐代下降。这不单是一个模型内部的错误,而是代际之间性能的持续衰退。简言之,AI“吃”了自己产出的文本,最终导致千篇一律。 可以想见,当AI编写的文字充斥公共空间,未来的模型将被迫依赖这些单调的语料进行学习。训练生态的窄化,必将把输出文本推向更为雷同的深渊。 长此以往,首当其冲的便是语言创新能力的凋敝。 从历史的长河看,新闻界一直是公共语言演进而非固化的重要场所。它是众多新词、新短语、描述现实新范式初次流传的广阔舞台。有关新闻语言与新词的研究也清晰表明,媒体是新词汇创造与传播的核心平台,尤其当社会需要向大众阐释新兴事件、技术与社会变革时。然而,一旦大量新闻写作被“委派”给生成式AI,媒体这一珍贵的社会角色便无可挽回地被削弱。 其后果便是不常用或专业词汇的消退,独特句式结构的减少,以及反语、歧义、观点递嬗等语言使用细微差别的消亡。 语言的生命力,恰恰常源于那些古怪的迂回表达、出人意料的词汇运用,或是为新生事物命名的本土化创意。倘若语言系统总是优先选择统计上最安全的选项,新兴表达便失去了孕育的土壤以及流传与扎根的空间。 区分能力衰弱消解公共思辨土壤 更要紧的问题,则是语言微妙区分能力的衰弱。当语言变得模糊、可预测、不断重复时,它也在无形中削弱人们用来描述问题、阐明观点、投身公共辩论的精密工具。最终伤害的,是人们思考与对话的深度。 此外,AI生成内容还普遍缺乏细腻的质感与鲜活的语境。尽管AI在快速处理海量信息上无人能及,但它往往难以捕捉人类记者心领神会的那些微妙之处。这可能导致其叙事失之简化或产生误导,无法复现现实的复杂肌理。 从更宏阔的视角看,问题绝不仅限于AI模型自身的退化,更关乎整个公共语言生态的变迁。如果互联网上日渐充斥着合成文本,那么读者、记者乃至各类机构,都将浸入一个多样性愈发贫瘠的语言环境。 尽管如此,人们也不必全然悲观。 一些研究表明,当合成数据与真实数据审慎混合,而非全然取代后者时,“模型崩溃”的表现会有所缓和,错误亦能得到控制。换言之,问题并非出在偶尔借助AI,或是明智地融合人工与AI生成的数据。真正的深渊,始于人类写作被大规模取代,且取代后的作品被当作活生生的语言奉为圭臬。 诚然,随着AI深入记者工作与生活的日常,新闻业正变得空前高效。但倘若媒体放弃了采写、编译、命名和讲授新鲜语言的天职——哪怕只是其中一部分,那么受影响的远不止是记者的工作。悄然流逝的,还有公共语言得以繁衍、更新和延展的最重要空间。 (
|
