斯坦福大学研究团队通过分析Newswire、PRWeb等平台的大量英文文稿,发现其中显著比例的文本带有AI生成特征。他们采用“分布式LLM量化框架”统计模型,估算了特定时期内AI生成文本的比例。研究涵盖了消费者投诉、企业新闻稿、招聘信息和联合国新闻稿等多种类型,结果显示,企业新闻稿中约24%、消费者投诉约18%、联合国新闻稿约14%、招聘信息约10%的内容显示出AI大模型直接生成或大幅改写的痕迹。研究指出,大型语言模型已广泛渗透到社会各领域的正式书面沟通中,成为重要的辅助工具,尤其在教育程度较低地区和中小型企业中更为普遍。随着技术发展,未来精确识别AI生成内容将更具挑战性。
📊 **AI已广泛应用于英文书面沟通**:斯坦福大学的研究表明,大型语言模型(LLMs)已被普遍用于生成各类正式书面文本。通过分析Newswire、PRWeb等平台的海量英文文稿,研究团队发现,在企业新闻稿、消费者投诉、联合国新闻稿以及招聘信息等多种类型的文本中,均存在相当比例的内容带有AI生成痕迹,部分甚至显示为AI直接生成或经过大幅改写,预示着AI已深度渗透到日常的书面沟通场景。
📈 **不同内容类型AI痕迹比例各异**:研究具体量化了AI在不同文本类型中的应用比例。在企业新闻稿中,约24%的内容被认为具有AI生成特征;消费者投诉约占18%;联合国新闻稿约14%;而招聘信息则接近10%。这种差异可能反映了不同领域对AI辅助写作工具的接受度和应用程度不同,也表明AI在提升内容生产效率方面发挥着重要作用。
🌍 **地域与企业规模影响AI使用**:研究还揭示了AI在书面沟通中的使用存在地域和企业规模上的差异。在教育程度较低的地区,使用AI撰写投诉的比例(19.9%)高于教育程度较高的地区(17.4%)。同时,中小型企业或初创公司在生成招聘信息时,更倾向于使用大模型,约有10%至15%的招聘公告显示出AI痕迹。这表明AI工具的普及程度和应用策略在不同社会经济背景下有所不同。
🧐 **未来AI识别难度增加**:研究人员强调,随着生成式AI技术的不断进步,其生成的文本在风格上越来越接近人类写作,这使得未来精确识别AI在文本创作中的参与程度变得愈发困难。这一趋势对内容真实性、版权归属以及信息传播的可靠性等方面提出了新的挑战,需要持续关注和研究。
IT之家 10 月 7 日消息,Cell Press 旗下期刊《Patterns》近日刊登斯坦福大学研究团队报告,相应研究团队对 Newswire、PRWeb 和 PRNewswire 等各大平台英语文稿进行分析,发现其中有大量文稿带有 AI 痕迹,认为大模型已被广泛应用于各类正式书面沟通场景。
据介绍,相应团队采用了一套名为“分布式 LLM 量化框架”(Distributional LLM Quantification Framework)的统计模型,从语料整体的语言特征分布中估算特定时间段内含有 AI 生成特征的文字比例。但该方法仅适用于英语,因此上述结果仅反映了英文语料中具备 AI 特征的比例,并不意味着整篇文章“完全由 AI 撰写”。
IT之家参考报告获悉,相应团队分析了去年共计 68.7 万条消费者投诉、53.7 万篇企业新闻稿、3.04 亿份招聘信息以及 1.6 万篇联合国新闻稿,发现其中约 24% 的企业新闻稿、18% 的消费者投诉、14% 的联合国新闻稿,以及接近 10% 的招聘内容“几乎由 AI 大模型直接生成,或经过大幅改写”。
研究人员指出,LLM 已深入渗透社会各领域的正式文本写作,逐渐成为人们日常书面表达的重要辅助工具。尤其是在教育程度较低的地区,使用 AI 撰写投诉的比例达到 19.9%,明显高于教育程度较高地区的 17.4%。在招聘信息方面,中小型企业或初创公司更倾向于使用大模型生成内容,其中约有 10% 至 15% 的招聘公告包含明显的 AI 痕迹。
研究人员同时表示,随着生成式 AI 技术的不断进步,其文风愈发接近人类,未来要精确识别 AI 在文本创作中的参与程度将变得愈发困难。