一项发表在Cell Press期刊《Patterns》上的研究报告指出,大型语言模型(LLM)已广泛渗透到企业新闻稿、消费者投诉、联合国新闻稿和职位招聘公告等正式书面沟通领域。研究人员分析了海量数据,发现相当比例的这些文本呈现出由LLM生成或大幅改写的特征。报告还指出,LLM在教育程度较低地区和小型/初创企业中的使用尤为显著。研究团队采用统计方法估算AI特征的比例,并强调随着技术进步,未来精确辨识AI参与度将更具挑战性。
📚 **LLM在正式书面沟通中的广泛应用**:研究发现,大型语言模型(LLM)已深入企业新闻稿、消费者投诉、联合国新闻稿及职位招聘公告等多种正式书面沟通形式。具体而言,24%的企业新闻稿、18%的消费者投诉、14%的联合国新闻稿以及近10%的职位公告显示出由LLM生成或改写的痕迹,表明LLM已成为日常撰写的重要辅助工具。
📈 **不同群体和地区的LLM使用差异**:研究揭示,LLM的使用在不同群体和地区存在差异。例如,在教育程度较低的地区,使用AI撰写投诉的比例(19.9%)高于教育程度较高的地区(17.4%)。此外,小型或初创企业在发布职位招聘信息时,有10%至15%的内容呈现AI生成或改写的特征,显示出其对LLM的偏好。
🔬 **研究方法与局限性**:该研究采用了一种名为“分布式LLM量化框架”的统计方法,通过分析整体语料库的语言特征分布来估算LLM的参与程度。然而,该方法仅聚焦于英文内容,因此数据反映的是整体文字中具AI特征的比例,而非整篇文章完全由AI撰写,也无法涵盖其他语言的文本。
🔮 **未来AI辨识的挑战**:研究人员预警,随着生成式AI技术的不断进步,其输出的文本越来越逼近人类的写作风格,未来要精确辨识AI在内容创作中的参与程度将面临越来越大的挑战。
Cell Press期刊《Patterns》上周刊登一份研究報告,指出大型語言模型(LLM)已被廣泛應用於正式書面溝通,包括企業新聞稿、消費者投訴、聯合國新聞稿,以及職缺公告中。
來自史丹福大學的研究人員分析了68.7萬筆的消費者投訴、53.7萬則的企業新聞稿,3.04億個職缺,以及1.6萬則的聯合國新聞稿,發現有24%的企業新聞稿內容、18%的消費者投訴內容、14%聯合國新聞稿內容,以及接近10%的職缺內容呈現出由LLM生成或大幅改寫的特徵。其中,研究中所分析的企業新聞稿主要來自於Newswire、PRWeb及PRNewswire等企業新聞稿的知名發布平臺。
該研究顯示出LLM已滲透至社會各層面的書面正式溝通,成為人們日常撰寫的重要輔助工具,特別是在教育程度較低的地區,使用AI撰寫投訴的比例達到19.9%,明顯高於教育程度較高地區之17.4%。在張貼職缺部分,小型或新創企業更傾向以LLM撰寫,有10%~15%的內容呈現由AI生成或改寫的特徵。
該團隊採用一套名為分布式LLM量化框架(Distributional LLM Quantification Framework)的統計方法,從整體語料的語言特徵分布來估算某段期間中有多少文字具備LLM特徵,惟僅聚焦於英文內容。因此,上述數據反映的是整體文字中具AI特徵的比例,而不代表整篇文章是由AI撰寫,也無法代表其它語言。
研究人員也認為,隨著生成式AI技術不斷精進,文風愈來愈像真正的人類,未來要精準辨識AI的參與程度將更具挑戰。