(本文阅读时间:7分钟)
作为自然语言处理领域全球顶级的学术盛会之一,ACL 2025 近日在维也纳落幕。来自微软亚洲研究院的多篇论文入选,我们通过两期“科研上新”为大家分享了研究院入选 ACL 2025 的精选论文解读。第一期聚焦了使大语言模型和语音模型在预训练、部署和持续学习中更快速、更小巧或更高效的研究工作。第二期探讨了模型在公平性、包容性、鲁棒性、评估公正性与伦理对齐等方面的议题。
根据读者朋友们的投票结果,我们特别邀请了票选人气最高的四篇论文的作者,于明天(8月20日)下午14:00,在微软亚洲研究院的直播间分享他们的前沿工作。欢迎大家锁定直播间!
欢迎在评论区留言提问,我们将邀请讲者在直播中逐一解答。
直播信息
直播时间:
2025年8月20日 14:00-16:00
直播地址:
微信视频号“微软亚洲研究院”
小红书“微软亚洲研究院”直播间
B 站账号“微软科技”直播间
论文及讲者介绍
孟令威
孟令威,毕业于香港中文大学,师从 Helen Meng 教授。曾于微软亚洲研究院通用人工智能组实习,合作导师为刘树杰研究员和周龙研究员。现于字节跳动 Seed 担任研究员。研究兴趣为语音大模型及语音合成。
分享论文:Autoregressive Speech Synthesis without Vector Quantization
论文摘要: 本篇论文提出的 MELLE 是一个基于连续语音 token 的、单阶段的自回归语音合成模型。相比于 VALLE 等基于离散 codec 的模型,MELLE 省去了繁琐的 NAR 迭代步骤。它的简洁性使其有机会更好地和 LLM 等融合。 MELLE 可以生成更自然的语音,在主客观评测中均展现出卓越水平。
论文链接:
https://arxiv.org/abs/2407.08551
宋挺,2015年加入微软亚洲研究院,参与了微软小英项目的研发工作。目前在微软亚洲研究院通用人工智能组从事 AI Infra 相关的工作,参与了 BitNet 项目的端侧推理优化。
分享论文:Bitnet.cpp: Efficient Edge Inference for Ternary LLMs
论文摘要:本篇论文提出的 Bitnet.cpp 是为 BitNet b1.58 模型设计的边缘推理系统,采用查找表(TL)和融合乘加(I2_S)两种高效的矩阵乘法核心,实现了1.58比特权重的无损推理,推理速度相较全精度模型最高提升6.25倍。
论文链接:https://arxiv.org/abs/2502.11880
吴津岑子,香港中文大学博士在读,师从 Helen Meng 教授,现于微软亚洲研究院社会计算组实习,合作导师为练建勋博士。研究方向为计算机科学与社会认知科学交叉,聚焦于大模型社会智能建模、推理与应用。在 ACL、NAACL、AAAI 等顶级会议发表多篇论文,荣获 ACL 2024 Oral 及 Area Chair Award。
分享论文:SocialCC: Interactive Evaluation for Cultural Competence in Language Agents
论文摘要:SocialCC 是首个跨文化社交动态评估框架,用于考察大模型在礼仪、价值观等方面的理解与适应。尽管主流 LLMs 具备一定文化常识,但在文化意识与行为适应上仍显不足,难以有效识别和避免文化冲突。LLMs 在不同文化中的表现存在差异,在深层价值取向方面尤为欠缺。
论文链接:
https://www.microsoft.com/en-us/research/wp-content/uploads/2025/07/SocialCC-Interactive-Evaluation-for-Cultural-Competence-in-Language-Agents.pdf
李在赫(Jaehyeok Lee),韩国成均馆大学(Sungkyunkwan University)博士在读。现于微软亚洲研究院社会计算组实习,合作导师为矣晓沅博士。研究兴趣在于开发在现实世界场景中具有鲁棒性和高效性的人工智能模型,同时将人类的价值观和情感融入这些系统中。研究成果已被 NAACL 和 ACL 等顶级自然语言处理会议接收。
分享论文:Unintended Harms of Value-Aligned LLMs: Psychological and Empirical Insights
论文摘要:
本篇论文聚焦于价值观对齐模型所带来的潜在风险,并从心理学和实验角度进行了深入分析。研究指出,价值观对齐的模型在安全评估中表现出比未微调模型更高的有害倾向,甚至在某些传统安全测试中也比其他微调模型更易产生风险。这种现象的根本原因在于模型是根据所对齐的价值维度生成文本的,从而可能放大某些有害结果。
论文链接:https://arxiv.org/abs/2506.06404
日程安排
14:00-14:30
分享内容:
Autoregressive Speech Synthesis without Vector Quantization语言:中文
分享嘉宾:
孟令威
14:30-15:00
分享内容:
Bitnet.cpp: Efficient Edge Inference for Ternary LLMs语言:中文分享嘉宾:
宋挺
15:00-15:30
分享内容:
SocialCC: Interactive Evaluation for Cultural Competence in Language Agents语言:中文分享嘉宾:
吴津岑子
15:30-16:00
分享内容:
Unintended Harms of Value-Aligned LLMs: Psychological and Empirical Insights语言:英文分享嘉宾:
Jaehyeok Lee (李在赫)
欢迎锁定直播间,与你不见不散!
当面对集体性的难题时,思想的碰撞与智慧的共鸣显得尤为重要。微软亚洲研究院历时两年打磨的《无界——透视微软创新研究之境》一书,正是献给这个时代的探索指南。
包括周礼栋院长在内的十余位顶尖科研人员参与了本书的编写工作,他们从不同角度探讨了人工智能、计算机科学及其交叉领域的最新进展,分享了前沿的展望、观点以及宝贵的科研经验。
本书已获得十余位全球顶尖学者的推荐,其中包括图灵奖得主、院士、知名高校领导、在各自领域享有盛誉的学者,以及微软亚洲研究院的杰出院友。
现在,《无界——透视微软创新研究之境》已全平台火爆开售!首批读者将获得限量版微软50周年书签,书签上的文章作者亲笔签名将随机呈现,盲盒式惊喜等你开启!
立即点击下方链接,开启你的专属阅读之旅!
你也许还想看:
文章原文
