原创 小茸茸 2025-08-26 11:04 重庆
谷歌 NotebookLM 视频概览新增多语言支持;微软开源 VibeVoice-1.5B:超长多说话人 TTS 模型;Genspark 推出AI Designer;阿里 Wan 2.2-S2V 模型预告:视频音频同步生成
谷歌 NotebookLM 视频概览新增多语言支持
NotebookLM[1] 的 Video Overviews 现已支持 80 种语言[2](包括简体中文),大幅提升了多语言内容处理能力。同时,Audio Overviews 功能同步升级,新增生成长度选择功能,用户可在「短版/默认版」之间自由切换。这个 Video Overviews 功能确实非常实用,强烈推荐佬们都试试!它生成的 PPT 采用演讲优先、内容辅助的设计理念,与市面上常见的将内容堆砌在页面中的 PPT 完全不一样。微软开源 VibeVoice-1.5B:超长多说话人 TTS 模型
Genspark 推出AI Designer
阿里 Wan 2.2-S2V 模型预告:视频音频同步生成
微信测试对话式 AI 新闻播报
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!
Reference
[1] NotebookLM 官方推文: https://x.com/NotebookLM/status/1960031496536047742[2] NotebookLM 支持语言完整列表: http://bit.ly/478UdBB[3] 微软 VibeVoice 官网: https://microsoft.github.io/VibeVoice/[4] Genspark AI Designer 官网: https://www.genspark.ai/ai_designer[5] 阿里通义万相官方X账号: https://x.com/Alibaba_Wan/status/1960012297059057935