对于那些曾在深夜为观看无字幕影片而苦恼的用户,一款新的移动端语音转字幕APP应运而生。该应用能够监听系统全局音频或特定APP的音频,无论是在观看直播还是无字幕视频时都能提供实时字幕生成。考虑到隐私和成本因素,它无需上传至云端处理。目前该APP处于Demo阶段,通过ASR模型将语音转写为文字,并支持后续的AI翻译。虽然尚不支持近实时翻译,但断句后翻译功能已实现。为获得最准确的翻译效果,建议下载3GB的AI模型,其内存占用在4GB以内。
🎤 **实时字幕生成,解决无字幕观影痛点**:针对移动端用户在观看直播或无字幕视频时遇到的字幕缺失问题,该APP提供实时语音转字幕功能,无需上传至云端,满足用户对隐私和成本的顾虑,让观影体验更加便捷。
⚙️ **技术方案与功能实现**:APP采用ASR模型进行语音转写,将音频实时转换为文字。虽然目前尚无法实现近乎实时的翻译,但支持断句后的AI翻译,用户可选择下载大型AI模型以获得更精准的翻译效果,模型本身内存占用可控。
🚀 **Demo阶段,诚邀体验与反馈**:目前该APP仍处于Demo体验阶段,开发者鼓励用户进行试用,并积极收集反馈意见,以持续优化产品功能和用户体验,未来计划将模型从谷歌云迁移。
大概在几年前,经常深夜孤独寂寞看片的人都知道,很多影片没有字幕的难受~
虽然目前已经很多工具软件可以在 PC 端可以实现近实时生成字幕,但是在移动端却很少见,由于某些隐私因素大家可能不想上传云端处理(其实是我穷用不起在线 api ),于是这块语音转字幕 APP 出现啦!它可以监听系统全局音频或者监听某一款 APP ,你在观看直播、或者看无字幕视频都能用上。字幕会在系统最上层实时显示
因为技术壁垒/性能问题,目前没法近实时翻译,只能实时生成原文,断句后翻译。
大概的技术方案是:ASR 模型转写文字-->文字喂给传统翻译模型 or ai 模型通过提示词翻译
目前这款 APP 还是 demo 阶段,需要大家体验提出一下意见,想要翻译最准确,还是得下载里面最大的 ai 模型哦~3 个 G ,但是内存占用不会很大,在 4 个 G 以内
当前为体验阶段,模型放在谷歌云里面的,后期会迁移
下载地址: https://www.pgyer.com/shishiyuyinzhuanxie