移动端语音转字幕APP，满足无字幕观影需求

V2EX 09月29日 17:23

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

对于那些曾在深夜为观看无字幕影片而苦恼的用户，一款新的移动端语音转字幕APP应运而生。该应用能够监听系统全局音频或特定APP的音频，无论是在观看直播还是无字幕视频时都能提供实时字幕生成。考虑到隐私和成本因素，它无需上传至云端处理。目前该APP处于Demo阶段，通过ASR模型将语音转写为文字，并支持后续的AI翻译。虽然尚不支持近实时翻译，但断句后翻译功能已实现。为获得最准确的翻译效果，建议下载3GB的AI模型，其内存占用在4GB以内。

🎤 **实时字幕生成，解决无字幕观影痛点**：针对移动端用户在观看直播或无字幕视频时遇到的字幕缺失问题，该APP提供实时语音转字幕功能，无需上传至云端，满足用户对隐私和成本的顾虑，让观影体验更加便捷。

⚙️ **技术方案与功能实现**：APP采用ASR模型进行语音转写，将音频实时转换为文字。虽然目前尚无法实现近乎实时的翻译，但支持断句后的AI翻译，用户可选择下载大型AI模型以获得更精准的翻译效果，模型本身内存占用可控。

🚀 **Demo阶段，诚邀体验与反馈**：目前该APP仍处于Demo体验阶段，开发者鼓励用户进行试用，并积极收集反馈意见，以持续优化产品功能和用户体验，未来计划将模型从谷歌云迁移。

大概在几年前，经常深夜孤独寂寞看片的人都知道，很多影片没有字幕的难受~

虽然目前已经很多工具软件可以在 PC 端可以实现近实时生成字幕，但是在移动端却很少见，由于某些隐私因素大家可能不想上传云端处理（其实是我穷用不起在线 api ），于是这块语音转字幕 APP 出现啦！它可以监听系统全局音频或者监听某一款 APP ，你在观看直播、或者看无字幕视频都能用上。字幕会在系统最上层实时显示

因为技术壁垒/性能问题，目前没法近实时翻译，只能实时生成原文，断句后翻译。

大概的技术方案是：ASR 模型转写文字-->文字喂给传统翻译模型 or ai 模型通过提示词翻译

目前这款 APP 还是 demo 阶段，需要大家体验提出一下意见，想要翻译最准确，还是得下载里面最大的 ai 模型哦~3 个 G ，但是内存占用不会很大，在 4 个 G 以内

当前为体验阶段，模型放在谷歌云里面的，后期会迁移
下载地址： https://www.pgyer.com/shishiyuyinzhuanxie

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签