V2EX 09月29日 17:23
移动端语音转字幕APP,满足无字幕观影需求
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

对于那些曾在深夜为观看无字幕影片而苦恼的用户,一款新的移动端语音转字幕APP应运而生。该应用能够监听系统全局音频或特定APP的音频,无论是在观看直播还是无字幕视频时都能提供实时字幕生成。考虑到隐私和成本因素,它无需上传至云端处理。目前该APP处于Demo阶段,通过ASR模型将语音转写为文字,并支持后续的AI翻译。虽然尚不支持近实时翻译,但断句后翻译功能已实现。为获得最准确的翻译效果,建议下载3GB的AI模型,其内存占用在4GB以内。

🎤 **实时字幕生成,解决无字幕观影痛点**:针对移动端用户在观看直播或无字幕视频时遇到的字幕缺失问题,该APP提供实时语音转字幕功能,无需上传至云端,满足用户对隐私和成本的顾虑,让观影体验更加便捷。

⚙️ **技术方案与功能实现**:APP采用ASR模型进行语音转写,将音频实时转换为文字。虽然目前尚无法实现近乎实时的翻译,但支持断句后的AI翻译,用户可选择下载大型AI模型以获得更精准的翻译效果,模型本身内存占用可控。

🚀 **Demo阶段,诚邀体验与反馈**:目前该APP仍处于Demo体验阶段,开发者鼓励用户进行试用,并积极收集反馈意见,以持续优化产品功能和用户体验,未来计划将模型从谷歌云迁移。

大概在几年前,经常深夜孤独寂寞看片的人都知道,很多影片没有字幕的难受~

虽然目前已经很多工具软件可以在 PC 端可以实现近实时生成字幕,但是在移动端却很少见,由于某些隐私因素大家可能不想上传云端处理(其实是我穷用不起在线 api ),于是这块语音转字幕 APP 出现啦!它可以监听系统全局音频或者监听某一款 APP ,你在观看直播、或者看无字幕视频都能用上。字幕会在系统最上层实时显示

因为技术壁垒/性能问题,目前没法近实时翻译,只能实时生成原文,断句后翻译。

大概的技术方案是:ASR 模型转写文字-->文字喂给传统翻译模型 or ai 模型通过提示词翻译

目前这款 APP 还是 demo 阶段,需要大家体验提出一下意见,想要翻译最准确,还是得下载里面最大的 ai 模型哦~3 个 G ,但是内存占用不会很大,在 4 个 G 以内

当前为体验阶段,模型放在谷歌云里面的,后期会迁移
下载地址: https://www.pgyer.com/shishiyuyinzhuanxie

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

语音转字幕 移动应用 实时字幕 AI翻译 无字幕观影 Speech-to-Text Mobile App Real-time Subtitles AI Translation Subtitle Generation
相关文章