V2EX 09月30日 00:18
一款解决移动端无字幕观看痛点的新应用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

对于经常在移动端观看无字幕视频或直播的用户来说,这款新推出的语音转字幕应用将是一个福音。它能监听系统全局音频或特定APP的音频,实时生成原文标题,并支持断句后进行翻译。该应用解决了PC端字幕生成工具在移动端稀缺的问题,并考虑了用户对隐私和成本的顾虑。虽然目前尚处于Demo阶段,但已提供最大AI模型供下载以追求更准确的翻译效果,并欢迎用户体验并提供反馈,以助其完善。

🎤 **移动端实时语音转字幕解决方案:** 该应用旨在解决用户在移动设备上观看无字幕视频或直播时的不便,能够监听全局音频或特定APP的声音,实时生成原文字幕,为用户提供更好的观看体验。

🔒 **隐私与成本考量:** 区别于依赖云端API的服务,该应用允许用户在本地处理音频,满足了部分用户对隐私的需求,同时也避免了在线API可能产生的额外费用。

⚙️ **技术实现与功能:** 应用的核心技术方案包括使用ASR模型进行语音转写,随后将文字输入传统翻译模型或AI模型进行提示词翻译。目前技术限制下,仅能实时生成原文,翻译功能需在断句后进行。

🚀 **Demo阶段与用户反馈:** 该应用目前处于Demo阶段,开发者鼓励用户下载并体验,特别是下载3GB的AI模型以获得最准确的翻译效果。开发者积极收集用户意见,以期在后续版本中进行优化。

大概在几年前,经常深夜孤独寂寞看片的人都知道,很多影片没有字幕的难受~

虽然目前已经很多工具软件可以在 PC 端可以实现近实时生成字幕,但是在移动端却很少见,由于某些隐私因素大家可能不想上传云端处理(其实是我穷用不起在线 api ),于是这块语音转字幕 APP 出现啦!它可以监听系统全局音频或者监听某一款 APP ,你在观看直播、或者看无字幕视频都能用上。字幕会在系统最上层实时显示

因为技术壁垒/性能问题,目前没法近实时翻译,只能实时生成原文,断句后翻译。

大概的技术方案是:ASR 模型转写文字-->文字喂给传统翻译模型 or ai 模型通过提示词翻译

目前这款 APP 还是 demo 阶段,需要大家体验提出一下意见,想要翻译最准确,还是得下载里面最大的 ai 模型哦~3 个 G ,但是内存占用不会很大,在 4 个 G 以内

当前为体验阶段,模型放在谷歌云里面的,后期会迁移
下载地址: https://www.pgyer.com/shishiyuyinzhuanxie

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

语音转字幕 移动应用 ASR AI翻译 无字幕观看 Privacy Speech-to-Text Mobile App AI Translation
相关文章