第57期【2025年6月28日-2025年7月5日】
1.VideoCaptioner
这是一个 通过语音识别、生成视频字幕 的开源项目,
中文名为《卡卡字幕助手》。
它使用起来非常简单,把视频、语音文件拖入进来,点击开始。
稍微等待一会儿,视频中的内容就被识别出来了。
你可以进一步对它优化,进行校正和翻译,
假如你是自己做视频,有视频的文案,把它添加到 “文稿提示” 中,优化的效果会更好。
最后,点击左上角的保存,即可一键导出成 视频字幕、或者 txt 文稿,
也可以在 “字幕样式” 功能中,调整自己喜欢的字幕样式,
然后直接把它合并到原视频里。
最近,好几个大厂的剪辑软件相关功能都增加了限制,
经过我的测试,《卡卡字幕助手》的效果也很不错,
如果你有 给视频加字幕,加翻译 的需求,或者想获取视频的文案,可以尝试一下。
【VideoCaptioner】https://github.com/WEIFENG2333/VideoCaptioner
2.chatlog
这是一个解密某信数据库,获取聊天数据的开源项目,
支持旧版本的微信 3.0 版本 和 最新的 4.0 版本,能在 Windows 和 Mac 中使用。
解密完之后,可以在网页中,随时查看你的聊天记录,
还可以通过 MCP 协议,把它集成到你的 AI 中,挖掘更大的价值。
此前的很多类似程序,目前都已经停更或者失效了,如果你还有解密的需求,可以试试它。
【chatlog】https://github.com/sjzar/chatlog
3.Twocast
最近字节的很多 AI 产品,都上线了 AI 播客功能,
上传 文件、想法 和链接,就可以生成双人播客。
Twocast 是一个功能类似的开源项目,
但因为是开源项目,所以更加自由,
它接入了 Fish Audio、Minimax、Google Gemini 三个平台,
可以自定义对谈双方的音色,和使用的语言,最后生成的播客类似于这样。
【Twocast】https://github.com/panyanyany/Twocast
4.read-frog
这是沉浸式翻译的一个开源实现,中文名为《陪读蛙》,
核心功能基本上差不多,点击翻译,会在原文下边显示出译文。
不过,目前类似的产品有很多,
作为一个开源项目,《陪读蛙》还需要自己填 API,并没有太大的优势,
如果你不想使用市面上的商业项目,可以试试它。
【read-frog】https://github.com/mengxi-ream/read-frog
5.One-Core-API-Binaries
这是一个可以让 XP 系统,兼容 Win10 的开源项目,
因为系统太老,所以很多现代的软件都不能用,
但使用了 One-Core-API 之后,各种最新的软件就能正常运行了。
如果你钟爱 XP 系统,它或许是你需要的。
【One-Core-API-Binaries】https://github.com/shorthorn-project/One-Core-API-Binaries
6.hoverzoom+
这是一个开源的浏览器扩展,
当你在浏览器上看 图片、视频 的时候,把鼠标放在上边,按下 D 键,
就可以快速的对它们放大预览。
在某些视频网站,甚至可以实现不点开,就能查看视频内容。
曾经有一个叫做 Hover Zoom 的插件挺火,不过后来被曝光含有恶意代码,
Hover Zoom + 就是它的开源版本。
【hoverzoom+】https://github.com/extesy/hoverzoom
7.TRAE-agent
TRAE 团队开源了一个 agent 项目,
它可以自主 理解代码库中的内容,掌握现有代码格式,
自动调试、分析代码出现的问题,并制定计划,对代码进行修复。
开发团队使用 SWE-bench Verified 基准集进行了测试,
500 个真实项目问题,最后成功修复了 376 个,总成功率 75.2%。