inspect
projects/subtitle-extractor
/projects/subtitle-extractor/
OCR / ASR / 视频工具v0.1.0
从 B 站视频中提取并对齐字幕。
B 站硬字幕提取工具,使用 PaddleOCR 与 Faster-Whisper ASR 进行识别、合并和对齐,并提供 Chrome 扩展前端。
概述
一个用于提取 B 站视频硬字幕的工具,基于 PaddleOCR,并可选合并 Faster-Whisper ASR 结果以提升覆盖率。项目包含 FastAPI 后端、Chrome 扩展前端、yt-dlp 视频下载和预检诊断脚本。OCR + ASR 双引擎管线可以同时覆盖画面文字和仅语音内容。
route/projects/subtitle-extractor/
repogithub.com/3aKHP/SubtitleExtractor
statusPASSING
touch3d ago
能力
- 01使用 PaddleOCR 提取画面硬字幕
- 02使用 Faster-Whisper ASR 转写音频
- 03合并并对齐 OCR 与 ASR 结果
- 04通过 FastAPI 后端和 Chrome 扩展提供界面
- 05集成 yt-dlp 下载 B 站视频
- 06使用 doctor.py 执行环境预检
H01双引擎管线
OCR 负责画面硬字幕,ASR 补充仅语音内容,最终结果会被合并并按时间对齐。
H02Chrome 扩展入口
可以直接从浏览器提交 B 站链接,FastAPI 后端会实时返回处理结果。
H03稳健预检
doctor.py 会在服务启动前检查 Python 依赖、ffmpeg 和 yt-dlp,提前暴露环境问题。