inspect projects/subtitle-extractor /projects/subtitle-extractor/
OCR / ASR / 视频工具v0.1.0

从 B 站视频中提取并对齐字幕。

B 站硬字幕提取工具,使用 PaddleOCR 与 Faster-Whisper ASR 进行识别、合并和对齐,并提供 Chrome 扩展前端。

languagePythonprimary stack
licenseGPL-3.0distribution
platformWindowsruntime surface
targetB 站视频字幕delivery focus

概述

一个用于提取 B 站视频硬字幕的工具,基于 PaddleOCR,并可选合并 Faster-Whisper ASR 结果以提升覆盖率。项目包含 FastAPI 后端、Chrome 扩展前端、yt-dlp 视频下载和预检诊断脚本。OCR + ASR 双引擎管线可以同时覆盖画面文字和仅语音内容。

route/projects/subtitle-extractor/
repogithub.com/3aKHP/SubtitleExtractor
statusPASSING
touch3d ago

能力

  • 01使用 PaddleOCR 提取画面硬字幕
  • 02使用 Faster-Whisper ASR 转写音频
  • 03合并并对齐 OCR 与 ASR 结果
  • 04通过 FastAPI 后端和 Chrome 扩展提供界面
  • 05集成 yt-dlp 下载 B 站视频
  • 06使用 doctor.py 执行环境预检
H01

双引擎管线

OCR 负责画面硬字幕,ASR 补充仅语音内容,最终结果会被合并并按时间对齐。

H02

Chrome 扩展入口

可以直接从浏览器提交 B 站链接,FastAPI 后端会实时返回处理结果。

H03

稳健预检

doctor.py 会在服务启动前检查 Python 依赖、ffmpeg 和 yt-dlp,提前暴露环境问题。