video-quick-eval

快速将 Bilibili/YouTube 视频或本地视频转写为文本，支持大模型智能优化。

内置部分提示词，用于优化视频文本、质量评估和总结。

新功能:

支持B站关键词搜索，自动转录搜索结果！
支持本地视频文件转录和总结！

安装

前置要求

Python 3.8+
FFmpeg：用于音视频处理

安装 FFmpeg

Windows (使用 winget):

winget install ffmpeg

macOS (使用 Homebrew):

brew install ffmpeg

Linux (Ubuntu/Debian):

sudo apt install ffmpeg

安装依赖

pip install -r requirements.txt

配置

1. 创建配置文件

复制示例配置文件并修改：

cp config.example.json config.json

2. 配置大语言模型

编辑 config.json：

{ "llm": { "provider": "openai", "api_key": "your-api-key-here", "base_url": "https://api.openai.com/v1", "model": "gpt-4o-mini", "temperature": 0.3, "max_tokens": 12000 }, "transcribe": { "model_size": "tiny", "cpu_threads": 4, "auto_optimize": true } }

3. 配置提示词

在 prompts/ 目录下创建或修改提示词模板（Markdown 格式）。提示词文件必须包含 {transcript_text} 占位符。

示例提示词：

evaluation.md: 内容评估与分析
summary.md: 内容总结
format.md: 格式化整理

使用方法

交互式运行

python transcribe.py

程序会提示你输入视频链接、选择提示词等。

命令行模式

单个视频

python transcribe.py --url "https://www.bilibili.com/video/BV1xx411c7mD"

本地视频

处理单个本地视频：

python transcribe.py --local "path/to/your/video.mp4"

B站搜索

搜索并转录前5个视频（默认）：

python transcribe.py --search "Python教程"

搜索并转录前10个视频：

python transcribe.py --search "Python教程" --search-count 10

指定排序方式：

# 综合排序（默认） python transcribe.py --search "Python教程" --search-order totalrank # 最新发布 python transcribe.py --search "Python教程" --search-order pubdate # 最多播放 python transcribe.py --search "Python教程" --search-order click # 最多弹幕 python transcribe.py --search "Python教程" --search-order dm

结合其他参数：

python transcribe.py --search "Python教程" --search-count 10 --prompts evaluation --model-size base

使用多个提示词

python transcribe.py --url "视频链接" --prompts evaluation,summary,format

指定 Whisper 模型

python transcribe.py --url "视频链接" --model-size base

批量处理（从文件读取）

python transcribe.py --batch urls.txt

列出可用提示词

python transcribe.py --list-prompts

项目结构

video-transcribe-ai/ ├── transcribe.py # 交互式/单视频处理脚本 ├── config.json # 配置文件（需自行创建） ├── config.example.json # 配置文件示例 ├── requirements.txt # Python 依赖 ├── video.txt # 批量处理视频列表（可选） ├── failed_videos.txt # 失败视频记录（自动生成） ├── src/ # 源代码模块（可选，用于模块化开发） │ ├── __init__.py │ ├── downloader.py # 视频下载器 │ ├── transcriber.py # 音频转写器 │ ├── bilibili_search.py # B站搜索模块（新） │ ├── models.py # 数据模型 │ └── utils.py # 工具函数 ├── prompts/ # 提示词模板 │ ├── evaluation.md # 评估提示词 │ ├── summary.md # 总结提示词 │ └── format.md # 格式化提示词 ├── docs/ # 文档目录 │ └── bilibili_search_guide.md # B站搜索功能详细说明 ├── output/ # 输出目录（自动创建） ├── data/ # 临时数据目录（自动创建） ├── models/ # 模型缓存目录（自动创建） │ └── whisper/ # Whisper 模型存储 │ ├── whisper-tiny/ │ ├── whisper-base/ │ └── whisper-small/ └── logs/ # 日志目录（自动创建） └── app.log # 应用日志

输出文件

处理完成后，会在 output/ 目录生成：

{video_title}_raw.md: 原始转写文本（包含视频信息）
{video_title}_{prompt_name}.md: 经过 LLM 优化后的文本
batch_report_{timestamp}.json: 批量处理报告（批量模式）

工作流程

单个视频/批量处理模式

下载音频：从指定平台下载视频音频（MP3 格式，64kbps）
音频转写：使用 Faster-Whisper 模型将音频转为文字
繁简转换：自动将繁体中文转为简体中文（需要 opencc）
链式处理：
- 如果提示词中包含 format，先进行格式化
- 其他提示词使用格式化后的文本进行处理
LLM 优化：使用配置的大语言模型和提示词对文本进行优化
保存结果：保存原始转写稿和优化后的文本
清理临时文件：删除下载的音频文件

本地视频处理模式（新）

音频提取：使用 FFmpeg 从本地视频提取音频（MP3 格式）
音频转写：使用 Faster-Whisper 模型将音频转为文字
繁简转换：自动将繁体中文转为简体中文（需要 opencc）
链式处理：与在线视频相同
LLM 优化：使用配置的大语言模型和提示词对文本进行优化
保存结果：保存原始转写稿和优化后的文本
清理临时文件：删除提取的音频文件

B站搜索模式（新）

关键词搜索：使用 bilibili-api-python 搜索B站视频
结果展示：显示搜索结果（标题、时长、播放量、UP主等）
批量转录：自动对搜索结果进行批量转录
后续流程：与批量处理模式相同

注意：

模型首次使用时会自动从 ModelScope 下载
模型存储在 models/whisper/ 目录
如果模型下载不完整，删除对应目录后重新运行即可
B站搜索功能需要安装 bilibili-api-python 库
本地视频处理需要 FFmpeg 和 FFprobe 工具

贡献

欢迎提交 Issue 和 Pull Request！

许可证

MIT License

致谢

faster-whisper - 高效的 Whisper 实现
yt-dlp - 强大的视频下载工具
ModelScope - 模型托管平台
OpenCC - 繁简转换工具
bilibili-api-python - B站API封装库
JefferyHcool/BiliNote - 项目灵感来源

更新日志

v1.2.0 (最新)

✨ 新增本地视频文件处理功能
支持多种视频格式（mp4, avi, mkv, mov, flv, wmv, webm, m4v）
使用 FFmpeg 自动提取音频
支持本地视频的转录和总结

v1.1.0

✨ 新增B站关键词搜索功能
支持搜索并自动转录前N个视频
支持多种排序方式（综合、最新、播放量、弹幕数）
添加搜索结果信息展示
完善文档和使用说明

v1.0.0

初始版本发布
支持 Bilibili、YouTube 视频转写
集成 Faster-Whisper 和 LLM
支持批量处理和多提示词
支持繁简转换

技术栈

视频下载: yt-dlp
音频转写: faster-whisper (基于 CTranslate2)
大模型: OpenAI API、Anthropic API、国内大模型 API
繁简转换: OpenCC
模型托管: ModelScope
B站搜索: bilibili-api-python

联系方式

如有问题或建议，欢迎通过 Issue 反馈。

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
prompts		prompts
src		src
.gitignore		.gitignore
README.md		README.md
config.example.json		config.example.json
requirements.txt		requirements.txt
transcribe.py		transcribe.py

Folders and files

Latest commit

History

Repository files navigation

video-quick-eval

安装

前置要求

安装 FFmpeg

安装依赖

配置

1. 创建配置文件

2. 配置大语言模型

3. 配置提示词

使用方法

交互式运行

命令行模式

单个视频

本地视频

B站搜索

使用多个提示词

指定 Whisper 模型

批量处理（从文件读取）

列出可用提示词

项目结构

输出文件

工作流程

单个视频/批量处理模式

本地视频处理模式（新）

B站搜索模式（新）

贡献

许可证

致谢

更新日志

v1.2.0 (最新)

v1.1.0

v1.0.0

技术栈

联系方式

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages