引言

  • 本篇文章旨在帮助不会python编程的小伙伴,快速使用RapidVideOCR视频硬字幕提取工具。
  • 可以运行的操作系统: `Windows | Mac | Linux``

配置环境

1. 安装VideoSubFinder软件(用于提取字幕关键帧)

2. 安装python软件(用于运行RapidVideOCR)

1. 下载python安装包

打开python官网 → https://www.python.org,选择自己系统进入下载界面(VideoSubFinder工具目前只有Windows的)>

2. 找到自己想要的版本

以python 3.10.7 为例。如果网速下载较慢的话,可以加入RapidVideOCR QQ群(706807542),群文件获取。

3. 下载完成之后,双击打开这个exe,即可开始准备安装

点击自定义安装,选择安装位置。同时,记得勾选最后一项Add Python 3.10 to PATH

4. 直接点击下一步

5. 勾选改路径

6. 点击Install,等待安装完毕即可

7. Win + r 输入cmd,回车,进入命令窗口

8. 输入python,看是否出现类似下图样子,如出现,证明安装成功

9. 添加Scripts目录到环境变量中

  • Win + q 输入“编辑” → 点击编辑系统环境变量

  • 打开环境变量用户变量Path编辑

  • 新建Python安装目录下的Script目录路径,如下图所示,记得点击保存哈。

3. 安装RapidVideOCR工具

1. Win + r 输入cmd,回车,进入命令窗口

2. 安装rapid_videocr

  pip install rapid_videocr -i https://pypi.tuna.tsinghua.edu.cn/simple/
  

3. 测试是否安装成功,输入rapid_videocr -h,如果出现类似下图输出,则说明安装成功

4. 命令行使用

Win + r 输入cmd,回车,进入命令行窗口

  rapid_videocr -i RGBImages -s result -m concat
  

其中RGBImages为VideoSubFinder软件生成,可以自定义,例如:G:\ProgramFiles\_self\RapidVideOCR\test_files\RGBImages 等等。

5. 脚本使用

  1. 在桌面上新建TXT文件,命名为rapid_videocr.py,注意后缀名改为*.py

  2. 用记事本打开,将以下代码拷贝到rapid_videocr.py里面

      from rapid_videocr import RapidVideOCR, RapidVideOCRInput
    
    # RapidVideOCRInput有两个初始化参数
    # is_concat_rec: 是否用单张图识别,默认是False,也就是默认用单图识别
    # concat_batch: 叠图识别的图像张数,默认10,可自行调节
    # out_format: 输出格式选择,[srt, txt, all], 默认是 all
    # is_print_console: 是否打印结果,[0, 1], 默认是0,不打印
    ocr_input_params = RapidVideOCRInput(
        is_batch_rec=False, ocr_params={"Global.with_paddle": True}
    )
    extractor = RapidVideOCR(ocr_input_params)
    
    rgb_dir = "tests/test_files/RGBImages"
    save_dir = "outputs"
    save_name = "a"
    
    # outputs/a.srt  outputs/a.t
    extractor(rgb_dir, save_dir, save_name=save_name)
      
  3. 更改rgb_dir 后面的目录为VideoSubFinder生成的RGBImages目录路径。

  4. Win + r 打开终端输入以下代码,回车执行即可。

      $ cd Desktop
    $ python rapid_videocr.py
      

Last updated 21 May 2025, 19:10 -0600 . history