找回密码
 立即注册
查看: 12107|回复: 33

VideoSubFinder辅助工具

该用户从未签到

1

主题

24

回帖

0

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
241967
yjyz1011 发表于 2021-1-7 20:30:25 | 显示全部楼层 |阅读模式
本帖最后由 yjyz1011 于 2021-1-12 21:40 编辑

最近网络上发现VideoSubFinder工具提取字幕非常好用,但是对其OCR处理以及识别工具用着非常不爽,闲来无事自己开个发百度OCR开发工具。


警告严格执行:
首次运行程序,需要自行申请百度云访问权限,并且填写config.txt前三行的APP_ID,API_KEY和SECRET_KEY
申请教程请见地址:
http://www.doc88.com/p-68539796721748.html
百度牛皮,不得不赞一下这个功能百度良心,有钱的朋友充钱支持一下吧,可以买高精准度的OCR。


1、文件->打开图片:打开单个或者多个图片,显示在列表栏中;
2、文件->打开文件夹:打开文件夹里面的所有图片,显示在列表栏中;
3、其它->关于:还没有想好功能;
4、列表栏:用于显示需要进行OCR的图片,选中一行后,可在右侧上部显示图片内容和文本框中显示OCR后文本。选中某一行后,按Q为选择上一行,W为选择下一行,D为删除当前一行;
5、一键OCR:对列表栏中的图片进行批量OCR识别,通过百度标准OCR进行识别,每天免费5万次;
6、上一个:选择列表栏上一行,同时保存当前的OCR文本;
7、下一个:选择列表栏下一行,同时保存当前的OCR文本;
8、删除:删除列表栏当前一行;
9、高级OCR:调用百度高精度OCR进行识别,每天免费500次;
10、标准OCR:调用百度标准OCR进行识别,每天免费5万次;
11、文本区域:显示列表栏选中行的OCR文本,同时也可以手动输入文本;
12、确认:保存当前的OCR文本,主要使用在通过鼠标在列表栏选中图片,在文本区域人工输入文本时,需要手动点击确认,才能保存当前的OCR文本,其它情况会自动保存,无需点击确认;
13、保存:保存列表栏中所有图片的OCR文本,每一张图片保存一个txt文件,存储位置在图片文件夹中。


使用步骤:
1、使用VideoSubFinder进行“RUN search”,生成包含字幕的视频图片。建议settings中的“use filter colors”设置为:Lab: l:180-255 a:108-148 b:108-148,或者自行调整;
2、图片生成后,使用pictureOCR打开->打开文件夹,打开VideoSubFinder软件所在目录下的RGBImages文件夹;
3、点击一键OCR开始识别;
4、识别完后,检查每一张图片识别的准确性,如有误可以通过高级OCR进行修改或者手动进行修改;
5、检查完毕后,点击保存保存OCR文本至txt文件;
6、保存txt文件完毕后,打开VideoSubFinder软件所在目录下的RGBImages文件夹,剪切所有txt文件至VideoSubFinder软件所在目录下的TXTResults文件夹;
7、使用VideoSubFinder进行“Create Sub From TXTResults”,保存srt文件即可。
分两个版本,一个带jre1.8,解压就能用;一个不带,需要自行安装jre1.8 64位的。
工具共享地址:
链接:https://pan.baidu.com/s/1IAet_5xIwTS201droU6zRw
提取码:qtx9


2021.01.12更新,软件见上面的共享地址。
升级说明:2021.01.10
1、图片显示区域按比例缩放;
2、增加高级一键OCR功能,将20张小图拼接成1张大图,使用高精准OCR进行识别;
3、文本显示区域增加自适应滚动条;
4、文本显示区域,鼠标左键定位光标后,点击鼠标右键,光标处会自动插入空格;
5、拼接识别效果比单张识别效果会差一点,会出现识别不出文本的情况,可通过右侧的“高级OCR”或者“标准OCR”进行单张图片再次识别。


评分

参与人数 3活跃度 +66334 收起 理由
kavenliang + 32767 很给力!
paul + 800 很给力!
fy939 + 32767

查看全部评分

回复

使用道具 举报

  • TA的每日心情

    2022-5-31 18:17
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    2

    主题

    28

    回帖

    132

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    5888
    VitaCake 发表于 2021-1-8 01:23:38 | 显示全部楼层
    还不错用
    就是受限每秒2API,30分钟影片的500多张图要很多时间

    右面显示原图的图片框,如果可以的话改成原比例会好点。
    现在图片被拉伸,校对时的空格有时很难看清楚(毕竟OCR把空格都全吃掉了,要人手加)

    回复

    使用道具 举报

  • TA的每日心情
    开心
    2020-12-14 09:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    1

    主题

    25

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    98869
    yuefeima 发表于 2021-1-8 10:02:21 | 显示全部楼层
    昨天刚在想,做一个可以校对vobsub的软件,也打算把我那个软件做成gui,你这个很大程度上解决了我的痛点。我那个软件可以采用叠图的方式,识别速度快很多,而且只要高精度就够了。有兴趣可以加q交流一下~昨天刚做好了个批量删除空白字幕的小软件
    回复

    使用道具 举报

    该用户从未签到

    1

    主题

    24

    回帖

    0

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    241967
    yjyz1011  楼主| 发表于 2021-1-8 10:17:13 | 显示全部楼层
    VitaCake 发表于 2021-1-8 01:23
    还不错用
    就是受限每秒2API,30分钟影片的500多张图要很多时间

    目前没空,有时间再优化一版。
    回复

    使用道具 举报

    该用户从未签到

    1

    主题

    24

    回帖

    0

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    241967
    yjyz1011  楼主| 发表于 2021-1-8 10:18:27 | 显示全部楼层
    yuefeima 发表于 2021-1-8 10:02
    昨天刚在想,做一个可以校对vobsub的软件,也打算把我那个软件做成gui,你这个很大程度上解决了我的痛点。 ...

    你那个软件很优秀,拼接识别我这有空优化一下。

    回复

    使用道具 举报

  • TA的每日心情
    开心
    2020-12-14 09:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    1

    主题

    25

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    98869
    yuefeima 发表于 2021-1-8 10:31:56 | 显示全部楼层
    yjyz1011 发表于 2021-1-8 10:18
    你那个软件很优秀,拼接识别我这有空优化一下。

    目前那个图片显示问题急需解决下
    回复

    使用道具 举报

    该用户从未签到

    1

    主题

    24

    回帖

    0

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    241967
    yjyz1011  楼主| 发表于 2021-1-12 21:41:07 | 显示全部楼层
    VitaCake 发表于 2021-1-8 01:23
    还不错用
    就是受限每秒2API,30分钟影片的500多张图要很多时间

    更新一版。
    回复

    使用道具 举报

    该用户从未签到

    1

    主题

    24

    回帖

    0

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    241967
    yjyz1011  楼主| 发表于 2021-1-12 21:41:34 | 显示全部楼层
    yuefeima 发表于 2021-1-8 10:31
    目前那个图片显示问题急需解决下

    更新一版。

    评分

    参与人数 1活跃度 +20 收起 理由
    maxforgood + 20 楼主牛逼!链接好像失效了

    查看全部评分

    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    2

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    36
    maxforgood 发表于 2021-1-21 19:14:24 | 显示全部楼层
    楼主,链接失效了,求补~
    回复

    使用道具 举报

    该用户从未签到

    1

    主题

    24

    回帖

    0

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    241967
    yjyz1011  楼主| 发表于 2021-1-25 18:42:08 | 显示全部楼层
    maxforgood 发表于 2021-1-21 19:14
    楼主,链接失效了,求补~

    最新版本,7天有效。
    链接:https://pan.baidu.com/s/11AVlfWzuEGWRAE7zIZsQRg
    提取码:ib0h
    复制这段内容后打开百度网盘手机App,操作更方便哦

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表