VideoSubFinder辅助工具
本帖最后由 yjyz1011 于 2021-1-12 21:40 编辑最近网络上发现VideoSubFinder工具提取字幕非常好用,但是对其OCR处理以及识别工具用着非常不爽,闲来无事自己开个发百度OCR开发工具。
http://tiebapic.baidu.com/forum/w%3D580/sign=240de2abc600baa1ba2c47b37711b9b1/f36a8f1001e939019a0fa2796cec54e737d1969f.jpg
警告严格执行:
首次运行程序,需要自行申请百度云访问权限,并且填写config.txt前三行的APP_ID,API_KEY和SECRET_KEY
申请教程请见地址:
http://www.doc88.com/p-68539796721748.html
百度牛皮,不得不赞一下这个功能百度良心,有钱的朋友充钱支持一下吧,可以买高精准度的OCR。
1、文件->打开图片:打开单个或者多个图片,显示在列表栏中;
2、文件->打开文件夹:打开文件夹里面的所有图片,显示在列表栏中;
3、其它->关于:还没有想好功能;
4、列表栏:用于显示需要进行OCR的图片,选中一行后,可在右侧上部显示图片内容和文本框中显示OCR后文本。选中某一行后,按Q为选择上一行,W为选择下一行,D为删除当前一行;
5、一键OCR:对列表栏中的图片进行批量OCR识别,通过百度标准OCR进行识别,每天免费5万次;
6、上一个:选择列表栏上一行,同时保存当前的OCR文本;
7、下一个:选择列表栏下一行,同时保存当前的OCR文本;
8、删除:删除列表栏当前一行;
9、高级OCR:调用百度高精度OCR进行识别,每天免费500次;
10、标准OCR:调用百度标准OCR进行识别,每天免费5万次;
11、文本区域:显示列表栏选中行的OCR文本,同时也可以手动输入文本;
12、确认:保存当前的OCR文本,主要使用在通过鼠标在列表栏选中图片,在文本区域人工输入文本时,需要手动点击确认,才能保存当前的OCR文本,其它情况会自动保存,无需点击确认;
13、保存:保存列表栏中所有图片的OCR文本,每一张图片保存一个txt文件,存储位置在图片文件夹中。
使用步骤:
1、使用VideoSubFinder进行“RUN search”,生成包含字幕的视频图片。建议settings中的“use filter colors”设置为:Lab: l:180-255 a:108-148 b:108-148,或者自行调整;
2、图片生成后,使用pictureOCR打开->打开文件夹,打开VideoSubFinder软件所在目录下的RGBImages文件夹;
3、点击一键OCR开始识别;
4、识别完后,检查每一张图片识别的准确性,如有误可以通过高级OCR进行修改或者手动进行修改;
5、检查完毕后,点击保存保存OCR文本至txt文件;
6、保存txt文件完毕后,打开VideoSubFinder软件所在目录下的RGBImages文件夹,剪切所有txt文件至VideoSubFinder软件所在目录下的TXTResults文件夹;
7、使用VideoSubFinder进行“Create Sub From TXTResults”,保存srt文件即可。
分两个版本,一个带jre1.8,解压就能用;一个不带,需要自行安装jre1.8 64位的。
工具共享地址:
链接:https://pan.baidu.com/s/1IAet_5xIwTS201droU6zRw
提取码:qtx9
2021.01.12更新,软件见上面的共享地址。
升级说明:2021.01.10
1、图片显示区域按比例缩放;
2、增加高级一键OCR功能,将20张小图拼接成1张大图,使用高精准OCR进行识别;
3、文本显示区域增加自适应滚动条;
4、文本显示区域,鼠标左键定位光标后,点击鼠标右键,光标处会自动插入空格;
5、拼接识别效果比单张识别效果会差一点,会出现识别不出文本的情况,可通过右侧的“高级OCR”或者“标准OCR”进行单张图片再次识别。
还不错用
就是受限每秒2API,30分钟影片的500多张图要很多时间
右面显示原图的图片框,如果可以的话改成原比例会好点。
现在图片被拉伸,校对时的空格有时很难看清楚(毕竟OCR把空格都全吃掉了,要人手加)
昨天刚在想,做一个可以校对vobsub的软件,也打算把我那个软件做成gui,你这个很大程度上解决了我的痛点。我那个软件可以采用叠图的方式,识别速度快很多,而且只要高精度就够了。有兴趣可以加q交流一下~昨天刚做好了个批量删除空白字幕的小软件 VitaCake 发表于 2021-1-8 01:23
还不错用
就是受限每秒2API,30分钟影片的500多张图要很多时间
目前没空,有时间再优化一版。
yuefeima 发表于 2021-1-8 10:02
昨天刚在想,做一个可以校对vobsub的软件,也打算把我那个软件做成gui,你这个很大程度上解决了我的痛点。 ...
你那个软件很优秀,拼接识别我这有空优化一下。
yjyz1011 发表于 2021-1-8 10:18
你那个软件很优秀,拼接识别我这有空优化一下。
目前那个图片显示问题急需解决下
VitaCake 发表于 2021-1-8 01:23
还不错用
就是受限每秒2API,30分钟影片的500多张图要很多时间
更新一版。
yuefeima 发表于 2021-1-8 10:31
目前那个图片显示问题急需解决下
更新一版。
楼主,链接失效了,求补~ maxforgood 发表于 2021-1-21 19:14
楼主,链接失效了,求补~
最新版本,7天有效。
链接:https://pan.baidu.com/s/11AVlfWzuEGWRAE7zIZsQRg
提取码:ib0h
复制这段内容后打开百度网盘手机App,操作更方便哦