yuefeima 发表于 2020-12-2 13:54:02

岁月留声 发表于 2020-12-2 13:11
两个软件我都比较熟悉了,只能说各有优缺点,esr少漏对白,但是去除图片杂质这一步工作量相当大,累死人,v ...

用百度ocr直接识别RGBImages图片,而不是用VSF处理过的TXTImages图片,可以避免你说的会漏轴的情况。关于百度ocr会漏字的情况,只能说不可避免,但是漏的很少,你用任何方式ocr都无法达到100%准确,后期校对是跑不了的。
校对也可以偷懒,用aegisub对字幕进行还原,和原字幕进行比较,可以快速找出出错的字幕,有兴趣可以下来交流交流{:4_683:}

岁月留声 发表于 2020-12-2 14:09:52

yuefeima 发表于 2020-12-2 13:54
用百度ocr直接识别RGBImages图片,而不是用VSF处理过的TXTImages图片,可以避免你说的会漏轴的情况。关于 ...
我是说RGBImages图片都有漏,TXTImages图片漏的我有办法快速筛选出来,另外,我对你说的百度直接OCRRGBImages图片非常感兴趣,百度不是只能识别二值化的图片吗?直接识别RGBImages怎么操作,效果如何呢?

yuefeima 发表于 2020-12-2 14:32:52

岁月留声 发表于 2020-12-2 14:09
我是说RGBImages图片都有漏,TXTImages图片漏的我有办法快速筛选出来,另外,我对你说的百度直接OCRRGBI ...

随着vsf版本的更新,RGB图片漏轴的情况已经越来越少了,百度都可以识别啊,不需要二值化。我那个程序就是直接识别RGB图片,效果还是很不错的。

岁月留声 发表于 2020-12-2 14:58:55

本帖最后由 岁月留声 于 2020-12-2 15:00 编辑

yuefeima 发表于 2020-12-2 14:32
随着vsf版本的更新,RGB图片漏轴的情况已经越来越少了,百度都可以识别啊,不需要二值化。我那个程序就是 ...
你那个程序双行字幕的图片OCR后会自动合成一行吗?如果不会,那导入不了时间轴SRT文件,因为行数不一样,另外我发现腾讯OCR的识别率比百度普通识别好很多,而且基本不会漏字,就是不知道怎么调用,我是用Python的

yuefeima 发表于 2020-12-2 15:06:43

岁月留声 发表于 2020-12-2 14:58
你那个程序双行字幕的图片OCR后会自动合成一行吗?如果不会,那导入不了时间轴SRT文件,因为行数不一样, ...

我用了分隔符来确保时间轴不会出错,而且我是调用的百度高精度识别,每天500次,比腾讯的要大方太多了。可以加我qq详聊(1156333484)

sun128764 发表于 2020-12-2 19:23:21

大佬有想法开源嘛,或者添加一下华为云支持?

yuefeima 发表于 2020-12-2 20:43:02

sun128764 发表于 2020-12-2 19:23
大佬有想法开源嘛,或者添加一下华为云支持?

已附上源代码,有兴趣可自行查看。其他云服务暂时不考虑。

hhbluestar 发表于 2020-12-7 14:22:48

竟然还有额度,醉了啊..

yuefeima 发表于 2020-12-7 15:35:55

hhbluestar 发表于 2020-12-7 14:22
竟然还有额度,醉了啊..

我这个采用叠图识别,虽然一天的额度只有500次,但是一天识别几部电影的量是没问题的,如果是重度使用,建议多申请几个账号

hhbluestar 发表于 2020-12-7 15:58:06

yuefeima 发表于 2020-12-7 15:35
我这个采用叠图识别,虽然一天的额度只有500次,但是一天识别几部电影的量是没问题的,如果是重度使用, ...

我一部都没识别完啊.......

页: 1 [2] 3 4 5 6 7
查看完整版本: 【Videosubfinder +百度ocr接口】提取硬字幕,彻底解放生产力