yuefeima
发表于 2020-12-2 13:54:02
岁月留声 发表于 2020-12-2 13:11
两个软件我都比较熟悉了,只能说各有优缺点,esr少漏对白,但是去除图片杂质这一步工作量相当大,累死人,v ...
用百度ocr直接识别RGBImages图片,而不是用VSF处理过的TXTImages图片,可以避免你说的会漏轴的情况。关于百度ocr会漏字的情况,只能说不可避免,但是漏的很少,你用任何方式ocr都无法达到100%准确,后期校对是跑不了的。
校对也可以偷懒,用aegisub对字幕进行还原,和原字幕进行比较,可以快速找出出错的字幕,有兴趣可以下来交流交流{:4_683:}
岁月留声
发表于 2020-12-2 14:09:52
yuefeima 发表于 2020-12-2 13:54
用百度ocr直接识别RGBImages图片,而不是用VSF处理过的TXTImages图片,可以避免你说的会漏轴的情况。关于 ...
我是说RGBImages图片都有漏,TXTImages图片漏的我有办法快速筛选出来,另外,我对你说的百度直接OCRRGBImages图片非常感兴趣,百度不是只能识别二值化的图片吗?直接识别RGBImages怎么操作,效果如何呢?
yuefeima
发表于 2020-12-2 14:32:52
岁月留声 发表于 2020-12-2 14:09
我是说RGBImages图片都有漏,TXTImages图片漏的我有办法快速筛选出来,另外,我对你说的百度直接OCRRGBI ...
随着vsf版本的更新,RGB图片漏轴的情况已经越来越少了,百度都可以识别啊,不需要二值化。我那个程序就是直接识别RGB图片,效果还是很不错的。
岁月留声
发表于 2020-12-2 14:58:55
本帖最后由 岁月留声 于 2020-12-2 15:00 编辑
yuefeima 发表于 2020-12-2 14:32
随着vsf版本的更新,RGB图片漏轴的情况已经越来越少了,百度都可以识别啊,不需要二值化。我那个程序就是 ...
你那个程序双行字幕的图片OCR后会自动合成一行吗?如果不会,那导入不了时间轴SRT文件,因为行数不一样,另外我发现腾讯OCR的识别率比百度普通识别好很多,而且基本不会漏字,就是不知道怎么调用,我是用Python的
yuefeima
发表于 2020-12-2 15:06:43
岁月留声 发表于 2020-12-2 14:58
你那个程序双行字幕的图片OCR后会自动合成一行吗?如果不会,那导入不了时间轴SRT文件,因为行数不一样, ...
我用了分隔符来确保时间轴不会出错,而且我是调用的百度高精度识别,每天500次,比腾讯的要大方太多了。可以加我qq详聊(1156333484)
sun128764
发表于 2020-12-2 19:23:21
大佬有想法开源嘛,或者添加一下华为云支持?
yuefeima
发表于 2020-12-2 20:43:02
sun128764 发表于 2020-12-2 19:23
大佬有想法开源嘛,或者添加一下华为云支持?
已附上源代码,有兴趣可自行查看。其他云服务暂时不考虑。
hhbluestar
发表于 2020-12-7 14:22:48
竟然还有额度,醉了啊..
yuefeima
发表于 2020-12-7 15:35:55
hhbluestar 发表于 2020-12-7 14:22
竟然还有额度,醉了啊..
我这个采用叠图识别,虽然一天的额度只有500次,但是一天识别几部电影的量是没问题的,如果是重度使用,建议多申请几个账号
hhbluestar
发表于 2020-12-7 15:58:06
yuefeima 发表于 2020-12-7 15:35
我这个采用叠图识别,虽然一天的额度只有500次,但是一天识别几部电影的量是没问题的,如果是重度使用, ...
我一部都没识别完啊.......