能不能直接用图像生成字幕?
如图,用vediosubfinder直接将字幕部分的图片搞了出来,但因为ocr的准确度太低了,能不能直接将这些图片弄成想pgs一样的图形字幕(我不在意截图的背景),避免ocr,求教。配一个xml序列应该就可以 图形字幕是【字】变成【图】,你这是直接截图,内容包含的不仅仅是【字】,还包含了其他内容,算不得图形字幕 esrxp 是可以输出图形字幕的 推荐video-subtitle-extractor项目,OCR是能用的程度,不过还需要校对。
https://github.com/YaoFANGUK/video-subtitle-extractor
如果字体不是很花哨的话也可以自己搭建Tr引擎做OCR:https://github.com/myhub/tr
有大佬魔改的VSE版,不过需要自行搭建TrOCRWeb前端(仅支持docker或Linux部署),还需要改动一下py代码。不过我跑了一下感觉对自己这个字幕的字体提升有限,就没有继续折腾。
页:
[1]