floater 发表于 2022-11-30 19:55:01

能不能直接用图像生成字幕?

如图,用vediosubfinder直接将字幕部分的图片搞了出来,但因为ocr的准确度太低了,能不能直接将这些图片弄成想pgs一样的图形字幕(我不在意截图的背景),避免ocr,求教。

Visionary 发表于 2022-11-30 21:32:03

配一个xml序列应该就可以

xiaomeng 发表于 2022-12-1 15:49:31

图形字幕是【字】变成【图】,你这是直接截图,内容包含的不仅仅是【字】,还包含了其他内容,算不得图形字幕

菜姬 发表于 2022-12-1 17:35:38

esrxp 是可以输出图形字幕的

Chrysoberyl 发表于 2022-12-2 13:46:29

推荐video-subtitle-extractor项目,OCR是能用的程度,不过还需要校对。

https://github.com/YaoFANGUK/video-subtitle-extractor
如果字体不是很花哨的话也可以自己搭建Tr引擎做OCR:https://github.com/myhub/tr
有大佬魔改的VSE版,不过需要自行搭建TrOCRWeb前端(仅支持docker或Linux部署),还需要改动一下py代码。不过我跑了一下感觉对自己这个字幕的字体提升有限,就没有继续折腾。
页: [1]
查看完整版本: 能不能直接用图像生成字幕?