能不能直接用图像生成字幕？

floater 发表于 2022-11-30 19:55:01

如图，用vediosubfinder直接将字幕部分的图片搞了出来，但因为ocr的准确度太低了，能不能直接将这些图片弄成想pgs一样的图形字幕（我不在意截图的背景），避免ocr，求教。

Visionary 发表于 2022-11-30 21:32:03

配一个xml序列应该就可以

xiaomeng 发表于 2022-12-1 15:49:31

图形字幕是【字】变成【图】，你这是直接截图，内容包含的不仅仅是【字】，还包含了其他内容，算不得图形字幕

菜姬发表于 2022-12-1 17:35:38

esrxp 是可以输出图形字幕的

Chrysoberyl 发表于 2022-12-2 13:46:29

推荐video-subtitle-extractor项目，OCR是能用的程度，不过还需要校对。

https://github.com/YaoFANGUK/video-subtitle-extractor
如果字体不是很花哨的话也可以自己搭建Tr引擎做OCR：https://github.com/myhub/tr
有大佬魔改的VSE版，不过需要自行搭建TrOCRWeb前端（仅支持docker或Linux部署），还需要改动一下py代码。不过我跑了一下感觉对自己这个字幕的字体提升有限，就没有继续折腾。

页: [1]

Anime字幕论坛's Archiver

能不能直接用图像生成字幕？