Mekozoko 发表于 2021-3-19 20:12:20

如何将sup字幕输出为长图(类似esrxp的输出)

最近想研究如何做sup的ocr,网上的教程都太老了,还要下各种依赖之类的,实在不想折腾了,只剩下一个Subtitle Edit好像还行,但是据说对中文OCR不友好。
我平时手抄字幕都是esrxp识别导出字幕长图,再用ABBYY进行OCR与校对,但用Subtitle Edit导出的图片都是分开的几千个图片,PS又不会处理,所以想求助看看有没有输出长图的方法(不需要时间轴),再或者有没有sup更好的OCR方案呢

LIONBING 发表于 2021-3-20 00:29:02

本帖最后由 LIONBING 于 2021-3-20 01:58 编辑

看错了

tonyhsie 发表于 2021-3-20 01:07:07

用 BDSup2Sub 把 .sup 轉成 .idx + .sub (DVD 式的字幕檔)

SubRip + SubToSrt 轉成 .srt/.ssa (或是其它能 orc DVD sub 的作法都可以)

hungry小浩纸 发表于 2021-3-20 01:54:30

idxsubocr可以直接上sup,就是modi的安装吧,比较反人类

Mekozoko 发表于 2021-3-20 10:49:03

tonyhsie 发表于 2021-3-20 01:07
用 BDSup2Sub 把 .sup 轉成 .idx + .sub (DVD 式的字幕檔)

SubRip + SubToSrt 轉成 .srt/.ssa (或是其它能 ...

SubRip貌似也是只对英文支持好的样子?其实我想要的是中日文的OCR,所以还是想交给专门的OCR软件做,或者说大佬你有中日文OCR数据?

tonyhsie 发表于 2021-3-20 13:48:09

Mekozoko 发表于 2021-3-20 10:49
SubRip貌似也是只对英文支持好的样子?其实我想要的是中日文的OCR,所以还是想交给专门的OCR软件做,或者 ...

SubRip 只是用來把 idx+sub 轉為圖片而已

實際上的 OCR 是靠 SubToSrt 來做的,準確度很高

可參考教程 https://sites.google.com/site/twbarry/03



我是用 SubToSrt 很多年了,所以也累積了不少 OCR 的字庫 (從 0 開始到現在 13 萬字了)

但圖源都是繁體中文的 DVD 字幕,對其它圖源可能沒有什麼幫助就是了

fuyouquan 发表于 2021-3-20 15:30:34

本帖最后由 fuyouquan 于 2021-3-22 09:58 编辑

subtitle edit可以转成idx+sub,然后好像是这个吧https://bbs.acgrip.com/forum.php? ... &highlight=videosub,我上次下来来,里面除了硬字幕识别工具还有一个idx+sub的识别工具。硬字幕识别工具用过还算可以,idx+sub这样没有背景干扰的识别效果估计还能更是好
--------------------------------------
专门去试了一下,这个程序需要将sup字幕或idx+sub字幕转成一个 index.html+分散的图片,同样用subtitle edit可以转换
页: [1]
查看完整版本: 如何将sup字幕输出为长图(类似esrxp的输出)