如何将sup字幕输出为长图(类似esrxp的输出)
最近想研究如何做sup的ocr,网上的教程都太老了,还要下各种依赖之类的,实在不想折腾了,只剩下一个Subtitle Edit好像还行,但是据说对中文OCR不友好。我平时手抄字幕都是esrxp识别导出字幕长图,再用ABBYY进行OCR与校对,但用Subtitle Edit导出的图片都是分开的几千个图片,PS又不会处理,所以想求助看看有没有输出长图的方法(不需要时间轴),再或者有没有sup更好的OCR方案呢
本帖最后由 LIONBING 于 2021-3-20 01:58 编辑
看错了 用 BDSup2Sub 把 .sup 轉成 .idx + .sub (DVD 式的字幕檔)
SubRip + SubToSrt 轉成 .srt/.ssa (或是其它能 orc DVD sub 的作法都可以) idxsubocr可以直接上sup,就是modi的安装吧,比较反人类 tonyhsie 发表于 2021-3-20 01:07
用 BDSup2Sub 把 .sup 轉成 .idx + .sub (DVD 式的字幕檔)
SubRip + SubToSrt 轉成 .srt/.ssa (或是其它能 ...
SubRip貌似也是只对英文支持好的样子?其实我想要的是中日文的OCR,所以还是想交给专门的OCR软件做,或者说大佬你有中日文OCR数据?
Mekozoko 发表于 2021-3-20 10:49
SubRip貌似也是只对英文支持好的样子?其实我想要的是中日文的OCR,所以还是想交给专门的OCR软件做,或者 ...
SubRip 只是用來把 idx+sub 轉為圖片而已
實際上的 OCR 是靠 SubToSrt 來做的,準確度很高
可參考教程 https://sites.google.com/site/twbarry/03
我是用 SubToSrt 很多年了,所以也累積了不少 OCR 的字庫 (從 0 開始到現在 13 萬字了)
但圖源都是繁體中文的 DVD 字幕,對其它圖源可能沒有什麼幫助就是了
本帖最后由 fuyouquan 于 2021-3-22 09:58 编辑
subtitle edit可以转成idx+sub,然后好像是这个吧https://bbs.acgrip.com/forum.php? ... &highlight=videosub,我上次下来来,里面除了硬字幕识别工具还有一个idx+sub的识别工具。硬字幕识别工具用过还算可以,idx+sub这样没有背景干扰的识别效果估计还能更是好
--------------------------------------
专门去试了一下,这个程序需要将sup字幕或idx+sub字幕转成一个 index.html+分散的图片,同样用subtitle edit可以转换
页:
[1]