肖恩马里奥 发表于 2020-6-3 15:30:56

楼主你好
添加滤镜之后点击开始报错如下:
cv::Exception: OpenCV(4.2.0) C:\build\master_winpack-bindings-win64-vc14-static\opencv\modules\core\src\arithm.cpp:669: error: (-209:Sizes of input arguments do not match) The operation is neither 'array op array' (where arrays have the same size and the same number of channels), nor 'array op scalar', nor 'scalar op array' in function 'cv::arithm_op'
请问如何解决

LIONBING 发表于 2020-6-7 03:06:29

本帖最后由 LIONBING 于 2020-6-7 03:07 编辑

终于成功一次...
希望越改越好...
唯一受不了的地方是基本两句之间就有一个空行...
别的其实还好....再接再厉作者辛苦了!!!!!!!!!!

kwindva 发表于 2020-6-7 13:26:23

跟背景颜色几乎一致的字幕怎么区分出来呢?
肉眼好区分,应该是因为字符的阴影。

万古皆空 发表于 2020-6-28 00:05:51

想问一下大佬,导出的ass字幕毫秒有5位数,匹配视频不能对轴,但aegisub能正常调整,有办法把毫秒变成两位数吗

NoobNeo 发表于 2020-7-1 14:20:47

本帖最后由 NoobNeo 于 2020-7-1 14:22 编辑

万古皆空 发表于 2020-6-28 00:05
想问一下大佬,导出的ass字幕毫秒有5位数,匹配视频不能对轴,但aegisub能正常调整,有办法把毫秒变成两位 ...
某些尚在开发的内容需要5位数的精度.
目前可用的解决方法:

[*]修改 源码 并重新编译
[*]使用 Aegisub 等工具保存一次




万古皆空 发表于 2020-7-1 16:38:15

NoobNeo 发表于 2020-7-1 14:20
某些尚在开发的内容需要5位数的精度.
目前可用的解决方法:



aegisub有用,谢谢大佬

岁月留声 发表于 2020-7-6 11:08:55

我发现有几点问题,希望大神可以改进一下:
1、在esrxp里面都没出现重复字幕的视频,用这个软件却出现很多重复字幕,需要合并的太多,十分麻烦。
2、字幕管理的界面不好操作,还是esrxp里面那种全屏幕的窗口一目了然,还不会卡顿。
3、不能导出IDX+SUB字幕
4、导出图片不能选择一张图片只导出一条字幕,因为OCR对大图的识别都不好,容易漏句、出错,问题很多,还是批量识别一张张的小图比较好,而且对于双行的字幕,大图OCR会将一条双行的字幕分成两行文字,两条字幕,这样无法正确导入时间轴。

岁月留声 发表于 2020-7-6 11:12:46

孤雨独火 发表于 2019-8-12 23:02
哇,以前看到现在esrxp还有大把人用就觉得不可思议,现在算是快有可靠的替代品了嘛 ...
esrxp的操作还是很人性化的,用起来特别顺手,就是容易报错和识别效果一般,其他方面我觉得还是非常好用的,不觉得落后

cedar 发表于 2020-7-22 00:25:24

本帖最后由 cedar 于 2020-7-23 14:12 编辑

请问, 背景也存在白色而且与字幕有重叠的情况下, 该怎么调整滤镜才能单独提取出白底黑框的字幕部分? 求给个思路..
几个滤镜看起来都是根据色彩过滤的 完全过滤不出来啊..形态学和连通域也不太行..形态学把字变得特别模糊 也没有完全过滤掉, 而连通域要么没效果要么误伤太严重..我考虑过算数运算但是也没想到什么好的算法..
之前捣鼓了半天 效果也不太好 识别率太低了, 最后约等于手抄..实在太痛苦了..

======
最后发现自适应二值化有点用..然而qq的识别率很高, 二值化之后反而降低了识别率..
老实说大部分其他模块真的没啥用啊..尤其是几个滤波..一滤波字就变糊, 这可怎么用啊..

NoobNeo 发表于 2020-7-25 21:30:17

cedar 发表于 2020-7-22 00:25
请问, 背景也存在白色而且与字幕有重叠的情况下, 该怎么调整滤镜才能单独提取出白底黑框的字幕部分? 求给个 ...
字幕颜色与背景色贴近的时候, 优先考虑 形态学/自适应/全局 这些模块.
至于你说的 双边/均值/高斯/中值滤波 模块, 这些都是用来处理文字区域, 使用这些模块, 至少需要两组或以上的二值化图像, 配合 形态学/算术运算 模块来达到分离文本和非文本区域; 或者在文字和背景对比度高的环境下, 利用这些模块, 把文字边框滤除, 再搭配 HSV/HLS 提取文字.

页: 1 2 3 4 5 6 7 8 9 [10] 11 12 13 14
查看完整版本: 为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta)