为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta) - 第13页 - 灌水聊天 - Anime字幕论坛

hhbluestar 发表于 2020-12-1 10:10:01

抱歉，完全没搞懂，有没有详细点的教程..谢谢了。

vbr9d 发表于 2020-12-6 14:58:14

发现OCR无法用在双行字幕上，只有第一行能识别成功{:11_830:}

NoobNeo 发表于 2020-12-9 16:45:26

vbr9d 发表于 2020-12-6 14:58
发现OCR无法用在双行字幕上，只有第一行能识别成功

这是因为默认参数把图片视为单行文字, 造成第二行文本无法识别.修改 tesseract 配置文件 (路径 /app_path/app/tessdata/config) 中的 tessedit_pageseg_mode 参数, 默认参数为 7, 按需求修改, 参数含义参考 Tesseract-OCR 文档 --psm 段落

vbr9d 发表于 2020-12-9 17:51:15

NoobNeo 发表于 2020-12-9 16:45
这是因为默认参数把图片视为单行文字, 造成第二行文本无法识别.修改 tesseract 配置文件 (路径 /app_path ...

上次手抄试用了这软件，撇除单行文本问题，发现繁体OCR准确率有点太低{:11_830:}然后这软件导出图片只能全部一起导出，结果outlook之类的因为图太长裂了不能识别，找了几个小时才找到方法把图均分切开，最后用outlook 2016识别率明显高很多，希望能改善一下这导出图片和准确率问题，谢了{:5_136:}

kshuzhiwang 发表于 2020-12-12 13:01:29

NoobNeo 发表于 2020-11-20 18:38
项目文档中的流程图有说明

流程图裂了

cascadahk 发表于 2020-12-28 16:01:41

The image must be a single channel object 是什麼

kshuzhiwang 发表于 2021-1-7 13:40:52

设置里的“视频帧采样频率”是越大采样越多还是越大采样越少

Michael 发表于 2021-2-27 11:58:23

我这儿的potplayer读取保存的字幕，发现字幕时间轴毫秒值是五位数，但是potplayer识别不了这时间，得手动改为两位数毫秒值才行，这个有没有办法修改下？

小小新11 发表于 2021-2-28 01:16:02

滤镜中，不管点什么都是错误，显示这个：
模块类型: 裁剪
模块信息: ModuleStatus(index=0, moduleType=CROP, enable=true, cache=false, attrMap={}, paramMap={ulx=1.0, lry=1.0, uly=0.0, lrx=1.0, sr=1.0})
OpenCv 信息: Invalid region, lower(x,y) less than upper(x,y)

skylimiter 发表于 2021-7-17 17:37:55

本帖最后由 skylimiter 于 2021-7-19 20:43 编辑

已自行解决 XD

页: 3 4 5 6 7 8 9 10 11 12 [13] 14

Anime字幕论坛's Archiver