TA的每日心情 | 开心 2019-4-4 17:54 |
---|
签到天数: 2 天 [LV.1]初来乍到
星辰大海
- 积分
- 477288
|
本帖最后由 NoobNeo 于 2019-10-27 13:29 编辑
tesseract进阶参数:
进阶参数位于程序目录 APP/tessdata 文件夹中, 如果不了解不建议调整!
用文本编辑器打开 'config' 文件
tessedit_char_blacklist | tesseract识别中被排除的字符 | unrecognised_char | 无法识别的字符用此字符替代, 默认为无 | 其他参数安装tesseract后 用 "tesseract --print-parameters" 查看
0.0.1-3 - alpha 版本及以上部分已失效, 可忽略, 程序中部分按钮悬停可查看描述
=====================================================================================
软件说明
主界面部分按钮(从上至下, 从左至右):
Open [CTRL+O] | 打开 COCR 文件 | Video | 打开视频文件 | Save [CTRL+S] | 保存为 COCR 文件 | Save As [CTRL+SHIFT+S] | 保存为 ASS 文件 | Export | 导出 PNG 文件 | Filter | 滤镜, 需要打开一个视频才能进入 | Del&Merge | 删除/合并字幕, 需要勾选 "Manager Mode" | OCR | 图片字幕识别 | Profile | 偏好设置 | BAT | 批量处理 | Manager Mode | 管理模式 | F | 当前打开文件的文件名 | FC | 视频文件的总帧数 |
BAT(批处理)界面部分按钮(从左至右)
Number of SIMUL tasks | 同时处理任务数量, 默认为1 |
Process(滤镜处理流程) 界面与 Param Settings 对应(从上至下, 从左至右)
其他界面比较简单, 不一一说明.
软件内各种参数说明 标题格式 [窗口] - [区域标题]
Video Filter - Region:
TL X | 字幕区域左上角 X 轴坐标, 一般为 0 | TL Y | 字幕区域左上角 Y 轴坐标 | BR X | 字幕区域右下角 X 轴坐标, 一般为视频宽度 | BR Y | 字幕区域右下角 Y 轴坐标
|
Param Settings - Morphology Parameter: (形态学变化)
MedianBlur Kernel | 中值滤波核尺寸, 只能是奇数, 一般设定为1或3 | Fixed Min Threshold | 固定二值化的阈值 | Adaptive Block | 自适应二值化核尺寸, 只能是奇数, 其他参数固定时, 应尽可能调大 | Adaptive Constant | 自适应二值化常量, 可以为负数, 其他参数固定时, 应尽可能调小 | Dilate Kernel Width | 背景腐蚀核尺寸 - 宽度, 尽可能调大, 不要出现大黑块, 不调整用默认值也没问题 | Dilate Kernel Height | 背景腐蚀核尺寸 - 高度, 同上 | Close Kernel Width | 闭运算核尺寸 - 宽度, 在确保文字区域没有被抹除的情况下, 尽可能调大 | Close Kernel Height | 闭运算核尺寸 - 高度, 同上 |
Param Settings - CCL Area & Pixel Count (连通区域过滤):
Max CCL Area | 最大连通区域 (方形), 确保文字没有被抹除的情况下, 应尽可能调小, 通常设定为 2000~4000 左右 | Min CCL Area | 最小连通区域 (像素点), 去除形态学中无法过滤的小噪点, 不宜过大, 容易把汉字中的"丶"过滤掉 | Min Pixel Count | 字幕图片中像素数量, 小于此数值的会被判定为无效字幕, 单独一个 "一" 字大概在500上下, 不宜过大 |
Param Settings - Similarity Profile (去重):
Min SSIM Threshold | SSIM算法阈值, 高于此数值判定为重复, 不建议低于默认值, 更不建议设置小于0.9的数值, 容易误判 | Min Psnr Threshold | Psnr算法阈值, 高于此数值判定为重复, 不建议低于默认值, 如果误判严重, 建议调大, 或选用SSIM | SSIM OR Psnr | 两者都是机器视觉, 与人类视觉不同, 当我们觉得两张图一样时, 机器不一定认为一样, 通常SSIM的表现优于Psnr |
Param Settings - Binarization Type: (二值化类型)
Fixed Binarization | 固定二值化, 颜色波动小时建议用这个, 速度快, 性能优 | Adaptive Binarization | 自适应二值化, 颜色波动大时建议用这个, 速度慢, 效果好 |
Param Settings - Adaptive Method: (自适应算法)
Mean | 核内区域计算均值 | Gaussian | 核内区域计算加权均值 (高斯函数) |
Param Settings - Storage Policy: (去重保存策略)
Min pixel count in stack | 保存堆内像素总量最少的 | Max pixel count in stack | 保存堆内像素总量最多的 | Med pixel count in stack | 保存堆内像素总量中位数 | First frame in stack | 保存堆内第一个 帧 | Last frame in stack | 保存堆内最后一个帧 |
Profile - : (偏好设置)
Caption Default Style | Default 字幕样式 | Digital container format | 视频容器格式, BAT中根据这个来判定是否为有效视频; 打开视频对话框内快速筛选格式; FFmpeg 支持的容器 | Editor Font Size | 编辑框字体大小 | Frame interval | 提取字幕时帧间隔, 精度越高越耗时 | Count Pre Page | 每次加载字幕图片的数量 | OCR Language | OCR 识别目标的语言, 支持混合语言 |
滤镜参数中建议调整顺序:
字幕区域 > 均值滤波 > 二值化类型 > 二值化类型对应参数, 其余参数基本不用动
|
|