找回密码
 立即注册
楼主: NoobNeo

为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta)

  • TA的每日心情
    难过
    2020-12-8 13:13
  • 签到天数: 2 天

    [LV.1]初来乍到

    0

    主题

    17

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    189
    hhbluestar 发表于 2020-12-1 10:10:01 | 显示全部楼层
    抱歉,完全没搞懂,有没有详细点的教程..谢谢了。
    回复

    使用道具 举报

  • TA的每日心情
    无聊
    前天 07:49
  • 签到天数: 1274 天

    [LV.10]以坛为家III

    11

    主题

    137

    回帖

    46

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    222988
    vbr9d 发表于 2020-12-6 14:58:14 | 显示全部楼层
    发现OCR无法用在双行字幕上,只有第一行能识别成功
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    477288
    NoobNeo  楼主| 发表于 2020-12-9 16:45:26 | 显示全部楼层
    vbr9d 发表于 2020-12-6 14:58
    发现OCR无法用在双行字幕上,只有第一行能识别成功

    这是因为默认参数把图片视为单行文字, 造成第二行文本无法识别.修改 tesseract 配置文件 (路径 /app_path/app/tessdata/config) 中的 tessedit_pageseg_mode 参数, 默认参数为 7, 按需求修改, 参数含义参考 Tesseract-OCR 文档 --psm 段落

    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复

    使用道具 举报

  • TA的每日心情
    无聊
    前天 07:49
  • 签到天数: 1274 天

    [LV.10]以坛为家III

    11

    主题

    137

    回帖

    46

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    222988
    vbr9d 发表于 2020-12-9 17:51:15 | 显示全部楼层
    NoobNeo 发表于 2020-12-9 16:45
    这是因为默认参数把图片视为单行文字, 造成第二行文本无法识别.修改 tesseract 配置文件 (路径 /app_path ...

    上次手抄试用了这软件,撇除单行文本问题,发现繁体OCR准确率有点太低然后这软件导出图片只能全部一起导出,结果outlook之类的因为图太长裂了不能识别,找了几个小时才找到方法把图均分切开,最后用outlook 2016识别率明显高很多,希望能改善一下这导出图片和准确率问题,谢了
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    3

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    118
    kshuzhiwang 发表于 2020-12-12 13:01:29 | 显示全部楼层
    NoobNeo 发表于 2020-11-20 18:38
    项目文档中的流程图有说明

    流程图裂了

    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    8

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    25
    cascadahk 发表于 2020-12-28 16:01:41 | 显示全部楼层
    The image must be a single channel object 是什麼
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    3

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    118
    kshuzhiwang 发表于 2021-1-7 13:40:52 | 显示全部楼层
    设置里的“视频帧采样频率”是越大采样越多还是越大采样越少
    回复

    使用道具 举报

  • TA的每日心情
    无聊
    2021-12-30 16:07
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    0

    主题

    8

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    481
    Michael 发表于 2021-2-27 11:58:23 | 显示全部楼层
    我这儿的potplayer读取保存的字幕,发现字幕时间轴毫秒值是五位数,但是potplayer识别不了这时间,得手动改为两位数毫秒值才行,这个有没有办法修改下?
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2022-8-8 10:43
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    15

    主题

    39

    回帖

    4132

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    122077
    小小新11 发表于 2021-2-28 01:16:02 | 显示全部楼层
    滤镜中,不管点什么都是错误,显示这个:
    模块类型: 裁剪
    模块信息: ModuleStatus(index=0, moduleType=CROP, enable=true, cache=false, attrMap={}, paramMap={ulx=1.0, lry=1.0, uly=0.0, lrx=1.0, sr=1.0})
    OpenCv 信息: Invalid region, lower(x,y) less than upper(x,y)
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-11-7 01:15
  • 签到天数: 558 天

    [LV.9]以坛为家II

    20

    主题

    260

    回帖

    509

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    131548

    崭露头角新人登场活跃达人

    skylimiter 发表于 2021-7-17 17:37:55 | 显示全部楼层
    本帖最后由 skylimiter 于 2021-7-19 20:43 编辑

    已自行解决 XD
    偶尔手抄、偶尔渣翻、无限當咕咕乃常态
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表