找回密码
 立即注册
楼主: yuefeima

【Videosubfinder +百度ocr接口】提取硬字幕,彻底解放生产力

  • TA的每日心情
    开心
    2020-12-14 09:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    1

    主题

    25

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    98869
    yuefeima  楼主| 发表于 2020-12-7 16:12:47 | 显示全部楼层
    hhbluestar 发表于 2020-12-7 15:58
    我一部都没识别完啊.......

    你是不是截图有问题,你要不加我qq,我给你看看(1156333484)
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    0

    主题

    41

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    235
    MichaelLv 发表于 2020-12-8 11:39:00 | 显示全部楼层
    tsMuxer提取SUP,IdxSubOcr进行ocr识别,当然前提是要先装一个MODI的OCR接口(office的OCR模块包),供第三方软件的OCR功能调用,据我所知专业字幕组都是这么操作的!百度的那个OCR识别率差远了!
    以前还要用java的一个小程序来将SUP进行转化,现在不用这么麻烦了!
    回复 支持 0 反对 1

    使用道具 举报

  • TA的每日心情
    难过
    2020-12-8 13:13
  • 签到天数: 2 天

    [LV.1]初来乍到

    0

    主题

    17

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    189
    hhbluestar 发表于 2020-12-8 13:13:17 | 显示全部楼层
    yuefeima 发表于 2020-12-7 16:12
    你是不是截图有问题,你要不加我qq,我给你看看(1156333484)

    截图没问题,截图了525张图.。然后额度500 》。。。。不过,软件不错了,谢了,小哥。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-12-14 09:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    1

    主题

    25

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    98869
    yuefeima  楼主| 发表于 2020-12-8 14:19:51 | 显示全部楼层
    hhbluestar 发表于 2020-12-8 13:13
    截图没问题,截图了525张图.。然后额度500 》。。。。不过,软件不错了,谢了,小哥。
    ...

    500次不止识别500张图片啊,它是用叠图的方式叠的,按理来说至少可以识别5000张图片
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-12-14 09:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    1

    主题

    25

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    98869
    yuefeima  楼主| 发表于 2020-12-8 14:21:59 | 显示全部楼层
    MichaelLv 发表于 2020-12-8 11:39
    tsMuxer提取SUP,IdxSubOcr进行ocr识别,当然前提是要先装一个MODI的OCR接口(office的OCR模块包),供第三 ...

    你可能用的是百度的标准识别模式,实际使用中,百度的高精度识别比起IdxSubOcr准确率好上不少
    回复 支持 1 反对 0

    使用道具 举报

  • TA的每日心情
    难过
    2020-12-8 13:13
  • 签到天数: 2 天

    [LV.1]初来乍到

    0

    主题

    17

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    189
    hhbluestar 发表于 2020-12-8 16:00:59 | 显示全部楼层
    yuefeima 发表于 2020-12-8 14:19
    500次不止识别500张图片啊,它是用叠图的方式叠的,按理来说至少可以识别5000张图片
    ...

    问题是我的就是样啊,还有26张没识别。提示额度用完....
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-12-14 09:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    1

    主题

    25

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    98869
    yuefeima  楼主| 发表于 2020-12-8 16:18:27 | 显示全部楼层
    hhbluestar 发表于 2020-12-8 16:00
    问题是我的就是样啊,还有26张没识别。提示额度用完....

    所以我怀疑是你截图是不是截得太高了,或者参数设置中stack_num = 0,你是不是设置为了stack_num = 1?
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    0

    主题

    41

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    235
    MichaelLv 发表于 2020-12-8 19:59:58 | 显示全部楼层
    yuefeima 发表于 2020-12-8 14:21
    你可能用的是百度的标准识别模式,实际使用中,百度的高精度识别比起IdxSubOcr准确率好上不少
    ...

    但是你这个软件能直接对sup字幕文件进行OCR识别吗?如果是一张一张的截图识别,那除非是满屏的特效字幕,才有应用价值啊!
    其实字幕组一般都是对英文字幕进行OCR识别,然后再进行翻译,这样比听译的效率要高许多。
    回复 支持 0 反对 1

    使用道具 举报

  • TA的每日心情
    开心
    2020-12-14 09:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    1

    主题

    25

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    98869
    yuefeima  楼主| 发表于 2020-12-8 20:26:55 | 显示全部楼层
    MichaelLv 发表于 2020-12-8 19:59
    但是你这个软件能直接对sup字幕文件进行OCR识别吗?如果是一张一张的截图识别,那除非是满屏的特效字幕, ...

    把sup字幕转成图片识别不就好了,我这个是提取硬字幕,顺带也可以识别sup字幕,我还做了个专门识别sup字幕的,只是没发布而已,原理都是一样的。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    难过
    2020-12-8 13:13
  • 签到天数: 2 天

    [LV.1]初来乍到

    0

    主题

    17

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    189
    hhbluestar 发表于 2020-12-9 09:04:39 | 显示全部楼层
    本帖最后由 hhbluestar 于 2020-12-9 09:12 编辑
    yuefeima 发表于 2020-12-8 16:18
    所以我怀疑是你截图是不是截得太高了,或者参数设置中stack_num = 0,你是不是设置为了stack_num = 1?
    ...

    参数没动,文字识别高度刚好。今天识别另一视频 没问题 1000多张图片都OK,这就有点迷了..
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表