找回密码
 立即注册
查看: 503|回复: 5

Simple_Subtitle_OCR : 简单易用的硬字幕提取工具(本地OCR)

  • TA的每日心情
    慵懒
    15 小时前
  • 签到天数: 250 天

    [LV.8]以坛为家I

    7

    主题

    31

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    101127
    op200 发表于 2024-10-14 15:26:42 | 显示全部楼层 |阅读模式
    本帖最后由 op200 于 2024-10-14 15:35 编辑

    Github项目地址

    优点是环境配置方便,即装即用,新手友好
    缺点是准确度不理想

    注意:很多sub filter(如libass)对srt解码有问题,最好用可靠的工具把输出的srt转成ass再编辑(后续会加入ass输出)




    为什么要水这个贴,因为只要不做字幕干啥都好(

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x

    评分

    参与人数 1活跃度 +6400 收起 理由
    Yukarubih + 6400 很给力!

    查看全部评分

    回复

    使用道具 举报

  • TA的每日心情
    开心
    18 小时前
  • 签到天数: 42 天

    [LV.5]常住居民I

    2

    主题

    10

    回帖

    120

    VC币

    高级会员

    Rank: 4

    积分
    33977
    braxiong 发表于 2024-10-16 23:23:34 | 显示全部楼层
    都是基于python的,感觉区别不大,简体字没啥问题,感觉繁体字是重灾区
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    3 天前
  • 签到天数: 156 天

    [LV.7]常住居民III

    23

    主题

    743

    回帖

    3104

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    584886
    sommio 发表于 2024-10-17 08:23:19 | 显示全部楼层
    braxiong 发表于 2024-10-16 23:23
    都是基于python的,感觉区别不大,简体字没啥问题,感觉繁体字是重灾区

    「基于 Python」可太广泛了,python 只是胶水语言,pytesseract、paddleocr、easyocr 都可以是「基于 python」。

    楼主这个比起之前的 video-subtitle-extractor 只使用 paddleocr 多了 easyocr。

    感觉 easyocr 应该比 paddleocr 对繁体中文识别更好,我看 pix2text 用它识别除了英文和简体中文以外的文本。
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    2021-6-2 07:44
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    1

    主题

    103

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    13280
    晃晃无事 发表于 2024-10-17 19:42:36 | 显示全部楼层
    看了图片难怪这么熟悉,之前在b站上也看了楼主的视频。

    点评

    丸辣,被逮到了(  发表于 2024-10-17 21:08
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    15 小时前
  • 签到天数: 250 天

    [LV.8]以坛为家I

    7

    主题

    31

    回帖

    0

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    101127
    op200  楼主| 发表于 2024-10-17 21:07:38 | 显示全部楼层
    sommio 发表于 2024-10-17 08:23
    「基于 Python」可太广泛了,python 只是胶水语言,pytesseract、paddleocr、easyocr 都可以是「基于 pyt ...

    其实只要是python的ocr库,想加多少都行,改个函数就解决了,但我没找到准确度更高的ocr库(泪目
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表