op200 发表于 2024-10-14 15:26:42

Simple_Subtitle_OCR : 简单易用的硬字幕提取工具(本地OCR)

本帖最后由 op200 于 2024-10-14 15:35 编辑

Github项目地址

优点是环境配置方便,即装即用,新手友好
缺点是准确度不理想

注意:很多sub filter(如libass)对srt解码有问题,最好用可靠的工具把输出的srt转成ass再编辑(后续会加入ass输出)




为什么要水这个贴,因为只要不做字幕干啥都好(

braxiong 发表于 2024-10-16 23:23:34

都是基于python的,感觉区别不大,简体字没啥问题,感觉繁体字是重灾区

sommio 发表于 2024-10-17 08:23:19

braxiong 发表于 2024-10-16 23:23
都是基于python的,感觉区别不大,简体字没啥问题,感觉繁体字是重灾区

「基于 Python」可太广泛了,python 只是胶水语言,pytesseract、paddleocr、easyocr 都可以是「基于 python」。

楼主这个比起之前的 video-subtitle-extractor 只使用 paddleocr 多了 easyocr。

感觉 easyocr 应该比 paddleocr 对繁体中文识别更好,我看 pix2text 用它识别除了英文和简体中文以外的文本。

晃晃无事 发表于 2024-10-17 19:42:36

看了图片难怪这么熟悉,之前在b站上也看了楼主的视频。

op200 发表于 2024-10-17 21:07:38

sommio 发表于 2024-10-17 08:23
「基于 Python」可太广泛了,python 只是胶水语言,pytesseract、paddleocr、easyocr 都可以是「基于 pyt ...
其实只要是python的ocr库,想加多少都行,改个函数就解决了,但我没找到准确度更高的ocr库(泪目
页: [1]
查看完整版本: Simple_Subtitle_OCR : 简单易用的硬字幕提取工具(本地OCR)