Simple_Subtitle_OCR : 简单易用的硬字幕提取工具(本地OCR)

op200 发表于 2024-10-14 15:26:42

本帖最后由 op200 于 2024-10-14 15:35 编辑

Github项目地址

优点是环境配置方便，即装即用，新手友好
缺点是准确度不理想

注意：很多sub filter（如libass）对srt解码有问题，最好用可靠的工具把输出的srt转成ass再编辑（后续会加入ass输出）

为什么要水这个贴，因为只要不做字幕干啥都好（

braxiong 发表于 2024-10-16 23:23:34

都是基于python的，感觉区别不大，简体字没啥问题，感觉繁体字是重灾区

sommio 发表于 2024-10-17 08:23:19

braxiong 发表于 2024-10-16 23:23
都是基于python的，感觉区别不大，简体字没啥问题，感觉繁体字是重灾区

「基于 Python」可太广泛了，python 只是胶水语言，pytesseract、paddleocr、easyocr 都可以是「基于 python」。

楼主这个比起之前的 video-subtitle-extractor 只使用 paddleocr 多了 easyocr。

感觉 easyocr 应该比 paddleocr 对繁体中文识别更好，我看 pix2text 用它识别除了英文和简体中文以外的文本。

晃晃无事 发表于 2024-10-17 19:42:36

看了图片难怪这么熟悉，之前在b站上也看了楼主的视频。

op200 发表于 2024-10-17 21:07:38

sommio 发表于 2024-10-17 08:23
「基于 Python」可太广泛了，python 只是胶水语言，pytesseract、paddleocr、easyocr 都可以是「基于 pyt ...
其实只要是python的ocr库，想加多少都行，改个函数就解决了，但我没找到准确度更高的ocr库（泪目

页: [1]

Anime字幕论坛's Archiver

Simple_Subtitle_OCR : 简单易用的硬字幕提取工具(本地OCR)