Simple_Subtitle_OCR : 简单易用的硬字幕提取工具(本地OCR)
本帖最后由 op200 于 2024-10-14 15:35 编辑Github项目地址
优点是环境配置方便,即装即用,新手友好
缺点是准确度不理想
注意:很多sub filter(如libass)对srt解码有问题,最好用可靠的工具把输出的srt转成ass再编辑(后续会加入ass输出)
为什么要水这个贴,因为只要不做字幕干啥都好( 都是基于python的,感觉区别不大,简体字没啥问题,感觉繁体字是重灾区 braxiong 发表于 2024-10-16 23:23
都是基于python的,感觉区别不大,简体字没啥问题,感觉繁体字是重灾区
「基于 Python」可太广泛了,python 只是胶水语言,pytesseract、paddleocr、easyocr 都可以是「基于 python」。
楼主这个比起之前的 video-subtitle-extractor 只使用 paddleocr 多了 easyocr。
感觉 easyocr 应该比 paddleocr 对繁体中文识别更好,我看 pix2text 用它识别除了英文和简体中文以外的文本。 看了图片难怪这么熟悉,之前在b站上也看了楼主的视频。 sommio 发表于 2024-10-17 08:23
「基于 Python」可太广泛了,python 只是胶水语言,pytesseract、paddleocr、easyocr 都可以是「基于 pyt ...
其实只要是python的ocr库,想加多少都行,改个函数就解决了,但我没找到准确度更高的ocr库(泪目
页:
[1]