找回密码
 立即注册
查看: 418|回复: 5

找到个基于百度开源ocr llm的抄字幕项目

  • TA的每日心情
    无聊
    2024-9-4 13:52
  • 签到天数: 11 天

    [LV.3]偶尔看看II

    25

    主题

    85

    回帖

    0

    VC币

    白金会员

    Rank: 12Rank: 12Rank: 12

    积分
    53530
    天空龙 发表于 2026-6-20 23:26:34 来自手机 | 显示全部楼层 |阅读模式
    分支一:https://github.com/timminator/VideOCR/releases/tag/v1.3.2
    分支二:https://github.com/timminator/VideOCR/releases
    应该是可以自己选择模型,试了下,比之前很多模型识别率高不少,不过有时候会有漏后半句的情况,整体效率可以高很多
    目前的是v5,可以替换为v6
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2020-3-28 11:06
  • 签到天数: 568 天

    [LV.9]以坛为家II

    56

    主题

    159

    回帖

    7177

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    447021

    崭露头角

    KarlZeo 发表于 2026-6-21 09:21:24 | 显示全部楼层
    PaddleOCR模型有个很大的毛病,空格识别极其拉胯.基本上约等于没有.前后句子之间的距离稍微短点.空格就识别不出来了.
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-11-7 01:15
  • 签到天数: 558 天

    [LV.9]以坛为家II

    21

    主题

    266

    回帖

    759

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    184416

    崭露头角新人登场活跃达人

    skylimiter 发表于 2026-6-21 19:07:55 | 显示全部楼层
    與望言ocr比如何?
    偶尔手抄、偶尔渣翻、无限當咕咕乃常态
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2020-3-28 11:06
  • 签到天数: 568 天

    [LV.9]以坛为家II

    56

    主题

    159

    回帖

    7177

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    447021

    崭露头角

    KarlZeo 发表于 2026-6-21 20:12:54 | 显示全部楼层

    就我的使用体验而言.望言v2的策略比较激进,空格识别很准确,有时候会过头.整体准确率没有PaddleOCR高,但是不需要操心空格,但是生僻字识别比较拉胯.目前我是望言所有模型全打开加上苹果本机的模型.跑一遍以后,人工或者AI视觉大模型校对一遍.基本上问题不大.

    PS: 望言现在内置了PaddleOCR早期模型和v5 v6.不同的场景这三个版本各有千秋.
    回复

    使用道具 举报

  • TA的每日心情
    无聊
    2024-9-4 13:52
  • 签到天数: 11 天

    [LV.3]偶尔看看II

    25

    主题

    85

    回帖

    0

    VC币

    白金会员

    Rank: 12Rank: 12Rank: 12

    积分
    53530
    天空龙  楼主| 发表于 2026-6-22 23:48:53 来自手机 | 显示全部楼层
    KarlZeo 发表于 2026-6-21 20:12
    就我的使用体验而言.望言v2的策略比较激进,空格识别很准确,有时候会过头.整体准确率没有PaddleOCR高,但是 ...

    https://huggingface.co/baidu/Unlimited-OCR
    又一个开源的,这次是3b,不知道效果如何,说是支持长上下文
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    20 小时前
  • 签到天数: 60 天

    [LV.6]常住居民II

    5

    主题

    19

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    12603
    tgwzpt 发表于 7 天前 | 显示全部楼层
    想问一下,为什么对视频的OCR如此困难,对基于图片的OCR发源于战间期,在1950年已经开始商业应用,冷战结束时候就已经是一个非常成熟的技术,到现在的话可以说已经无所不能
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表