找回密码
 立即注册
楼主: NoobNeo

为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta)

  • TA的每日心情
    擦汗
    2022-5-19 07:13
  • 签到天数: 188 天

    [LV.7]常住居民III

    21

    主题

    327

    回帖

    87

    VC币

    金牌会员

    Rank: 6Rank: 6

    积分
    48611
    wudihongjing 发表于 2020-1-4 02:48:19 | 显示全部楼层
    工具帖不应该被置顶吗?
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    2017-3-4 14:01
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    14

    主题

    122

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    3586
    amiemie666 发表于 2020-1-11 09:14:03 | 显示全部楼层
    强大的大佬~赞~如果能遇到强大的队友协同作战,就完美了~
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    477288
    NoobNeo  楼主| 发表于 2020-1-16 20:06:21 | 显示全部楼层

    第二次的错误和第一次的肯定不相同, 你没有贴出来, 新版本近期更新, 届时再试试
    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    477288
    NoobNeo  楼主| 发表于 2020-1-16 20:11:49 | 显示全部楼层
    瞬间抛锚 发表于 2019-12-20 16:31
    楼主你好,我发现即使帧间隔调成1帧,截取的时间轴还是不如esrXP的精确,不知道该怎么解决?

    如图:

    COCR 的时间轴是由 FFMpeg 直接返回的, 粗看了下 Aegisub 的源码, 不懂 C/C++语言, 盲猜? Aegisub 的时间码和 FFMpeg 不太一样导致的.暂时没有太大问题, 除非手抄的字幕是要匹配内嵌版的, 以后着手解决吧


    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复

    使用道具 举报

  • TA的每日心情

    2020-1-11 12:03
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    0

    主题

    2

    回帖

    0

    VC币

    注册会员

    Rank: 2

    积分
    577
    Duang 发表于 2020-1-17 11:31:04 | 显示全部楼层
    本帖最后由 Duang 于 2020-1-17 15:44 编辑

    我有个想法,用无字幕视频和有字幕视频作差,然后提取差异较大画面的区间作为手抄字幕的时间点。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    477288
    NoobNeo  楼主| 发表于 2020-1-20 11:19:08 | 显示全部楼层
    Duang 发表于 2020-1-17 11:31
    我有个想法,用无字幕视频和有字幕视频作差,然后提取差异较大画面的区间作为手抄字幕的时间点。 ...

    用这种方法来找时间轴的话有一个缺陷, opencv 是使用 ffmpeg 作为视频支持的, 从视频里比对图像, 就涉及到帧, 所以又回到了 帧 所在时间位置的问题
    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复

    使用道具 举报

  • TA的每日心情

    2020-1-11 12:03
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    0

    主题

    2

    回帖

    0

    VC币

    注册会员

    Rank: 2

    积分
    577
    Duang 发表于 2020-1-20 19:12:42 | 显示全部楼层
    本帖最后由 Duang 于 2020-1-20 19:23 编辑
    NoobNeo 发表于 2020-1-20 11:19
    用这种方法来找时间轴的话有一个缺陷, opencv 是使用 ffmpeg 作为视频支持的, 从视频里比对图像, 就涉及 ...

    作差就是为了方便提取时间位置 https://paste.ubuntu.com/p/zGJ4BnNpfW/
    不过这方法也挺麻烦的,如果两个开始视频时间不同还得手动调时间,而且有的视频中间丢帧到后面就对不齐了,不过这方法提取出来的时间精度还可以,提取出来的画面间隔基本上都是字幕,很少有非字幕的画面
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    477288
    NoobNeo  楼主| 发表于 2020-1-20 20:19:13 | 显示全部楼层
    本帖最后由 NoobNeo 于 2020-1-20 20:20 编辑
    Duang 发表于 2020-1-20 19:12
    作差就是为了方便提取时间位置 https://paste.ubuntu.com/p/zGJ4BnNpfW/
    不过这方法也挺麻烦的,如果两个 ...

    我以为你是考虑帧转时间的精度问题,理解偏差。做差取帧的方法,如你所说,要两个视频,且帧率,总帧数和时长要相同,不然会造成严重的偏差,另外视频比例也是不稳定因素,如果比例不吻合,字幕区域就匹配不上,做差也就没有意义了
    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复

    使用道具 举报

  • TA的每日心情
    无聊
    10 小时前
  • 签到天数: 613 天

    [LV.9]以坛为家II

    5

    主题

    61

    回帖

    106

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    125268
    Yukarubih 发表于 2020-1-30 09:22:43 | 显示全部楼层


    做了2集战国 Collection,发现一直出现“中后期时轴不完全对应OCR之后的文本”!有几行时轴多出来(缺几行ocr该有的文本),不过我就是用这个工具提取时间轴的,倒是不影响!只是大大没出现这个问题吗?

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    477288
    NoobNeo  楼主| 发表于 2020-1-30 10:03:40 | 显示全部楼层
    Yukarubih 发表于 2020-1-30 09:22
    做了2集战国 Collection,发现一直出现“中后期时轴不完全对应OCR之后的文本”!有几行时轴多出来(缺几 ...

    是 Tesseract-ocr 没有识别出文本, 直接跳过了, 导致文本和时间轴错位. 我是在 'Caption OCR Tool' 中完成 OCR 错误修正后, 再导出 ass 字幕的.
    我是这样进行手抄的, 仅供参考:
    • 先批处理全季字幕;
    • 对每个 cocr 文件进行合并 + OCR;
    • 把全季 OCR 结果分别复制到 文本编辑工具 (例如: Notepad++), 利用 文本编辑工具的 "查找和替换" 把所有明显错误的地方 (多余的标点, 空格, 明显错字之类的) 都去除;
    • 把替换后的内容复制回 'Caption OCR Tool' 的编辑框内, 再逐行修正, 文本编辑工具 中剩余集数同步替换修正, 这样越往后, 修正速度越快

    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表