找回密码
 立即注册
查看: 15384|回复: 48

Freyja: 使用深度学习的视频硬字幕提取工具,更加方便的手抄字幕(21/01/11 更新,减少资源占用)

该用户从未签到

15

主题

41

回帖

40

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
284315

小有所成崭露头角BD!

arition 发表于 2020-11-28 20:18:12 | 显示全部楼层 |阅读模式
本帖最后由 arition 于 2021-1-11 18:41 编辑

Freyja 是使用 PyTorch,Nodejs 和 Electron 编写的视频硬字幕提取工具,可以帮助手抄字幕用户更加方便的从视频中提取字幕。
只需要简单的选择提取范围,工具就可以自动识别范围中的文字,无需传统手抄字幕软件复杂的调参操作。

目前仍然在 beta 测试中。基本功能都是可用的,但是可能会遇到 bug 或者随机崩溃等问题。如果你碰到了任何问题,请带上 log.log 文件在 Github issues (https://github.com/freyjaSubOCR/freyja-sub-ocr-electron/issues) 中报告。目前OCR只能识别一些常见的字幕组的字幕样式,如果遇到OCR识别准确率很差的情况,请提供一个可以让我下载视频的方法(链接,种子等)让我调试。





更新日志

2021/01/11 V0.4.0

新版使用了更新后的OCRV3模型。新的OCRV3模型相比旧的OCR模型来说运行速度更快,也更加准确。新模型使用的GPU内存较少,所以默认的批次大小从8个变更为32个。在Surface book 2笔记本上(i7-8650U,GTX 1060 Max-Q),新版本处理一段24分钟的视频只需要10分钟。
新版不需要以前的对象检测模型,也统一了CPU和GPU模型。
新的模型需要框选更准确的字幕边界,否则准确度会很差。
下一个版本主要会优化视频解码和播放。

系统要求

Freyja 需要 8GB 的内存。强烈推荐使用带 Nvidia 显卡的电脑,否则过程会非常缓慢。

使用

如果你使用的是 Windows,安装Visual C++ Redist 2019。如果你使用的是 MacOS 或 Linux ,确保已安装ffmpeg。
https://github.com/freyjaSubOCR/freyja-sub-ocr-electron/releases下载最新版本的Freyja并将其解压缩。
https://github.com/freyjaSubOCR/freyja-sub-ocr-model-zoo/releases中下载对应模型的所有txt和torchscript文件,并将这些文件放入<程序根目录>/models/文件夹。
运行freyja.exe。如果有 Nvidia 显卡,请启用Enable CUDA选项,否则禁用该选项。

已知的问题

视频播放很慢

目前的视频播放实现不是很可靠,会占用比较多的内存并且会有播放卡顿。在正式版推出之前会有新的视频播放实现。

无法使用 MacOS 和 Linux 版本

当前,底层的torch-js包存在一些问题。下一个测试版本预计会修复这个问题。

常见问题

视频播放没有声音。

目前视频播放器没有播放声音功能。

无法播放视频。

这个视频可能是vfr(可变帧率)视频,当前视频播放器不支持播放这类视频。一个比较简单的解决方法是使用ffmpeg进行转码,来把视频转换为恒定帧率视频:ffmpeg -i video.mkv video_transcoded.mkv。

无法使用GPU模型。

确认你有 Nvidia 的显卡。如果确实有 Nvidia 的显卡,请尝试更新驱动程序。

程序提示 "pyTorch backend crashed"。

检查一下 log.log 中的最后一条错误信息。

如果log中有 CUDA out of memory 的提示,说明显存不足。可以通过降低 batch size 来减少显存使用。如果降低 batch size 不起作用,说明你的显存太小,请换用CPU模型。
如果log显示其他错误,请尝试改变视频裁剪的大小然后重试。

碎碎念

这个项目本来是上学期图像识别课程的final project。当时只有非常简陋的代码,不过识别效果不错,所以用了暑假的时间写了一个正经的UI。暑假结束的时候其实已经基本写完了,不过开学了以后又忙了起来导致拖到现在才发布。接下来的计划主要是换掉这个写的非常烂的视频播放方法,换成最近新提出的模型,以及修bug。


评分

参与人数 12活跃度 +201814 收起 理由
OO永恒 + 40 很给力!
BXV + 3840 很给力!
Seekladoom + 69633 机械飞升!
AkiZZZ + 400 很给力!
kyriakos + 800 很给力!
靈停考人 + 1600 很给力!
Ranpo + 800
那只猫 + 800 很给力!
菜姬 + 25600 赞一个!
NF-GL + 32767 很给力!
kysdm + 32767 很给力!
千恋万花 + 32767 很给力!

查看全部评分

回复

使用道具 举报

  • TA的每日心情
    慵懒
    2020-7-9 17:09
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    10

    主题

    10

    回帖

    208

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    4502
    小往422 发表于 2020-11-28 22:00:46 | 显示全部楼层

    确实好慢
    回复

    使用道具 举报

  • TA的每日心情

    2023-5-11 16:53
  • 签到天数: 50 天

    [LV.5]常住居民I

    2

    主题

    52

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    5831
    shiro 发表于 2020-11-28 22:50:16 | 显示全部楼层
    太强了了吧。。。膜拜大佬
    回复

    使用道具 举报

  • TA的每日心情
    擦汗
    2021-5-23 01:07
  • 签到天数: 45 天

    [LV.5]常住居民I

    12

    主题

    305

    回帖

    53

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    19972
    Beatrice-Raws 发表于 2020-11-29 02:19:17 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    擦汗
    2021-5-23 01:07
  • 签到天数: 45 天

    [LV.5]常住居民I

    12

    主题

    305

    回帖

    53

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    19972
    Beatrice-Raws 发表于 2020-11-29 02:22:25 | 显示全部楼层
    mpv开源是不是可以直接将视频播放换成mpv核心
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2020-3-28 11:06
  • 签到天数: 568 天

    [LV.9]以坛为家II

    21

    主题

    110

    回帖

    606

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    394354

    崭露头角

    KarlZeo 发表于 2020-11-29 09:36:49 | 显示全部楼层
    Beatrice-Raws 发表于 2020-11-29 02:22
    mpv开源是不是可以直接将视频播放换成mpv核心

    mpv也是基于ffmpeg的,本质上没有任何区别.
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-7-20 12:47
  • 签到天数: 278 天

    [LV.8]以坛为家I

    26

    主题

    397

    回帖

    455

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    394360

    新人登场崭露头角渐入佳境活跃达人

    橙兜酱 发表于 2020-11-29 12:45:20 | 显示全部楼层
    这个软件是不是能治疗我的懒癌晚期,先下载看看先另外有没有什么交流群鸭~这样子更方便交流


    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    动画年鉴-统计表 (notion.so)
    动画年鉴网盘目录 (xido.workers.dev)

    欢迎参观,如果想一起收集整理的话可以在统计表主页找我联系方式~
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-7-20 12:47
  • 签到天数: 278 天

    [LV.8]以坛为家I

    26

    主题

    397

    回帖

    455

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    394360

    新人登场崭露头角渐入佳境活跃达人

    橙兜酱 发表于 2020-11-29 13:04:36 | 显示全部楼层
    好家伙直接报错了

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    动画年鉴-统计表 (notion.so)
    动画年鉴网盘目录 (xido.workers.dev)

    欢迎参观,如果想一起收集整理的话可以在统计表主页找我联系方式~
    回复

    使用道具 举报

  • TA的每日心情
    擦汗
    2024-9-2 20:52
  • 签到天数: 93 天

    [LV.6]常住居民II

    18

    主题

    80

    回帖

    523

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    87427

    崭露头角新人登场渐入佳境

    hungry小浩纸 发表于 2020-11-29 13:58:44 | 显示全部楼层
    还没到能使用的阶段吧,几乎每个步骤都是bug
    试了几次都是闪退
    回复

    使用道具 举报

  • TA的每日心情
    无聊
    前天 18:55
  • 签到天数: 2540 天

    [LV.Master]伴坛终老

    1

    主题

    166

    回帖

    24

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    560279
    pyyii1987 发表于 2020-11-29 14:42:05 | 显示全部楼层
    又一个新工具,大佬们真的给力
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表