Freyja: 使用深度学习的视频硬字幕提取工具，更加方便的手抄字幕(21/01/11 更新，减少资源占用)

arition · 发表于 2020-11-29 21:18:18

vbr9d 发表于 2020-11-29 20:25
并不是楼上，提供一下我不能打开的视频
[Lilith-Raws]搬运的baha源视频全部时间轴都会异常地长，尝试把视 ...

Lilith-Raws搬运的视频的视频合并都有点问题，导致合并出来的帧数不太对。目前按照我说明里写的用ffmpeg转码一遍就行了，remux没用。然后那个crash问题，可以尝试调整裁剪大小，多试几次就能成功。
除开crash的问题，我看了一下你这个截图，这种字体我没有训练过，所以估计识别出来结果会很差。如果你知道这是什么字体的话可以告诉我，我下次训练的时候加入这个字体

AsexualityK · 发表于 2020-11-29 21:24:57

太难了显卡不匹配慢出天际

vbr9d · 发表于 2020-11-29 22:23:54

arition 发表于 2020-11-29 21:18
Lilith-Raws搬运的视频的视频合并都有点问题，导致合并出来的帧数不太对。目前按照我说明里写的用ffmpeg ...

嗯，基本上都是要转码才能用

黑五那个我调了好几遍都没用，字体我也不知道，不过我也就测试用，这种字体做字幕很少见，没什么必要特地训练一个了

softfuttery · 发表于 2020-11-30 08:33:31

arition 发表于 2020-11-29 19:38
能给个无法打开的视频的例子嘛？任意一个都行，给个链接啥的，不方便公开的话可以私信 ...

就是随便从b站找一段视频下载，转成mp4，还是打不开,包括从vcb下载的的暗杀教室也是,只会显示最开始的一段图片,怀疑是调度问题吧，显卡根本没在工作
https://vcb-s.com/archives/13457

b站的是下了这个第八集
https://www.bilibili.com/bangumi/play/ss34230/

xfdz · 发表于 2020-11-30 08:38:37

手抄字幕进入人工智能时代！

web0316 · 发表于 2020-11-30 11:25:54

提示: 作者被禁止或删除内容自动屏蔽

arition · 发表于 2020-11-30 15:04:52

web0316 发表于 2020-11-30 11:25
macOS 那个models 放哪里啊？

MacOS版现在没法用，下一版会修复

silly1stupid · 发表于 2020-11-30 19:14:33

好……好猛

arition · 发表于 2020-12-1 14:12:53

softfuttery 发表于 2020-11-30 08:33
就是随便从b站找一段视频下载，转成mp4，还是打不开,包括从vcb下载的的暗杀教室也是,只会显示最开始的一 ...

这个版本应该修复了mkv的视频时间问题，可以试一下
fix duration on mkv sources · freyjaSubOCR/freyja-sub-ocr-electron@2ad0c51 (github.com)

可能需要登录github账号才能看见下载

arition · 发表于 2021-1-11 18:39:28

本帖最后由 arition 于 2021-1-11 18:42 编辑

2021/01/11 版本更新 V0.4.0

新版使用了更新后的OCRV3模型。新的OCRV3模型相比旧的OCR模型来说运行速度更快，也更加准确。新模型使用的GPU内存较少，所以默认的批次大小从8个变更为32个。在Surface book 2笔记本上（i7-8650U，GTX 1060 Max-Q），新版本处理一段24分钟的视频只需要10分钟。
新版不需要以前的对象检测模型，也统一了CPU和GPU模型。
新的模型需要框选更准确的字幕边界，否则准确度会很差。下一个版本主要会优化视频解码和播放。

		自动登录	找回密码
密码			立即注册

Freyja: 使用深度学习的视频硬字幕提取工具，更加方便的手抄字幕(21/01/11 更新，减少资源占用)

小有所成

崭露头角

BD！

新人登场