arition 发表于 2020-11-29 21:18:18

vbr9d 发表于 2020-11-29 20:25
并不是楼上,提供一下我不能打开的视频
搬运的baha源视频全部时间轴都会异常地长,尝试把视 ...

Lilith-Raws搬运的视频的视频合并都有点问题,导致合并出来的帧数不太对。目前按照我说明里写的用ffmpeg转码一遍就行了,remux没用。然后那个crash问题,可以尝试调整裁剪大小,多试几次就能成功。
除开crash的问题,我看了一下你这个截图,这种字体我没有训练过,所以估计识别出来结果会很差。如果你知道这是什么字体的话可以告诉我,我下次训练的时候加入这个字体

AsexualityK 发表于 2020-11-29 21:24:57

{:12_852:}太难了 显卡不匹配 慢出天际

vbr9d 发表于 2020-11-29 22:23:54

arition 发表于 2020-11-29 21:18
Lilith-Raws搬运的视频的视频合并都有点问题,导致合并出来的帧数不太对。目前按照我说明里写的用ffmpeg ...
嗯,基本上都是要转码才能用{:8_708:}
黑五那个我调了好几遍都没用,字体我也不知道,不过我也就测试用,这种字体做字幕很少见,没什么必要特地训练一个了



softfuttery 发表于 2020-11-30 08:33:31

arition 发表于 2020-11-29 19:38
能给个无法打开的视频的例子嘛?任意一个都行,给个链接啥的,不方便公开的话可以私信 ...

就是随便从b站找一段视频下载,转成mp4,还是打不开,包括从vcb下载的的暗杀教室也是,只会显示最开始的一段图片,怀疑是调度问题吧,显卡根本没在工作
https://vcb-s.com/archives/13457

b站的是下了这个第八集
https://www.bilibili.com/bangumi/play/ss34230/

xfdz 发表于 2020-11-30 08:38:37

手抄字幕进入人工智能时代!

web0316 发表于 2020-11-30 11:25:54

arition 发表于 2020-11-30 15:04:52

web0316 发表于 2020-11-30 11:25
macOS 那个models 放哪里啊?

MacOS版现在没法用,下一版会修复

silly1stupid 发表于 2020-11-30 19:14:33

好……好猛

arition 发表于 2020-12-1 14:12:53

softfuttery 发表于 2020-11-30 08:33
就是随便从b站找一段视频下载,转成mp4,还是打不开,包括从vcb下载的的暗杀教室也是,只会显示最开始的一 ...

这个版本应该修复了mkv的视频时间问题,可以试一下
fix duration on mkv sources · freyjaSubOCR/freyja-sub-ocr-electron@2ad0c51 (github.com)

可能需要登录github账号才能看见下载

arition 发表于 2021-1-11 18:39:28

本帖最后由 arition 于 2021-1-11 18:42 编辑

2021/01/11 版本更新 V0.4.0

新版使用了更新后的OCRV3模型。新的OCRV3模型相比旧的OCR模型来说运行速度更快,也更加准确。新模型使用的GPU内存较少,所以默认的批次大小从8个变更为32个。在Surface book 2笔记本上(i7-8650U,GTX 1060 Max-Q),新版本处理一段24分钟的视频只需要10分钟。
新版不需要以前的对象检测模型,也统一了CPU和GPU模型。
新的模型需要框选更准确的字幕边界,否则准确度会很差。下一个版本主要会优化视频解码和播放。
页: 1 2 [3] 4 5
查看完整版本: Freyja: 使用深度学习的视频硬字幕提取工具,更加方便的手抄字幕(21/01/11 更新,减少资源占用)