arition
发表于 2020-11-29 21:18:18
vbr9d 发表于 2020-11-29 20:25
并不是楼上,提供一下我不能打开的视频
搬运的baha源视频全部时间轴都会异常地长,尝试把视 ...
Lilith-Raws搬运的视频的视频合并都有点问题,导致合并出来的帧数不太对。目前按照我说明里写的用ffmpeg转码一遍就行了,remux没用。然后那个crash问题,可以尝试调整裁剪大小,多试几次就能成功。
除开crash的问题,我看了一下你这个截图,这种字体我没有训练过,所以估计识别出来结果会很差。如果你知道这是什么字体的话可以告诉我,我下次训练的时候加入这个字体
AsexualityK
发表于 2020-11-29 21:24:57
{:12_852:}太难了 显卡不匹配 慢出天际
vbr9d
发表于 2020-11-29 22:23:54
arition 发表于 2020-11-29 21:18
Lilith-Raws搬运的视频的视频合并都有点问题,导致合并出来的帧数不太对。目前按照我说明里写的用ffmpeg ...
嗯,基本上都是要转码才能用{:8_708:}
黑五那个我调了好几遍都没用,字体我也不知道,不过我也就测试用,这种字体做字幕很少见,没什么必要特地训练一个了
softfuttery
发表于 2020-11-30 08:33:31
arition 发表于 2020-11-29 19:38
能给个无法打开的视频的例子嘛?任意一个都行,给个链接啥的,不方便公开的话可以私信 ...
就是随便从b站找一段视频下载,转成mp4,还是打不开,包括从vcb下载的的暗杀教室也是,只会显示最开始的一段图片,怀疑是调度问题吧,显卡根本没在工作
https://vcb-s.com/archives/13457
b站的是下了这个第八集
https://www.bilibili.com/bangumi/play/ss34230/
xfdz
发表于 2020-11-30 08:38:37
手抄字幕进入人工智能时代!
web0316
发表于 2020-11-30 11:25:54
arition
发表于 2020-11-30 15:04:52
web0316 发表于 2020-11-30 11:25
macOS 那个models 放哪里啊?
MacOS版现在没法用,下一版会修复
silly1stupid
发表于 2020-11-30 19:14:33
好……好猛
arition
发表于 2020-12-1 14:12:53
softfuttery 发表于 2020-11-30 08:33
就是随便从b站找一段视频下载,转成mp4,还是打不开,包括从vcb下载的的暗杀教室也是,只会显示最开始的一 ...
这个版本应该修复了mkv的视频时间问题,可以试一下
fix duration on mkv sources · freyjaSubOCR/freyja-sub-ocr-electron@2ad0c51 (github.com)
可能需要登录github账号才能看见下载
arition
发表于 2021-1-11 18:39:28
本帖最后由 arition 于 2021-1-11 18:42 编辑
2021/01/11 版本更新 V0.4.0
新版使用了更新后的OCRV3模型。新的OCRV3模型相比旧的OCR模型来说运行速度更快,也更加准确。新模型使用的GPU内存较少,所以默认的批次大小从8个变更为32个。在Surface book 2笔记本上(i7-8650U,GTX 1060 Max-Q),新版本处理一段24分钟的视频只需要10分钟。
新版不需要以前的对象检测模型,也统一了CPU和GPU模型。
新的模型需要框选更准确的字幕边界,否则准确度会很差。下一个版本主要会优化视频解码和播放。