wudihongjing
发表于 2020-1-4 02:48:19
工具帖不应该被置顶吗?
amiemie666
发表于 2020-1-11 09:14:03
强大的大佬~赞~如果能遇到强大的队友协同作战,就完美了~
NoobNeo
发表于 2020-1-16 20:06:21
hitomae 发表于 2019-11-22 00:07
视频信息
General
第二次的错误和第一次的肯定不相同, 你没有贴出来, 新版本近期更新, 届时再试试
NoobNeo
发表于 2020-1-16 20:11:49
瞬间抛锚 发表于 2019-12-20 16:31
楼主你好,我发现即使帧间隔调成1帧,截取的时间轴还是不如esrXP的精确,不知道该怎么解决?
如图:
COCR 的时间轴是由 FFMpeg 直接返回的, 粗看了下 Aegisub 的源码, 不懂 C/C++语言, 盲猜? Aegisub 的时间码和 FFMpeg 不太一样导致的.暂时没有太大问题, 除非手抄的字幕是要匹配内嵌版的, 以后着手解决吧
Duang
发表于 2020-1-17 11:31:04
本帖最后由 Duang 于 2020-1-17 15:44 编辑
我有个想法,用无字幕视频和有字幕视频作差,然后提取差异较大画面的区间作为手抄字幕的时间点。
NoobNeo
发表于 2020-1-20 11:19:08
Duang 发表于 2020-1-17 11:31
我有个想法,用无字幕视频和有字幕视频作差,然后提取差异较大画面的区间作为手抄字幕的时间点。 ...
用这种方法来找时间轴的话有一个缺陷, opencv 是使用 ffmpeg 作为视频支持的, 从视频里比对图像, 就涉及到帧, 所以又回到了 帧 所在时间位置的问题
Duang
发表于 2020-1-20 19:12:42
本帖最后由 Duang 于 2020-1-20 19:23 编辑
NoobNeo 发表于 2020-1-20 11:19
用这种方法来找时间轴的话有一个缺陷, opencv 是使用 ffmpeg 作为视频支持的, 从视频里比对图像, 就涉及 ...
作差就是为了方便提取时间位置 https://paste.ubuntu.com/p/zGJ4BnNpfW/
不过这方法也挺麻烦的,如果两个开始视频时间不同还得手动调时间,而且有的视频中间丢帧到后面就对不齐了,不过这方法提取出来的时间精度还可以,提取出来的画面间隔基本上都是字幕,很少有非字幕的画面
NoobNeo
发表于 2020-1-20 20:19:13
本帖最后由 NoobNeo 于 2020-1-20 20:20 编辑
Duang 发表于 2020-1-20 19:12
作差就是为了方便提取时间位置 https://paste.ubuntu.com/p/zGJ4BnNpfW/
不过这方法也挺麻烦的,如果两个 ...
我以为你是考虑帧转时间的精度问题,理解偏差。做差取帧的方法,如你所说,要两个视频,且帧率,总帧数和时长要相同,不然会造成严重的偏差,另外视频比例也是不稳定因素,如果比例不吻合,字幕区域就匹配不上,做差也就没有意义了
Yukarubih
发表于 2020-1-30 09:22:43
做了2集战国 Collection,发现一直出现“中后期时轴不完全对应OCR之后的文本”!有几行时轴多出来(缺几行ocr该有的文本),不过我就是用这个工具提取时间轴的,倒是不影响!只是大大没出现这个问题吗?
NoobNeo
发表于 2020-1-30 10:03:40
Yukarubih 发表于 2020-1-30 09:22
做了2集战国 Collection,发现一直出现“中后期时轴不完全对应OCR之后的文本”!有几行时轴多出来(缺几 ...
是 Tesseract-ocr 没有识别出文本, 直接跳过了, 导致文本和时间轴错位. 我是在 'Caption OCR Tool' 中完成 OCR 错误修正后, 再导出 ass 字幕的.
我是这样进行手抄的, 仅供参考:
[*]先批处理全季字幕;
[*]对每个 cocr 文件进行合并 + OCR;
[*]把全季 OCR 结果分别复制到 文本编辑工具 (例如: Notepad++), 利用 文本编辑工具的 "查找和替换" 把所有明显错误的地方 (多余的标点, 空格, 明显错字之类的) 都去除;
[*]把替换后的内容复制回 'Caption OCR Tool' 的编辑框内, 再逐行修正, 文本编辑工具 中剩余集数同步替换修正, 这样越往后, 修正速度越快
页:
1
2
3
4
[5]
6
7
8
9
10
11
12
13
14