默沨
发表于 2023-7-5 12:20:57
1362513713 发表于 2023-7-5 11:54
srt泛用性挺高的,甚至能导进pr里。
确实,不过转lrc不如直接输出text with timestamp{:4_684:}
1362513713
发表于 2023-7-5 12:38:59
拿平家物语sp里山田老师十七分钟的采访试了一下,大佬这套方案可靠性确实NB。
别的不说,能把收音范围以外微弱的记者提问也识别出来,可以说相当强悍了,毕竟从波形来看记者那两句话和背景噪声没有任何区别,甚至粗听起来也和噪声没有区别。
准确度可以说相当不错了,这么长的视频,比较离谱的错误也就下面三个:
【叙事詩】识别成了【女子誌】
【叙情詩】识别成了【女女誌】
【死生観】识别成了【姿勢感】(生艹得很233333)
都是发音差不多的单词的锅,没有整段垮掉的情况出现。
山田老师接受采访普遍表现得比较腼腆,讲话的节奏会比较迷一点,AI生成的字幕在这种条件下也只有连在一起的几个长难句断句不理想,不过这个怪不得AI,那几段话就很迷,我手调的时候也觉得断句费老劲了{:10_787:}。
因为采访视频画面里有官方制作的部分日文字幕,可以和AI生成的字幕形成对照。你会发现AI识别的日文字幕与官方配出的字幕从内容到断句的契合度都是很高的,比较流畅的中短句甚至是一模一样。
这个十七分钟采访里AI表现唯一称得上不足的地方,是识别出的单行字幕有时会过长(可能是山田老师断句比较迷的锅2333),而且单行字幕的文本不会在语音有停顿的地方添加空格,单看长文字有一种没有标点的蛋疼感。这也是大佬这套AI识别方案里唯一需要手调的地方,其它堪称完美。
谢大佬让我实现生肉了自由{:10_1016:},感激不尽(づ~3~)づ╭❤~
Q1124357920
发表于 2023-7-5 12:39:09
本帖最后由 Q1124357920 于 2023-7-5 12:40 编辑
=-=--=-=-=-
肖恩马里奥
发表于 2023-7-5 17:38:40
默沨 发表于 2023-7-5 10:23
试了试这准确性完全ok
这东西似乎也能用来生成歌词,输出带时间戳的文本可以直接用,试了下foobar2000可以 ...
这么厉害的嘛 我好多歌冷门的 网上没歌词 看来可以搞一下歌词了
与中酱
发表于 2023-7-6 00:52:20
孤雨独火 发表于 2023-7-5 00:49
你都有磁链了为什么还要人带种子???
我还是喜欢保存一份种子文件比较安心,万一再遇到上不去官网的情况,还是有种子来安慰(自从遇上上次官网打不开后,我基本都是下一份种子备份一次对应的官网介绍),磁链一次都没用过,我现在倒是可以直链ACG来下载种子,也不是次次麻烦同学的
乂熊貓乂
发表于 2023-7-6 21:30:25
有沒有不限字數的CHATGPT 推薦
字幕太長 都不能一次翻譯
AsexualityK
发表于 2023-7-7 07:14:12
A卡可以用吗?没GPU
渣渣飞
发表于 2023-7-7 14:14:53
AI 越来越NB真好 指不定哪天就能实时翻译了
huburr
发表于 2023-7-7 17:26:19
有用 好评
syochan
发表于 2023-7-8 14:34:18
生成出的日语文本里面时常会有大段的无关内容,正常的对话却没有识别出来。有遇到过吗?
Dialogue: 0,1:53:48.16,1:53:50.16,Default,,0,0,0,,明日は
Dialogue: 0,1:53:50.16,1:53:52.16,Default,,0,0,0,,明日は
Dialogue: 0,1:53:52.16,1:53:54.16,Default,,0,0,0,,明日は
Dialogue: 0,1:53:54.16,1:53:56.16,Default,,0,0,0,,明日は
Dialogue: 0,1:53:56.16,1:53:58.16,Default,,0,0,0,,明日は
Dialogue: 0,1:53:58.16,1:54:00.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:00.16,1:54:02.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:02.16,1:54:04.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:04.16,1:54:06.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:06.16,1:54:08.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:08.16,1:54:10.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:10.16,1:54:12.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:12.16,1:54:14.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:14.16,1:54:16.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:16.16,1:54:18.16,Default,,0,0,0,,明日は
Dialogue: 0,1:54:18.16,1:54:20.16,Default,,0,0,0,,明日は