【Aegisub教程】注音字幕的做法（假名、汉字、英文等均可）

Seekladoom 发表于 2020-7-18 21:06:12

本帖最后由 Seekladoom 于 2020-7-19 10:11 编辑

【注音假名】
英文：http://docs.aegisub.org/3.2/Furigana_karaoke/
中文：https://aegi.vmoe.info/docs/3.2/Furigana_karaoke/

【syl furi的用法】
英文：http://docs.aegisub.org/3.2/Auto ... Template_modifiers/
中文：https://aegi.vmoe.info/docs/3.2/ ... Template_modifiers/
https://i.loli.net/2020/07/18/hFVtmN5n8zC9ROe.png

【日文汉字在线转罗马音、平假名、片假名】
http://www.kawa.net/works/ajax/romanize/japanese.html
不知道自己想要加注音假名的汉字的假名读法的话可以直接上这里看，然后把转化后的结果复制粘贴到字幕文件中去。

这个是用Aegisub自带的注音假名的功能做的，模板里面需要添加修饰语syl和furi，这两个一起用的时候才能把歌词和注音字幕都显示出来，注音的时候需要在对应的汉字后面加“|<”和对应的假名才能让Aeg识别，如果一个字的假名有两个或两个以上，这时候后面的假名也需要打K，并在K值后面加上“#|<”以后，再打假名才行。Comment: 2,0:00:00.00,0:00:00.00,OPJP,,0,0,0,template noblank syl furi,!retime("start2syl",($si-1)*30-200,0)!{\an5\pos($x,$y)\1c&H3767E6&\3c&HFFFFFF&\blur2\fad(200,0)}
Comment: 2,0:00:00.00,0:00:00.00,OPJP,,0,0,0,template noblank syl furi,!retime("syl",0,0)!{\an5\pos($x,$y)\blur2\1c&H3767E6&\3c&HFFFFFF&\t(0,$sdur,\1c&HFFFFFF&\3c&H3767E6&)}
Comment: 2,0:00:00.00,0:00:00.00,OPJP,,0,0,0,template noblank syl furi,!retime("syl2end",0,($si-1)*30+200)!{\an5\pos($x,$y)\blur2\fad(0,200)}
Comment: 0,0:00:01.00,0:00:06.03,OPJP,,0,0,0,karaoke,{\k34}き{\k32}み{\k32}の{\k29}声|<こ{\k30}#|<え{\k29}忘|<わ{\k30}#|<す{\k23}れ{\k17}な{\k20}い{\k0}　{\k26}涙|<な{\k26}#|<み{\k28}#|<だ{\k39}も{\k29}忘|<わ{\k30}#|<す{\k20}れ{\k17}な{\k12}いhttps://i.loli.net/2020/07/18/GfSgDkyYTzN4U7j.png

汉字、英文等做法更简单，直接把假名所在的位置换成汉字、英文等文本即可。
补充说明一下，日本文化当中有读作XX，写作YY的做法，比如某科学的超电磁炮中，作者在原作小说中就把超电磁炮写作Railgun了（不少动画的OPED歌词中也有这种做法，用好了情感激发效果会相当强大），具体操作如下：Comment: 2,0:00:00.00,0:00:00.00,CN,,0,0,0,template noblank syl furi,!retime("line",0,0)!{\an5\pos($center,$middle)\blur2)}Comment: 0,0:00:00.00,0:00:01.00,CN,,0,0,0,karaoke,{\k100}超电磁炮|<Railgun
https://i.loli.net/2020/07/18/bIWD764zvhjiVHu.png

关于注音字幕这点进一步深挖其艺术创作上的可能性的话，还可以试着这么玩（以下文本纯属自嗨，仅供参考），希望能够鼓舞更多字幕组和汉化组的朋友们，不局限于翻译、特效、校对这几个职位，希望其他职位（海报、发布、压制等）也能用上：
https://i.loli.net/2020/07/18/21sR3uH9F7jIiUt.png
https://i.loli.net/2020/07/18/XbyKA2DYMN3G7BH.png
https://i.loli.net/2020/07/18/NEgdxlIcbBw2yoC.png

补充：目前我还没有碰到过能自动把日文汉字的假名根据语境标注出来的工具，希望以后语音识别和文本翻译这块的技术发达了能有人把这种东西做出来。。。_(:з」∠)_

Seekladoom 发表于 2020-7-18 22:12:05

本帖最后由 Seekladoom 于 2020-7-18 22:20 编辑

特效这个职位是字幕组当中二次创作属性最强的职位，做得好的特效的强大的视觉效果如果和翻译结合起来将产生令人无法想象的情感激发作用，把握得当的话可以继续扩大字幕圈子的人脉，并激发圈子活力！

此外，特效也是字幕组中除压制外早就具备了大批量自动化的物质基础的职位，虽然翻译很重要，但我个人还是希望优先把能工业化、自动化的事情给先做了，再做其他职位的事，这样不仅能减轻字幕组的工作压力，同时还能提升字幕组的工作效率和质量。{:4_684:}

有兴趣的朋友可以翻翻我的B站相簿，我之前也提到了时轴和翻译这块工业化、自动化的可能性的想法：
https://space.bilibili.com/5423735/album

ssnake 发表于 2020-7-18 22:12:47

本帖最后由 ssnake 于 2020-7-18 22:36 编辑

回答最后一个问题：

根据语境标注需要的是形態素解析

python lib:
https://mocobeta.github.io/janome/

web API:
https://maapi.net/
https://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html （例： https://tool.stabucky.com/convert/kanji2kana.php）
https://labs.goo.ne.jp/api/jp/morphological-analysis/ （例： https://qiita.com/mininobu/items/4bae484ed368b7a35be5）

等等。这些输出基本都是 MeCab Format（前两个应该是直接用 MeCab 的），算是好用吧。
不过这么想直接用 MeCab （https://taku910.github.io/mecab/）也不错……

当然 100% 正确是不可能的，因为日语本来就有各种当て字（读作XX，写作YY，比如 Railgun 绝对不会有哪个能跟你标出来ry）（不一定是中二/艺术表现，或者说日本文化本来就中二），另外浊化也是靠形態素解析做不好的地方。
各种怪异的当て字可以参考 https://furigana.info/

P.S. 只是自己用的话， Excel 的 PHONETIC 函数（虽然没有语义识别，但精度还说得过去，而且毕竟都是要人校对的明显不对的一眼就能看出来）：
https://support.microsoft.com/ja ... 8-9a55-639086988554
（Word 等其他 Office 应用也有类似功能）

P.S.2. 日语的语音识别的话，阿里云的性能（速度和精度）可能是现在最好的（当然依然没到实用程度）。
翻译要自动化工业化还是太难（而且也丧失太多意义了，做到工业化的程度就不叫 FANSUB 了），不过至少轴还是有希望的……

NF-GL 发表于 2020-7-19 06:10:16

本帖最后由 NF-GL 于 2020-7-19 07:09 编辑

【syl furi的用法】
中英文的链接放反了

ps：个人也的确希望自动化程度再高一些（在机械重复性工作上花费大量时间实在是浪费生命

客观来说，在目前的技术水平下，时轴、特效、压制等，在一定/相当程度上可以实现自动化（人工甚至只需要作为补充
但翻译/校对这类工作，基本是无法取代的（至少在近些年
毕竟如今的AI都是机械性翻译——基于数据库和算法上的对应规则，故而其译文没什么感情色彩（所以只适合政府发言人或官媒
eg:
白い雪が降り積もれば——如果白雪堆积的话——皑皑白雪累累堆叠
包み隠すの悲しみの色——隐藏着悲伤的颜色——潸潸作别哀哀欲绝（ssnake译本——from efS2）
原句————百度翻译————人工翻译（虽说例子极端了点，但就是这个道理
最主要的是，如果真被完全取代了，我们不就丧失了人生的一大乐趣吗{:4_684:}

Seekladoom 发表于 2020-7-19 10:08:33

本帖最后由 Seekladoom 于 2020-7-19 12:06 编辑

NF-GL 发表于 2020-7-19 06:10
【syl furi的用法】
中英文的链接放反了

嗨呀，这部分时间省下来了，咱们不就可以往其他领域扩展了吗？让大家更早地从字幕制作的重担中解脱出来，不就可以去玩更多其他有意思的东西了吗？{:4_684:}

我记得当年（2015年之前）的部分字幕组甚至还有MAD组、配音组等衍生组织，而不是衰退到现在这样，不少组连做字幕都难以为继。。。_(:з」∠)_
而且MAD圈那边我都看到有人搞一键MAD生成器这种东西出来了，在一定程度上按照剧本、分镜（事实上稍微有点阅历的死宅都能自己根据新番题材去具体分类了，甚至根据动画制作公司、编集（没错就是这个职位在管OPED的字体）、制作进行、系列构成、监督等人的工作习惯制定相应的工作模型）等去根据现有素材进行自动化拼接工作！{:4_684:}

B站搜”一键MAD“：
https://search.bilibili.com/all?keyword=%E4%B8%80%E9%94%AEMAD

深入剖析日本业界的话，这点上大家可以看看动画魂-Anitama的B站专栏：
https://space.bilibili.com/11357018/article

动画与音乐的关系（这部分适合做日本动画OPED歌词特效的朋友们反复看）
https://www.bilibili.com/read/readlist/rl150162

Seekladoom 发表于 2020-7-19 10:31:04

ssnake 发表于 2020-7-18 22:12
回答最后一个问题：

根据语境标注需要的是形態素解析

感谢蛇大分享经验，这部分以后对自动翻译很有好处啊，如果真搞定了，以前积压的一些冷番字幕也能靠自动化把坑给迅速填上了。。。_(:з」∠)_

NF-GL 发表于 2020-7-19 11:15:55

Seekladoom 发表于 2020-7-19 10:08
嗨呀，这部分时间省下来了，咱们不就可以往其他领域扩展了吗？让大家更早地从字幕制作的重担中解脱出来， ...一键MAD太魔鬼了，起码翻译的乐趣不要夺走啊（别的时间省下来我双手赞成

顺便表示感谢（正在纠结つき/つきあって的翻译问题呢，帮了大忙

Takuya_kun 发表于 2020-7-19 13:18:41

NF-GL 发表于 2020-7-19 11:15
一键MAD太魔鬼了，起码翻译的乐趣不要夺走啊（别的时间省下来我双手赞成

顺便表示感谢（正在纠结つき/つき ...

哇~用心了~感谢制作，期待成品字幕！

Seekladoom 发表于 2020-11-1 19:29:01

ssnake 发表于 2020-7-18 22:12
回答最后一个问题：

根据语境标注需要的是形態素解析

卧槽蛇大NB啊，成神之日第4话就涉及到形态素解析了！{:4_685:}

ssnake 发表于 2020-11-2 21:41:47

Seekladoom 发表于 2020-11-1 19:29
卧槽蛇大NB啊，成神之日第4话就涉及到形态素解析了！
B站直接把汉字转写了啊，虽然确实国内NLP领域也没有固定的译法（但是应该没人用「形态素解析」）。

所以我是意译「词法分析」（知网里关键词检索数量最高的译法）加上Ruby「morphological analysis」。

P.S. 对我来说更有意思的是那个兴梠-浅间 model algorithm ，不知道能不能猜中这是哪个语言学模型……
P.S.2. 不过这话打了一整话尬麻将，NLP完全没展开（ry

页: [1]

Anime字幕论坛's Archiver

【Aegisub教程】注音字幕的做法（假名、汉字、英文等均可）