tonyhsie 发表于 2020-10-15 04:19:53

現在還有字幕組會做假名字幕嗎



諸神字幕組曾經做了不少假名字幕,不過他們後來似乎有困難,就中止了


最近我有點興趣,就研究了一下如何由日文字幕自動產生出假名字幕

自己寫了一個程式,透過 gooラボ 提供的 API,目前已經可以自動產生出類似諸神這種效果的字幕了


不過這種機器轉換的假名字幕,仍需要人工最後再做修正的工作

因為 API 轉換的假名,大部分都跟人工翻譯一樣,但仍有小部分 (< 10%) 可能是錯誤的,需要人工確認結果再修正



(左:諸神字幕、右:API 字幕)

但透過機器轉換,能大幅降低製作假名字幕的難度跟時間,只剩下修正的工夫而已


不曉得現在還有沒有字幕組有興趣做假名字幕?

我有在諸神字幕組的網站留言,不過不曉得他們會不會去看就是了


附檔是 API 產生出來的樣本字幕、和比對用的諸神字幕(夏目友人帳 S4 OAD 貓咪老師初次跑腿)

有興趣可以下載回去看看

千恋万花 发表于 2020-10-15 07:18:24

本帖最后由 千恋万花 于 2020-10-15 07:28 编辑

主要还是后期人工修正费时费力(受众也不是很多),换个字体或者同一字体版本不同都有可能导致标注的假名位置跑偏;遇上假名长的,生成的假名可能会重叠(例ご注文承りました),要调整字间距(参考word注音对这种的处理)、或横向压缩假名字符(用\fscx一类的)、或直接把汉字换成假名书写等来避免(这种应该能想办法通过程序实现)

Yukata 发表于 2020-10-15 07:57:07

这个工程太大了。。。{:4_679:}

现在动画好多都写作“情报管理员?” 读作“人口贩子”这种。

菜姬 发表于 2020-10-15 08:29:00

domo有个lua专门做这个来着

ssnake 发表于 2020-10-15 08:39:52

我之前提过一次形態素解析,这些ひらがな化API是属于其的一个应用。
根据我(看论文)的印象,精度大概也就是90%上下吧……

其实更重要的问题是,注音字幕真的有需要吗?

阅读书籍、报刊之类的时候,没有人配音,确实有时候会对读法感到困惑。
但是字幕的对象是音视频媒体,会有演员 / 配音演员把这句话读出来。除了个别特殊的当て字(这种也不能自动)之外,我个人感觉不存在注音的需求。

Seekladoom 发表于 2020-10-15 22:33:17

本帖最后由 Seekladoom 于 2020-10-15 22:35 编辑

【Aegisub教程】注音字幕的做法(假名、汉字、英文等均可)
https://bbs.acgrip.com/forum.php?mod=viewthread&tid=6319

之前Vmoe有建一个卡拉OK搜索引擎,里面的歌词全都有假名:
http://karaoke.vmoe.info/

tonyhsie 发表于 2020-10-16 03:55:47

千恋万花 发表于 2020-10-15 07:18
主要还是后期人工修正费时费力(受众也不是很多),换个字体或者同一字体版本不同都有可能导致标注的假名位 ...

>> 主要还是后期人工修正费时费力(受众也不是很多),

的確如此

>> 换个字体或者同一字体版本不同都有可能导致标注的假名位置跑偏;


這些都是程式已經可以處理的


>> 遇上假名长的,生成的假名可能会重叠(例ご注文承りました),要调整字间距(参考word注音对这种的处理)、或横向压缩假名字符(用\fscx一类的)、
目前是不會有這個問題,但卻是因為程式沒辦法分辨一串漢字裡要怎麼分組 {:4_686:}

像你的例句「注文承」的部分應該要分成「注文」「承」兩個部分,但目前程式只會看成把「注文承」三個漢字當成同一組

既然當成同一組,暫時就沒有假名會重疊的問題了 {:4_675:}



這部分的確是只能靠人工後處理了

但過長的假名,發生的機率應該不會太高就是了


>> 或直接把汉字换成假名书写等来避免(这种应该能想办法通过程序实现)





這樣就純粹是假名而已,反而沒有漢字了


{:4_684:}

tonyhsie 发表于 2020-10-16 04:04:04

本帖最后由 tonyhsie 于 2020-10-16 04:06 编辑

ssnake 发表于 2020-10-15 08:39
我之前提过一次形態素解析,这些ひらがな化API是属于其的一个应用。
根据我(看论文)的印象,精度大概也就 ...
需要的人應該還是有的

如果完全沒需求,諸神之前應該也不會花許多心力在這種字幕上


但也誠如大家說的,市場不大就是了





tonyhsie 发表于 2020-10-16 04:05:57

Seekladoom 发表于 2020-10-15 22:33
【Aegisub教程】注音字幕的做法(假名、汉字、英文等均可)
https://bbs.acgrip.com/forum.php?mod=viewthre ...

之前有看過這篇
但我自己的理解,這個是要手動輸入假名?

還是我理解錯誤了....

千恋万花 发表于 2020-10-16 12:25:37

tonyhsie 发表于 2020-10-16 03:55
>> 主要还是后期人工修正费时费力(受众也不是很多),

的確如此


>> 换个字体或者同一字体版本不同都有可能导致标注的假名位置跑偏;
這些都是程式已經可以處理的
<主要针对外挂字幕>字体问题主要是观众方,观众必须安装指定的字体(字体版本最好还要跟字幕制作者一样)才能正确显示,否则有可能出现假名位置跑偏的情况;观众心血来潮想换个字体也有可能导致假名位置跑偏;也有一开始附了正确的字体包,但字幕经过几手转载后,字体包丢失的情况。
我也见过很多从不装字体的观众{:13_959:}


页: [1] 2
查看完整版本: 現在還有字幕組會做假名字幕嗎