【自动翻译相关】Python 自然语言处理相关库

Seekladoom 发表于 2021-1-12 08:56:12

本帖最后由 Seekladoom 于 2021-1-12 13:33 编辑

首先成神之日第4话（1分28秒开始）截图镇帖：
注：有兴趣的朋友可以持续关注这块，看看以后现实世界中真正完美的“兴梠-浅间模型算法”到底是下面github开源项目中的哪个NLP库，抑或是别的地方的NLP库。
为了解决字幕组翻译和校对人手短缺（越来越多的人扛不住三次元爆炸）的问题，这里我把github上的Python 自然语言处理相关库搬运过来了。
英文链接：https://github.com/vinta/awesome-python#natural-language-processing中文链接：https://github.com/jobbole/awesome-python-cn
常年看日本动画字幕的观众和字幕组朋友们应该都知道，像一些对话比较简单的【日常番】，对话的词汇量和文法也就那么多，翻译得多了以后，再做类似的片子可以很快就想到这片子该怎么翻译。【少数有大量梗】的日常番，也可以把【比较简单的对白部分】和【较为复杂的梗部分】分开，来精准把握一部番的翻译质量，目前我看到的做得好的校对几乎都有这种习惯。其他类型的日本动画也可以根据相应的风格和场景（包括各种细化的地方）以此类推。
实操过程中个人建议配合【思维导图】把握各个组成部分的【难易度】，这样管理出来的效率和质量也会高得多，做到又快又好。

Seekladoom 发表于 2021-1-12 09:01:08

另外，这圈子其实已经有一个现成的适合作为训练库的资源了，也就是——U2字幕库：
链接:https://pan.baidu.com/s/1Gtwo6_8T7qthu93u7NZuug
提取码:9oa5

橙兜酱 发表于 2021-1-14 13:09:40

Seekladoom 发表于 2021-1-12 09:01
另外，这圈子其实已经有一个现成的适合作为训练库的资源了，也就是——U2字幕库：
链接:https://pan.baidu. ...

U2的字幕全部扒下来了？？

Seekladoom 发表于 2021-1-14 13:55:23

橙兜酱发表于 2021-1-14 13:09
U2的字幕全部扒下来了？？
不是全部，是早几年别的老哥整理的，时间的话应该是持续到2014年。

页: [1]

Anime字幕论坛's Archiver

【自动翻译相关】Python 自然语言处理相关库