Seekladoom 发表于 2021-1-12 08:56:12

【自动翻译相关】Python 自然语言处理相关库

本帖最后由 Seekladoom 于 2021-1-12 13:33 编辑

​首先成神之日第4话(1分28秒开始)截图镇帖:
注:有兴趣的朋友可以持续关注这块,看看以后现实世界中真正完美的“兴梠-浅间模型算法”到底是下面github开源项目中的哪个NLP库,抑或是别的地方的NLP库。
为了解决字幕组翻译和校对人手短缺(越来越多的人扛不住三次元爆炸)的问题,这里我把github上的Python 自然语言处理相关库搬运过来了。
英文链接:https://github.com/vinta/awesome-python#natural-language-processing中文链接:https://github.com/jobbole/awesome-python-cn
常年看日本动画字幕的观众和字幕组朋友们应该都知道,像一些对话比较简单的【日常番】,对话的词汇量和文法也就那么多,翻译得多了以后,再做类似的片子可以很快就想到这片子该怎么翻译。【少数有大量梗】的日常番,也可以把【比较简单的对白部分】和【较为复杂的梗部分】分开,来精准把握一部番的翻译质量,目前我看到的做得好的校对几乎都有这种习惯。其他类型的日本动画也可以根据相应的风格和场景(包括各种细化的地方)以此类推。
实操过程中个人建议配合【思维导图】把握各个组成部分的【难易度】,这样管理出来的效率和质量也会高得多,做到又快又好。

Seekladoom 发表于 2021-1-12 09:01:08

另外,这圈子其实已经有一个现成的适合作为训练库的资源了,也就是——U2字幕库:
链接:https://pan.baidu.com/s/1Gtwo6_8T7qthu93u7NZuug
提取码:9oa5

橙兜酱 发表于 2021-1-14 13:09:40

Seekladoom 发表于 2021-1-12 09:01
另外,这圈子其实已经有一个现成的适合作为训练库的资源了,也就是——U2字幕库:
链接:https://pan.baidu. ...

U2的字幕全部扒下来了??

Seekladoom 发表于 2021-1-14 13:55:23

橙兜酱 发表于 2021-1-14 13:09
U2的字幕全部扒下来了??
不是全部,是早几年别的老哥整理的,时间的话应该是持续到2014年。
页: [1]
查看完整版本: 【自动翻译相关】Python 自然语言处理相关库