找回密码
 立即注册
查看: 1446|回复: 3

【自动翻译相关】Python 自然语言处理相关库

  • TA的每日心情
    开心
    2022-1-29 18:58
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    184

    主题

    414

    回帖

    585

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    549470

    崭露头角活跃达人新人登场

    Seekladoom 发表于 2021-1-12 08:56:12 | 显示全部楼层 |阅读模式
    本帖最后由 Seekladoom 于 2021-1-12 13:33 编辑

    ​首先成神之日第4话(1分28秒开始)截图镇帖:

    :有兴趣的朋友可以持续关注这块,看看以后现实世界中真正完美的“兴梠-浅间模型算法”到底是下面github开源项目的哪个NLP,抑或是别的地方的NLP库。

    为了解决字幕组翻译和校对人手短缺(越来越多的人扛不住三次元爆炸)的问题,这里我把github上的Python 自然语言处理相关库搬运过来了。

    英文链接:
    https://github.com/vinta/awesome-python#natural-language-processing
    中文链接:
    https://github.com/jobbole/awesome-python-cn

    常年看日本动画字幕的观众和字幕组朋友们应该都知道,像一些对话比较简单的【日常番】,对话的词汇量和文法也就那么多,翻译得多了以后,再做类似的片子可以很快就想到这片子该怎么翻译。【少数有大量梗】的日常番,也可以把【比较简单的对白部分】和【较为复杂的梗部分】分开,来精准把握一部番的翻译质量,目前我看到的做得好的校对几乎都有这种习惯。其他类型的日本动画也可以根据相应的风格和场景(包括各种细化的地方)以此类推。

    实操过程中个人建议配合【思维导图】把握各个组成部分的【难易度】,这样管理出来的效率和质量也会高得多,做到又快又好。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    一个对动画组来说真正耐用的中文字体应该具备哪些条件?
    https://bbs.acgrip.com/forum.php?mod=viewthread&tid=5310

    使用思源字体在Aegisub中制作字幕时的一些常见问题
    https://bbs.acgrip.com/forum.php?mod=viewthread&tid=3805
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2022-1-29 18:58
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    184

    主题

    414

    回帖

    585

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    549470

    崭露头角活跃达人新人登场

    Seekladoom  楼主| 发表于 2021-1-12 09:01:08 | 显示全部楼层
    另外,这圈子其实已经有一个现成的适合作为训练库的资源了,也就是——U2字幕库:
    链接:https://pan.baidu.com/s/1Gtwo6_8T7qthu93u7NZuug
    提取码:9oa5
    一个对动画组来说真正耐用的中文字体应该具备哪些条件?
    https://bbs.acgrip.com/forum.php?mod=viewthread&tid=5310

    使用思源字体在Aegisub中制作字幕时的一些常见问题
    https://bbs.acgrip.com/forum.php?mod=viewthread&tid=3805
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-7-20 12:47
  • 签到天数: 278 天

    [LV.8]以坛为家I

    26

    主题

    397

    回帖

    455

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    394360

    新人登场崭露头角渐入佳境活跃达人

    橙兜酱 发表于 2021-1-14 13:09:40 | 显示全部楼层
    Seekladoom 发表于 2021-1-12 09:01
    另外,这圈子其实已经有一个现成的适合作为训练库的资源了,也就是——U2字幕库:
    链接:https://pan.baidu. ...

    U2的字幕全部扒下来了??

    动画年鉴-统计表 (notion.so)
    动画年鉴网盘目录 (xido.workers.dev)

    欢迎参观,如果想一起收集整理的话可以在统计表主页找我联系方式~
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2022-1-29 18:58
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    184

    主题

    414

    回帖

    585

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    549470

    崭露头角活跃达人新人登场

    Seekladoom  楼主| 发表于 2021-1-14 13:55:23 | 显示全部楼层
    橙兜酱 发表于 2021-1-14 13:09
    U2的字幕全部扒下来了??

    不是全部,是早几年别的老哥整理的,时间的话应该是持续到2014年。
    一个对动画组来说真正耐用的中文字体应该具备哪些条件?
    https://bbs.acgrip.com/forum.php?mod=viewthread&tid=5310

    使用思源字体在Aegisub中制作字幕时的一些常见问题
    https://bbs.acgrip.com/forum.php?mod=viewthread&tid=3805
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表