本帖最后由 MingY 于 2025-3-31 14:59 编辑
最近大模型一直很火,正好有部 AI 动画『ツインズひなひま』,就想着拿它试试 AI 翻译靠不靠谱。 为了搞清楚这个问题,我测试了好几个主流的大模型。结果嘛……目前 AI 还远远称不上胜任。
测试模型
字幕 | 模型 | 调用方式 | ChatGPT | GPT 4o | 网页 | Claude | Claude 3.7 Sonnet | 网页 | DeepSeek | DeepSeek R1 | API | Doubao | Doubao 1.5 pro | API | Gemini | Gemini 2.0 Flash Thinking (experimental) | 网页 | Grok | Grok 3 | 网页 | Qwen | Qwen 2.5 Max | API
|
得分
纯主观判断
字幕 | 得分 | 对白 (80%) | OP (10%) | ED (10%) | 综合 | ChatGPT | 7 | 7 | 8 | 7.1 | Claude | 8 | 4 | 7 | 7.5 | DeepSeek | 6 | 6 | 7 | 6.1 | Doubao | 7 | 6 | 7 | 6.9 | Gemini | 5.5 | 6 | 6 | 5.6 | Grok | 6 | 5 | 7 | 6.0 | Qwen | 5 | 5 | 6 | 5.1 |
其他的细节
这个字幕的“含人量”其实很高,字幕的时间轴、说话人都是手动打的,日字是官方台本修改的
具体的提示词就不放了,大致包含:动画简介,人物介绍,字幕的时间轴、说话人、台词
整体来看,AI 的表现问题还挺多的:不按要求的格式输出;即使给了说话人,AI 还是会搞错主语;翻译不太连贯
台词和音乐歌词是分开翻译的,翻译内容没有改动,但格式有调整(替换标点符号之类的)
翻出来的结果不算很好,可能提示词写得不行吧
|