天空龙 发表于 2023-2-7 11:01:56

关于chatgpt翻译

这几天后知后觉的发现目前很火的chatgpt,又听说他翻译可以,于是就找人试了一下
目前有以下几个结论
1.主要是文本翻译,翻译以意译为主,还是需要校对,但是由于他是语言模型,语句通顺度还是可以
2.可以识别字幕格式,但是限制长度,通常10句就到头了,一般需要手动或者调用api写个脚本批量,或者使用付费的
3.可以识别字幕格式,让他只翻译字幕内容,不破坏代码,但是连续的话上下文关联可能很差,目前只推荐翻译日文字幕再修正,英文日语字幕偏差不小

天空龙 发表于 2023-2-7 11:31:32

Dialogue: 0,00:02:12.80,00:02:15.53,丹拜因日,,0,0,0,,这样的摩托旅行车并不好啊
Dialogue: 0,00:02:22.36,00:02:24.26,丹拜因日,,0,0,0,,富人不该干这种事
Dialogue: 0,00:02:24.63,00:02:26.73,丹拜因日,,0,0,0,,摩托越野比赛是很有勇气的
Dialogue: 0,00:02:28.16,00:02:29.43,丹拜因日,,0,0,0,,就放弃吧
Dialogue: 0,00:02:37.03,00:02:37.73,丹拜因日,,0,0,0,,哇啊
Dialogue: 0,00:02:41.26,00:02:41.86,丹拜因日,,0,0,0,,家伙
Dialogue: 0,00:02:44.06,00:02:44.53,丹拜因日,,0,0,0,,啊
Dialogue: 0,00:02:45.23,00:02:47.53,丹拜因日,,0,0,0,,啊 它消失了
Dialogue: 0,00:02:48.00,00:02:49.20,丹拜因日,,0,0,0,,怎么办,怎么办了
Dialogue: 0,00:03:08.16,00:03:12.20,丹拜因日,,0,0,0,,记得拜斯顿·韦尔的故事的人是幸福的
Dialogue: 0,00:03:14.00,00:03:16.83,丹拜因日,,0,0,0,,我们被记录着那些记忆
Dialogue: 0,00:03:17.26,00:03:19.43,丹拜因日,,0,0,0,,即使我们生在了这个世界上
Dialogue: 0,00:03:20.46,00:03:23.36,丹拜因日,,0,0,0,,却因拥有无法回忆的性格

Dialogue: 0,00:02:12.80,00:02:15.53,丹拜因日,,0,0,0,,そんなクルージングマシンに乗るなんて良くないよー
Dialogue: 0,00:02:22.36,00:02:24.26,丹拜因日,,0,0,0,,金持ちがやるもんじゃないんだよなあ
Dialogue: 0,00:02:24.63,00:02:26.73,丹拜因日,,0,0,0,,モトクロスってのは ハングリーなんだ
Dialogue: 0,00:02:28.16,00:02:29.43,丹拜因日,,0,0,0,,辞めちゃえってんだよ
Dialogue: 0,00:02:37.03,00:02:37.73,丹拜因日,,0,0,0,,うわああ
Dialogue: 0,00:02:41.26,00:02:41.86,丹拜因日,,0,0,0,,野郎
Dialogue: 0,00:02:44.06,00:02:44.53,丹拜因日,,0,0,0,,あ
Dialogue: 0,00:02:45.23,00:02:47.53,丹拜因日,,0,0,0,,わ き 消えた
Dialogue: 0,00:02:48.00,00:02:49.20,丹拜因日,,0,0,0,,ど どうしちまったんだろ
Dialogue: 0,00:03:08.16,00:03:12.20,丹拜因日,,0,0,0,,バイストン・ウェルの物語を覚えている者は 幸せである
Dialogue: 0,00:03:14.00,00:03:16.83,丹拜因日,,0,0,0,,私たちは その記憶を記されて
Dialogue: 0,00:03:17.26,00:03:19.43,丹拜因日,,0,0,0,,この地上に生まれて来たにも関わらず
Dialogue: 0,00:03:20.46,00:03:23.36,丹拜因日,,0,0,0,,思い出すことのできない性を 持たされたから

天空龙 发表于 2023-2-7 11:33:19

用openai是
Dialogue: 0,0:00:37.94,0:00:42.23,OP song JP,,0,0,0,,仲間のために 若さのために
Dialogue: 0,0:00:44.59,0:00:50.86,OP song JP,,0,0,0,,恐れずに立ち向かえ 悪い奴には
Dialogue: 0,0:00:51.18,0:01:04.80,OP song JP,,0,0,0,,愛と勇気をうばいとる ウラーの魔の手打ち破れ
Dialogue: 0,0:01:05.11,0:01:11.59,OP song JP,,0,0,0,,希望に満ちた あの宇宙の
Dialogue: 0,0:01:12.51,0:01:18.39,OP song JP,,0,0,0,,未来に向かう僕等の心
Dialogue: 0,0:01:18.79,0:01:25.02,OP song JP,,0,0,0,,守りぬこうぜ 力あわせて
Dialogue: 0,0:01:25.65,0:01:32.45,OP song JP,,0,0,0,,裂空 裂空 君も一緒さ
Dialogue: 0,0:01:32.70,0:01:41.46,OP song JP,,0,0,0,,学園特捜ヒカルオン

把上面的段落翻译成中文是:

为了我们的朋友,为了我们的青春,勇敢地面对恶劣的敌人,抢夺他们的爱与勇民,朝着那个充满希望的宇宙未来,我们一起守护它,裂空裂空,你也一起来,学园特搜组,Hikaruon!

天空龙 发表于 2023-2-7 11:36:25

# coding=utf8
import os
import openai
import jsonlines
import json

openai.api_key = os.getenv("OPENAI_API_KEY") #你的openai专用key

headers = []
inputfile = open ("input.txt", "r",encoding='UTF-8')
inputtxt = inputfile.readlines()
model_input=[]

for i in inputtxt:
        pos = i.find(",,")
        model_input.append(i)
        headers.append(i[:pos+2])

inputset = "Translate this into chinese line by line and keep the formating:\n\n"

for i in model_input:
        inputset += i
inputset += "\n\n"

#print(inputset)

response = openai.Completion.create(
model="text-davinci-003",
prompt=inputset,
temperature=0.3,
max_tokens=2000,
top_p=1.0,
frequency_penalty=0.0,
presence_penalty=0.0
)

#print(response.choices.text)

outfile = response.choices.text.split("\n")
del outfile
#print(outfile)
outtxt=[]

for i in range(len(headers)):
        outtxt.append(headers+outfile)

#outfile = response.choices.text
output = open("out.txt", "w",encoding='UTF-8')
for i in outtxt:
        output.write(i+"\n")
output.close()



另外简单写了个基于openai的,请大家看下
页: [1]
查看完整版本: 关于chatgpt翻译