关于chatgpt翻译

天空龙 发表于 2023-2-7 11:01:56

这几天后知后觉的发现目前很火的chatgpt,又听说他翻译可以，于是就找人试了一下
目前有以下几个结论
1.主要是文本翻译，翻译以意译为主，还是需要校对，但是由于他是语言模型，语句通顺度还是可以
2.可以识别字幕格式，但是限制长度，通常10句就到头了，一般需要手动或者调用api写个脚本批量，或者使用付费的
3.可以识别字幕格式，让他只翻译字幕内容，不破坏代码，但是连续的话上下文关联可能很差，目前只推荐翻译日文字幕再修正，英文日语字幕偏差不小

天空龙 发表于 2023-2-7 11:31:32

Dialogue: 0,00:02:12.80,00:02:15.53,丹拜因日,,0,0,0,,这样的摩托旅行车并不好啊
Dialogue: 0,00:02:22.36,00:02:24.26,丹拜因日,,0,0,0,,富人不该干这种事
Dialogue: 0,00:02:24.63,00:02:26.73,丹拜因日,,0,0,0,,摩托越野比赛是很有勇气的
Dialogue: 0,00:02:28.16,00:02:29.43,丹拜因日,,0,0,0,,就放弃吧
Dialogue: 0,00:02:37.03,00:02:37.73,丹拜因日,,0,0,0,,哇啊
Dialogue: 0,00:02:41.26,00:02:41.86,丹拜因日,,0,0,0,,家伙
Dialogue: 0,00:02:44.06,00:02:44.53,丹拜因日,,0,0,0,,啊
Dialogue: 0,00:02:45.23,00:02:47.53,丹拜因日,,0,0,0,,啊它消失了
Dialogue: 0,00:02:48.00,00:02:49.20,丹拜因日,,0,0,0,,怎么办，怎么办了
Dialogue: 0,00:03:08.16,00:03:12.20,丹拜因日,,0,0,0,,记得拜斯顿·韦尔的故事的人是幸福的
Dialogue: 0,00:03:14.00,00:03:16.83,丹拜因日,,0,0,0,,我们被记录着那些记忆
Dialogue: 0,00:03:17.26,00:03:19.43,丹拜因日,,0,0,0,,即使我们生在了这个世界上
Dialogue: 0,00:03:20.46,00:03:23.36,丹拜因日,,0,0,0,,却因拥有无法回忆的性格

Dialogue: 0,00:02:12.80,00:02:15.53,丹拜因日,,0,0,0,,そんなクルージングマシンに乗るなんて良くないよー
Dialogue: 0,00:02:22.36,00:02:24.26,丹拜因日,,0,0,0,,金持ちがやるもんじゃないんだよなあ
Dialogue: 0,00:02:24.63,00:02:26.73,丹拜因日,,0,0,0,,モトクロスってのはハングリーなんだ
Dialogue: 0,00:02:28.16,00:02:29.43,丹拜因日,,0,0,0,,辞めちゃえってんだよ
Dialogue: 0,00:02:37.03,00:02:37.73,丹拜因日,,0,0,0,,うわああ
Dialogue: 0,00:02:41.26,00:02:41.86,丹拜因日,,0,0,0,,野郎
Dialogue: 0,00:02:44.06,00:02:44.53,丹拜因日,,0,0,0,,あ
Dialogue: 0,00:02:45.23,00:02:47.53,丹拜因日,,0,0,0,,わ　き消えた
Dialogue: 0,00:02:48.00,00:02:49.20,丹拜因日,,0,0,0,,どどうしちまったんだろ
Dialogue: 0,00:03:08.16,00:03:12.20,丹拜因日,,0,0,0,,バイストン・ウェルの物語を覚えている者は幸せである
Dialogue: 0,00:03:14.00,00:03:16.83,丹拜因日,,0,0,0,,私たちはその記憶を記されて
Dialogue: 0,00:03:17.26,00:03:19.43,丹拜因日,,0,0,0,,この地上に生まれて来たにも関わらず
Dialogue: 0,00:03:20.46,00:03:23.36,丹拜因日,,0,0,0,,思い出すことのできない性を持たされたから

天空龙 发表于 2023-2-7 11:33:19

用openai是
Dialogue: 0,0:00:37.94,0:00:42.23,OP song JP,,0,0,0,,仲間のために若さのために
Dialogue: 0,0:00:44.59,0:00:50.86,OP song JP,,0,0,0,,恐れずに立ち向かえ悪い奴には
Dialogue: 0,0:00:51.18,0:01:04.80,OP song JP,,0,0,0,,愛と勇気をうばいとるウラーの魔の手打ち破れ
Dialogue: 0,0:01:05.11,0:01:11.59,OP song JP,,0,0,0,,希望に満ちたあの宇宙の
Dialogue: 0,0:01:12.51,0:01:18.39,OP song JP,,0,0,0,,未来に向かう僕等の心
Dialogue: 0,0:01:18.79,0:01:25.02,OP song JP,,0,0,0,,守りぬこうぜ力あわせて
Dialogue: 0,0:01:25.65,0:01:32.45,OP song JP,,0,0,0,,裂空裂空君も一緒さ
Dialogue: 0,0:01:32.70,0:01:41.46,OP song JP,,0,0,0,,学園特捜ヒカルオン

把上面的段落翻译成中文是：

为了我们的朋友，为了我们的青春，勇敢地面对恶劣的敌人，抢夺他们的爱与勇民，朝着那个充满希望的宇宙未来，我们一起守护它，裂空裂空，你也一起来，学园特搜组，Hikaruon！

天空龙 发表于 2023-2-7 11:36:25

# coding=utf8
import os
import openai
import jsonlines
import json

openai.api_key = os.getenv("OPENAI_API_KEY") #你的openai专用key

headers = []
inputfile = open ("input.txt", "r",encoding='UTF-8')
inputtxt = inputfile.readlines()
model_input=[]

for i in inputtxt:
pos = i.find(",,")
model_input.append(i)
headers.append(i[:pos+2])

inputset = "Translate this into chinese line by line and keep the formating:\n\n"

for i in model_input:
inputset += i
inputset += "\n\n"

#print(inputset)

response = openai.Completion.create(
model="text-davinci-003",
prompt=inputset,
temperature=0.3,
max_tokens=2000,
top_p=1.0,
frequency_penalty=0.0,
presence_penalty=0.0
)

#print(response.choices.text)

outfile = response.choices.text.split("\n")
del outfile
#print(outfile)
outtxt=[]

for i in range(len(headers)):
outtxt.append(headers+outfile)

#outfile = response.choices.text
output = open("out.txt", "w",encoding='UTF-8')
for i in outtxt:
output.write(i+"\n")
output.close()

另外简单写了个基于openai的，请大家看下

页: [1]

Anime字幕论坛's Archiver

关于chatgpt翻译