找回密码
 立即注册
楼主: tonyhsie

b站字幕大全集 (~2024/1/8)

该用户从未签到

3

主题

270

回帖

680

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
1068247
ssnake 发表于 2022-1-3 22:04:50 | 显示全部楼层
本帖最后由 ssnake 于 2022-1-3 22:23 编辑
StarRingChild 发表于 2022-1-3 19:40
甘城这 srt 是由 ass 转来的吗?

@tonyhsie 这个是 ass drawing 吧,据说(我已经快10年没看了)B站是有些字幕用了 ass drawing 的。

如果B站串流就是 ass 格式(播放时用 js 之类的渲染),这种类型最好还是保留 ass 格式(因为没有别的字幕格式有这个功能)。

应该可以写一个函数判断:如果一个字幕里包含「\p[int]」字符串,那么就将之保留为 ass 格式。
「\p[int]」不和 ass 中任何其他 tag 重叠(比如只检索 \p 的话会撞上 \pos ),一般也不会出现在翻译正文中,应该是一个可靠的 trigger 。
(顺便完全符合 ass spec 的话必须以「{\p[1-4]}m」(记得 VSFilter 2.2x 时代只有1到4,现在已经可以无限大了)开头,「{\p0}」结尾;不过因为 ass 的 implemetation 基本都强调 robustness 所以我就没怎么见过完全符合规范的)

-----

Edit:忘了 macOS 里 \ 和 ¥ 不是一个字符了(
再多一句嘴,虽然我不知道B站用 ass drawing 干了什么,不过我个人有的时候会用这个来做一些特殊文字(比如约定的梦幻岛里不能用人类语言发音/表达的「鬼的顶点」)。

点评

其實我的 ListAssFonts 就是一個 ass parser,所以把這些ass語法判斷寫成程式碼,並不是什麼問題。問題只在於,有沒有這麼做的必要而已  发表于 2022-1-3 22:57
回复

使用道具 举报

  • TA的每日心情
    郁闷
    2016-12-31 01:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    69

    主题

    1377

    回帖

    1万

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    2969743

    卓越贡献

    tonyhsie  楼主| 发表于 2022-1-3 22:22:40 | 显示全部楼层
    本帖最后由 tonyhsie 于 2022-1-3 22:23 编辑
    ssnake 发表于 2022-1-3 22:04
    @tonyhsie 这个是 ass drawing 吧,据说(我已经快10年没看了)B站是有些字幕用了 ass drawing 的 ...

    你說的沒錯

    不過 b 站原始字幕是 json 格式,可以無損轉成 srt,跟 ass/js 之類的皆不相關
    一個簡單的 json 範例如下
    {"font_size":0.4,"font_color":"#FFFFFF","background_alpha":0.5,"background_color":"#9C27B0","Stroke":"none","body":[{"from":6.156,"to":8.258,"location":2,"content":"管制一号呼叫送葬者"},{"from":8.761,"to":13.013,"location":2,"content":"点302及504有多数敌方迎击部队"}]}

    它等於

    1
    00:00:06,156 --> 00:00:08,258
    管制一号呼叫送葬者

    2
    00:00:08,761 --> 00:00:13,013
    点302及504有多数敌方迎击部队

    至於那些 ass 代碼,是 b 站自己沒先處理好就弄成 json 了

    我並不打算進一步去處理這些 b 站原始字幕就有的問題


    通常是舊番字幕,才會有這種明顯是 ass 代碼的問題
    與其在那邊處理這些代碼,不如直接去找字幕組的 ass 字幕,可能還比較快

    回复

    使用道具 举报

    该用户从未签到

    3

    主题

    270

    回帖

    680

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    1068247
    ssnake 发表于 2022-1-3 22:37:37 | 显示全部楼层
    本帖最后由 ssnake 于 2022-1-3 22:39 编辑
    tonyhsie 发表于 2022-1-3 22:22
    你說的沒錯

    不過 b 站原始字幕是 json 格式,可以無損轉成 srt,跟 ass/js 之類的皆不相關

    看上去是私有方案(和 ass-parser 、 cruchyroll 之类都不一样),不过从 json 的结构(颜色和透明度之类的数量、location 的 2 都有很重的 ass 感)看应该最终是还原成 ass (而不是 WebVTT 之类的)然后用 JavascriptSubtitleOctopus 之类渲染的。

    不过,只有老片的话确实可以无视了。


    回复

    使用道具 举报

  • TA的每日心情
    郁闷
    2016-12-31 01:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    69

    主题

    1377

    回帖

    1万

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    2969743

    卓越贡献

    tonyhsie  楼主| 发表于 2022-1-3 22:48:39 | 显示全部楼层
    本帖最后由 tonyhsie 于 2022-1-3 22:51 编辑
    ssnake 发表于 2022-1-3 22:37
    看上去是私有方案(和 ass-parser 、 cruchyroll 之类都不一样),不过从 json 的结构(颜色和透明度之类 ...

    它的 json 乍看之下好像有很多功能,但實際上都是全域設定居多
    字型/背景顏色、背景透明度,都是全域的,沒多大作用


    唯一對單句字幕有作用的控制代碼,就是 location


    location 2 = {\an2} 也就是字幕居中置底的意思

    我在轉換成 srt 的時候,也有特別處理 location 不為 2 的情況
    但實際上似乎沒遇過這種例外


    所以,其實它的 json,就是把 srt 換個包裝而已
    並沒有什麼高深的字幕學問

    回复

    使用道具 举报

  • TA的每日心情
    开心
    2022-1-22 14:41
  • 签到天数: 1 天

    [LV.1]初来乍到

    0

    主题

    2

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    177
    longzhu_000 发表于 2022-1-4 01:23:37 | 显示全部楼层
    adfa 发表于 2022-1-1 10:41
    根据网盘里面的文件路径重新制作的清单

    非常感谢
    回复

    使用道具 举报

  • TA的每日心情
    无聊
    2022-8-15 21:02
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    0

    主题

    6

    回帖

    0

    VC币

    注册会员

    Rank: 2

    积分
    652
    ccf 发表于 2022-2-2 23:46:01 | 显示全部楼层
    新年快乐,感谢礼物
    回复

    使用道具 举报

  • TA的每日心情
    郁闷
    2016-12-31 01:33
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    69

    主题

    1377

    回帖

    1万

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    2969743

    卓越贡献

    tonyhsie  楼主| 发表于 2022-4-2 15:53:50 | 显示全部楼层
    更新至 2022/4/1

    首樓連結
    回复

    使用道具 举报

  • TA的每日心情

    2024-2-12 19:20
  • 签到天数: 840 天

    [LV.10]以坛为家III

    78

    主题

    292

    回帖

    4367

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    1444300

    活跃达人崭露头角CD!BD!小有所成新人登场日积月累渐入佳境人尽其财肝帝在此

    ansonbanana 发表于 2022-4-5 09:48:53 | 显示全部楼层
    tonyhsie 发表于 2022-4-2 15:53
    更新至 2022/4/1

    首樓連結

    可以请教或是麻烦您一件事吗?您上传了魔法少女伊莉雅第一季的字幕但是是简中,我看b站有台港澳版但是是硬字幕,小弟不会ocr,不知您会不会或能不能麻烦您?又或是其它人能帮忙?我知道字幕包里有简中的但本来就有繁中的想直接用,即便用繁化姬转繁中多少还是得修(虽然简中有留一份就是了),不行不勉强,假如有人能帮忙,轴我自己会调(我知道ocr很麻烦也不应麻烦别人,但自己不会而且不问没机会找到好心人)
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2023-12-25 07:53
  • 签到天数: 34 天

    [LV.5]常住居民I

    7

    主题

    127

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    8042
    fuyouquan 发表于 2022-4-5 10:39:50 | 显示全部楼层
    ansonbanana 发表于 2022-4-5 09:48
    可以请教或是麻烦您一件事吗?您上传了魔法少女伊莉雅第一季的字幕但是是简中,我看b站有台港澳版但是是硬 ...

    ocr出来的修起来可能比繁化姬繁化的还麻烦哟
    回复

    使用道具 举报

  • TA的每日心情

    2024-2-12 19:20
  • 签到天数: 840 天

    [LV.10]以坛为家III

    78

    主题

    292

    回帖

    4367

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    1444300

    活跃达人崭露头角CD!BD!小有所成新人登场日积月累渐入佳境人尽其财肝帝在此

    ansonbanana 发表于 2022-4-5 10:45:44 | 显示全部楼层
    fuyouquan 发表于 2022-4-5 10:39
    ocr出来的修起来可能比繁化姬繁化的还麻烦哟

    也是,姑且一问,上文也说了不问没机会
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表