Mekozoko 发表于 2020-4-9 20:27:18

求科普字体子集是啥玩意

貌似字幕组发布的内封字幕MKV大部分都是封装的子集字体?
1、将内封的ass提取出来后,直接拖进论坛大佬的的小工具LissAssFonts小工具里识别字体列表,会先识别出字体名为“数字混合大写字母”的字体,然后自动弹出Aegisub界面,就多了一个后缀是移除字体子集的新ass,再将这个ass拖进去才能正确识别字体列表。这些名为“数字混合大写字母”的字体就是子集字体对吗?
2、如果将这些内封字体直接提取出来安装在电脑上,会显示安装的字体名也是“数字混合大写字母”,原字体还是没安装成功,有没有办法获取原字体文件呢?
3、因为想获取FOT-TsukuMin Pr6N B的字体文件,但就像第2点所述提取出来还是无法安装原字体,刚好这个字体VCB完整包里也没有,字客网没VIP,其他地方也找不到,于是很苦恼就发了这个帖子,想得到这个关于子集字体疑问的解答。提前感谢大佬们!

hasamaki 发表于 2020-4-9 21:33:19

本帖最后由 hasamaki 于 2020-4-9 21:40 编辑

因为ass的style里的字体名已经变成你说的“数字混合大写字母”了,所以直接拉进LissAssFonts是识别不出来的。
这个子集化就是精简版的字体,某条字幕对应什么style用的什么字体,就从这个字体里只把用到的字提取出来,最后一一重新打包生成新的字体。再比如你开发一个页面,要用到一些字体风格,你又不想用ps把文本那个图层做成图片放上去,但是一个字体小到几MB大到几十MB,英文字体其实还好,中文字体不做子集化,打开一个网页会消耗不必要的资源,所以就要做字体子集化,最大程度压缩体积。这种精简是不可逆的,只有子集化之后的字体得不到原字体的,就像320kbps的MP3不能转成无损一样(假无损除外{:4_684:})。

你说的筑紫明朝Pr6N加粗我也没找到,只找到了FOT-TsukuMin Pro LB和L。

tonyhsie 发表于 2020-4-10 06:21:59

本帖最后由 tonyhsie 于 2020-4-10 06:23 编辑

子集的部分,基本上就是樓上講的那樣


對於這種字幕文件,ListAssFonts 的邏輯是

  字幕文件使用了哪些字型,它就秀出那些字型來
  所以對於那些使用字型子集的子幕,ListAssFonts 會秀出一堆子集化的字型名稱出來

  同時 ListAssFonts 也會另外產生一個去除這些字型子集的新字幕文件
  然後自動呼叫系統上的關聯程式,來打開這個新字幕文件,(在你的例子上,就是 AegiSub 了)

hasamaki 发表于 2020-4-10 11:30:55

本帖最后由 hasamaki 于 2020-4-10 12:24 编辑

感谢大佬tonyhsie带来ListAssFonts这样方便的工具。同时也感谢大佬的补充。

这里权当抛砖引玉,拿最简单的在线提取工具简单介绍一下。

简单说就是照方抓药,你把你要子集化的文字告诉这个工具,工具根据这些字符的Unicode在你上传的字体(比如ttf、eof、woff、woff2、svg等)里把他们挑出来重新打包成一个新的字体给你。


比如这里我先上传了一个方正楷体_GBK.ttf,然后随便复制了一段文字进去,工具会自动统计你输入了多少字需要提取多少,再加上下面可以额外添加的半角全角的字母、符号和数字,点立即生成就会产生根据你给的文本定向精简之后的字体文件,我们来比较一下


原字体13.4MB,做了子集化之后一共提取了353个字符,大小只有36KB,是不是很精简?

此外还有大佬开发了fontmin、font-carrier、fontTools等这样的字体工具API和插件日常是用不到了。

动画片里做子集化的不多,一般都是外挂字幕附上字体或者直接内封字幕再把字体当附件一起打包进mkv的是大多数。然而枫雪字幕组做的One Piece 海贼王我知道是做子集化的,我收了900+集,打包mkv的时候字体都在附件里,这样的好处是你不用装字体了,播放之前会自动加载字体缓存,但是如果不做子集化会浪费不少存储空间。有生之年系列。

tonyhsie 发表于 2020-4-10 22:52:00

用在 web 上的子集化範例好像蠻多的

但用在字幕上的好像不太好找

剛搜尋了一下,找到這個

https://github.com/youlun/AssFontSubset


不曉得字幕組是不是也是用這套

boday 发表于 2020-4-11 06:54:18

本帖最后由 boday 于 2020-4-11 06:55 编辑

tonyhsie 发表于 2020-4-10 22:52
用在 web 上的子集化範例好像蠻多的

但用在字幕上的好像不太好找

LoliHouse 用的就是这个。主要依赖也是 fonttools。

cnlolicon 发表于 2020-4-12 17:58:42

本帖最后由 cnlolicon 于 2020-4-12 18:01 编辑

只是想要用其他压制组的片源挂载这些使用子集的字体而字体又不太好找的话可以用mkvtoolnix解决,把封装了子集的视频和自己下的视频都拖进mkvtoolnix,取消勾选带字体子集的视频的视频轨道和音频轨道,然后选择混流,这样子集字体就和自己想要的片源封装在一起了。当然这样的话就不能用工具把使用子集的字幕文件的映射关系去除了。
页: [1]
查看完整版本: 求科普字体子集是啥玩意