方正字库的手写字体开始出真GBK了
本帖最后由 Seekladoom 于 2020-8-10 10:25 编辑今天突然发现方正字库最近出的不少手写字体的字数已经上21002字了,也就是说,这些字体都是简繁通用的真GBK手写字体了。这些字体应该是非专业字体制作者给它们命名的,所以字体名称就有点不忍直视,但这并不影响它们的正常使用。方正字库在B站的官方账号也曾发过视频说他们已经把机器学习用到了字体制作上来,特别是手写字体这块,官方明确表态,下载了手迹造字的用户,只需要写700多个字,后面的6000多字就可以用机器学习去学习汉字的偏旁部首,笔画等算法去自动拼接生成,最后官方适当微调即可上架。然而没想到的是,现在连真GBK手写字体都出来了,截至目前为止机器学习生成的真GBK手写字体已经有93个了,不得不感慨时代进步太快了,已经远远超出了想象。
如下是官网页面的截图,这里用的预览文本是——咲說菈,这三个字,如果这三个字都能正常显示的话那肯定就是简繁通用的真GBK了。
【图1】
https://i.loli.net/2020/08/09/ZenA98PpsK64GEt.png
【图2】
https://i.loli.net/2020/08/09/IRZkmxhOzfv3PVH.png
【图3】
https://i.loli.net/2020/08/09/F8myhv4uzQ79o6x.png
這字體名稱還真隨性,沒有規律可言....
我自己測 GBK 有沒有缺字,大概是用這一串
丟佇偽內別刪卻吶啟喚夠強悅拋掙換搖撐攜晉欸毀決沒況淨溫滾為獎眾絕罵脫腳荊虛蛻話說貓跡蹟遙醫錄靜顏麼黃
一般偽 GBK 至少缺五個字以上,如方正幼线_GBK、方正行楷_GBK,
有的字型甚至以上文字全數從缺,如方正宋三_GBK、方正胖头鱼_GBK
看不懂...... 用这类字体会减慢我的阅读速度.... 本帖最后由 Seekladoom 于 2020-8-10 10:42 编辑
凡人亦烦 发表于 2020-8-10 10:06
用这类字体会减慢我的阅读速度....
这类字体对做日本动画字幕的字幕组来说还是有价值的,特别是屏幕字,用在正文字幕上肯定是会降低阅读效率的。
方正字库用机器学习量产这些手写字体最大的价值就是卖到各个手机厂商(小米、华为、魅族、OPPO等)或者社交软件平台(QQ、微信、B站、抖音等)的主题商店上,这些字体的价格大多在3-6块钱,绝大部分喜欢给手机主题换字体的年轻人们也花得起这钱,虽然便宜但走起量来的利润就很可观了,这块才是手写字体目前对方正字库来说最来钱的地方。
钱赚够了,有足够的研发经费才能继续给圆黑宋印刷字体、创意字体或者前面这些风格混合的字体搞进一步的自动化研发工作,从而形成良性循环,继续产出更多质量更好、字数更大的新字体。
以后做字幕找不到好的屏幕字匹配就可以自己写啦(无端 能把已有的字体补全吗
汉仪细行楷什么的 本帖最后由 Seekladoom 于 2020-8-16 16:23 编辑
true 发表于 2020-8-16 01:32
能把已有的字体补全吗
汉仪细行楷什么的
技术上要实现的话肯定是做得到的,就是工作量比较大,而且此前已经有民间高手用AFDKO配合机器学习批量处理过字体(比如github上ButTaiwan的源泉圓體、源雲明體等)了,想自己搞的话可以试着去看看知乎这几个帖子找找线索:
开源 | 汉字风格迁移项目Rewrite:利用神经网络学习设计汉字新字体
由风格学习算法自动生成大规模手写字体
机器学习能不能生成字体呢?
这块跟Python的Numpy库关联较大,配合机器学习一起上更容易做到对字体的批量处理,可以先去github搜AFDKO并下下来。
true 发表于 2020-8-16 01:32
能把已有的字体补全吗
汉仪细行楷什么的
汉仪家的就不要想了,汉仪在手机主题商店放出的字都是直接硬补的,长得像楷体的直接用楷体,长得像仿宋的直接用仿宋。或许它自家私藏了完整版,但一点都不肯放出来
本帖最后由 YAYOI 于 2023-1-22 07:16 编辑
那些GBK簡繁通用字型都是有一個重大缺陷, 就是..
https://s2.loli.net/2023/01/21/m3tykuagoUJzfqT.jpg
上面是用了(FZLanTingHei-DB-GBK) <方正兰亭中黑> 字型, 不能正確顯示辵部首的字體
下面是用了(Source Han Sans TC Medium) <思源黑體> 字型, 能正確顯示辵部首的字體
希望有做開繁體字幕的喵萌奶茶屋 /星空字幕組/ SweetSub 有留意到.. {:12_852:}
很多字幕組的動畫繁體字幕中 (這)(逃通隨連) 等等<辵部首> 其實全是 簡體 字型
因為有些(字型)例如 (simhei)<中易黑體(FZLanTingHei-DB-GBK)<方正兰亭中黑 ,所有字的辵部首 , 都無法正確顯示出繁體字形的
建議例如用 (Source Han Sans TC Medium)<思源黑體或 (華康香港標準楷書) (字型) 等等來代替
页:
[1]
2