十三 发自 凹非寺
量子位 报道 | 公众号 QbitAI
有一种面条,很多人吃过,但很少人能写对它的名字,甚至拿输入法都打不出来。
没错,这就是著名的陕西 「biáng biáng 面」。
这是因为像biáng这样的字太生僻了,所以电脑的字符编码集一直没有收录。
然而,最近Unicode(统一码、万国码、单一码)宣布要发布13.0版本,划重点:
将把biáng包括在内的4939个生僻字收录到CJK 统一表意汉字 的扩展G区中。
看看宣布时间和内容,嗯,现在已经生效了!
答案是:别着急!
虽然Unicode收录了biáng,也做了版本更新,但是文字编码系统是内嵌在操作系统中的。
也就是说,还得等各个操作系统更新才有可能使用。
但即便系统更新,也只是说明能显示biáng字,不再是像“□”这样的乱码状态。
而至于我们能不能打出来这个字,还得看输入法。
毕竟,biáng字连字典都查不到……
而且,biáng字有多种写法,各地区用得还不一样,哪个收录到词典里,其它地区的人可能也会不乐意吧。
坊间还流传一个笑话,说是某届全国面条比赛,「biáng biáng 面」因为打不出字,就没入围……
但也有学者呼吁,对“biáng”字做深入的调查和研究,将其收录到字典:
biáng字是陕西老百姓群力创造的一个字,有关其写法的口诀朗朗上口,家喻户晓。它的出现既符合汉字创造发展的规律,同时还体现了陕西人的性格、品格和精神,其文化元素有十种之多,内涵十分丰富。
作为在全国都有影响力的“biang”字,很有必要将其收入字典、词典等工具书当中,让更多人了解陕西文化,了解汉字这一中华优秀传统文化。
所以,等这些条件都满足后,或许我们就可以打出biáng字了。
到了那天,估计朋友圈里会被biáng字刷屏吧。
更有网友听说这个消息后,号称要给自己孩子取名,除了姓,就用两个biáng。
这位朋友,biáng字56笔画,你孩子考试写名字要112笔画起步…….确定吗?
Unicode从1990年开始研发,1994年正式公布。是计算机科学领域里的一项业界标准,包括字符集、编码方案等。
我们知道计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。
而最早的计算机在设计时采用8个比特作为一个字节,而一个字节能表示的最大的整数就是255(2^8-1=255)。
早期大名鼎鼎的ASCII (美国信息交换标准代码,一套电脑编码系统),占用70-127来表示大小写英文字母、数字和一些符号,比如大写字母A的编码是65,小写字母z的编码是122。
而要表示中文,显然一个字节是完全不够的,至少需要两个字节,而且还不能和ASCII编码冲突。类似的,韩文和日文也存在这个问题。
为了统一所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
它解决传统的字符编码方案的局限,为每种语言中的每个字符设定了统一并且唯一的二进制编码。
除了Unicode13.0版本发布,将生僻字收录进来,统一码联盟(Unicode Consortium)还推出了Emoji 13表情符号!
更新了共有62个新表情,如含泪的笑脸、北极熊、海豹、泡茶、皮卡、 火锅 、茶壶、魔杖、甲虫、皮纳塔等。
是不是有点小激动?
关于「biáng biáng 面」的由来,据说古代有位怀才不遇、穷困潦倒的书生经过一家面馆时,被店家面条的香味所吸引。
吃完后便问店小二面条叫什么,店小二回答“biáng biáng 面”。书生饱读诗书,却不知biáng字怎么写,店小二也说:“此名因声音特色而起,没人想过怎么去写。”
书生因为没钱,便说以写biáng字来抵面钱。他一边“造”字,一边歌道:
一点飞上天,黄河两边弯八字大张口,言字往里走左一扭,右一扭西一长,东一长中间夹个马大王心字底,月字旁留个勾搭挂麻糖推着车车进咸阳……
书生写罢,赢得满堂喝彩。这个顺口溜,至今仍被广为流传。
那么,今晚来碗「biáng biáng 面」?
参考链接
https://twitter.com/ken_lunde/status/1235050880363384832
https://baike.baidu.com/item/biang/2015710?fr=aladdinhttps://mp.weixin.qq.com/s/du81N_DiCGvM7u9h0wrZnQ
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态