用户:Mrhso2014/吐槽区
关于汉字的吐槽
本页面有关 Wikipedia:Unicode扩展汉字。阅读之前可以看普及区增长姿势水平。
当香港推广 ISO 10646 时,内地推广的是什么?虽然应该推广 GB 18030,但是现状简直就是推广 GB 2312。
内地政府没有大力普及 UCS,腾讯又来个 QQ 拼音造字(后来搜狗拼音继承),使得网络上到处是“某字用 QQ 拼音打”,正确码点没人知道,网友以为 QQ 拼音打不出的字就是字符集没有的字,事实上 QQ 拼音连 HKSCS 里的字都不一定支持。
这种造字是滥用 PUA 的行为,腾讯等厂商不以为耻,反以为荣。
后来我进入了搜狗群,故意用 HKSCS 去显示 PUA。管理就说我电脑“字库坏了”。
风华正茂999999 曾说:“中国大陆至今还有许多人不知道扩展区,目前大陆广泛使用的输入法均只停留在基本区4E00-9FA5的水平。导致明明已经收录了很多年的汉字,却仍然几乎没人知道,仍被认为在电脑中打不出。最典型也是最可悲的,就是这个字‘𢒉’。当时新闻里提到,由于电脑打不出此字,导致此姓200多名村民被迫改姓。事实上这个新闻报告的时候,𢒉已经收录了八九年了。然而大陆部门的相关人员竟然无人知道,当时网上也基本无人提及,都觉得这个字电脑上没有。本来传承了这么久的一个姓,就因为这个决不应该是理由的理由给改了。”
他们不关心扩展字,只关心绘文字,连“💩”都关心。
百毒百科的生僻字条目主要表达这种观点:“名字中有生僻字的人,你们不觉得带给别人麻烦吗,总不能让大家都因为你而麻烦吧”
再看百毒贴吧,以前还不支持 non-BMP 字符(BMP 以外的字符),发出去“头被切掉”(比如𦏵 (U+263F5),发出去变成了揵 (U+63F5)),只因为程序员不懂 Unicode。后来被我和 风华正茂999999 轰炸掉了。
于是就有了普及区。
我在回答知乎某问题的时候,看到个搜狗吹,说什么“搜狗万能”。
其实根据我上面的吐槽大家也能看出搜狗并不是万能的,但是为何会有人说搜狗万能呢?
主要还是搜狗的垄断,在人们心中根深柢固了。
而 IRG 为了解决扩展 B 时期臃肿的问题,推广 IVD。我甚感欣慰,但是目前还未看到有商业字体支援。期待堕朱砂。
关于胡都木的吐槽
Unicode 对胡都木的编码可以说是一塌糊涂,按音来编码而不是字形……
使用者也没有遵循规范。“ᠣ”“ᠤ”、“ᠥ”“ᠦ”不分可以说是非常常见,虽然本来编码上也不必要分。
这也就算了,甚至有把“ᠩ”写成“ᠨᠭ”的……
上述情况都是我在汉文维百看到的,可以说有必要指导使用者去使用正确规范的字符了。
不过按照 Unicode 严格转写的也有,比如中蒙联合转写:
蒙古文统一码 | 通用转写 | 胡都木转写 | 托忒转写 | 锡伯文转写 | 满文转写 |
---|---|---|---|---|---|
᠀ | & | & | & | ||
᠁ | … | … | … | … | |
᠂ | , | , | |||
᠃ | . | . | |||
᠄ | : | : | : | : | |
᠅ | # | # | # | ||
᠆ | –' | – | |||
᠇ | –" | – | |||
᠈ | ,' | , | |||
᠉ | .' | . | |||
᠊ | ‐ | ‐ | ‐ | ‐ | ‐ |
(FVS1) | ' | ' | ' | ' | ' |
(FVS2) | " | " | " | " | " |
(FVS3) | ` | ` | ` | ` | ` |
(MVS) | _ | _ | |||
᠐ | '0 | '0 | '0 | ||
᠑ | '1 | '1 | '1 | ||
᠒ | '2 | '2 | '2 | ||
᠓ | '3 | '3 | '3 | ||
᠔ | '4 | '4 | '4 | ||
᠕ | '5 | '5 | '5 | ||
᠖ | '6 | '6 | '6 | ||
᠗ | '7 | '7 | '7 | ||
᠘ | '8 | '8 | '8 | ||
᠙ | '9 | '9 | '9 | ||
︑ | ," | , | |||
︐ | ,` | ,` | |||
︒ | ." | . | |||
ᠠ | a | a | a | a | a |
ᠡ | e | e | |||
ᠢ | i | i | |||
ᠣ | o | o | o | o | |
ᠤ | u | u | |||
ᠥ | ö | ö | |||
ᠦ | ü | ü | |||
ᠧ | ë | ë | |||
ᠨ | n | n | n | n | n |
ᠩ | ng | ng | ng | ||
ᠪ | b | b | b | b | |
ᠫ | p | p | |||
ᠬ | x | x | |||
ᠭ | g | g | |||
ᠮ | m | m | m | m | |
ᠯ | l | l | l | l | l |
ᠰ | s | s | s | s | s |
ᠱ | š | š | š | ||
ᠲ | t | t | |||
ᠳ | d | d | |||
ᠴ | č | č | z | c | c |
ᠵ | ǰ | ǰ | j | ||
ᠶ | y | y | (y') | y | y |
ᠷ | r | r | r | r | |
ᠸ | w | w | f | w | w/f |
ᠹ | f | f | |||
ᠺ | k | k | (k') | ḱ | ḱ |
ᠻ | ḳ | ḳ | ḳ | ||
ᠼ | c | c | |||
ᠽ | z | z | |||
ᠾ | h | h | |||
ᠿ | ž | ž | |||
ᡀ | lh | lh | |||
ᡁ | ẑ | ẑ | |||
ᡂ | ĉ | ĉ | |||
ᡃ | ː | ː | |||
ᡄ | é | e | |||
ᡅ | í | i | |||
ᡆ | ó | o | |||
ᡇ | ú | u | |||
ᡈ | ő | ö | |||
ᡉ | ű | ü | |||
ᡊ | ṅ | ng | |||
ᡋ | ḃ | b | |||
ᡌ | ṗ | p | |||
ᡍ | ẋ | x | |||
ᡎ | ġ | g | |||
ᡏ | ṁ | m | |||
ᡐ | ṫ | t | |||
ᡑ | ḋ | d | |||
ᡒ | ċ | č | |||
ᡓ | j | ǰ | |||
ᡔ | ć | c | |||
ᡕ | ẏ | y | |||
ᡖ | ẇ | w | |||
ᡗ | ḱ | k | |||
ᡘ | ģ | ģ | |||
ᡙ | ḣ | h | |||
ᡚ | ĵ | ĵ | |||
ᡛ | ń | ń | ń | ||
ᡜ | ź | ź | |||
ᡝ | è | e | e | ||
ᡞ | ì | i | |||
ᡟ | ï | ï | ï | ||
ᡠ | ȕ | u | u | ||
ᡡ | ū | ū | ū | ||
ᡢ | ň | ng | |||
ᡣ | ǩ | k | |||
ᡤ | ǧ | g | g | ||
ᡥ | ẍ | x | x | ||
ᡦ | ṕ | p | p | ||
ᡧ | ś | š | š | ||
ᡨ | ṭ | t | t | ||
ᡩ | ḍ | d | d | ||
ᡪ | ƶ | j | |||
ᡫ | ƒ | f | |||
ᡬ | ĝ | ġ | ġ | ||
ᡭ | x̊ | x̊ | x̊ | ||
ᡮ | ts | ts | ts | ||
ᡯ | dz | dz | dz | ||
ᡰ | ẓ | ž | ž | ||
ᡱ | ḉ | ḉ | ḉ | ||
ᡲ | ʒ | ʒ | |||
ᡳ | î | i | |||
ᡴ | ķ | k | |||
ᡵ | ṛ | r | |||
ᡶ | ḟ | f | |||
ᡷ | ď | ď | |||
ᢀ | ṃ | ṃ | ṃ | ṃ | |
ᢁ | ḥ | ḥ | ḥ | ḥ | |
ᢂ | â | â | â | â | |
ᢃ | ŏ | ŏ | ŏ | ŏ | |
ᢄ | ȏ | ȏ | ȏ | ȏ | |
ᢅ | ˑ | ˑ | ˑ | ˑ | |
ᢆ | ːˑ | ːˑ | ːˑ | ːˑ | |
ᢇ | ā | ā | ā | ||
ᢈ | ī | ī | |||
ᢉ | ḵ | ḵ | ḵ | ||
ᢊ | ṉ | ṉ | ṉ | ||
ᢋ | ƈ | ƈ | ƈ | ||
ᢌ | ť | ť | ť | ||
ᢍ | ţ | ţ | ţ | ||
ᢎ | ḏ | ḏ | ḏ | ||
ᢏ | ņ | ņ | ņ | ņ | |
ᢐ | ṯ | ṯ | ṯ | ||
ᢑ | ḓ | ḓ | ḓ | ||
ᢒ | p̄ | p̄ | p̄ | ||
ᢓ | ṕh | ṕh | ṕh | ||
ᢔ | ş | ş | ş | ||
ᢕ | ẖ | ẖ | ẖ | ||
ᢖ | ẕ | ẕ | ẕ | ||
ᢗ | ʒ̄ | ʒ̄ | ʒ̄ | ||
ᢘ | ŧ | ŧ | |||
ᢙ | ǯ | ǯ | |||
ᢚ | g̊ | g̊ | |||
ᢛ | ŋ | ŋ | |||
ᢜ | c̊ | c̊ | |||
ᢝ | żh | żh | |||
ᢞ | ṱ | ṱ | |||
ᢟ | ḑ | ḑ | |||
ᢠ | t́ | t́ | |||
ᢡ | đ | đ | |||
ᢢ | ŝ | ŝ | |||
ᢣ | c̯ | c̯ | |||
ᢤ | ʒ̊ | ʒ̊ | |||
ᢥ | z̊ | z̊ | |||
ᢦ | ŭ | ŭ | ŭ | ||
ᢧ | ÿ | ÿ | ÿ | ||
ᢨ | b̊ | b̊ | |||
ᢩ | ̲ | ̲ | |||
ᢪ | lh | lh | |||
(ZWNJ) | ^ | ^ | ^ | ^ | ^ |
(ZWJ) | * | * | * | * | * |
(NNBSP) | - | - | - | - | - |
蒙古文统一码 | 通用转写 | 胡都木转写 | 托忒转写 | 锡伯文转写 | 满文转写 |
关于 Sauketu 的吐槽
- 嗯……mnmrtbot 是什么鬼……--Naïve 的小石𫁶(留言) 2017年9月15日 (五) 07:56 (UTC)
- iconv-lite 实在是太不稳定了,一天要出几十次问号。--Naïve 的小石𫁶(留言) 2017年9月15日 (五) 13:44 (UTC)
- 为什么我要搅 Q1 这趟混水呢?大概是 Q2 人数很多了吧。--Naïve 的小石𫁶(留言) 2017年9月16日 (六) 01:03 (UTC)