2005-04-18 (Mon) [長年日記]
_ Normalization Forms KD and KC Examples
追記: ていうか別に同一でない文字列としてもいいんじゃん?と考えることもできそうだけど、UAX#15のA1.3 Normalization Forms KD and KC Examplesでは、NFKCではこれらは同一の文字列になる、と明言してしまっているのよね。というかそもそもそこが疑問の出発点だったわけでして。
[ものがたり (diary for AtsushiEno)より引用]
A1.3 Normalization Forms KD and KC Examplesのtenは、 Table 3: Character Abbreviationによると、 KATAKANA-HIRAGANA VOICED SOUND MARK(309B)ではなく COMBINING KATAKANA-HIRAGANA VOICED SOUND MARK(3099)のようなので、 UNICODE的にはこれでよかったりするんじゃないでしょうか。
で、これが望ましい仕様かどうかを論じるほどの見識は自分には なかったりするわけですが:(
ちなみに、JISX0208の濁点(212B)は309Bにマッピングされているらしい。 そういうものなんですかね。