トップ «前の日記(2005-04-17 (Sun)) 最新 次の日記(2005-04-19 (Tue))» 編集   RSS 1.0 FEED  

Journal InTime


2005-04-18 (Mon) [長年日記]

_ [プログラミング] Normalization Forms KD and KC Examples

追記: ていうか別に同一でない文字列としてもいいんじゃん?と考えることもできそうだけど、UAX#15のA1.3 Normalization Forms KD and KC Examplesでは、NFKCではこれらは同一の文字列になる、と明言してしまっているのよね。というかそもそもそこが疑問の出発点だったわけでして。

[ものがたり (diary for AtsushiEno)より引用]

A1.3 Normalization Forms KD and KC Examplesのtenは、 Table 3: Character Abbreviationによると、 KATAKANA-HIRAGANA VOICED SOUND MARK(309B)ではなく COMBINING KATAKANA-HIRAGANA VOICED SOUND MARK(3099)のようなので、 UNICODE的にはこれでよかったりするんじゃないでしょうか。

で、これが望ましい仕様かどうかを論じるほどの見識は自分には なかったりするわけですが:(

ちなみに、JISX0208の濁点(212B)は309Bにマッピングされているらしい。 そういうものなんですかね。