kanizaのブログ

コンピュータ、ソフトウェア、映画、音楽関連や家族のことなど、思いついたことを書きます。

UTF-8もいろいろで困った

Macで使っているSubversionリポジトリをそのままWindows環境にコピーして、そのリポジトリからWindowsSubversionでチェックアウトしてみた。そうしたら、濁点のあるファイル名が文字化けしちゃってる。

Mac OS Xファイルシステムは名前が UTF-8エンコードされているんだけど、それが Normalization Format D (NFD)というあまり一般的ではない形式になっていて、たとえば「が」が「か」と濁点に分けて記録されているのだそうだ。たしかに、Emacsのdiredで濁点のあるファイル名がうまく表示されないという問題もそれが原因だった。

UTF-8なら当面はOK」と思っていたけどこういうところに落とし穴がある。

Subversionリポジトリ内での Normalization Format を統一して、チェックアウト時に各ファイルシステムに合わせて変換するようになればいいのかなぁ。うむー。