文字コード・国際化

文字コードに関して適当に考えるメモ。

文書

主要な文字コードとMIME名

シフトJIS / EUC-JPとUnicodeとの妥当な変換表

異なる文字コードのテキストを混在させるには

ICU: International Components for Unicode

ICUを使う ICUを使った文字コードの変換なども、こちら。

文字コードの変換 [C++] レガシーな文字コード (シフトJIS, EUC-JP) から Unicode への変換や、あるいはレガシーな文字コード同士の変換。

Unicode正規化 (icu::Normalizer2) [C++]

Unicodeでの文字列照合・ソート [C++]

Linux での描画

伝統的なXのテキスト描画 (Xft)

Pango でテキスト描画 タイ語を表示する

m17n library でテキスト描画 タイ語とクメール語を表示する

覚え書き

1999.07.02 Unicodeの問題点

1999.03.24 Windows 95における1バイト文字集合

1999.03.21 UnicodeとJIS X 0208との変換表について

1999.03.15 ユーロ

1999.03.10 ISO-2022-JPがISO/IEC 2022に適合しない理由

1999.02.24 JIS X 0201ラテン文字集合とISO/IEC 646 IRVとの差異

1999.02.20 シフトJIS, EUC

1999.02.05 包摂規準の変更は,非互換な文字集合となるか