随感録 2000年3月

2000-03-02 (Thu)

　最近話題になっているWindowsのconconバグ（ソフトウェアの欠陥），かなり強力。たとえばこれ。これをimgタグやスタイルシートに仕込めば，HTMLを表示するだけでWindowsを落とすことができる。cgiに仕込めばWindowsベースのWebサーバーも落とすことができる。ちょっと凄い。

2000-03-06 (Mon)

# CJK UNIFIED IDEOGRAPH

Tag(s): 文字コード

1999.08.18/02の続き，UnicodeのCJK UNIFIED IDEOGRAPHについて。lilo MLでの議論を通じて私が得た結論。

まず，漢字はそれ自体では一つの用字系であり，日本漢字，簡体字，繁体字で全く別のコードを与える必要はない。CJKの間で字形が等しいものは同じ文字であって，これに同じコードポイントを与えるのは自然である。

UnicodeのC欄，J欄，K欄の各漢字は，異なる文字に一つのコードポイントを与えたものがある。すなわち，漢字においては字形の異なりによって同じ文字か判断することになるが，CJKの間で同じ文字といえないほど字形が異なるものがある。これはコードポイントを節約するための措置だったが，16bitに収納できないことが決定した現在では，全く先見性がなかったとしか言いようがない。

すでにUnicodeが普及しつつあるので，何かしら運用で回避する方法を考えないといけないだろう。

この，あるコードポイントの（複数の）文字を区別するには，言語タグを用いる。ただし注意しないといけないのは，CJKで同じ文字の場合は言語タグが違っても区別してはならない，すなわち，CJKで異なる文字の場合のみ言語タグによって区別しなければならない。したがって，どのコードポイントが異なる文字をunifyしているかのデータベースが必要になるが，これは難儀だなぁ。

ここでいう言語タグは，あくまでも文字を区別するためのもので，テキストの言語を指定するものではない。ある文字を取り出したとき，（特定の言語でしか用いられない文字を除き）その文字自体は何かしら特定の言語を示したりはしない。すなわち「一」という文字だけでは，何語かは分からない。これはラテン文字でも同様。

　ゲーセンで小一時間ほど遊んで帰る。

--
　東京話の続き。昨日書いた敗北の後，高島屋内のハンズとかで小物を買い求める。

卓上カレンダー
Christina AguileraのCD
Angelic Layer #2

2000-03-26 (Sun)

　昨日は夕方から，

ビリヤード
飲む
飲み直す
もう一度ビリヤード
カラオケ

で，朝5時。アホ。

--
　Web掲示板の新版を公開。検索できるようになった。

　2000.02.09ぐらいにタイトルをQ's crafting atticからNetsphere Laboratoriesに変更したが，なかなか次のソフトを完成できない。

　現状書いてるのはデスクトップ・ソフトウェアだけど，データがローカルになくって，データ共有できるようになるはず。

2000-03-28 (Tue)

　QILM v2.65公開。Webブラウザとの連携を強化。ダウンロード機能の強化は先送り。

2000-03-02 (Thu)

2000-03-06 (Mon)

# CJK UNIFIED IDEOGRAPH

2000-03-12 (Sun)

2000-03-15 (Wed)

2000-03-18 (Sat)

2000-03-19 (Sun)

2000-03-23 (Thu)

2000-03-24 (Fri)

2000-03-26 (Sun)

2000-03-28 (Tue)