2000-03-02 (Thu)
最近話題になっているWindowsのconconバグ(ソフトウェアの欠陥),かなり強力。たとえばこれ。これをimgタグやスタイルシートに仕込めば,HTMLを表示するだけでWindowsを落とすことができる。cgiに仕込めばWindowsベースのWebサーバーも落とすことができる。ちょっと凄い。
最近話題になっているWindowsのconconバグ(ソフトウェアの欠陥),かなり強力。たとえばこれ。これをimgタグやスタイルシートに仕込めば,HTMLを表示するだけでWindowsを落とすことができる。cgiに仕込めばWindowsベースのWebサーバーも落とすことができる。ちょっと凄い。
1999.08.18/02の続き,UnicodeのCJK UNIFIED IDEOGRAPHについて。lilo MLでの議論を通じて私が得た結論。
まず,漢字はそれ自体では一つの用字系であり,日本漢字,簡体字,繁体字で全く別のコードを与える必要はない。CJKの間で字形が等しいものは同じ文字であって,これに同じコードポイントを与えるのは自然である。
UnicodeのC欄,J欄,K欄の各漢字は,異なる文字に一つのコードポイントを与えたものがある。すなわち,漢字においては字形の異なりによって同じ文字か判断することになるが,CJKの間で同じ文字といえないほど字形が異なるものがある。これはコードポイントを節約するための措置だったが,16bitに収納できないことが決定した現在では,全く先見性がなかったとしか言いようがない。
すでにUnicodeが普及しつつあるので,何かしら運用で回避する方法を考えないといけないだろう。
この,あるコードポイントの(複数の)文字を区別するには,言語タグを用いる。ただし注意しないといけないのは,CJKで同じ文字の場合は言語タグが違っても区別してはならない,すなわち,CJKで異なる文字の場合のみ言語タグによって区別しなければならない。したがって,どのコードポイントが異なる文字をunifyしているかのデータベースが必要になるが,これは難儀だなぁ。
ここでいう言語タグは,あくまでも文字を区別するためのもので,テキストの言語を指定するものではない。ある文字を取り出したとき,(特定の言語でしか用いられない文字を除き)その文字自体は何かしら特定の言語を示したりはしない。すなわち「一」という文字だけでは,何語かは分からない。これはラテン文字でも同様。
今さらながら,Anna and the King。はぅー,よい。ほろりときてしまった。
やっと確定申告を書く。11年の収入,831,125円なり。失業が長かったからこんなものか。
日記の検索機能が完成。
朝からバンド練習。寝坊してまう。
昼から三宮。すでに持ってるCDを買ってまう。あぅ,厄日か?
携帯電話,交換。
本をいろいろ買う。
昨日,今日と東京出張。小旅行みたいで楽しかった。さて明日はどれだけ仕事が溜まっているかしら。
出張の出来事は気が向けば明日にでも書くけど,敗因は「あぁ,大阪から」。
予想通り仕事が溜まってる。なんか急ぎの分も残ってるし。何なんだ。
晩,難波に着いたら電話し,と言われたが,難波で電話をしたら通じない。気分悪い。無理して仕事切り上げるんじゃなかった。
ゲーセンで小一時間ほど遊んで帰る。
--
東京話の続き。昨日書いた敗北の後,高島屋内のハンズとかで小物を買い求める。
昨日は夕方から,
--
Web掲示板の新版を公開。検索できるようになった。
2000.02.09ぐらいにタイトルをQ's crafting atticからNetsphere Laboratoriesに変更したが,なかなか次のソフトを完成できない。
現状書いてるのはデスクトップ・ソフトウェアだけど,データがローカルになくって,データ共有できるようになるはず。
QILM v2.65公開。Webブラウザとの連携を強化。ダウンロード機能の強化は先送り。