随感録 2004年10月

2004-10-29 (Fri)

昨日の話。トップページのタイトルロゴを替えた。あと、スタイルシートでmax-widthを指定して、幅を制限してみた。

Internet Explorerは、max-widthプロパティをサポートしていないので、工夫が必要。IE独自のexpression()を使ってみた。

width:expression(document.body.clientWidth > 800 ? "800px" : "auto");

2004-10-30 (Sat)

htmlsplit, htmlrepairのパッチを書いた。こちら;htmlsplit / htmlrepair 

もっぱら信頼できないHTMLデータを読み込んで、加工したい場合に使うようなHTMLパーサ、ということでhtmlsplitを選んでみた。このほか、RAAで探すと、HTMLパーサには次のようなものがある。しかし多い。

html-parser
PythonのSGML parserに似せたもの。やや冗長。メンテナンスされていない。
html-parser-2
html-parserにパッチを当てたもの。それだけ。
HTMLTokenizer
HTMLTokenizer#getNextToken()で読み進めていく。文書型宣言とかは読めないのかな。
xmlscanに付属のhtmlscan
デザインパターンのVisitorパターンで作られている。visitorクラスを作るのがやや面倒。メンテされていない?
tagiter
面白そうだが、方向性が違う。
mltagparser
DOMを構築したいようだが、やや中途半端な気が。