からだのブログ

五体満足に生まれてきたことに感謝してブログの名前を「からだ」にしました。

からだのブログ header image 2

SgmlReader

1月 1st, 2008 · 1 Comment · tek

HTML (not XHTML) をC#でXMLとして読み込もうとすると、ダメじゃん。

XHTMLじゃないHTMLはXMLじゃないので、当然そうなる。で、XHTMLでなくてもいいから(非推奨の属性とかあってもいい、ってことね)、とにかくXMLにしたかったんだけど、いいのが見つかった。

SgmlReader
http://sourceforge.net/project/showfiles.php?group_id=173074&package_id=246977

ロバスト具合がなかなかよい。素晴らしい。

これでようやくXMLというクリーンルームで作業できそうだ。もういやだ、僕は薄汚れた外の世界になんか出たくないんだ。うぐぅ。。。

Tags: