読者です 読者をやめる 読者になる 読者になる

プログラミングの魔物

エラー、バグ、仕様変更と戦うブログ

PHP Simple HTML DOM Parser

PHP Simple HTML DOM Parserはその名の通りHTMLのパーサー。
スクレイピングするために使用している。
比較検討したわけではないのでひょっとしたらもっと優れたものがあるかも知れないけど、今のところ満足している。

マニュアル

http://simplehtmldom.sourceforge.net/manual.htm
Quick Startを読むと大体分かる。
jQuery風の要素指定が可能。

文字列からオブジェクトを作れるので文字コード変換等の対応はそれで。

APIヘルプ

http://simplehtmldom.sourceforge.net/manual_api.htm

書き換えや保存も可能な様子。
外部HTMLを取得した後、書き換えて保存するといった用途に使えるかもしれない。