htmlcxx は、C++ 用の単純な非検証 html パーサー ライブラリです。解析ツリーから元の HTML ドキュメントを文字ごとに完全にダンプできます。また、直感的なツリートラバーサルAPIを持っています。