C# Web Scraping Library 4.0.4.2
5秒でダウンロードできます。
に関しては C# Web Scraping Library
C# の Web スクレーパーを使用すると、.Net 開発者は、Web アプリケーションからコンテンツを抽出し、それを JSON、スプレッドシート、C# オブジェクト、または単純な C# と Linq コードを使用した SQL に変換する論理を作成できます。 Iron WebScraper は.Net 4.5 および Core プラットフォーム用の Web スクレーピングライブラリで、開発者はクリーンでシンプルなロジックを使用して、任意の Web リソースを C# オブジェクトまたは SQL に戻すことができます。 これは、設定されたステップ(もしそうなら、この場合)ワークフローを使用してページを抽出し、インターネットまたはローカルイントラネット上のhtml、javascript、xml、RSS、pdf、オフィス文書を簡単に削り取って解析し、有用な構造化データに戻すことができます。 これにより、開発者は理解しやすくデバッグしやすい、クリーンで効率的な Web スクレイピング アプリケーションを提供します。 C# Web スクレイピング ライブラリは非常に丁寧で、ドメインまたは IP アドレスに同時要求が多すぎないようにします。 クライアント側とサーバー側の両方をインテリジェントに調整し、CPU の過剰な使用率を探し、適切なペースに減速します。 さらに、ボット固有のクロールレートや制限を含むロボット.txt指令に従うことができます。 厳密な URL とコンテンツ タイプは、論理的なワークフローと正規表現/ワイルドカードルールを使用して設定できます。 スクリーンスクレイピングは、アイデンティティ制御を自動的に管理し、スレッド、レート制限、URL、重複、再試行、プロキシ、ヘッダー、クッキーを仮想ブラウザの軍隊に自動的に管理し、人間の行動やクライアントボタンを模倣したり、フォームに記入したり、セキュリティウォールの背後にログインしたりすることができます。 これは、レガシーシステムの移行、エンタープライズ検索機能の導入、統計的競合分析に役立ちます。 C# Web スクレーパーの完全なドキュメント、サポート、ダウンロード可能な DLLS は、Azure と Mono の完全な互換性を備えた .Net 4.5+ Nuget パッケージへのリンクに加えて、http://ironsoftware.com/csharp/webscraper/から入手できます。