Webデータ抽出Proは、さまざまなデータ型の大量収集のために特別に設計されたウェブスクレーピングツールです。URL、電話番号、FAX番号、メールアドレス、メタタグ情報、本文テキストを収集できます。WDE Proの特長は、構造化データのカスタム抽出です。この高速かつマルチスレッドプログラムは、検索エンジンにキーワードを使用して、WebサイトまたはURLのリストをファイルからスパイダーすることによって動作します。また、元のページからの外部リンクをフォローできるようにして、必要な URL パスを深く調べて、実際にインターネット全体を検索することもできます。Web データ抽出機能は、Web サイトの複数のレイヤーを検索して提供するキーワードに関連する構造化情報や特定のデータ型を収集する場合に優れています。
バージョン履歴
- バージョン 3.10 に転記 2020-01-06
電子メール アドレスの大幅に向上したパーサー;ユーザー エージェントの一覧が更新されました。ターゲット Web サイトとの作業をさらに効果的に行うための接続に、抽出されていない URL の追加と "拡張されたヒューマン ファクター" オプションが追加されました。プロキシとのより効果的な作業のためにプロキシサーバーでリンク"のY数を読んだ後、各X分"および"更新をチェックするオプションを追加しました。お客様のレビューに応じて多くの改善が行われました! - バージョン 3.9 に転記 2018-12-30
検索エンジンのリストは、古い/壊れたリンクのクリアされます。これにより、検索エンジンモードでソフトウェアの速度を上げ、ソフトウェアの速度を上げ、検索エンジンモードでの使用を可能にしました。電子メール アドレス パーサー、特に JS (JavaScript) 隠しメールの大幅な改善;CSV ファイルから独自のプロキシ サーバーをインポートするオプションの改善;HTTPS Web サイトの作業の改善;大きな URL リストを操作する際のパフォーマンスの向上;改善された "Cookie キャプチャ&クォート;お客様のフィードバックに応じた、さまざまなマイナーな修正/改善 - バージョン 3.8 に転記 2017-12-29
PDFファイルから情報をロードし、抽出する機能を追加しました。プログラムの使用期間が終了したときに、UI フォームからライセンス ファイルを直接読み込む機能を追加しました。または、試用期間が切れていない場合は、ライセンス ファイルを [オプション] -> [について] フォームからアップロードすることもできます。プロキシ サーバーを使用する作業が大幅に改善されました。エンコードされた JS-メールのパーサーが改善されました。コンテキスト メニュー項目 "Re-start URL" が "Bad URL" リストに追加されました。すべてのデータとサービスファイルと一緒にセッションを削除する機能を追加し、また、ソフトウェアは自動的に必要なディスクスペースを減らすためにプログラムの内部リポジトリを圧縮します。UI に "初期参照元" テキスト フィールドが追加されました。ウェブサイトによっては、どの外部サイトから来たかによって異なる情報が表示される場合があります。"初期参照元" フィールドでは、そのようなサイトの Web アドレスを指定できます。また、お客様からのフィードバックを踏まえて、さまざまなマイナーチェンジや改善を行いました。 - バージョン 3.7 に転記 2017-02-28
"検索エンジン&クォートモードの改善された作業;改善された "HTML タグ&クォートの削除;および"Pageは、データ&クォートを抽出するために次のテキストを含める必要があります。追加された "国 IP フィルターを使用するフィルターを使用して、"検索エンジン オプションで選択された国に (地理位置情報によって) 関連しないサーバーの結果を除外できます。大幅に改善された電子メールパーサーとカスタムビルダーパーサー;データ検出と抽出の一般的な改善。また、お客様からのフィードバックを踏まえて、さまざまなマイナーチェンジや改善を行いました。 - バージョン 3.6 に転記 2016-08-22
リダイレクトを通じて表示される URL (ウェブサイトのアドレスなど) を抽出する "カスタム データ エディター" フォームに、チェック ボックス "Get リダイレクト URL" を追加しました。チェックボックス"非応答プロキシを非アクティブ自動"のようにマークするが追加されました。セッションプロキシサーバが不良(動作していない)と判断された場合、自動的に非アクティブとしてマークされ、セッションで使用されません。新しいオプション "1 行の merge" を使用して、データを 1 つの文字列にマージするオプションが追加されました。たとえば、次のような T シャツの色をエクスポートできます。インターネットからのパブリック プロキシ サーバーの読み込みが大幅に改善されました。"ヒューマンファクター&クォート; オプションが改善されました;JS電子メールのドレスによって閉じられたのパーサを改善しました。Google経由でデータを検索する際にGoogleキャプチャを渡すオプションを改善しました。また、お客様からのフィードバックを踏まえて、さまざまなマイナーチェンジや改善を行いました。 - バージョン 2.0 に転記 2012-08-29
スキャンの深さを決定するためのアルゴリズムを修正しました, データベースの物理的な損傷に対するプログラムの持続可能性が追加されました, 改善されたストリーム制御, 全体的なパフォーマンスにプラスの影響を与えます, "検索エンジン" モードでキーワードの大きなリストを持つ改善された作業
プログラムの詳細
- カテゴリ: ネットワークとインターネット > 検索/検索ツール
- パブリッシャー: WebExtractor System
- ライセンス: 無料トライアル
- 価格: $199.00
- バージョン: 3.10
- プラットフォーム: windows