Arch Search Engine 1.15

ライセンス: 無料 ‎ファイルサイズ: 31.07 MB
‎ユーザー評価: 3.5/5 - ‎2 ‎投票

Archは、Apache Nutch (一般的な、非常にスケーラブルな汎用検索エンジン) のイントラネット検索のオープンソースの拡張です。あなたの企業の検索エンジンに満足していませんか?当然のことながら、非常に少数の人々です。私たちの知る限りでは、Googleのグローバルウェブ検索と同様に機能するイントラネットエンジンはありません。これには根本的な理由があります:Googleがグローバルウェブ(または同様)で使用するアルゴリズムは、統計データがないためイントラネット上ではほとんど機能しません。アーチ(最後に!)は、この問題を解決します。これは、素晴らしい作品を高精度の検索結果を提供するために、新しい方法を使用しています。信じないのか?ブラインドテスト評価ツールが含まれています。Arch を導入し、ブラインド テスト手法を使用して、そのパフォーマンスを現在の検索エンジンや Google (サイトの一般公開部分) と比較できます。 優れた検索品質に加えて、Archは企業環境に不可欠な多くの機能を備えています。 - ドキュメント レベルのセキュリティ。ユーザーは、表示を許可されているドキュメントのみを検索できます。 - 安価なインデックスの更新。Arch はインデックスを最新の状態に保ち、定期的にサイトを完全に再クロールしないようにすることができます。 - 24時間365日のアベイラビルティ。クロールが失敗した場合でも、常に有効なインデックスが使用できます。 - 複数の Web サイトの同時インデックス作成と検索をサポートし、必要に応じてサイトを個別に検索および管理できます。Webサイトの動的な追加と削除は簡単です。 - 自動生成されたサイト ディレクトリ。 - 一度展開された低コストのサポート。 - 簡単な展開とカスタマイズのためのデュアルインターフェイス(PHPとJava)。 - ファセット検索 "アウト・オブ・ザ・ボックス&クォート; - HTML、PHP、PDF、MS Office、オープンオフィスなど、さまざまなファイル形式を解析するための広範で拡張可能なパーサーのセット。 - 簡単にカスタマイズおよび拡張できる、モジュール式のプラグインベースのアーキテクチャ。 - ソースコードが含まれています。 - 高いパフォーマンスと拡張性。Arch は、コンピュータ クラスタ上で実行して、非常に大きなデータ セットにインデックスを付けることができます。

バージョン履歴

  • バージョン 1.15 に転記 2019-05-17
    ナッチ1.15に移植
  • バージョン 1.9.2 に転記 2016-08-18
    Nutch 1.9で移植された、ドキュメントの解析が改善されました。
  • バージョン 1.2 に転記 2010-09-17
    Apache Nutch 1.2 に移植され、PDF パーサーをアップグレードし、テストとチューニングツールを追加し、ベータ版で見つかった問題を解決し、コンピュータークラスタの使用を可能にしました。

プログラムの詳細