Apache ManifoldCF

ManifoldCFはJavaで書かれたOSSのクローラーです。クローラーとは、Webや社内ファイルサーバなどに保存されている文書を収集するプログラムのことで、ロボットなどと呼ばれることもあります。

クローラーは検索エンジンには不可欠なプログラムです。クローラーで収集した文書を検索エンジンに登録して検索対象とします。

ManifoldCFはSolrのコネクターを持ち、収集したファイルを簡単にSolrに登録することができます。

また、ManifoldCFは差分クロールやファイルパーミッション情報のクロールを行うことができます。セキュリティ情報をきめ細かく取得することができるので、企業内検索システムでは不可欠な役職や所属部署によるセキュリティを考慮した検索機能が実現可能です。

ロンウイット社員も開発の中心メンバーとして、ManifoldCFの不具合の修正や新機能の追加を行う活動をしています。

関連リンク


関連記事


▲ ページの先頭に戻る