Apache Lucene
Apache Lucene(アパッチ ルシーン)はApache Software Foundation(ASF)で開発・管理されている、Javaで書かれたオープンソース・ソフトウェア(OSS)の検索エンジン・ライブラリです。ASFで管理されているソフトウェア製品の種類は数十にものぼり、すべてボランティアのソフトウェア技術者(開発者)によって開発されています。
Luceneもそのようにして開発されているOSSであり、ロンウイット社員もコミッターとしてLuceneコミュニティで活発に活動しています。
Apache Solr
Apache Solr(アパッチ ソーラー)はASFで開発・管理されている、Javaで書かれたOSSの検索エンジン・サーバです。内部でLuceneを利用しています。SolrもLucene同様、ボランティアの開発者によって開発されています。ロンウイット社員もコミッターとしてSolrコミュニティで活発に活動しています。
Apache ManifoldCF
Apache ManifoldCF(アパッチ マニフォールドシーエフ)はASFで開発・管理されている、Javaで書かれたOSSのクローラーです。クローラーとは、Webや社内ファイルサーバなどに保存されている文書を収集するプログラムのことで、検索エンジンと組み合わせて利用します。
ManifoldCFはその名が示すとおり、さまざまなシステムをクロールできる多様性(manifold)を持ち、Active Directoryなどと組み合わせることでセキュリティを考慮に入れた検索を可能にするパーミッション情報収集能力があります。
ManifoldCFもLucene/Solr同様、ボランティアの開発者によって開発されています。ロンウイット社員もコミッターとしてManifoldCFコミュニティで活発に活動しています。
Apache UIMA
Apache UIMA(アパッチ ユイーマ)はASFで開発・管理されているOSSの非構造化データ管理フレームワークです。UIMAの枠組みを使ってテキストなどの非構造化データから固有名詞などのメタデータを抽出します。抽出したメタデータは、検索エンジンに登録することで検索の機能性や品質を高めるのに寄与します。
ロンウイットでは、UIMAを使って日本語文書から固有名詞などを抽出するツールをOSSとして公開しています。
自然言語処理/機械学習
自然言語処理や機械学習は検索システムと密接な関係があります。ロンウイットでは自然言語処理ツールである形態素解析器や固有表現抽出サーバをOSSとして公開しています。
