INFORMATION
サブスクリプション

NLP4L 0.5.0 リリースのお知らせ

お客様各位

平素はお引き立てを賜り、ありがとうございます。

この度、弊社サブスクリプション・パッケージの機能拡張として、NLP4L 0.5.0 をリリースしましたのでお知らせします。

NLP4LはNatural Language Processing for Luceneの頭文字をとって命名された、Lucene/Solrのための自然言語処理パッケージです。

NLP4LはLuceneインデックスのデータを単語単位で整理されたコーパスとみなして活用することで、次のねらいを達成いたします。

  • Lucene/Solrの基本検索のF値(精度と再現率を同時に評価する指標)を向上します。
  • Lucene/Solrの応用検索(もしかして、サジェスト、レコメンド、クラスタリング等)の精度や利便性を向上します。
  • Lucene/Solrの運用コストを低減します。
  • Luceneインデックスのデータをコーパスとみなすので、追加投資が不要です。お客様が現在保有している文書データの能力を最大限引き出します。

NLP4Lの最初のリリースでは、次の機能をご提供いたします。

関連語ネットワークの抽出と可視化
辞書型コーパスからの類義語知識の自動獲得
日本語単語分割の多義性に対応した形態素解析器
Luceneインデックスからの専門用語抽出
Luceneインデックスからの共起単語の抽出と検索
系列パターンマイニングを用いたLuceneインデックスにおける単語出現パターン学習
HTMLページからのノイズの削減
類義語に対応した文字N-gramトークナイザー

それぞれの機能についての詳しい説明は、今後公開するWeb記事またはマニュアルをご覧ください。

更に、弊社コンサルティング・サービスを組み合わせてご活用いただくことで、お客様の高度な検索課題を解決できると思っております。

NLP4Lがお客様の文書データの能力を引き出し、検索精度の向上やお客様のWebサイトの利便性向上に役立てば幸いです。

今後ともよろしくお願い申し上げます。


トレーニングコース

ロンウイットのトレーニングは、Lucene/Solrの経験豊富なコミッターの
監修のもと開発されたハンズオン(実習)形式のコースです。

セミナー

ロンウイットのApache Software Foundationコミッターが、情報検索の基礎、自然言語処理、そして、ユーザにとっての効果についてご説明させていただきます。