お問い合わせ採用情報お客様ログイン

RONDHUIT

テクノロジーTECHNOLOGIES

ホーム > テクノロジー > 自然言語処理/機械学習

自然言語処理/機械学習

自然言語処理・機械学習ロンウイットでは、検索システムをより使いやすく高品質にするためにこれらの技術を適宜応用しています。

NLP4L

NLP4Lは、Apache Luceneのための自然言語処理ライブラリです(NLP4LはNatural Language Processing for Luceneの略です)。オープンソースの検索エンジンライブラリApache Luceneをベースにするあらゆるアプリケーションや製品と組み合わせて活用できるよう設計されています。たとえば、Apache SolrやElasticSearchなどと一緒に使えば、企業が生成・管理するLuceneインデックスに登録されたデータからさまざまな知識を抽出しますので、最小限の投資で検索の精度を高めたり、Webサイトの利便性向上に貢献します。

以下のような機能があります。

  • 関連語ネットワークの抽出と可視化
  • 辞書型コーパスからの類義語知識の自動獲得
  • 情報検索に最適化されたN-best解出力対応形態素解析器
  • 専門用語抽出
  • Apache Mahout分類器用のLuceneインデックスからの単語情報抽出
  • Luceneインデックスからの共起単語の抽出と検索
  • 系列パターンマイニングを用いた単語出現パターン学習

関連リンク

Apache Mahout

Apache Mahout は機械学習のライブラリです。Apache Hadoop の MapReduce フレームワーク上で学習アルゴリズムが実行されるため、大量の訓練データをスケーラブルに処理できます。

ロンウイットでは自然言語の文書処理等にMahoutを利用しています。またトレーニングコース「Apache Mahout ではじめる機械学習」を通じてお客様に基本知識をご提供する活動を行っています。

関連リンク

ピックアップ

お問い合わせ

 

PAGE TOP
HOME
Apache Solr, Lucene, Hadoop, Mahout, Spark, ManifoldCF, UIMA and their logos are trademarks of the Apache Software Foundation.
Copyright © 2006-2015 RONDHUIT Co, Ltd. All Rights Reserved.