INFORMATION
サービス

Apache OpenNLP 1.9.0 がリリースされました!

Apache OpenNLP チームはバージョン 1.9.0 のリリースをアナウンスいたします。Apache OpenNLP ライブラリは自然言語テキストを処理するための機械学習ベースのツールキットです。多くの一般的な NLP タスクをサポートします。たとえば、トークナイズ、文セグメント化、品詞タグ付け、固有表現抽出、チャンク化、構文解析などです。

OpenNLP 1.9.0 のバイナリおよびソースは私どものダウンロードページより配布されます:https://opennlp.apache.org/download.html

OpenNLP ライブラリは Maven Central からも配布されます。詳しくは Maven 依存ページをご覧ください:http://opennlp.apache.org/maven-dependency.html

このバージョンでの変更点

  • Brat 文書パーサーが名前タイプフィルターをサポートしました。
  • Brat フォーマットが複数フラグメントアノテーションを正しくサポートするようになりました。
  • リリースプロセスから MD5 ハッシュを削除しました。
  • LanguageModel API にて StringList の代わりに String[] を使うようになりました。
  • Brat アノテーションサービスが正しく起動するようになりました。
  • トークンモデル生成にて タグが1つもないときは不正終了するようになりました。
  • Penn Treebank URL を新しくしました。
  • Feature Generator XML のフォーマットが新しくなり、ドキュメントにも記載されました。
  • 入力 context feature のコードを一体化しました。
  • FeatureGeneratorUtil が日本語のひらがなとカタカナ文字を認識するようになりました。

その他の詳しい不具合修正と改善内容については、配布パッケージに含まれるリリースノートを参照してください。

Apache OpenNLP チーム


KandaSearch

KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。

  • セマンティックサーチ

    人間が理解するように検索エンジンがテキストや画像を理解して検索できます。

  • クローラー

    検索対象文書を収集するWebクローラーが使えます。

  • 簡単操作のUIと豊富なライブラリー

    検索や辞書UIに加え、定義済み専門用語辞書/類義語辞書やプラグインがあります。

  • ローコードで低コスト導入

    検索UIで使い勝手を調整した後、Webアプリケーションを自動生成できます。

セミナー

企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!