INFORMATION
サービス

Apache OpenNLP 1.9.0 がリリースされました!

Apache OpenNLP チームはバージョン 1.9.0 のリリースをアナウンスいたします。Apache OpenNLP ライブラリは自然言語テキストを処理するための機械学習ベースのツールキットです。多くの一般的な NLP タスクをサポートします。たとえば、トークナイズ、文セグメント化、品詞タグ付け、固有表現抽出、チャンク化、構文解析などです。

OpenNLP 1.9.0 のバイナリおよびソースは私どものダウンロードページより配布されます:https://opennlp.apache.org/download.html

OpenNLP ライブラリは Maven Central からも配布されます。詳しくは Maven 依存ページをご覧ください:http://opennlp.apache.org/maven-dependency.html

このバージョンでの変更点

  • Brat 文書パーサーが名前タイプフィルターをサポートしました。
  • Brat フォーマットが複数フラグメントアノテーションを正しくサポートするようになりました。
  • リリースプロセスから MD5 ハッシュを削除しました。
  • LanguageModel API にて StringList の代わりに String[] を使うようになりました。
  • Brat アノテーションサービスが正しく起動するようになりました。
  • トークンモデル生成にて タグが1つもないときは不正終了するようになりました。
  • Penn Treebank URL を新しくしました。
  • Feature Generator XML のフォーマットが新しくなり、ドキュメントにも記載されました。
  • 入力 context feature のコードを一体化しました。
  • FeatureGeneratorUtil が日本語のひらがなとカタカナ文字を認識するようになりました。

その他の詳しい不具合修正と改善内容については、配布パッケージに含まれるリリースノートを参照してください。

Apache OpenNLP チーム


トレーニングコース

ロンウイットのトレーニングは、Lucene/Solrの経験豊富なコミッターの
監修のもと開発されたハンズオン(実習)形式のコースです。

セミナー

ロンウイットのApache Software Foundationコミッターが、情報検索の基礎、自然言語処理、そして、ユーザにとっての効果についてご説明させていただきます。