INFORMATION
テクノロジ

Apache Lucene 7.7.0 が公開されました!

Apache Lucene 7.7.0 が 2019 年 2 月 11 日に公開されました。

Apache Lucene は完全に Java で書かれたハイパフォーマンスな全文検索エンジンです。今回行われた主なアップデート内容を以下に記します。

主なアップデート – バグ修正,最適化,機能強化

  • 日付変更線をまたいだ LatLonShape.newPolygonQuery が正しく動作するようになりました。
  • LatLonShape の WITHIN と DISJOINT を使ったクエリが間違った結果を返していた問題を修正しました。
  • range クエリや geo クエリ使用時にタイムアウトの設定が可能になりました。
  • StandardTokenizer と UAX20URLEmailTokenizer が Unicode9.0 をサポートしました。これによって UTS#51 で定義された Emoji を正しく分割できるようになりました。
  • TopFieldCollector が SortField.DOC でソートする際に Early-terminate クエリを発行できるようになりました。
  • point フィールドが記述されているセグメントのマージが高速化されました。
  • KoreanTokenizer で Character#UnicodeScript#of を使用することで,未知語分割の精度が向上しました
  • LatLonShape のエンコーディングで1次元毎に4バイト使用するようになりました。
  • BufferedUpdates クラスの docValues のバッファリングを最適化することで,ヒープの使用量が最大で 80% 削減されるようになりました。
  • DocValuesFieldUpdates で docValues を更新する際のパフォーマンスが最大で 4 倍向上しました。
  • DocValuesFieldUpdates で docValues を更新する際のソート方法を変更したことでパフォーマンスが向上しました。
  • 高次元な LatLonShape が格納されているインデックスマージの I/O 負荷が軽減しました。

リリースの詳細と Lucene ダウンロードについて

すべての新機能および変更点に関しては CHANGES.txt を参照してください。 https://lucene.apache.org/core/7_7_0/changes/Changes.html

現在の最新の Lucene ダウンロードについては下記 URL を参照して下さい。 http://lucene.apache.org/core/mirrors-core-latest-redir.html


トレーニングコース

ロンウイットのトレーニングは、Lucene/Solrの経験豊富なコミッターの
監修のもと開発されたハンズオン(実習)形式のコースです。

セミナー

ロンウイットのApache Software Foundationコミッターが、情報検索の基礎、自然言語処理、そして、ユーザにとっての効果についてご説明させていただきます。