INFORMATION
テクノロジ

Apache Lucene 8.4.0 が公開されました!

Apache Lucene 8.4.0 が 2019 年 12 月 29 日に公開されました。

Apache Lucene は完全に Java で書かれたハイパフォーマンスな全文検索エンジンです。今回行われた主なアップデート内容を以下に記します。

主なアップデート – 新機能

  • LatLonShapeは、”CONTAINS” 関係をサポートします。これにより、インデックスされた形状が、クエリーの形状に含まれているデータを検索できるようになります。

主なアップデート – 最適化,機能向上

  • スレッド間にて、情報を共有することにより、関連が低いヒットをスキップするようになり、並列検索がより効率的になりました。
  • 密なFSTに対して、より高速なルックアップが可能になりました。
  • ポスト機能は、SIMD インストラクションにてデコードするようになりました。
    これにより、ポスト機能の並列処理化が期待できます。
  • LRUQueryCache に新しいヒューリスティックが追加されました。
    これにより、キャッシングに特に時間のかかるクエリーがなくなりました。
  • LatLonShape は、検索速度向上のため、より効率的な木構造を作成するようになりました。
  • FilterDirectoryReaderは、numDocs の値を遅延評価するようになりました。
    これにより、パフォーマンスが向上しました。
  • BKD木の上位にインデックスされたドキュメントは、MMapDirectory を使い、off-heap に格納されます。これにより、GCのオーバーヘッドを避けることが期待できます。
  • シンプルインターバルクエリー(Simple Intervals Queries)は、ハイライトをサポートしました。
  • DocValues を読んでいる間に TimeOutが発生した場合、例外を投げるようになりました。

リリースの詳細と Lucene ダウンロードについて

すべての新機能および変更点に関しては CHANGES.txt を参照してください。 https://lucene.apache.org/core/8_4_0/changes/Changes.html

現在の最新の Lucene ダウンロードについては下記 URL を参照して下さい。 http://lucene.apache.org/core/mirrors-core-latest-redir.html


KandaSearch

KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。

  • セマンティックサーチ

    人間が理解するように検索エンジンがテキストや画像を理解して検索できます。

  • クローラー

    検索対象文書を収集するWebクローラーが使えます。

  • 簡単操作のUIと豊富なライブラリー

    検索や辞書UIに加え、定義済み専門用語辞書/類義語辞書やプラグインがあります。

  • ローコードで低コスト導入

    検索UIで使い勝手を調整した後、Webアプリケーションを自動生成できます。

セミナー

企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!