INFORMATION
サービス

[インタビュー]Solrサブスクリプションご利用会社
株式会社 NTTドコモ様

高精度な位置情報検索サービスを実現するためには Solr の柔軟性とロンウイットの技術力が不可欠だった


モバイル通信キャリアとして日本トップクラスのシェアを誇る NTTドコモ。しかし、その事業のフィールドは携帯電話だけにとどまらず、光ブロードバンドサービスや、衛星電話サービス、動画・音楽の配信、金融・決済サービスなどスマートライフサービスにも及んでいます。さらにNTTドコモR&Dセンターを中心に、インターネットや情報システムの未来を見据えた最先端の要素技術の研究開発も行われています。今回はロンウイットのサポートのもと、Solr 技術を活用した POI(Point of Interest)検索エンジンのサービス化に取り組むR&Dイノベーション本部サービスイノベーション部の皆さんにお話を伺いました。

株式会社NTTドコモ様


左から、㈱ロンウイット 代表取締役社長 関口、協力会社 ㈱VSN 山﨑亘涼さん、㈱NTTドコモ 大西杏菜さん、協力会社 ㈱VSN 薄麻子さん、㈱NTTドコモ 川崎仁嗣さん

検索エンジンへの取り組みはカーナビの開発がきっかけだった。

ロンウイット「NTTドコモというとモバイル通信サービスを提供している企業というイメージが強くあります。どんなことがきっかけで、検索エンジンの研究開発がスタートしたのでしょうか。」
川崎様「そもそものきっかけは、2015年ごろから地図情報会社との協業で「AI インフォテイメントサービ ス」というシステムの開発がスタートしたことです。これは音声入力で目的地を検索できることに加え、 SNS 上で施設がどれくらい話題になっているか等の解析結果を利用することで、検索結果を人気度順に表示することのできる高度な情報検索技術が盛り込まれたもの。カーナビ開発メーカーや自動車メーカーなどに向けて提供することを計画していました。しかし、実際に試作を行ってみると、思ったほど正確に検索を行うことができず、目的地を正しく設定することが難しかったのです。当初は地図情報会社が開発した検索エンジンを活用していたのですが、これでは無理だ、という話になり、より精度の高いものを探すことになったのです。」
大西様「Solr の採用が検討されるようになったのは、前任者の時代ですので、残念ながら正確な経緯は分かりません。しかし、大幅なカスタマイズを加えるなら、商用の検索エンジンよりもオープンソースのほうが適しているだろうという判断だったと思います。Solr のコミュニティーは、オープンソースソフトウェア全体の中でも非常に活発な活動が行われていますし、日本で『 Solr 』と検索すると、一番に表示されるのはロンウイットです。この会社とパートナーシップを組むのが適切だろうということになったのでしょう。」

地名と施設名を切り分けるため、プラグインの開発を依頼した。

ロンウイット「当初はどんな形でロンウイットとのお付き合いが始まったのでしょう。」
川崎様「2016年の初めに問い合わせを行い、Solr の基本的な機能や、ロンウイットが提供することのできるサービスについて、ご説明を受けました。その数か月後に、前任者がロンウイットの主催する Solr トレーニングを受講し、同社のサブスクリプションサービスの利用を開始しています。それから1年ほどをかけてロンウイットとのディスカッションを続け、POI 情報を扱う際の検索エンジンの問題点について、議論を深めていきました。」

ロンウイット「検索エンジンで位置情報を扱う際に、何か特別の問題が生じるのでしょうか。」
大西様「まずは、店舗や施設を検索しようとする時、キーワードのどの部分が地名で、どこからが施設名なのかが分からないという問題がありました。例えば『横浜のコンビニ』というキーワードが入力された場合、横浜市内全域のコンビニを表示すればいいのか、店舗名に横浜店と付く店を探しているのかは判然としません。そこで、ロンウイットに、こうした問題を解決するためのプラグインの開発を依頼したのです。」
薄様「地名か施設名か判断する機能は、Solr に地名の一覧辞書を持たせることで実現しました。キーワードの内、辞書と一致する部分の文字列は地名、残りの文字列を施設名とし、住所にその地名を含む施設名を検索することで、より確からしい検索結果を返すことを目指しました。」

位置情報検索の膨大な実績から検索結果の「正解セット」を作成。

ロンウイット「開発は順調に進んでいったのでしょうか。」
関口「NTTドコモ様の場合、入力されたキーワードに対してどんな検索結果が表示されればよしとするか、という「正解セット」を用意していただけたことが、開発の大きな助けになりました。これはNTTドコモ様が POI 検索への取り組みの中で、膨大な POI 検索のデータをお持ちだったからこそご用意いただけたもの。通常の場合、『正解セット』を用意するには手間もコストもかかりますから、実は何が正解かはっきりとしない、という状態で検索エンジンが開発されていることも多いのです。」

ロンウイット「『正解セット』はデータとして、どのぐらい用意されていたのですか」
山﨑様「『正解セット』の作成は、私が担当していましたが、キーワードと検索結果のペアは全体で4000ほどです。どのようなキーワードに対してどのような結果が出るか、という傾向が分析できれば良いので、ある程度の検索パターンを網羅すれば、想定される全てのキーワードに対する正解を用意する必要はありません。また検索の結果として、不適当な施設情報が上位に表示されるようなケースでも、正解セットを使ってエンジンのチューニング を行うことで、個別に対応を行わなくても、表示順位を下げることもできます。」



大西様「そこは、一般的なネット検索の SEO 対策と同じ考え方ですね。どのような検索結果が表示されるのが望ましいか、という分析ができれば、スコアリングで精度を高めていくこともできるのです。ただし、この場合、何度、検索しても同じような結果になる、という再現性の検証を行う必要も出てきます。」

音声入力ならではの、あいまいな表現も大きな課題だった。

ロンウイット「地名と施設名の切り分けができるようになることで、目標としていたような精度は実現できたのでしょうか。」
川崎様「さらに大きな課題だったのは、音声入力固有の問題です。私たち人間は声でキーワードを伝えようとすると、かなりいい加減なことを言いがちです。『この前、行ったあの店』とか『話題になっているイタリアン』とかですね。こうした問題は、検索エンジンそのものをカスタマイズすることでは解決できません。そこで私たちは、SNS 上の情報と位置情報を組み合わせることで、こうした非常にあいまいなキーワードにも対応できるように工夫を凝らしています。」

ロンウイット「『この前』とか『話題の』というキーワードでは、検索が不可能なようにも思えます。」
大西様「それがそうでもないのです。ユーザが密集している地域の情報や、SNS でのつぶやきを解析した情報を組み合わせて分析することで、どのような施設や店舗が話題になっているか、ということが分かります。それらの情報と、検索キーワード内の住所やジャンルなどを組み合わせることで、尤もらしい結果を推定することは可能です。ただし、これはもうビッグデータ解析の分野の話で、直接、ロンウイットのサポートを受けて実現した機能ではありませんし、分析に使用しているのも Solr ではありません。しかし、複雑なキーワードや、あいまいな入力から施設や店舗を探しだすということも、様々なジャンルのデータを、それぞれの特性に応じて検索し、それらを組み合わせることで実現できるのです。」

究極の検索はリコメンド。検索エンジンはまだまだ進化する。

ロンウイット「今回の取り組みの中で得られた成果を、私たちユーザーはどんな形で目にすることになるのでしょうか。」
川崎様「当初の目標だったカーナビへの搭載は、現在も開発が進んでおり、近い将来に普及するコネクテッドカーの登場とともに一般的になっていくはずです。またNTTドコモ独自の取り組みとしては、当社が提供している AI エージェントサービス「 my daiz 」の中に組み込まれていくことにもなります。これはユーザーが端末上のスケジュール帳に入力したデータを AI が解析し、出張先の天候を教えてくれたり、ユーザーが興味を持ちそうなイベントやお勧めのスポットを教えてくれるというもの。POI 情報や Solr との連携が進んでいけば、AI は「このユーザーは、大阪に行った時にはあのレストランを使うことが多い」といった判断をして、「予約の必要はありませんか」と尋ねてくるといった機能にも発展させられるはずです。結局のところ、究極の検索というのは、リコメンドになっていくのだと思います。そういった意味では、検索の重要性は、今後、ますます大きくなっていきますし、検索結果をコントロールすることで、様々なビジネスに大きな影響を与えることにもなるでしょう。そうした新たなサービスを開発していくうえで、Solr の柔軟性は大きなメリットですし、そのスペシャリストとしてロンウイットのサポートを受けることができるのは非常に重要です。」

ロンウイットとのパートナーシップで新しいサービスを生み出していきたい

ロンウイット「この先、NTTドコモの POI 検索関連のプロジェクトはどのような方向に進んでいくのですか。」
川崎様「先ほど、自社サービスである『 my daiz 』のお話をしましたが、この仕組みが AI エージェントサービスのエンジンとして、他社の様々なサービスに組み込まれていく可能性があります。先ほどからお話しているカーナビへの搭載も、その一例ということになっていくでしょうね。」
大西様「世の中の多くの方は、NTTドコモと言えば、携帯電話の会社とお考えです。研究開発と言っても、通信回線や基地局といったハードウェア的なことが中心だろうと思われているでしょう。しかし、実際には、私たちのようにモバイル端末の上で動く様々な要素技術を研究し、新たなサービスとして実現していこうとしているチームも存在します。当社の技術が搭載されたカーナビが実用化されても、そこに『 Powered by NTT docomo 』といった記載がされることはなさそうですが、気が付けば、ドコモの技術やサービスがあらゆる場面で使われていた、という可能性も大いにあるのです。そんなことも、少しは世の中の方に知っていただければと思いますね。」
川崎様「私たちが思い描くようなサービスを実現し、新しいビジネスを開拓していくパートナーとして、ロンウイットには大きな期待を寄せています。Solr の勉強会で私自身が登壇させてもらうなど、お付き合いもどんどん深まってきていますし、今後とも有益なディスカッションを重ねながら、新しい可能性に挑んでいきたいですね。」


インタビュー参加者プロフィール

株式会社NTTドコモ R&Dイノベーション本部
サービスイノベーション部 第2サービス開発担当
川崎 仁嗣さん
大西杏菜さん
協力会社 株式会社VSN 情報通信第2本部テレコム第2事業部ソリューションサービス第6G
薄 麻子さん
山﨑 亘涼さん
株式会社ロンウイット
代表取締役社長 関口宏司

企業プロフィール

株式会社NTTドコモ (NTT DOCOMO, INC.)
代表者:代表取締役社長 吉澤 和弘
営業開始:1992年7月1日
資本金:9,496億7,950万円(2017年3月31日現在)


トレーニングコース

ロンウイットのトレーニングは、Lucene/Solrの経験豊富なコミッターの
監修のもと開発されたハンズオン(実習)形式のコースです。

セミナー

ロンウイットのApache Software Foundationコミッターが、情報検索の基礎、自然言語処理、そして、ユーザにとっての効果についてご説明させていただきます。