お問い合わせ採用情報お客様ログイン

RONDHUIT

テクノロジINFORMATION

ホーム > テクノロジ > NExTR on Railsを使う

NExTR on Railsを使う

2011.05.19
固有表現抽出ツールNExTR on Rails(以下NEXTRRと記述)の簡単な使い方を紹介します。

  1. 最初にNEXTRRをダウンロードサイトからダウンロードします。
  2. ダウンロードしたファイル(nextr-1.0.0.tar.gz)を解凍ツールやtarコマンドで解凍します。
    $ tar xvzf nextr-1.0.0.tar.gz
  3. 解凍してできたファイルをVMWareで起動します。
    起動時に「この仮想マシンは使用中の可能性があります。」と表示された場合は、「再度開く」を選択し、「所有権を取得」を選択して先に進みます。
    また、起動時に「この仮想マシンは移動またはコピーされた可能性があります。」と表示された場合は、「コピーしました」を選択して先に進みます。
  4. 起動したらユーザ名:next、パスワード:chasenでログインします。
  5. ifconfigでIPアドレスを調べます。
    $ ifconfig
    ネットワークが起動していないと思われる場合、仮想マシンのMACアドレスを調べます。nextr.vmwarevm/nextr.vmxファイルの「ethernet0.generatedAddress = “00:0c:29:xx:xx:xx”」という行を見つけます。そしてNEXTRRにて/etc/udev/rules.d/70-persistent-net.rulesファイルをエディタでオープンします。
    $ sudo vi /etc/udev/rules.d/70-persistent-net.rules
    そして、NAME=”eth0″の行のMACアドレスが違うはずなのでこの行を#でコメントアウトします。そしてその下にMACアドレスが一致するNAME=”eth1″の行があるはずなので、これをeth0に変更して再起動します。
    $ sudo shutdown -r now
    そして再度ログインしてifconfigでIPアドレスを調べます。
  6. products/nextr-GPL2/text-nextr.htmlファイルをscpコマンド等を使ってローカル環境にコピーします。
    $ scp next@<IPアドレス>:products/nextr-GPL2/text-nextr.html text-nextr.html
  7. ローカル環境にコピーしたtext-nextr.htmlをエディタで開き、”localhost”となっているところをNEXTRRのIPアドレスに書き換えます。
  8. ブラウザでtext-nextr.htmlを開き、入力ボックスに地名や組織名などの固有名詞を含む文章を入力します。たとえばここでは「自由民主党の谷垣総裁が今朝、新幹線で東京駅に到着しました。」と入れてみます。
  9. analyzeボタンをクリックするとNEXTRRにリクエストが飛んで、解析結果がXMLで次のように戻ってきます。
    <result>
      <ORGANIZATION>自由民主党</ORGANIZATION>
      <PERSON>谷垣</PERSON>
      <GPE>東京</GPE>
      <STATION>東京駅</STATION>
    </result>
    


次回は、Solrと組み合わせて使う方法を紹介します。

関連リンク


▲ ページの先頭に戻る

ピックアップ

お問い合わせ

 

PAGE TOP
HOME
Apache Solr, Lucene, Hadoop, Mahout, Spark, ManifoldCF, UIMA and their logos are trademarks of the Apache Software Foundation.
Copyright © 2006-2017 RONDHUIT Co, Ltd. All Rights Reserved.