SERVICE
サービス

トレーニング

TRAINING

Apache Mahout & Spark ではじめる機械学習(研修)

目的

  • 機械学習の基本的な知識を体系立てて習得します。
  • 一般的な機械学習アルゴリズムを学びます。
  • Apache Mahout と Spark MLlib の基本的な使い方を学びます。

[受講者インタビュー] コニカミノルタ㈱太田様
[受講者インタビュー] 東芝メモリ㈱河野様、岩瀬様
[受講者インタビュー] べニックソリューション㈱三島和也様
[受講者インタビュー] NTTデータ鄭様、ヒューメインシステム寺田様
[受講者インタビュー] 日本ヒューレット・パッカード 置田様
[受講者インタビュー] リンカーズ 孫様,川口様
[受講者インタビュー] Altus-Five 小池様
[受講者インタビュー] 沖電気工業 村田様, ライトカフェ 小林様
[受講者インタビュー] KSKアナリティクス 松尾さん
[受講者インタビュー] ネットアドバンス 野口さん
[受講者インタビュー] モノプラス 小林さん
[受講者インタビュー] 金融エンジニアリング・グループ 原田さん 黒柳さん
[受講者インタビュー] ミュートス 西海敬介さん
[受講者インタビュー] ランチェスター 金子将範さん

受講者様の声

内容

全2日間のトレーニングコースとなります。ノートPCまたはUSBメモリをご持参のお客様は、演習に使ったファイルをお持ち帰りいただけます。
初歩の高校数学を思い出しながら、機械学習とApache Mahout / Spark MLlib を豊富な演習を通じて楽しく学べる内容になっています。
初日は「機械学習とは何か」から始まり、パターン認識、教師あり学習のいろいろな分類アルゴリズム、そして最後に手書き文字認識プログラムを作成します。受講者全員参加で手書き文字データを作成します。Mahoutの分類器は果たしてどのくらい手書き文字を認識するでしょうか?お楽しみに!

【1日目】
  • 機械学習とApache Mahout / Spark MLlib
    • 機械学習とは?
    • モデル [演習]
    • Apache Mahoutとは?
    • Apache Sparkとは?
    • Mahoutのインストール [演習]
    • Sparkのインストール [演習]
  • パターン認識
    • パターン認識とは?
    • 特徴ベクトル
    • さまざまな距離測度 [演習]
    • プロトタイプと学習データ
  • 分類
    • 最近傍決定則
    • k-NN法 [演習]
    • 学習によるプロトタイプの決定
    • 識別関数の導出
    • パーセプトロンの学習規則 [演習]
    • 平均化パーセプトロン
    • パーセプトロンの学習規則の問題点
    • Widrow-Hoffの学習規則 [演習]
    • ニューラルネットワーク [演習]
    • サポートベクトルマシン [演習]
    • ラグランジュの未定乗数法 [演習]
    • [演習] Spark
    • 決定木 [演習]
    • 決定木の学習 [演習]
    • 単純ベイズ [演習]
    • 多変数ベルヌーイモデル [演習]
    • ロジスティック回帰
    • [演習] Spark
    • ROC曲線とAUC
    • 多クラス分類への拡張
  • 手書き文字認識プログラムを作ろう!
    • 手書き文字認識プログラムの構成
    • 学習データの作成 [演習]
    • 手書き文字認識の実際 [演習]

2日目はMahout / Spark MLlib が提供する分類以外の機能であるレコメンデーション、クラスタリングから始まり、特徴ベクトルの次元削減を目的とした主成分分析、機械学習の評価に関する話、そして最後に自然言語処理における機械学習についてMahout / Sparkがどのように使えるか、演習を通じて学んでいきます。

【2日目】
  • レコメンデーション
    • レコメンデーションとは?
    • 情報検索とレコメンデーション
    • レコメンデーションアーキテクチャの種類
    • ユーザプロファイルとその収集
    • 評価値予測 [演習]
    • ピアソンの相関係数
    • レコメンデーションの評価
    • レコメンデーションにおける説明
  • ページランク
    • ランキングの重要性
    • 情報検索システムの評価尺度の理論と実際
    • ベクトル空間モデル [演習]
    • Apache Lucene のスコア計算
    • ページランク [演習]
    • [演習] Hama / Spark
    • HITS
    • ランキング学習 [デモ]
  • クラスタリング
    • クラスタリングとは?
    • クラスタリング手法
    • k平均法 [演習]
    • 最近隣法 [演習]
    • クラスタリング結果の評価と分析
    • 類似画像検索 Apache alike
    • 情報検索とクラスタリング
  • 主成分分析
    • 学習パターン数と次元数の関係 [演習]
    • 主成分分析とは?
    • 平均と分散 [演習]
    • 共分散行列 [演習]
    • 固有値、固有ベクトル [演習]
    • [演習] Mahout / Spark
    • (参考)主成分分析後の可視化
  • 機械学習の評価
    • 結果の評価と分析
    • 訓練データの分割 [演習]
    • 過学習
    • 精度と再現率 [演習]
    • 偽陽性と偽陰性 [演習]
    • 特徴の評価
    • クラス内分散、クラス間分散
    • ベイズ誤り確率
    • 素性選択
  • 自然言語処理における機械学習
    • 自然言語処理とは?
    • 言語理解のための自然言語処理
    • コーパス
    • bag-of-words
    • Nグラムモデル [演習]
    • 系列ラベリング
    • 隠れマルコフモデル [演習]
    • ビタビアルゴリズム [演習]

開催日

開催日 時間 状況
2018年10月16日〜17日 10:00~17:00 締め切りました
2018年11月13日〜14日 10:00~17:00 お申込受付中
2018年12月 10:00~17:00 日程調整中

会場

東京都千代田区神田東紺屋町28−1神田EAST(旧称メナードビル)4階

前提知識

演習ではUbuntuマシンを使用しますので、viやEmacsなどのエディタが使えたり、Linuxコマンドを知っているとスムーズに受講できます。

お申し込み前のご準備

LAN接続(無線/有線いずれか)が可能でsshが利用できるノートPCをご持参ください。ノートPCをご用意できない場合はお申し込み時にご連絡ください。お貸し出しいたします。
また手計算による演習がありますので、鉛筆/シャープペンシル、消しゴムをご用意ください。

価格/申し込み方法

1名様につき 198,000円(税別)
入力フォームよりお申し込みください。開催決定後、請求書を発行いたしますので、期限までにお振り込みください。会社経理の都合上遅れる場合はご一報下さい。 開催決定の通知後(通知はお申込み受付後から、開催日のおおむね一週間前までに)はキャンセルはお受けできかねますのであらかじめご了承ください。

最少開講人数

2人
最少開講人数に達しない場合は開講しません。なるべく2名様以上でお申し込みください。

その他

遠方のお客様にはオンサイトで同内容のトレーニングを実施させていただくことができます。こちらの入力フォームから3名以上でお申し込みください。別途旅費(実費)を請求させていただきます。

受講者様の声

    2018年7月
  • 「機械学習の基本概念から丁寧に教えてもらえた。」(メーカー 様)
  • 「随時演習があり、実際に動かして確かめられたり、数式を使って計算して実践できたことがとても良かったです。機械学習は初心者だったのでどうかと思いましたが、演習込みでの説明でとても分かりやすく、実際の業務へのイメージも沸きやすかったです。」(メーカー 様)
  • 2018年3月
  • 「一通りポイントが学べてよかったです。」(公益財団法人 様)
  • 「通常の統計、機械学習にとどまらず、検索、自然言語処理など応用的な内容を含むものだった。各手法の説明が、教科書的な進め方ではなく、実際のユースケースに対し、具体的な手法の事例を説明する、直接的な進め方であった。」(公益財団法人 様)
  • 「基本的なことを改めて学べてよかったです。実用の高そうな事例がもっとあれば,よかった気がします。」(公益財団法人 様)
  • 2018年1月
  • 「理論やその中の数式なども解説があり、どのようなバックボーンがあって実現できているかの概要がわかった。」(メーカー 様)
  • 2017年11月
  • 「機械学習の基本から教えていただいた。Webでは数式しか出てこないがその数式の意味も説明していただけたのがよかった。」(SI 様)
  • 「背景にある数学の部分まで触れられる研修を期待していたので期待通りだった。」(メーカー 様)
  • 2017年10月
  • 「機械学習についての理解が深まり期待通りの内容でした。」(監査法人 様)
  • 「受講前は、内容についていけるか心配でしたが、数式を用いておりわかりやすかったです。実際にプログラムを実行し、結果が表示されるのも楽しみながら受講できました。」(SI 様)
  • 「ツールの使い方より、まず基礎となる知識・理論を習得することが目的であったため、期待通りです。」(SI 様)
  • 2017年9月
  • 「機械学習テクニックのようなイメージでいたが、アルゴリズム重視の内容だった。」(情報・通信業 様)
  • 2017年8月
  • 「機械学習とは、という概念の部分が多く感じたので、実際の実例などを紹介していただければと思いました。」(出版社 様)
  • 「機械学習というものの概要は分かった。」(自動車販売 様)
  • 「機械学習のアルゴリズムと考え方の方向性がわかりました。」(ITソリューション 様)
  • 「内容が濃く、大変参考になりました。」(出版社 様)
  • 「機械学習や自然言語処理について、書籍だけでは難しい部分を幅広く説明いただいて良かったです。機械学習という分野に必要な知識の広さを痛感しました。」(出版社 様)
  • 2017年2月
  • 「ライブラリの使用方法よりも、背後の理論や仕組みをご説明いただけた点がよかったように思います。」
  • 2016年10月
  • 「実践的と言うよりそれぞれの手法で簡単な例を丁寧に計算して言うという内容だったが、自分たちで勉強するときに飛ばしてしまいがちな所だったのでそれは助かった。おかげで原理やパラメータの役割はとても理解できた。レコメンドのところは実務での標準的な方法を少し交えて教えていただいて助かった。」(ECサイト 様)
  • 「ツールやライブラリの使い方ではなく、その内部で行われている処理内容の理論の説明が沢山聞けて良かったです。このような説明が聞けるとは思っていなかったので、期待以上です。」(フリーランス 様)
  • 2016年8月
  • 「セミナーでは省略されやすい、各種法の数式を説明していただけて大変参考になった。また、単純でわかりやすい演習問題がよかった。」(情報通信 様)
  • 2016年7月
  • 「機械学習の領域で、キーワードと何ができるだけ知っているものに関して、自分がきちんと理解できていなかったものを網羅的に基礎を理解できたのがとてもよかったです。」(ネット配信 様)
  • 「理論と実践のバランスがよかったと思います。」(ネットサービス 様)
  • 2016年3月
  • 「機械学習の全体象を見るためにはとてもよいトレーニングだった。また実際に計算を含めた演習があるのは身につきやすい。」(SI 様)
  • 「2日コースとしてはかなり内容が多いと思ったが、実習が適度に取り混ぜられており理解しやすかった。」(SI 様)
  • 2016年2月
  • 「これまで知識的な土台がなく勉強の機会を求めていた部分についてきちんと知識を得ることが出来たと思う。」(インターン 様)
  • 「普段はアルゴリズム概要とツール(API)の使い方程度の調査で開発しているので、理論的な部分の解説は参考になった。」(ITソリューション 様)
  • 「機会学習の基礎がわかったと思う。」(インターン 様)
  • 2015年11月
  • 「Mahoutをツールとして使用していたが、仕組みを知らなかったので、知ることができてよかった。」(SI 様)
  • 「Mahout、Sparkの実習が多いことを期待していた」(ITソリューション 様)
  • 2015年8月
  • 「大変なボリュームがあった。2日間の日程で学べる最大量を提供いただいた。」(ITサービス 様)
  • 2015年7月
  • 「数学、統計の分野に疎く、数式の理解というハードルはあったもののサービスに組み込むにはどうすればよいかのイメージまで繋げやすい内容だった。サンプルコードで実行できるとのことだったので、オプションを調べて他のデータで実行するまでのイメージも浮かびやすかった。」(ITインフラ 様)
  • 2015年6月
  • 「研修については、Apahe Mahout、Sparkを機械学習で利用する利用方法をマシン的に掘り下げる内容と伺っていたので、操作における、コマンド文法や、応用方法など掘り下げたかった。機械学習の考え方、方法論について、理解が深まり、機械学習を利用する際の背景として学習出来ました。機械学習でできる可能性を方論を再確認しながら、自社の課題をどのように解決するか今一度整理して考える機会としては非常に有効でした。総合的には、機械学習について不足していた基礎知識が深まり、実用に向けた足がかりになると見込んでいます。」(ECサイト 様)
  • 2015年5月
  • 「分析に関する様々な手法を知ることができた。」(電気事業 様)
  • 「実際のMahoutの引数、パラメータの与え方の説明があると思っていました。ただ、実際に理論を知ることも必要だということは実感しました。」(ITサービス 様)
  • 「ただツールを使うだけでなく、ツールの根本的な考え方や分類をするための評価手法に様々なものがあることがわかった。」(ITサービス 様)
  • 2015年4月
  • 「理論的な部分は少し難しい部分もありましたが、それを用いてどんなことができるかを学ぶことができました。今後実際の業務で役立つことを期待しています。」(インターネットサービス 様)
  • 「ハンズオンのボリュームがもう少しあると更によかったと思います。内容に関しては2日間ではボリュームが多すぎるかなとも思います。1日目と2日目の内容でコースを分割するか、もう少しアジェンダを少なくするのもよいかと思います。」(印刷業 様)
  • 2015年3月
  • 「機械学習の内容とmahaout/sparkの使い方をひも付けて学べたので、理解しやすかった。」(監査法人 様)
  • 「機械学習の概要を広く知れたのはよかった。機械学習のある一つの部分に特化して深く知ることができる講義があればいいと思う。」(音楽配信系 様)
  • 「機械学習の色々な理論を解説してくれて、分かりやすくとてもよかった。時間の関係で厳しいかもしれないが、特定分野を重点的にやるコースがあってもいいかもしれない。」(音楽配信系 様)
  • 「機械学習の理論的な部分が、演習を踏まえて分かった。ApacheMahout、HadoopおよびSparkの動かし方も分かり、今後、これをベースに機械学習の理解を深めていきたい。」(音楽配信系 様)
  • 2014年12月
  • 「内容が分かりやすく、実践的で、実務にも有用なものだった。」(人材サービス 様)
  • 「機械学習を使う上で、何を検討する必要があるのか体系的に理解できた。」(電機メーカー 様)
  • 2014年9月
  • 「事前に公開されていたアジェンダ通りの網羅的かつ理論的な解説で、期待していた通りの内容でした。」(監査法人 様)
  • 「いくつか、概念を把握していないもの(SVMなど)があったので、概念を把握できたのはよかったです。」(人材サービス 様)

トレーニングコース

ロンウイットのトレーニングは、Lucene/Solrの経験豊富なコミッターの
監修のもと開発されたハンズオン(実習)形式のコースです。

セミナー

ロンウイットのApache Software Foundationコミッターが、情報検索の基礎、自然言語処理、そして、ユーザにとっての効果についてご説明させていただきます。