お問い合わせ採用情報お客様ログイン

RONDHUIT

トレーニング TRAINING

ホーム > サービス > トレーニング > Apache Mahout & Spark ではじめる機械学習

Apache Mahout & Spark ではじめる機械学習

目的

  • 機械学習の基本的な知識を体系立てて習得します。
  • 一般的な機械学習アルゴリズムを学びます。
  • Apache Mahout と Spark MLlib の基本的な使い方を学びます。

[受講者インタビュー] Altus-Five 小池様
[受講者インタビュー] 沖電気工業 村田様, ライトカフェ 小林様
[受講者インタビュー] KSKアナリティクス 松尾さん
[受講者インタビュー] ネットアドバンス 野口さん
[受講者インタビュー] モノプラス 小林さん
[受講者インタビュー] 金融エンジニアリング・グループ 原田さん 黒柳さん
[受講者インタビュー] ミュートス 西海敬介さん
[受講者インタビュー] ランチェスター 金子将範さん

受講者様の声

内容

全2日間のトレーニングコースとなります。ノートPCまたはUSBメモリをご持参のお客様は、演習に使ったファイルをお持ち帰りいただけます。

初歩の高校数学を思い出しながら、機械学習とApache Mahout / Spark MLlib を豊富な演習を通じて楽しく学べる内容になっています。

初日は「機械学習とは何か」から始まり、パターン認識、教師あり学習のいろいろな分類アルゴリズム、そして最後に手書き文字認識プログラムを作成します。受講者全員参加で手書き文字データを作成します。Mahoutの分類器は果たしてどのくらい手書き文字を認識するでしょうか?お楽しみに!

【1日目】
  • 機械学習とApache Mahout / Spark MLlib
    • 機械学習とは?
    • モデル [演習]
    • Apache Mahoutとは?
    • Apache Sparkとは?
    • Mahoutのインストール [演習]
    • Sparkのインストール [演習]
  • パターン認識
    • パターン認識とは?
    • 特徴ベクトル
    • さまざまな距離測度 [演習]
    • プロトタイプと学習データ
  • 分類
    • 最近傍決定則
    • k-NN法 [演習]
    • 学習によるプロトタイプの決定
    • 識別関数の導出
    • パーセプトロンの学習規則 [演習]
    • 平均化パーセプトロン
    • パーセプトロンの学習規則の問題点
    • Widrow-Hoffの学習規則 [演習]
    • ニューラルネットワーク [演習]
    • サポートベクトルマシン [演習]
    • ラグランジュの未定乗数法 [演習]
    • [演習] Spark
    • 決定木 [演習]
    • 決定木の学習 [演習]
    • 単純ベイズ [演習]
    • 多変数ベルヌーイモデル [演習]
    • ロジスティック回帰
    • [演習] Spark
    • ROC曲線とAUC
    • 多クラス分類への拡張
  • 手書き文字認識プログラムを作ろう!
    • 手書き文字認識プログラムの構成
    • 学習データの作成 [演習]
    • 手書き文字認識の実際 [演習]

2日目はMahout / Spark MLlib が提供する分類以外の機能であるレコメンデーション、クラスタリングから始まり、特徴ベクトルの次元削減を目的とした主成分分析、機械学習の評価に関する話、そして最後に自然言語処理における機械学習についてMahout / Sparkがどのように使えるか、演習を通じて学んでいきます。

【2日目】
  • レコメンデーション
    • レコメンデーションとは?
    • 情報検索とレコメンデーション
    • レコメンデーションアーキテクチャの種類
    • ユーザプロファイルとその収集
    • 評価値予測 [演習]
    • ピアソンの相関係数
    • レコメンデーションの評価
    • レコメンデーションにおける説明
  • ページランク
    • ランキングの重要性
    • 情報検索システムの評価尺度の理論と実際
    • ベクトル空間モデル [演習]
    • Apache Lucene のスコア計算
    • ページランク [演習]
    • [演習] Hama / Spark
    • HITS
  • クラスタリング
    • クラスタリングとは?
    • クラスタリング手法
    • k平均法 [演習]
    • 最近隣法 [演習]
    • クラスタリング結果の評価と分析
    • 類似画像検索 Apache alike
    • 情報検索とクラスタリング
  • 主成分分析
    • 学習パターン数と次元数の関係 [演習]
    • 主成分分析とは?
    • 平均と分散 [演習]
    • 共分散行列 [演習]
    • 固有値、固有ベクトル [演習]
    • [演習] Mahout / Spark
    • (参考)主成分分析後の可視化
  • 機械学習の評価
    • 結果の評価と分析
    • 訓練データの分割 [演習]
    • 過学習
    • 精度と再現率 [演習]
    • 偽陽性と偽陰性 [演習]
    • 特徴の評価
    • クラス内分散、クラス間分散
    • ベイズ誤り確率
    • 素性選択
  • 自然言語処理における機械学習
    • 自然言語処理とは?
    • 言語理解のための自然言語処理
    • コーパス
    • bag-of-words
    • Nグラムモデル [演習]
    • 系列ラベリング
    • 隠れマルコフモデル [演習]
    • ビタビアルゴリズム [演習]
    • NLP4Lの紹介

開催日

開催日 時間 状況
2016年11月24日〜25日 10:00~17:00 締め切りました
2016年12月13日〜14日 10:00~17:00 お申込受付中
2017年1月 10:00~17:00 日程調整中

前提知識

演習ではUbuntuマシンを使用しますので、viやEmacsなどのエディタが使えたり、Linuxコマンドを知っているとスムーズに受講できます。

お申し込み前のご準備

LAN接続が可能でsshが利用できるノートPCをご持参ください。ノートPCをご用意できない場合はお申し込み時にご連絡ください。お貸し出しいたします。

また手計算による演習がありますので、鉛筆/シャープペンシル、消しゴムをご用意ください。

価格/申し込み方法

1名様につき 198,000円(税別)
入力フォームよりお申し込みください。開催決定後、請求書を発行いたしますので、期限までにお振り込みください。会社経理の都合上遅れる場合はご一報下さい。 開催決定の通知後(通知はお申込み受付後から、開催日のおおむね一週間前までに)はキャンセルはお受けできかねますのであらかじめご了承ください。

最少開講人数

2人 最少開講人数に達しない場合は開講しません。なるべく2名様以上でお申し込みください。
» トレーニングお申し込みフォームはこちら

その他

遠方のお客様にはオンサイトで同内容のトレーニングを実施させていただくことができます。こちらの入力フォームから3名以上でお申し込みください。別途旅費(実費)を請求させていただきます。

受講者様の声

  • 「いろいろ知識を得ることができよかったです。」(家電大手R&D部門 様)
  • 「Mahoutイン・アクションを使って自己学習していましたが、あまり理解できなかったので研修を受けられてよかったです。」(電力系SI 様)
  • 「期待通り、Mahoutを中心に、機械学習の仕組みを知ることができた。」(大手電器系SI 様)
  • 「すべてがわかったかというと難しいところですが、実際の問題に向かうための道具を知れた気がします。これからより研鑽を積もうと思います。」(医療系SI 様)
  • 「難しい数式をしっかりと理解できた。広い範囲をカバーしつつ、大事なところは詳細まで説明があってよかった。」(フリープログラマー 様)
  • 「Mahoutを始める人に適した内容と思いますが、もう少しMahout固有の内容が多くてもよかったと思います。」(商社系SI 様)
  • 「Webの紹介ページの通りの内容だった。ちょっと時間が足りないと思いました。」(商社系SI 様)
  • 「機械学習というものが正直よくわかっていなかったが、トレーニングを受けてある程度こういうものだと理解できた。すごく奥深いものだと感じております。」(医療系SI 様)
  • 「機械学習について全体的に学べてとてもためになりました。正直、数式に関しては時間内ではすべて理解することはできなかったので、復習したいと思います。」(カーナビベンダーR&D部門 様)
  • 「期待を上回り、機械学習の基礎から学ぶことができた。」(キャリア情報システム部門 様)
  • 「機械学習の全体像がわかり、とても有意義でした。ありがとうございました。」(フリープログラマー 様)
  • 「レコメンドや学習の仕組みに関する基礎理論の導入には大変よかったと思います。」(音楽配信系 様)
  • 「わかりやすく、細かいことも聞きやすい雰囲気でよいです。」(システムインテグレーター 様)

ピックアップ

お問い合わせ

 

PAGE TOP
HOME
Apache Solr, Lucene, Hadoop, Mahout, Spark, ManifoldCF, UIMA and their logos are trademarks of the Apache Software Foundation.
Copyright © 2006-2015 RONDHUIT Co, Ltd. All Rights Reserved.