前回に引き続き、Courseraでやった内容をまとめていきます。
前回は機械学習とはなんぞやといった内容でした。
今回は機械学習で使用される各種手法とその使用例についてです。
なるべく数式が出てこないような説明を心掛けたいと思います。
教師あり学習
機械学習の種類一つ目は教師あり学習です。
これは、入力と出力の関係がわかっているデータについて学習を行い、 その学習結果をもとに未知の入力に対しての予想を行います。
教師あり学習は回帰と分類に分けることができます。
回帰
連続した値を予想するのに使います。
入力値と出力値からそのそれぞれについての関係を予想します。
少し数学的な表現になってしまいますが、入出力の関数を機械学習で求めるイメージです。
また、出力は連続的な数値になります。
講義中では家の広さから値段を予想するといった例が出されていました。
分類
YesかNoか もしくは どのクラスに属するのかといったことを予測するのに使います。
回帰と違うのは、出力はとびとびの値を取るということです。
つまり、写真に写っているのは犬か猫かといった予想を行うのに「犬60% 猫40%…」みたいな回答ではなくこれは犬ですといった回答が帰ってくるということを表しています。
講義中では腫瘍のサイズからそれが悪性かどうか判断するといった例が使用されていました。
教師無し学習
教師ありがあるなら教師なしもありますよね…ということで、機械学習の2種類目として教師無し学習があります。
教師無し学習では正解となる出力のデータがなくても学習を行っていくことができます。
正解となるデータはないため何らかの値を予想するといったことはできないのですが、与えられたデータから特徴量を見つけ出すといったことができます。
この特性を利用した例としてクラスタリングというものがあります。
これは与えられたデータをいくつかの集合(クラスタ)に分類するというものです。
講義中にはいろんなサイトのニュースのジャンル分けとか、遺伝子解析の例とかが示されていました。
まとめ
機械学習と一口に言ってもその中には教師あり学習・教師なし学習といった種類があります。
教師あり学習は正解のデータも含まれているので、入力と出力の関係を予想していくといった場面で用いられます。
一方で教師なし学習は正解のデータは与えられず、与えられたデータの関係や特徴量を見つけるのに向いています。
そのほか強化学習とかも機械学習にはあるみたいですが、そこまでは触れられていませんでした。
次回は目的関数とか最急降下法とかです。
つづく。
コメント