Pythonでクラスタリング k-meansからk-medoidsを改良する

今回は、答え(出力値)のないデータから、データの構造を見えるようにする教師なし学習のひとつであるクラスタリングについて述べていきます。クラスタリングとは、データが似ているものを一つのクラスタにまとめて情報を集約することによって、見通しを良…

Pythonを使って正規分布からt検定を知る

前回は統計的検定ってなんなの?っていうのをイメージで語ってみました。検定を作業と考えてなんとなくやりきってきた方々はぜひご一読ください。 www.dskomei.com 検定をイメージで語ってみたわけですが、やはり実際にやってみないと腹落ちしないですよね。…

Pythonを使って変数選択!

前回、分類問題に関して機械学習のいろいろなアルゴリズムでの学習結果を決定境界によって確認しました。 www.dskomei.com 決定境界の描かれ方がそれぞれのアルゴリズムで異なり、ランダムフォレストにおいては過学習をしている様子も見られました。このとき…

検定とは? イメージで語ってみる

これまでの自分の統計学の検定では、なんとなく理解した気のままで、実際に行うと何からすれば良いのか戸惑い、毎回調べながらそれとなくこなしてきました。そろそろ検定を理解して行わなければいけないと感じ始めたので(かなり遅いですが・・・)、大学生…

機械学習の分類結果を可視化!決定境界

学習した機械学習のモデルが与えたデータに対してどのように分類したかを知りたいことは多いです。ここら先は違うクラスになるという境界がわかられば、分類モデルの理解が深まりますし、改善ポイントもわかるようになります。学生の頃に隣のクラスになろう…

Pythonで機械学習をやってみる!複数回試行での評価

前回以下のエントリを書きました。そのエントリでは複数の機械学習のアルゴリズムの正答率を比較しましたが、1回の試行だけだったので複数回試行の結果でアルゴリズムを評価したいと思います。(*前回行った学習を複数回に拡張しただけです。) dskomei.hat…

Pythonで機械学習をやってみる!

本エントリはとにかく機械学習をやってみたいという思いだけで突っ走って書きました。機械学習をしてドヤりたい人、色々アルゴリズムがあるのは知っているけど実際どうやるんだっけという人向けになっていると思います。理論より実践!!という感じなので玄人…