スポンサーリンク

【読感】「嫌われる勇気」を読んでみた

この本が終始一貫して説いていることは、 「人生を変えるのは自分自身であり、それは今すぐ始めれる」ということです。 このブログは、pythonを使った統計的なことを主に書いてきましたが、読書が趣味でもあるので読んだ感想をまとめるメモ代わりとしても使…

Pythonを使って行動ログの可視化 Sankey Diagram

今やデータを残しておくことは簡単になってきており、様々なデータが日々蓄積されています。その中でも、何かしらのアクションのログを残しておいて、いつか役に立たせようと思っている方は多いかと思います。例えば、Webページの遷移ログや位置情報を使った…

Pythonでトピックモデル Word Cloud と LDA

SNSがコミュニケーションのインフラになりつつあることで、世の中は言葉で溢れています。この膨大な言葉の文章をまとめることで一つ一つの文章からはわからない傾向を新たに獲得することができます。具体的には、文章をカテゴライズして分類することで、どの…

Pythonでクラスタリング k-meansからk-medoidsを改良する

これまでの機械学習で行ってきたのは、入力値と出力値があわさったデータから、データ間の関係を学習し、正しい出力データを出すモデルにを作ることでした。いわゆる教師あり学習です。 www.dskomei.com 今回は、答え(出力値)のないデータから、データの構…

Pythonを使って正規分布からt検定を知る

前回は統計的検定ってなんなの?っていうのをイメージで語ってみました。検定を作業と考えてなんとなくやりきってきた方々はぜひご一読ください。 www.dskomei.com 検定をイメージで語ってみたわけですが、やはり実際にやってみないと腹落ちしないですよね。…

Pythonを使って変数選択!

前回、分類問題に関して機械学習のいろいろなアルゴリズムでの学習結果を決定境界によって確認しました。 www.dskomei.com 決定境界の描かれ方がそれぞれのアルゴリズムで異なり、ランダムフォレストにおいては過学習をしている様子も見られました。このとき…

検定とは? イメージで語ってみる

これまでの自分の統計学の検定では、なんとなく理解した気のままで、実際に行うと何からすれば良いのか戸惑い、毎回調べながらそれとなくこなしてきました。そろそろ検定を理解して行わなければいけないと感じ始めたので(かなり遅いですが・・・)、大学生…

機械学習の分類結果を可視化!決定境界

前回、機械学習をして学習したアルゴリズムの正答率を出しました。 www.dskomei.com しかし、前回の結果からは、テストデータに対してそこそこの正答率を出すのはわかったし、アルゴリズムによって正答率に違いがあるのもわかりましたが、各々のアルゴリズム…

Pythonで機械学習をやってみる!複数回試行での評価

前回以下のエントリを書きました。そのエントリでは複数の機械学習のアルゴリズムの正答率を比較しましたが、1回の試行だけだったので複数回試行の結果でアルゴリズムを評価したいと思います。(*前回行った学習を複数回に拡張しただけです。) dskomei.hat…

Pythonで機械学習をやってみる!

本エントリはとにかく機械学習をやってみたいという思いだけで突っ走って書きました。機械学習をしてドヤりたい人、色々アルゴリズムがあるのは知っているけど実際どうやるんだっけという人向けになっていると思います。理論より実践!!という感じなので玄人…