中心極限定理による分布収束のアニメーション nを増やすと標本平均はどうばらつくか

モチベーション中心極限定理は一言で言うと、「平均する対象を増やすと、その標本平均は正規分布に従うようになる」という定理である。これの解釈はあとで与える。この定理は直感的にはわかりにくく誤用する人も多いため、twitterでhotなトピックになった…

2019-07-15

特徴量重要度にバイアスが生じる状況ご存知ですか？

機械学習人気記事

なぜこの記事を書いたのか？決定木をベースにしたアルゴリズムのほとんどに特徴量重要度という指標が存在する。データに対する知識が少ない場合はこの指標を見て特徴量に対する洞察深めることができる。KaggleではEDAのときにとりあえず重要度を見てみるな…

2019-07-10

AI・機械学習ハンズオン〜実践Kaggle 初級編〜に参加しました

はじめに今回はただの日記です。 AI・機械学習ハンズオン〜実践Kaggle 初級編〜に参加したので、感想を書く。これから行く人が知りたいだろう情報も書くように心がける。はじめに率直な感想対象者は？どんなことをやったのかデータと環境データのED…

2019-06-01

新曲をプレイするとスコアはいくつ？〜最大値を利用したスコアの分布推定〜

機械学習

概要本記事では音楽ゲーム(以下音ゲ)において、曲をプレイすると得られるスコアを確率変数として、その分布を推定することを試みた。音ゲのスコアは慣習的に最大値のみが保存されるような仕組みになっている。そのため、曲をプレイすると得られるスコアは…

2019-04-13

PriorityQueue Classを作る [Pythonで競プロ]

この問題を解くのにpriority queueを使う方法がある。 atcoder.jp Pythonでpriority queueを実装するためには２つ方法があるがどちらも欠点がある。 heapqを用いた方法こちらを用いて実装する方が多いと思う。でもめちゃくちゃ使いづらくないですか？これ…

2019-03-31

逆パームレストを自作した

はじめに薄すぎるMagic Keyboard 底上げ板を自作サイズを決定するものを購入作成逆パームレストはじめにたまには日記のようなことを書いていこうと思います。最近キーボードの配列をJISからUSに変更しました。ためしに3日間使ってみようという感じ…

2019-03-24

【具体例つき】scikit-learnを改変しよう ~改変版のinstall方法と改変に必要な知識のリンク集~

人気記事機械学習環境構築

はじめにこの記事を読むことで、scikit-learnの中身のコードに改変を加えることができるようになることを期待している。改変に必要な知識も学習できるようリンクを用意してある。そして改変を加えたコードをpipで管理する方法も示した。最後には具体例とし…

2019-03-20

読んだ本のレビューデータサイエンス編

機械学習

この記事は？レビューパターン認識と機械学習上 Pythonではじめる機械学習ゼロから作るDeepLearning scikit-learnとTensorFlowによる実践機械学習直感DeepLearning 詳解ディープラーニング TensorFlow・Kerasによる時系列データ処理 Pythonデータサイエ…

2019-03-01

RNNを用いた正規分布の回帰 keras実装

深層学習機械学習

概要時系列の1時刻後の分布を推定したパラメーターが時間に依存する正規分布を仮定したニューラルネットが正規分布のパラメーターを学習できるように適切な損失関数を導入した概要問題意識データと今回の目的データ目的仮定モデル損失関数結果 …

2019-02-10

特徴量選択の今とこれから

人気記事機械学習

特徴量選択とは特徴量選択の難しさ特徴量選択の手法の大別教師ありの特徴量選択 filter method 単変量とクラスラベルの関連性を上げる関係性を上げて冗長性を下げる関係性を上げて多様性を上げる wrapper method Forward SelectionとBackward Eliminati…

2019-01-29

QRNN ニューラルネットを用いた分位点回帰

機械学習深層学習

概要条件付き分布の分位点を推定するNeural Networkを紹介するそのアイデアは既存のNeuralNetに対して損失関数を変えるというシンプルなもの人工データを用いてちゃんと推定できていそうか確認した目次概要目次分布推定の重要性点推定の問題点推定…

2019-01-05

ランダムフォレストと検定を用いた特徴量選択手法 Boruta

人気記事機械学習

特徴量選択(Feature Selection, 変数選択とも)はデータサイエンスにおいて非常に重要である。 Kaggle等のコンペティションではひたすら判別の精度を重要視するが、実務上どうしてそのような判別をしたのかという理由のほうが大事である. このBorutaという手…

2018-11-23

pickleより楽にpythonオブジェクトを保存する方法

時系列データで予測区間付き回帰を行う keras

概要時系列のデータについて、1時刻先を推定する回帰問題を扱った。点推定ではなく正規分布を仮定した分布を推定した。 2σ区間を予測区間とした。電力使用量のデータを用いて実験した。概要問題意識アイデアの概要データの説明モデルの説明結果ま…

2018-10-27

脳波を可視化してみた

概要脳波を色を使って可視化してみた。脳波を採取するのには、Mindwaveを用いた amzn.asia 可視化には、Nanoleaf Auroraを用いた amzn.asia 具体的には行動によって変わる時系列としての脳波を、光の系列で表現した。概要脳波と表現の説明脳波とは結果…

2018-09-29

Hyper+xonshで超モダンな環境づくり

人気記事環境構築

はじめにばんくしさんをフォローしたらすっかりxonshに洗脳された。また、巷でうわさのHyperなるターミナルアプリを試してみたら使いやすかったので、組み合わせて使ったら最強では？と安直な発想で記事を書きはじめた。適当に操作してみたのがこちら。 …

2018-09-23

時系列データでVariational AutoEncoder keras

人気記事深層学習機械学習

はじめに前回の記事で時系列入力に対するオートエンコーダーを組んだ。 aotamasaki.hatenablog.com 今回は潜在変数を正規分布に押し込むというVariational AutoEncoderを組んでみた。CNNとVAEを組み合わせる記事は割と見つかるのに、RNNとなったとたん見つ…

2018-09-16

時系列データを使ってオートエンコーダー keras

深層学習

はじめに時系列でオートエンコーダーを組む練習。ネットで漁っても見当たらなくて(kerasの日本語記事)、kerasのblogでも放置されていた。 Building Autoencoders in Keras ""We won't be demonstrating that one on any specific dataset. "" →自分でやるし…

2018-08-27

メモリに乗り切れないデータをkerasで学習する

はじめに何を使うか方法1 方法2 両者の違い(私感) やることの概要データの説明モデルの構築(飛ばしてOK) HDDからバッチを読み出す訓練結果まとめ追記はじめにこんにちは。何が起きたかから言うと、DeepLearningしようとしたらデータが270GB近くあ…

2018-08-14

Google流資料作成術を読んで

ここで書くことは？日本実業出版社から出版されている、"Google流資料作成術"を読んだので、自分が気をつけておく点をまとめておく。ここで書くことは？コンテキスト(文脈,背景)を理解する心持ち資料を作り始めるまえに表現を選ぶ不必要な要素を取り…

2018-08-05

またまた、LightGBMのインストールでエラーが出た

環境構築

事件の発生 LightBGMというライブラリを公式の手順に従ってインストールしようとしたらエラーメッセージが突如現れた。 github.com これのmacOS Apple Clang(9.0 or higher)に従ってインストを行ったらエラーが出た。どんなエラーがでたかインストレイショ…

2018-07-28

ハンズオンUMAP

機械学習

はじめになぜ、あとからサンプルを布置できると嬉しいのか？ドキュメントにそってインストールデータの概要訓練とテストに分割訓練データで空間を学習この潜在空間で学習テストデータの潜在空間への布置テストデータへの汎化性能まとめはじめに U…

2018-07-03

LightGBMのインストールのエラーに戸惑った話

環境構築

事件の発生 LightBGMというライブラリを公式の手順に従ってインストールしようとしたらエラーメッセージが突如現れた。 github.com またインストールするときにスムーズに行くように記録を残しておく。環境はmacOS Sierra 10.12.6 どんなエラーが出たか $ c…

2018-06-23

Jupyter notebookで変数一覧を常に出す方法

機械学習環境構築

はじめに変数一覧を出す方法おわりにはじめに RStudioやMATLABを使ったことのある方ならわかると思うが、今扱っている変数を一望する機能がある。 RStudioならばこんな感じ。 RStudioならGlobal Environmentと書いてあり、MATLABならばWorkspaceと書いて…

2018-06-14

PythonでForward Selection (mlxtend)

機械学習

背景 Sequential Feature Selector まず、forward selectionを行ってみる。 sequential feature algorithms (SFAs) 1. Sequential Forward Selection (SFS) 2. Sequential Backward Selection (SBS) 3. Sequential Forward Floating Selection (SFFS) 4. Seq…

2018-05-03

imbalanced-learnを実際に使った分析例使わない場合と比較

機械学習

はじめにデータの説明分析の流れ分析 1. どういう判別器を用いたら良いか。 2. 変数選択をする。 3. imblearnでオーバーサンプリングとアンダーサンプリングを行う。 4. インバランスを考慮しなかった場合と性能を比較する。 5. 分析結果まとめ

2018-05-02

imbalanced-learnの機能の紹介

はじめに imbalanced-learnとは動機やること参考機能の紹介インストール 2.2.1 サンプルのでっち上げ(オーバーサンプリング) 普通のSMOTE ボーダーラインSMOTE SVM SMOTE ADASYN 3.2.2 クリーニングアンダーサンプリングテクニック(データの削除) 3.2.2…

2018-04-27

変数選択(Feature Selection)の実装と改善の確認

機械学習

はじめに実験設定目的用いるデータ用いる変数選択手法用いる判別器評価指標行わないことデータを少し見てみるすべての特徴を用いた場合 Filter Method 目視により選択 sklearn.feature_selection.SelectKBestによる選択 Wrapper Method sklearn.fea…

2018-04-24

目的地に案内してくれる魔法の帽子 Gogoal cap

要約はじめに問題意識完成品システムの概要入力&音声認識目的地検索&センサーデータ取得出力実際につかってみる要約振動で目的地の方向を教えてくれる帽子を作ったよ音声認識で場所を検索するよ GPSや地磁気センサーで場所と向いている方向を取得…

2018-04-18

変数選択(Feature Selection)手法のまとめ

説明変数がめちゃくちゃ多いデータを扱うことになったので変数選択が重要なんじゃないかと思って調べたところまとまっている記事を見つけました。要約して翻訳してここに置いておきます。追記:更に踏み込んだ話を記事にしました。 aotamasaki.hatenablog.co…

学習する天然ニューラルネット

主に機械学習に関する覚書や情報の整理。競プロ水色→Kaggle Master→？

中心極限定理による分布収束のアニメーション nを増やすと標本平均はどうばらつくか

特徴量重要度にバイアスが生じる状況ご存知ですか？

AI・機械学習ハンズオン〜実践Kaggle 初級編〜に参加しました

新曲をプレイするとスコアはいくつ？〜最大値を利用したスコアの分布推定〜

PriorityQueue Classを作る [Pythonで競プロ]

逆パームレストを自作した

【具体例つき】scikit-learnを改変しよう ~改変版のinstall方法と改変に必要な知識のリンク集~

読んだ本のレビューデータサイエンス編

RNNを用いた正規分布の回帰 keras実装

特徴量選択の今とこれから

QRNN ニューラルネットを用いた分位点回帰

ランダムフォレストと検定を用いた特徴量選択手法 Boruta

pickleより楽にpythonオブジェクトを保存する方法

時系列データで予測区間付き回帰を行う keras

脳波を可視化してみた

Hyper+xonshで超モダンな環境づくり

時系列データでVariational AutoEncoder keras

時系列データを使ってオートエンコーダー keras

メモリに乗り切れないデータをkerasで学習する

Google流資料作成術を読んで

またまた、LightGBMのインストールでエラーが出た

ハンズオンUMAP

LightGBMのインストールのエラーに戸惑った話

Jupyter notebookで変数一覧を常に出す方法

PythonでForward Selection (mlxtend)

imbalanced-learnを実際に使った分析例使わない場合と比較

imbalanced-learnの機能の紹介

変数選択(Feature Selection)の実装と改善の確認

目的地に案内してくれる魔法の帽子 Gogoal cap

変数選択(Feature Selection)手法のまとめ