学習する天然ニューラルネット

主に機械学習に関する覚書や情報の整理。競プロ水色→Kaggle Master→?

論文読み Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery

読んだので自分の整理のためにまとめます。

[1703.05921] Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery

  • 導入
    • 扱う問題
    • 問題意識
    • メインアイデア
  • 理論
  • 実験
  • 結論
続きを読む

インバランスデータにおけるPR曲線とROC曲線の振る舞いの違い

  • 注意
  • PR曲線について
    • PR曲線とは
    • どんなときにPR曲線を使うのか
  • 前提知識
    • ROC曲線
    • Confusion Matrix
    • PrecisionとRecall
  • PR曲線の書き方
  • インバランスデータにおけるPR曲線とROC曲線の違い
    • 面積の比較
      • ちょっと悪い場合
      • もっと悪い場合
    • 軌跡の比較(アニメーション)
  • まとめ
  • 参考

注意

本記事は自分の知識が浅いうちに書いた記事なので、ツッコミどころが多い。 本記事を読むにあたっては、以下のことに注目して読んでいただきたい。

  • ROC曲線も悪くはない。むしろ自分はこちらばかり使っている。
  • PR曲線との振る舞いの違いを確かめた記事として読んでほしい。
  • 少数クラスに注目する上ではPR曲線のほうが数値としての変動が大きい。それがわかりやすいという文脈でPR曲線のほうが"適している"と本文で書きがちであるが、面積最大化という意味ではROC曲線と等価(?ほぼ等価なはず)である。
続きを読む

Jupyter notebookでPlotlyを使うときに一設定必要だった話

  • はじめに
  • エラーを解決する
    • どんなエラー表示が出たか
    • どうしたら良いか
  • Plotlyをオフラインで使う
  • さいごに注意

はじめに

可視化が大事なのは言わずもがな。調べていた所Plotlyというものに出会いました。ただ、早速使おうとしたらJupyter notebookにグラフが表示されなかったりエラーがでたりしました。エラーで検索したところ、日本語の記事がヒットしなかったので、ここに記録を残しておきます。

エラーを解決する

どんなエラー表示が出たか

IOPub data rate exceeded.
The notebook server will temporarily stop sending output

実行しようとすると、上述の文からはじまるエラーが表示されていつまで経っても図が表示されませんでした。(データ点の個数にもよるのかな?検証してません)

続きを読む

ROC曲線の書き方を整理する。

  • はじめに
  • 前提知識
  • 一瞬でわかりたい人向け
  • ROC曲線を手で書くには?
    • メインアイデア
    • 具体例
    • 別の具体例1
    • 別の具体例2
    • 注意すべき例
  • まとめ
    • 追記
続きを読む