読んだので自分の整理のためにまとめます。
続きを読むインバランスデータにおけるPR曲線とROC曲線の振る舞いの違い
- 注意
- PR曲線について
- PR曲線とは
- どんなときにPR曲線を使うのか
- 前提知識
- ROC曲線
- Confusion Matrix
- PrecisionとRecall
- PR曲線の書き方
- インバランスデータにおけるPR曲線とROC曲線の違い
- 面積の比較
- ちょっと悪い場合
- もっと悪い場合
- 軌跡の比較(アニメーション)
- 面積の比較
- まとめ
- 参考
注意
本記事は自分の知識が浅いうちに書いた記事なので、ツッコミどころが多い。 本記事を読むにあたっては、以下のことに注目して読んでいただきたい。
- ROC曲線も悪くはない。むしろ自分はこちらばかり使っている。
- PR曲線との振る舞いの違いを確かめた記事として読んでほしい。
- 少数クラスに注目する上ではPR曲線のほうが数値としての変動が大きい。それがわかりやすいという文脈でPR曲線のほうが"適している"と本文で書きがちであるが、面積最大化という意味ではROC曲線と等価(?ほぼ等価なはず)である。
Jupyter notebookでPlotlyを使うときに一設定必要だった話
- はじめに
- エラーを解決する
- どんなエラー表示が出たか
- どうしたら良いか
- Plotlyをオフラインで使う
- さいごに注意
はじめに
可視化が大事なのは言わずもがな。調べていた所Plotlyというものに出会いました。ただ、早速使おうとしたらJupyter notebookにグラフが表示されなかったりエラーがでたりしました。エラーで検索したところ、日本語の記事がヒットしなかったので、ここに記録を残しておきます。
エラーを解決する
どんなエラー表示が出たか
IOPub data rate exceeded.
The notebook server will temporarily stop sending output
実行しようとすると、上述の文からはじまるエラーが表示されていつまで経っても図が表示されませんでした。(データ点の個数にもよるのかな?検証してません)
続きを読む