環境構築機械学習人気記事

機械学習系のデモアプリを作成することがしばしばありStreamlitを使用していたが、パラメーターなどをいじるたびに処理が最初から走るなどといった挙動に悩まされていた。同僚がGradioというのを使っていたのでサーベイがてらメモしていたらブログが出来上…

Visual Studio Code 等のアプリで command + [ (open bracket) がmacOSに吸われるニッチなバグの解決

環境構築人気記事

状況直し方先人たちの記録と解決しない事象推測される原因ついでに発見したバグ状況 Macを初期化して再セットアップしたら、VSCodeで command + [ (open bracket, left bracketとも) が効かなくなった。プログラミングしているときにこのショートカッ…

2020-09-09

AtCoderでCythonの力を開放する魔術詠唱

人気記事競技プログラミング

概要以下のformatをPythonで提出すればいい mycode = r''' # distutils: language=c++ # cython: language_level=3, boundscheck=False, wraparound=False, cdivision=True {ここにcythonのコードを書く} ''' import sys import os if sys.argv[-1] == 'ONL…

2020-08-09

githubやnoteでもTeXの数式を書くぜ

人気記事環境構築

この記事は何？使い方作成のモチベーション関連するツールまとめこの記事は何？これを作った↓ https://tex-image-link-generator.herokuapp.com/ これを使えば、githubのreadmeやissuesに数式を埋め込むことができる。例えばこんなふうに。 noteやhat…

2020-04-04

Confident Learningは誤った教師から学習するか？ ~ tf-idfのデータセットでノイズ生成から評価まで ~

機械学習人気記事

概要現実の判別問題において教師が完璧であることは珍しい。ラベリング作業において、知識不足や勘違いなどで引き起こされるヒューマンエラーはデータセットを汚染する。このような間違った教師のことを、noisy label (corrupted label や polluted label…

2019-07-15

特徴量重要度にバイアスが生じる状況ご存知ですか？

機械学習人気記事

なぜこの記事を書いたのか？決定木をベースにしたアルゴリズムのほとんどに特徴量重要度という指標が存在する。データに対する知識が少ない場合はこの指標を見て特徴量に対する洞察深めることができる。KaggleではEDAのときにとりあえず重要度を見てみるな…

2019-03-24

【具体例つき】scikit-learnを改変しよう ~改変版のinstall方法と改変に必要な知識のリンク集~

人気記事機械学習環境構築

はじめにこの記事を読むことで、scikit-learnの中身のコードに改変を加えることができるようになることを期待している。改変に必要な知識も学習できるようリンクを用意してある。そして改変を加えたコードをpipで管理する方法も示した。最後には具体例とし…

2019-02-10

特徴量選択の今とこれから

人気記事機械学習

特徴量選択とは特徴量選択の難しさ特徴量選択の手法の大別教師ありの特徴量選択 filter method 単変量とクラスラベルの関連性を上げる関係性を上げて冗長性を下げる関係性を上げて多様性を上げる wrapper method Forward SelectionとBackward Eliminati…