重なり合う領域も許容する NER 特化のアノテーションツールを作った

機械学習環境構築

重なり合う領域も扱える文字列アノテーションツール「Layered Span Studio」を作った。NER のようなタスクで、ラベル定義や過去の付与例、同じ表層が別の文書でどう扱われているかを確認しながら、判断しやすく素早く作業できる。既存ツールでは扱いにくい重…

2024-12-25

貸せ、RunpodはKaggleでこう使う

kaggle 環境構築

Kaggleコンペを勝ち抜くために必須となるGPUリソースを、安価かつ手軽に確保できるRunpodの活用法を解説。Storage機能やPoetry環境構築、Secretsでの認証管理など、Kagglerが知っておきたい実用的なTipsを紹介します。さらに、 Kaggle Grandmasterのエチレン…

2023-10-29

AIメロディー生成コンテスト弁財天第二幕参加記録

機械学習

2023年10月28日、「弁財天」というAIメロディー生成コンテストにチームメンバーのCapchiiと一緒に出場した。コンテストは、運営から伴奏のデータが提供され、それに対して各チームは制限時間内に自身のメロディー生成システムを実行し、生成されたメロディ…

2023-08-05

【それを言ってはいけない！を言う】「データ分析失敗事例集」を読んで

【Streamlitよりいいかも？】機械学習系のデモアプリ作成に最適！Gradio解説

環境構築機械学習人気記事

機械学習系のデモアプリを作成することがしばしばありStreamlitを使用していたが、パラメーターなどをいじるたびに処理が最初から走るなどといった挙動に悩まされていた。同僚がGradioというのを使っていたのでサーベイがてらメモしていたらブログが出来上…

2023-06-11

AI画像加工ツールClipdropの全機能を検証 (有料機能含む)

Clipdropとは？ https://clipdrop.co/ で提供されるAI画像加工サービス。昨今職業驚き屋さんが驚き始めたのを感じるので今日はその実態に迫っていく。検証に際しては有料登録もして比較するので参考になればと思う。追記 : 動画にしていただきました！ Cl…

2022-12-04

Kaggle Masterになった日記

kaggle

Kaggle Masterになった "Feedback Prize - English Language Learning" で金メダル今後はどうしようか Kaggle Masterになった "Feedback Prize - English Language Learning" (以下FB3) で金メダルを取得した結果、メダルの条件を満たし、Kaggle Competitio…

2022-06-26

チームメイトに恵まれKaggle Competitions Expertになった日記

kaggle

はじめに Expertになるまでの戦歴 NBMEコンペの思い出 PPPMコンペの思い出 Masterは目指そうかなはじめに日記です。Kaggleを初めて2つのコンペに参加し無事Expertになったので、つれづれなるままにPCに向かひて、心にうつりゆくよしなしごとをそこはかとな…

2022-05-06

kaggle notebookで`pandas.read_pickle`ができない原因と対策法

kaggle

- 背景 - kaggle notebook以外の環境で`pandas.DataFrame`を`to_pickle`で保存する。 - kaggle notebookにて`pandas.read_pickle`をしようとすると、エラーが出て読み込めない。 - 原因は二重にある - Pythonのversionの問題 - Pandasのversionの問題 - 手っ…

2022-02-11

Visual Studio Code 等のアプリで command + [ (open bracket) がmacOSに吸われるニッチなバグの解決

環境構築人気記事

状況直し方先人たちの記録と解決しない事象推測される原因ついでに発見したバグ状況 Macを初期化して再セットアップしたら、VSCodeで command + [ (open bracket, left bracketとも) が効かなくなった。プログラミングしているときにこのショートカッ…

2021-07-10

クリックレートやコンバージョンレートといった二項母集団の母比率の信頼区間精密法のPython実装

機械学習

前提データ求めたいもの実装確認前提本記事ではクリックレート(CTR)やコンバージョンレート(CVR)といった二項母集団の母比率について信頼区間を計算するPython実装を与える。データ数が少ない状況においてはCTRやCVRだけではなく、その不確実性も考慮…

2021-05-01

病気に備える保険にはいつ加入すべきか？罹患の累積確率と許容リスクから考える

背景早速結論なぜ保証内容と加入タイミングを考えるのか何を保証すべきか？いつから保険に加入すべきか？ further investigation is required まとめ背景保険には入っておいたほうが良いとは聞くが、商品は膨大で何を保証すべきか、いつ入ればいいのか…

2021-04-21

intel macbookでスリープ中に電源が切れる問題とその解決方法

環境構築

概要エラーメッセージ解決方法参考概要 Intel CPUのMacbook proの電源を切った覚えがないのに、蓋を開けると電源の付く音が流れることが数回発生した。しかも決まって前回は異常終了したという警告。そこで原因を調べ、暫定的な解決法をここにメモをす…

2020-12-31

iDeCoを使用する上での注意点 ~利益を最大にするために~

概要本記事では以下の内容について述べている。自分のメモ代わりの意味合いが大きいが、興味のある方はぜひご付き合いください。 iDeCoの概要 iDeCoのデメリット会社員はどう活用すべきか (いろいろケーススタディなども行ったがごちゃごちゃして主張が不…

2020-11-14

人生最後のキーボードを購入 Ultimate Hacking Keyboard (UHK 60 v1)

環境構築

Ultimate Hacking Keyboard とは一週間使ってみた感想打鍵感について独自機能について静音化注文してから届くまで注文方法届くまで開封から設定まで最後に Ultimate Hacking Keyboard とは最近購入した最高のキーボード。もうほかのキーボードは買…

2020-09-09

AtCoderでCythonの力を開放する魔術詠唱

人気記事競技プログラミング

概要以下のformatをPythonで提出すればいい mycode = r''' # distutils: language=c++ # cython: language_level=3, boundscheck=False, wraparound=False, cdivision=True {ここにcythonのコードを書く} ''' import sys import os if sys.argv[-1] == 'ONL…

2020-08-19

AtCoderでPythonが再帰に弱い問題をどうにかしたい

競技プログラミング

概要目次概要背景解決法速度比較 PythonとPypyの回答 Cythonの回答 Cythonを使いやすく今回のオチまとめ本記事の貢献 Python, Pypy, Cythonにおける再帰関数の速度比較 cythonをscript感覚で動かすコマンドの作成 (stackで書き換えるのが一番早かっ…

2020-08-09

githubやnoteでもTeXの数式を書くぜ

人気記事環境構築

この記事は何？使い方作成のモチベーション関連するツールまとめこの記事は何？これを作った↓ https://tex-image-link-generator.herokuapp.com/ これを使えば、githubのreadmeやissuesに数式を埋め込むことができる。例えばこんなふうに。 noteやhat…

2020-08-05

自動化で\のの/ラッシュを攻略 (毎週！いちかの超BEMANIラッシュ2020)

ののラッシュとはこれ。KONAMIのリズムゲームのイベント。カードを引くだけというカードバトルをする。本田圭佑より勝てる。 p.eagate.573.jp カード引くのめんどくさすぎ問題このイベントでは1日1回、特定の時間にブラウザ上で操作が必要。いや、普通…

2020-08-04

Mo's algorithm のPython実装 (コピペ用)

競技プログラミング

この記事はなに？ Mo's algorithmについてPythonでの実装が検索に引っかからなかったので、(自分のメモも含めて)ここに実装をおいておく。コンテストに向けてコピペで済むように心がけた。 Mo's algorithmとは? このブログにたどり着いてる時点で多くを語る…

2020-06-30

自動化でいちかジャンケン2020を攻略

summary これ作った。いちかジャンケンとはこれ。KONAMIのリズムゲームのイベント。本田圭佑より勝てる。 p.eagate.573.jp じゃんけんするのめんどくさすぎ問題このイベントでは一日三回、特定の時間にブラウザ上でじゃんけんすることが必要。 2020/06/29…

2020-06-10

蟻本Python回答集中級前編 (P127~P187)

競技プログラミング

はじめに AtCoder青を目指しつつデータ構造など勉強するため、プログラミングコンテストチャレンジブック [第2版] ■ (通称、蟻本)を解くことした。せっかくなのでPythonでの解答をここに記録する。 Pythonで解答してる人のブログを漁っても初級編の途中(DP…

2020-05-17

蟻本Python回答集初級編 (~P126)

競技プログラミング

はじめにとうとうAtCoder水色になれた(過去問精進と夜活コンテストのおかげ)。さらなる高みを目指すべく、プログラミングコンテストチャレンジブック [第2版] (通称、蟻本)を解くことした。せっかくなのでPythonでの解答をここに記録する。 Pythonで解答し…

2020-04-04

Confident Learningは誤った教師から学習するか？ ~ tf-idfのデータセットでノイズ生成から評価まで ~

機械学習人気記事

概要現実の判別問題において教師が完璧であることは珍しい。ラベリング作業において、知識不足や勘違いなどで引き起こされるヒューマンエラーはデータセットを汚染する。このような間違った教師のことを、noisy label (corrupted label や polluted label…

2020-03-27

Confident Learning -そのラベルは正しいか？-

機械学習深層学習

これは何？ ICML2020に投稿された Confident Learning: Estimating Uncertainty in Dataset Labels という論文が非常に面白かったので、その論文まとめを公開する。論文 [1911.00068] Confident Learning: Estimating Uncertainty in Dataset Labels 超概要…

2020-02-24

らくらくp進全探索コピペで使えるPython実装

競技プログラミング

何をしたか？連続するp進数を次々返してくれるiteratorを実装しました(といっても標準ライブラリにラップしただけ)。例えば、3桁の3進数だったら000, 001, 002, 010, 012 ..., 222 というものを次々に返してくれます。実際には桁ごとにリストの1要素を構…

2020-02-23

降順リストに対するbisectの実装 list.sort(reverse=True)に対する配列二分法

競技プログラミング

はじめに Pythonにおいて、降順リスト向けの配列二分法アルゴリズムを実装しました。使用するメリットコピペで標準ライブラリに準拠した動作をします。標準ライブラリと異なり、降順リストを扱います。昇順リストに変換し直す計算量と、昇順のidxを降順…

2020-02-22

めぐる式二分探索コピペで使えるPython実装

競技プログラミング

はじめにめぐる式二分探索のメリットと参考文献コピペ用例題はじめに AtCoderで二分探索を実装するときバグらせないように考えると結構時間かかりませんか？自分はかかります。競技プログラミング界隈ではめぐる式二分探索という二分探索の書き方(流派…

2019-12-11

螺旋本をPythonで解く Part4

競技プログラミング

はじめに 17章動的計画法 P412 DPL_1_A: Coin Changing Problem P416 DPL_1_B: 0-1 Knapsack Problem P421 DPL_1_D: Longest Increasing Subsequence P425 DPL_3_A: Largest Square P428 DPL_3_B: Largest Rectangle 18章整数論 P436 ALDS_1_C: Prime Numb…

2019-12-01

螺旋本をPythonで解く Part3

競技プログラミング

はじめに 14章高度なデータ構造 P318 DSL_1_A: Disjoint Set: Union Find Tree P324 DSL_2_C: Range Search (kD Tree) 15章高度なグラフアルゴリズム P336 GRL_1_C: All Pairs Shortest Path P342 GRL_4_B: Topological Sort P348 GRL_3_A: Articulation P…

学習する天然ニューラルネット

主に機械学習に関する覚書や情報の整理。競プロ水色→Kaggle Master→？

重なり合う領域も許容する NER 特化のアノテーションツールを作った

貸せ、RunpodはKaggleでこう使う

AIメロディー生成コンテスト弁財天第二幕参加記録

【それを言ってはいけない！を言う】「データ分析失敗事例集」を読んで

【Streamlitよりいいかも？】機械学習系のデモアプリ作成に最適！Gradio解説

AI画像加工ツールClipdropの全機能を検証 (有料機能含む)

Kaggle Masterになった日記

チームメイトに恵まれKaggle Competitions Expertになった日記

kaggle notebookで`pandas.read_pickle`ができない原因と対策法

Visual Studio Code 等のアプリで command + [ (open bracket) がmacOSに吸われるニッチなバグの解決

クリックレートやコンバージョンレートといった二項母集団の母比率の信頼区間精密法のPython実装

病気に備える保険にはいつ加入すべきか？罹患の累積確率と許容リスクから考える

intel macbookでスリープ中に電源が切れる問題とその解決方法

iDeCoを使用する上での注意点 ~利益を最大にするために~

人生最後のキーボードを購入 Ultimate Hacking Keyboard (UHK 60 v1)

AtCoderでCythonの力を開放する魔術詠唱

AtCoderでPythonが再帰に弱い問題をどうにかしたい

githubやnoteでもTeXの数式を書くぜ

自動化で\のの/ラッシュを攻略 (毎週！いちかの超BEMANIラッシュ2020)

Mo's algorithm のPython実装 (コピペ用)

自動化でいちかジャンケン2020を攻略

蟻本Python回答集中級前編 (P127~P187)

蟻本Python回答集初級編 (~P126)

Confident Learningは誤った教師から学習するか？ ~ tf-idfのデータセットでノイズ生成から評価まで ~

Confident Learning -そのラベルは正しいか？-

らくらくp進全探索コピペで使えるPython実装

降順リストに対するbisectの実装 list.sort(reverse=True)に対する配列二分法

めぐる式二分探索コピペで使えるPython実装

螺旋本をPythonで解く Part4

螺旋本をPythonで解く Part3