はじめに
この記事は初心者でも,やってみたらと意外となんとか頑張れるというポエムです.
機械学習を始めたきっかけ
普段は診療放射線技師として医療機関に勤務している非情報系学部出身者です.
プログラム経験はまったくありません.
2017年ごろに大学院へ進学しようと決心しまして
院試対策としてTOEFLの勉強をしていました.
リスニング対策の一つとして北米放射線学会のpodcastをよく聞いていました.
Radiology Podcasts | RSNA
仕事でも必要なネタを英語で解説してくれるので有難かったです.
めでたく2018年の試験で大学院に合格し,一息つけました.
2018年8月ごろのradiology podcastでは
医療画像にもAIが使われるようになること
AI関係の論文も増えているので2019年にradiology AIも刊行するという内容でした.
その中で
・機械学習には無料で使用できるフレームワーク(tensorflow,caffe..)がいろいろある.
・画像を学習させておくと結果が出る.
・そのままだとダメなので,きちんと検証してね.
・NIHが大規模な胸部XPデータセットを公開する予定で,それは誰でも使える.
という話があり,早速調べてPythonとやらが良さそうに見え
2018年11月ごろ'Hello world!'しました.
肺炎コンペ
胸部XPのデータセットをあれこれ調べているうちに
RSNAが公開しているデータセットを見つけました.
これをコンペ形式で何やらやっているらしい,ということでたどり着いたのが
kaggle rsna-pneumonia-detection-challengeです.
pythonですら操れないのに,機械学習などわかるわけもなく
ただひたすらNotebooksやDiscussionを読みました.
自分もやってみたい!と手を動かしたり
udacityで
機械学習のコースを受講して勉強しました.
カレーさんのチュートリアルを買い
見よう見まねでtitanicにsubmitして,kaggleデビューしました.
カレーさんのチュートリアルは本当に勉強になりました.
指示が具体的で,コードも書いてあるため
一つ一つが何をしているのかがわかりやすいです.
それにしても日本語で説明してもらえるって良いですね!
環境
計算環境ですがGPUなどもなく10年ほど前に購入した古いノートがあるだけです.
ローカルで機械学習は無理だなと思っていましたが
Kaggle kernel上なら,かなりのことができました.
Google colabratoryの存在を知り,現在ほとんどこの2つで作業しています.
肺炎コンペのコードを使って
自院の患者さんの胸部XPからGGO検出とかもやってみました.
(もちろん倫理とかいろいろ許可を取ってやってます.)
初期の肺がんや間質性肺炎,非定型抗酸菌症などの症例を試しましたが
今一つな結果しか得られませんでした.
これは私のモデルの精度が出せてないせいかと思います.
これは2019年6月のFHSという国際会議で発表しました.
気が付いたら,contributorになれたっぽい
contributorの資格要件は主に次の4つと,プロファイルの入力です.
-Run 1 script
-Make 1 competition submission
-Make 1 comment
-Cast 1 upvote
どうでしょうか,contributorはわりと簡単になれそうです.
なんだか気が付かないうちに,全部クリアしていたので
プロファイルを埋めてcontributorになりました.
最後に
contributorになったからと言って
初心者であることに変わりはなく,あまり価値のあるものではありません.
それでもKaggleを知っていて,
多少手を動かす人なんだ,くらいの印象にはなるかもしれないなと思っています.
肺炎コンペでは上位に日本人のチームが入っていて,本当にすごいなと感動しました.
いつか自分もメダルを取れるように頑張りたいです.