はじめに
オプティムの R&D チームで Deep な画像解析をやっている奥村です。時代は INT8 だと思います。
Deep Learning は非常に研究が活発で、論文がポンポンポンポン出てきます。
多くの論文は、arXiv1 (アーカイブと読みます)というサイトに投稿されます。例えば、2018 年 5 月には 12,000 本を超える投稿があり、コンピュータサイエンス関連は 3,264 本あったそうです2。
これらすべてに逐一目を通すのは人間には不可能に近いので、筋の良い論文を効率的に探したくなります。また「理論はさておき、とりあえず動かしてみたい」という場合、arXiv のサイトにはそれを探す機能がないので大変です。
そんな方におすすめなのが Papers With Code : the latest in machine learning という Web サイトです。
Papers With Code について
Papers With Code では、コードが GitHub で公開されている論文だけが表示されます。そのため、とりあえず動かせる手法を簡単に探すことができます。PC だけでなく、スマホでも快適に見れるので、電車通勤中の暇つぶしにも最適です。
2018 年の夏頃には動いていた気がします。Papers With Code の目的については以下に記載されています。
Atlas ML さんががんばっているようです。
SOTA を探す
SOTA とは、State Of The Art の略称です。画面上部にある「Browse state-of-the-art」を選択すれば一望できます。
コンピュータビジョン、自然言語処理、医用画像解析など、分野ごとにまとまっています。例えば、コンピュータビジョンの物体追跡を見てみましょう。
こういった形で、どのデータセットでどういう手法が一番スコアが高いのかをサクッと確認できます。画面を下にスクロールしていくと・・・
こんな形で、そのタスクのサブタスクや、そのタスクでどういう手法が人気なのかも一覧されます。データセットで「COCO」を選択してみましょう。
このように、時系列でどのように精度が向上してきたかが分かります。サイトでは、グラフの点にマウスオーバーすると、どの手法がその精度を達成したかも分かります。下部の一覧では、そのデータセットでの順位が一望できます。
一覧から探す
サイトにアクセスすると、論文の一覧が表示されます。一覧には、
- 論文のタイトル
- 論文の投稿日時
- 利用されている深層学習フレームワーク
- 論文の Abstract からピックアップした一文
- タスクでの順位(COCO の物体検出部門で1位、など)
- タスク
- GitHub の⭐数
- GitHub レポジトリへのリンク
- 論文へのリンク
が表示されます。一覧の表示順序は、3つから選ぶことができます。
Trending Research
流行り順に表示されます。表示順序のルールは明記されていませんが、GitHub で⭐が多く付いていて、鮮度の高い論文が順に表示されている印象を受けます。サイトにアクセスすると、この状態で一覧が表示されるはずです。
Latest
論文の投稿日時降順に表示されます。例えば、2019/04/17 だけでも 11 本のコードつき論文があることが分かります。
Greatest
GitHub で⭐が多くついている順に表示されます。今の所 TensorFlow、Caffe、Detectron という順になっています。
さいごに
手っ取り早く試せる Deep Learning モデルを効率的に探せるサイトの Papers With Code を紹介しました。この辺をちらちら見ていると「COCO の Object Detection で mAP 40 もいけるの?しかも 30 fps?すげーな!」など数字の肌感がつかめるようになることでしょう。私は毎朝チェックして一人で興奮しています。
Papers With Code は現時点でも十二分に役に立つ Web サイトですが、学習済みモデルが提供されているか、提供サイトはどこか (Google Drive、Dropbox、Baidu、etc...) も閲覧できるとさらに使い勝手がよくなりそうですね。
オプティムでは、こうした技術に興味がある・作ってみたい、というエンジニアを募集しています。興味のある方は、こちらをご覧ください。