Papers With Code で Deep Learning に関する情報を効率的に収集する

はじめに

オプティムの R&D チームで Deep な画像解析をやっている奥村です。時代は INT8 だと思います。

Deep Learning は非常に研究が活発で、論文がポンポンポンポン出てきます。

多くの論文は、arXiv1 (アーカイブと読みます)というサイトに投稿されます。例えば、2018 年 5 月には 12,000 本を超える投稿があり、コンピュータサイエンス関連は 3,264 本あったそうです2

これらすべてに逐一目を通すのは人間には不可能に近いので、筋の良い論文を効率的に探したくなります。また「理論はさておき、とりあえず動かしてみたい」という場合、arXiv のサイトにはそれを探す機能がないので大変です。

そんな方におすすめなのが Papers With Code : the latest in machine learning という Web サイトです。

Papers With Code について

Papers With Code では、コードが GitHub で公開されている論文だけが表示されます。そのため、とりあえず動かせる手法を簡単に探すことができます。PC だけでなく、スマホでも快適に見れるので、電車通勤中の暇つぶしにも最適です。

f:id:optim-tech:20190509143733p:plain

2018 年の夏頃には動いていた気がします。Papers With Code の目的については以下に記載されています。

paperswithcode.com

Atlas ML さんががんばっているようです。

SOTA を探す

SOTA とは、State Of The Art の略称です。画面上部にある「Browse state-of-the-art」を選択すれば一望できます。

f:id:optim-tech:20190509144428p:plain

コンピュータビジョン、自然言語処理、医用画像解析など、分野ごとにまとまっています。例えば、コンピュータビジョンの物体追跡を見てみましょう。

f:id:optim-tech:20190509144418p:plain

こういった形で、どのデータセットでどういう手法が一番スコアが高いのかをサクッと確認できます。画面を下にスクロールしていくと・・・

f:id:optim-tech:20190509144423p:plain

こんな形で、そのタスクのサブタスクや、そのタスクでどういう手法が人気なのかも一覧されます。データセットで「COCO」を選択してみましょう。

f:id:optim-tech:20190509144425p:plain

このように、時系列でどのように精度が向上してきたかが分かります。サイトでは、グラフの点にマウスオーバーすると、どの手法がその精度を達成したかも分かります。下部の一覧では、そのデータセットでの順位が一望できます。

一覧から探す

サイトにアクセスすると、論文の一覧が表示されます。一覧には、

  • 論文のタイトル
  • 論文の投稿日時
  • 利用されている深層学習フレームワーク
  • 論文の Abstract からピックアップした一文
  • タスクでの順位(COCO の物体検出部門で1位、など)
  • タスク
  • GitHub の⭐数
  • GitHub レポジトリへのリンク
  • 論文へのリンク

が表示されます。一覧の表示順序は、3つから選ぶことができます。

流行り順に表示されます。表示順序のルールは明記されていませんが、GitHub で⭐が多く付いていて、鮮度の高い論文が順に表示されている印象を受けます。サイトにアクセスすると、この状態で一覧が表示されるはずです。

Latest

論文の投稿日時降順に表示されます。例えば、2019/04/17 だけでも 11 本のコードつき論文があることが分かります。

Greatest

GitHub で⭐が多くついている順に表示されます。今の所 TensorFlow、Caffe、Detectron という順になっています。

さいごに

手っ取り早く試せる Deep Learning モデルを効率的に探せるサイトの Papers With Code を紹介しました。この辺をちらちら見ていると「COCO の Object Detection で mAP 40 もいけるの?しかも 30 fps?すげーな!」など数字の肌感がつかめるようになることでしょう。私は毎朝チェックして一人で興奮しています。

Papers With Code は現時点でも十二分に役に立つ Web サイトですが、学習済みモデルが提供されているか、提供サイトはどこか (Google Drive、Dropbox、Baidu、etc...) も閲覧できるとさらに使い勝手がよくなりそうですね。

オプティムでは、こうした技術に興味がある・作ってみたい、というエンジニアを募集しています。興味のある方は、こちらをご覧ください。

www.optim.co.jp