Deep Learning

顔検出器CenterFaceで高速推論

まえがき R&Dチームの宮﨑です。CenterFaceをTensorRTで実装したところ、かなりの性能が出たので記事にしました。 日々様々なDNNを実装・計測しているオプティムですが、その中でアンカーフリーの顔検出としてピックされたCenterFaceが期待できる結果が出た…

AWS SageMakerローカルモードで学ぶコンテナベース機械学習

R&Dチームの徳田(@dakuton)です。 時系列分析に携わるエンジニア目線でコロナウイルスに関する動向を見ていると、短い期間で当てはまる予測モデルをつくるというよりは、カットオフ発生(データの分断点)を調べることが重要になるだろうと思いながら自宅で静…

大規模コーパスでGoogle Cloud Speech To Text APIの精度検証を行う & アップデート内容の検証

どうもこんにちは!新型コロナウイルスの影響で卒業式が中止になった、2020年新卒入社予定の山口です。 今回はGoogle Cloud Speech-to-Text API(以下GST)を大規模コーパスで精度検証した結果と、GSTアップデートの検証内容について共有していけたらと思い…

Google Cloud Speech-to-Text APIをいろいろ調査してみる

こんにちは、2020年新卒入社予定の山口です!修論と引越し準備とアルバイトで慌ただしい日々を過ごしています。今日は業務で触った、Google製API Google Cloud Speech-to-Text API について皆さんと共有できればと思います。 Google Cloud Speech-to-Text AP…

深層学習モデルの高速推論を支える TensorRT の概要

GCP の Tesla T4 が安くなったと思ったら元通りの価格にもどっていて、あれは幻だったのか・・・と嘆いている R&D チームの奥村(@izariuo440)です。これまで何度か TensorRT について触れてきましたが、どのように使うのかは触れていませんでした。今回は…

TensorRT 7 でさらに快適な高速推論

オプティムの R&D チームで Deep な画像解析をやっている奥村です。TensorRT 7 の変更点についてメモしました。非推奨機能に関するポリシーの明確化や、NLP、特に BERT に関するサポートの拡充、ありそうでなかった PReLU のサポートが気になった変更点です…

【ML Kitで】来場者が身に着けたQRコードを自動取得するAI Marker(α版)の話【Androidアプリ開発】

はじめに AI Markerとはなんぞや OPTiM INNOVATION 2019でAI Markerお披露目 必要なスペック 技術選定 QRコードのライブラリ選定 ML Kitは便利 quickstart-android/mlkit紹介 (おまけ)QRコードの精度向上について (番外編)ARマーカーじゃダメなの? 取得…

TensorRT 6 でさらに快適な高速推論

はじめに オプティムの R&D チームで Deep な画像解析をやっている奥村です。 2019/09/17 の Tweet で TensorRT 6 のリリースを発見しました。TensorRT 5.1.5 のリリースから約四ヶ月ぶりのリリースとなります。今回は RC がなく、いきなり GA となっていま…

2019インターン紹介: MediaPipeを用いたモバイル向けリアルタイム手指トラッキングを動かしてみる

R&D チームの徳田(@dakuton)です。好きなHand Poseはメロイックサインです。 先日、2019年度のインターン事例として、EdgeTPU向けの全身姿勢推定をご紹介しました。今回は別の事例として、MediaPipeを用いたモバイル向けのリアルタイム手指推定+トラッキング…

Edge TPU の July 2019 Updates を追う

こんにちは。R&D チームでコンピュータビジョンの深層学習モデル推論特化型人材として活躍している(自称)奥村(@izariuo440)です。Edge TPU リリースからはや4ヶ月。周辺ソフトウェアの更新でハードウェアの潜在能力が顕在化してきています。先日、post-…

本気で自然言語処理やらないエンジニアでもできる、イベントアンケートの意見抽出

まえがき R&Dチームの徳田(@dakuton)です。 私の開発業務としては自然言語処理をメインとした業務ではありませんが、必要に応じてテキスト解析に携わることもあります。 今回は、がっつり自然言語処理やらないエンジニアからみたときのテキスト解析の使いど…

3Dゲームエンジンを使って建機のアノテーション済みデータを自動生成する

3Dゲームエンジンを使って建機のアノテーション済みデータを自動生成してみました。加えてRefineDetで物体検出をさせてみました。脱データセット作成なるか?

Papers With Code で Deep Learning に関する情報を効率的に収集する

はじめに オプティムの R&D チームで Deep な画像解析をやっている奥村です。時代は INT8 だと思います。 Deep Learning は非常に研究が活発で、論文がポンポンポンポン出てきます。 多くの論文は、arXiv1 (アーカイブと読みます)というサイトに投稿されま…

Mask R-CNNで、一般物体検出、セグメンテーションを実装する

こんにちは。山本@ABです。ようやく私も、テックブログに参戦です。 本日は、COCOデータセットにより学習済の、Mask R-CNN※というモデルを利用して、一般物体検出、セグメンテーションを動かしてみます。 今回紹介するのは、2019/3/22に発売された「AIプロジ…

Deep Learning等の精度評価において、F値(Dice)とIoU(Jaccard)のどちらを選択するべきか?

初めまして、R&Dの加藤です。R&Dでは珍しく中途入社です*1 。業務は農業や医療のプロジェクトでDeep Learningを使った画像解析を主に担当しています*2。 また、終業後は不定期(主に月曜日)に職場の人達と一緒に皇居を走っています。先日開催された多摩川の…

Mask R-CNNでいちごを検出する話

Mask R-CNNでいちごを検出してみました。実用的な検証という意味も込めて、撮影はiPhoneで行っています。学習と毛出にはFacebook ResearchのMask R-CNN Benchmarkを使いました

Deep Learningによる行動認識

はじめまして、OPTiMの久末 (@mstn_)です。私は現在R&Dチームに所属している新卒1年目のスタッフで、普段は様々な物体の行動を映像から解析する日々を過ごしています。 今回はそんな私が、普段使っている技術に関して、そのバックボーンとなる部分も含めてお…

RefineDet より高精度な物体検出器、M2Det を実行する

はじめに オプティムの R&D チームで Deep な画像解析をやっている奥村です。最近の主力開発言語は Rust になりました。噂の M2Det のコード *1 が公開されたようなので試してみましょう。すでに Ubuntu の開発環境があれば 30 分ほどで試せます。GPU はあっ…

ハイブリッド学習時代にそなえる、定量データ解析AIのためのエッジデバイス活用パターン

まえがき R&Dチームの徳田(@dakuton)です。本ブログの副編集長を兼任しています。普段の業務では機械学習などを用いて定量データの解析を行っています。 今年の6月に、Androidのイベント(ABC 2018 Spring)でエッジデバイス(主にモバイル)に関する機械学習の…

Microsoft の ONNX Runtime を速攻レビュー

はじめに オプティムの奥村です。Microsoft が 2018/12/04 に ONNX Runtime を MIT ライセンスでオープンソースとして公開しました。 azure.microsoft.com ONNX Runtime は 2018/10/16 に Preview として公開されて気になっていましたが、コードが公開された…

TensorRT で物体検出・姿勢推定はどれくらい速くなる?

今回は、TensorRT で物体検出・姿勢推定はどれくらい速くなるのかを紹介します。せっかちな人のために、TensorRT による効果を先にかいつまんで書いておきます。 RefineDet という物体検出モデルでは 38 fps が 68 fps に向上 (x1.8 Faster!) OpenPose とい…