デンソーテン:組込み機器向け軽量・高性能エッジAI技術を開発

デンソーテンは、ドライブレコーダーなどの組込み機器(エッジ端末)で撮影した車両・歩行者などの物体を、エッジ端末のSoC(※1)上でリアルタイムに認識する軽量・高性能なエッジAI(人工知能)技術を開発した。

 デンソーテンのエッジAI技術は、処理能力0.5TOPS (※2)程度のSoCで、高性能コンピューターに用いられるGPU(※3)向けAIに匹敵する性能を実現した。同社製品への搭載に加えて、SoC上で動作するAI学習済みモデル(ソフトウェア)の外販にも取り組む。

エッジAI技術の適用例
〜ドライブレコーダーなどの車載機器から効率的にデータを収集〜

 エッジAI技術の適用先の一つに、車載機によるデータ収集が挙げられる。デンソーテンは2005年にタクシー向けドライブレコーダーを発売。2015年にはクラウドセンターと連携し、走行中の膨大な記録データの中から危険と判断された画像だけをリアルタイムに確認できる「クラウド連携ドライブレコーダー」を商品化した。コネクティッドカーの普及に伴うデータ活用の多様化・高度化によって、例えば、ドライブレコーダーが収集する画像データに対する需要が増え、それをクラウドセンターに送信するための通信コストや、クラウドセンターのストレージコストなどデータ収集コストの増加が見込まれる。そこで、解決策として、まず、車の中にエッジAIを搭載して撮影した画像に映り込んでいる物体を認識し、(a)例えば、看板や車の台数などの認識結果を文字データとしてクラウドセンターに送信。次に、クラウドセンターで認識結果に基づいて(b)本当に必要な画像データの送信だけを車載機器へ要求することで、データ収集に係るコストを大幅に削減し、効率の良いデータ収集を行えるようになる(※4)。今回、このような車載用途に適用可能な、軽量・高性能なエッジAI技術を開発した。

図1 エッジAIを組み込んだ効率的なデータ収集。OTA:Over The Airの略。信号やデータの伝送を無線通信で実施。AIモデルの更新に利用

演算量削減と高度な認識性能を両立、教師データ作成やAIモデル学習に係る時間も短縮

・画像認識AI技術の概要
 画像認識AI技術は、ディープラーニング(深層学習)が主流。ディープラーニングの画像認識ソフトウェア(AIモデル)は、ニューラルネットワークと呼ばれる人間の脳の神経を模倣した構成を多層的に重ね合わせている。多層のニューラルネットワークであるため演算量は多いが、従来の認識技術よりも高精度に認識できる。この技術では、認識したい物体を含む画像(教師データ)を大量(数万~数十万枚)に用意してAIモデルに何度も学習させ、その結果をSoCに載せられるサイズに軽量化して実装する(図2)。

・課題
 AIモデルの構築・更新・変更には以下の課題を克服しなければならない。

1.小規模なSoCでの処理を可能とする、少ない演算量・メモリ量と、それらによってもたらされる、他のプロセスとも共存可能な軽量化(図2:プロセス⑤)
2.大量の教師データを作成するための工数削減(図2:プロセス③)と、AIモデル生成における工数削減(図2:プロセス④)
 
図2 AIモデル開発のプロセスと課題

・解決策
1.超軽量エッジAI技術(※5)
・様々な大学や研究機関、企業などで開発されている高性能の画像認識AIから、車載機向けのベースとなるAIを選定。性能確保のために残すべき部分を特定し、そうでない部分を簡単な演算に置き換えることでAIモデルの演算量・メモリ量を削減(図2:プロセス⑤)
・高性能パソコン向けのGPUなどで実行される代表的なAIである、Darknet53+Yolov3と比較して、1/60以下の演算量と1/32以下のメモリ量で同等の認識性能を実現
2.モデル生成効率化技術
・今回開発したデンソーテンのエッジAI技術と組み合わせることで教師データの作成にかかる手作業を一部自動化。経験豊富な人の手作業による教師データ作成と比較して時間を20%削減(図2:プロセス③)
・デンソーテンのAI技術者が保有するノウハウをソフトウェア化することで性能の良いモデルを作るための設定値(学習用パラメータ)を特定する工程を自動化。AI技術者がいなくてもAI技術者が作成したモデルと同等性能のモデルを短期間かつ自動で生成することが可能(図2:プロセス④)

 これら技術開発で作成したAIモデルをデンソーテン製品に適用。さらに、収集画像の個人情報保護(例:映り込んでいる人の顔をマスク)、車両や歩行者による通行量の把握、防犯カメラでの侵入検知、店舗内カメラによる来店客の移動軌跡の検出など車載以外の用途も提案していく。

(※1)System-on-a-chipの略。集積回路の1個のチップ上にプロセッサコアをはじめ一般的なマイクロコントローラが持つような機能のほか応用目的の機能なども集積。それらが連携してシステムとして機能するよう設計されている集積回路製品
(※2)Trillion Operation Per Secondの略。1TOPSは1秒間に1兆回命令を処理する能力
(※3)Graphics Processing Unitの略。コンピューターゲームに代表されるリアルタイム画像処理に特化した演算装置あるいはプロセッサ
(※4)コネクティッドカー普及を見据えた効率的なデータ収集方式を開発~「第26回ITS世界会議シンガポール2019」に出展~ 2019年10月18日プレスリリース https://www.denso-ten.com/jp/release/2019/10/20191018_2.html
(※5)第26回画像センシングシンポジウム(SSII2020:2020年6月10日~12日開催)IS2にて以下テーマで発表。「車載向けSoCに搭載可能な軽量物体検出モデルの開発」

キーワードで検索する

著者プロフィール

Motor Fan illustrated編集部 近影

Motor Fan illustrated編集部