東芝:1枚の登録画像から、新しい物体を高精度で検出する画像認識AI「Few-shot物体検出AI」を開発

東芝は、製造現場や流通現場で取り扱う製品や部品の変更が発生しても、新規物体の画像を1枚登録するだけで即座に世界最高精度で検出する画像認識AI「Few-shot物体検出AI」を開発した。本AIは、新製品や改良品等で扱う製品や部品が定期的に変更になる工場や、常に新規商品への対応が求められる物流現場など頻繁に新しい物体が登場する現場での活用が期待されている。

現場からセンシングしたデータを価値ある情報に変換し、現場にフィードバックすることで、現場における生産性・品質・作業効率の向上につなげる取り組みは世界規模で進められている。特に、画像から人や物体を検出する画像認識AIは、生産性の改善や自動化・省力化のための解析に基盤的に使われる重要な技術である。しかし、画像認識AIを用いて現場ニーズに応じた物体を新たに検出するためには、都度、大量の画像を準備し学習させる必要があり、その手間が課題であった。

今般、東芝が開発した「Few-shot物体検出AI」は、画像に映る学習対象以外の任意の物体の形状を自動的に学習する同社独自の仕組みを導入し事前に学習しておくことで、現場での再学習が不要であり、画像を1枚登録するだけで新規物体を検出することができる。東芝の技術は公開データセット(1)を用いた検出精度の評価において、世界トップ精度を実現している(2)

本技術により、再学習のための手間や時間が障壁となりAI導入が見送られてきた、多数の部品や設備を扱う工場やプラントにおいても、導入・運用しやすい「Few-shot物体検出AI」により現場のデータ化・デジタル化に貢献し、DXによる生産性・品質・作業効率の向上を推進する。

東芝は本技術の詳細を、2022年5月25日に開催されるコンピュータビジョンの国際会議ICIAP2021(21st International Conference on Image Analysis and Processing)で発表する予定。

開発の背景

AIビジネスは今後も拡大していくことが見込まれており、国内市場は2025年には2020年度比約2倍の1兆9,357億円になる予測である(3)。中でも、画像認識AIは、人の行動や周辺環境の認識に必要不可欠な技術として、製造現場における品質・生産性向上、社会インフラの現場における保守点検作業の効率化、物流・流通現場における業務効率化など、多種多様な分野で実利用が進んでいる。

東芝グループでも、インフラ事業における豊富な知見と実績を生かしたインフラサービスを支える技術として活用が進んでいるが、実際の現場では、AI導入時には存在しなかった新しい物体が登場する場面が多くある。例えば、長期間運用中に新規の部品や製品を扱う場合や、別の製品や部品を扱う新設工場に適応する場合、AIが未学習の物体を新たに追加し解析対象とすることが求められる。

新規物体の検出には、通常、AIの再学習を行う(以下、再学習型)が、現場で、大量の画像・映像と正解情報を用意する必要があることに加え、学習の時間が長くかかるため、頻繁に新規物体が登場するような現場での活用は困難であった。一方で、再学習が不要な方式(以下、登録型)を採用すると、実用化レベルの検出精度が実現できない課題があった。

本技術の特長

そこで東芝は、未学習の物体の画像をたった1枚用意し登録するだけで、AIの再学習を行うことなく即座に新規物体の検出を可能にする「Few-shot物体検出AI」を開発した。

図1: 従来の再学習型との学習の違い

通常AIは対象となる「正解」が付与された物体以外は「背景」として扱い、画像から対象物体が映る領域を物体候補として抽出する深層モデルを学習する。今般、東芝は、付与された「正解」以外の背景として扱っていた物体を含めて自動的に学習する新たな方式を開発した(図1)。更に開発した方式で事前に学習した深層モデルを用いることで、従来であれば背景と認識していた部分から自動で抽出される物体候補と、登録した新規物体とを比較し、画像から新規物体を検出する「Few-shot物体検出AI」を確立した(図2)。本AIを用いることで、新たに検出したい対象の画像1枚を登録するだけで、即座に検出することが可能になる(図3)。

図2: 「Few-shot物体検出AI」による物体検出
図3: 従来の登録型との認識精度の違いの例

また、今回開発されたAIと同様に、深層モデルの再学習を必要としない登録型の従来方式(4)の検出精度21.2%と比較して、東芝方式では検出精度が46.0%へと大幅に向上し、再学習不要な登録型において世界最高精度を達成した(2)

今後の展望

「Few-shot物体検出AI」の開発により、これまで導入が見送られていた現場においても、画像認識AIの導入や運用が容易になる。DXの推進に貢献し、多種多様な現場での生産性・品質・作業効率の向上が期待できる。

 東芝は今後、本技術を早期の社会実装に向けて2023年度中の製品化を目指す。

*1 公開データセット The PASCAL Visual Object Classes Challenge
*2 東芝調べ 2022年2月時点
*3 AIビジネスの国内市場 オートメーション新聞
*4 Qi Fan, et al. , Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector, Conference on Computer Vision and Pattern Recognition, 2020.

キーワードで検索する

著者プロフィール

Motor Fan illustrated編集部 近影

Motor Fan illustrated編集部