パナソニックHD、AIモデルが学習していない物体の「知ったかぶり誤認識」を防ぐAI技術を開発

パナソニック ホールディングス(以下、パナソニックHD)と、Panasonic R&D Company of Americaは、AIモデルが学習しておらず「本質的に認識ができない」物体を「未知物体」として認識し、画像認識AIモデルの信頼性を高める技術を開発した。本技術は先進性が国際的に認められ、AI・機械学習技術のトップカンファレンスであるUAI2023(The Conference on Uncertainty in Artificial Intelligence)にも採択されている。また、開発技術は2023年7月31日から2023年8月4日まで米国ピッツバーグで開催される本会議で発表される。

開発の背景

画像認識AIモデルは事前に学習させた対象に対しては高い認識率を誇るが、実環境のすべての物体を画像認識AIモデルにあらかじめ学習させることは困難だ。そのため、実際の利用環境では、AIモデルにとって未知の物体に直面することは避けらない。

一方、AIモデルは「知らない」と判断することが苦手で、モデルが知っている範囲で無理やり認識し「知ったかぶる」ことが、予期しない誤動作にもつながりかねない。この問題は、近年AIの社会実装の進展に伴って大きな課題となっていた。

そこで、パナソニックHDは、AIの信頼性を高める技術に注目が集まる中、画像認識結果が「どれくらい信頼できるのか(不確実性)」を推定可能な生成モデルを、画像認識モデルの後段に追加することで、「未知物体」に付与された誤ラベルを棄却し、本質的に認識が可能な学習済の物体のみを正しく認識できるようにする技術FlowEneDetを開発した。本手法は学習済の画像認識AIモデルの後段に追加するだけで簡単に拡張でき、高速に動作することが特長となっている。今後、AIの信頼性が求められる車載やくらし、B2Bなどの様々なユースケースでの活用が期待されている。

開発技術の特長

画像認識AIのひとつであるセマンティックセグメンテーション※1モデルは、学習時と似た環境・物体については精度よく推定ができるが、実環境に存在するすべての物体を事前に学習させることは不可能だ。学習データに存在しない未知の物体に遭遇した際に、そのモデルが学習した物体ラベルを無理やり当てはめてしまうことが、認識性能の低下や予期せぬ誤検知に繋がることが、課題となっている。

例えば、図1の矢印で示す物体(画像左上:ビールケース、画像左下:犬)は、セマンティックセグメンテーションモデルが事前に学習していない未知の物体だが、学習済のラベルから無理やり当てはめて推定してしまった結果、そもそも認識できない物体であるはずのビールケースを、一部が車(紺色)で残りが道路(紫)と誤認識し、同様に犬についても一部が木(緑)で一部が道路(紫)と誤認識してしまっている。特に車載カメラに搭載されるAIモデルにおいては、「道路」と誤認識してしまうことは重大な事故にも繋がりかねず、未知物体は「未知」と推定できる技術が必要とされる。

図1 未知物体に誤ったラベルが無理やり振られてしまう例

これに対し、パナソニックHDは、AIモデルが認識結果にどれくらい自信を持っているか(不確実性)を推定するフローベースの生成モデルFlowEneDetを開発した。

フローベースの生成モデルは、逆変換可能な関数の合成として複雑な分布を表現できるモデルで、学習した物体の分布を正確にモデリングできるため、「学習した既知の物体」と「学習していない未知物体や誤分類(モデリング結果が実際の分布と合わない)」を分離することが可能となる。さらに、未知物体(OOD)や誤分類(IDM)領域をより高精度に分離するため、データ密度のモデリングを行うエネルギーベースモデルと組み合わせられている。

今回開発されたFlowEneDetを、通常のセマンティックセグメンテーションモデルの後段に追加することで、時間のかかるセグメンテーションモデル側の再トレーニングを行うことなく、認識結果の不確実性を推定できるセグメンテーションモデルへと拡張することができる。FlowEneDet自体は、エネルギーベースモデルにおける低次元の自由エネルギーを処理するモデルであるため、複雑さの低いアーキテクチャであり、学習・評価コストを大きく増やすことなく、未知物体と誤分類の同時検出を実現している。(図2)

事前トレーニング済みのセマンティックセグメンテーションモデルの後段に今回開発されたFlowEneDetを追加し、複数のベンチマークデータセット※2に対して未知物体や誤分類の認識性能評価が行われた結果、従来法を上回る認識結果※3が確認された。(図3)

図2 FlowEneDetを追加したセマンティックセグメンテーションモデル
図3 評価結果の一例(正解・従来法・本手法において、赤色は未知物体または誤分類、青色は既知物体、その他の色は未知か既知か判定できていない領域を表している)

今後の展望

今回開発されたFlowEneDetは、実環境でしばしばAIモデルが遭遇する、学習したことのない未知物体に対する誤認識を防ぐことで、モデルの性能と信頼性を高める技術である。AIの信頼性が求められる車載やくらし、B2Bなどの様々なユースケースでの活用が期待されている。

※1 セマンティックセグメンテーション:
画素単位で物体の領域を認識し、各画素に何の物体が写っているのかを関連付ける画像認識タスク。セマンティックセグメンテーションのための代表的なAIモデルとしてDeepLabV3+やSegFormerが挙げられる(本手法の性能評価に利用)
※2 Cityscapes、Cityscapes-C、FishyScapes、SegmentMeIfYouCanのベンチマークデータセットにおいて。
※3 MCD(Monte Carlo Dropout)、SML(Standardized Max Logits)といった従来法と比較し、真陽性率95%のときの誤検出率(FPR95)を20~50%低減。

キーワードで検索する

著者プロフィール

Motor Fan illustrated編集部 近影

Motor Fan illustrated編集部