目次
AI開発の背景
現在、世界的にAIの産業応用が本格化している。中でも、自動運転時のシーン認識やロボットが物体を把持する際など、画像認識AIを社会実装するにあたっては、画像中の物体を認識する画像識別だけではなく、物体の位置情報を含む画像中の詳細内容を把握できる画像領域分割※1がコア技術になるとして注目されている。一方で画像領域分割は、大量の実画像に人間が手作業で教師ラベル※2を付与することで画像データセットを構成し、AIが学習することで視覚能力を獲得するが、人間による教師ラベル付けには1画像あたり数十分の時間を要するとも言われており、できるかぎり少ない画像で産業現場に適応可能な技術が求められている。
こうした課題を解決するため、NEDO(新エネルギー・産業技術総合開発機構)の本事業※3において、産業技術総合研究所(産総研)は、数理モデル※4から画像や教師ラベルを生成することで、AIが基礎的な視覚特徴を自動で獲得する学習済みモデル※5の構築に取り組んでいる。学習済みモデルにより、その後の産業応用で個別に必要な学習の精度を底上げし、これまでよりも容易なAI開発が目指されている。
今回の成果
■画像認識AIモデルの構築
本事業では、数理モデルで生成した学習用の画像に、画像を識別した教師ラベルまで自動で生成するタスクまで成功※6しているという。今回、より産業応用に特化したタスクとして、画素ごとの位置情報を生成できる画像領域分割のタスクを同時に学習できるようになり、膨大な人的コストを抑えるとともに、実画像データを使用することなく、画像領域分割の事前学習モデルを構築することができる。画像領域分割技術を実現したことで、産業応用先のタスクに応じて画像や教師ラベルを柔軟に変化させることができる。
今後の予定
本成果のように、位置情報など高度かつ膨大な時間を要する領域分割を含む教師ラベル付けは、AI分野の至るところで開発のボトルネックになっている。数理モデルによる学習用の実データと教師ラベルの生成においては、あらゆる産業応用に耐えうるモダリティ(画像・動画・3Dなどデータ種別)やタスク(物体検出・領域分割・超解像など)の設定が根幹技術となる。将来的には、これらに対応するAIの「汎用学習済みモデル」が開発されていく予定とされている。なお、本技術の詳細は2023年10月2日から6日までフランス・パリで開催される国際会議ICCVで産総研により発表される。
【注釈】
※1 画像領域分割 画像領域分割(Semantic Segmentation)は、画像内の画素ごとに物体ラベルを割り当てる処理。各物体がどの程度の大きさや位置関係で画像に映っているかを明確に示す。
※2 教師ラベル 画像に対して付与したタグ情報。深層学習のモデルを訓練できる形式にする。例として、画像に対して動物や人工物の種類を与えるなどが挙げられる。
※3 本事業
- 事業名:人と共に進化する次世代人工知能に関する技術開発事業
- 事業期間:2020年度~2024年度
- 事業概要:人と共に進化する次世代人工知能に関する技術開発事業
※4 数理モデル 輪郭などの数式ベースの幾何学的構造。
※5 学習済みモデル 数万枚以上など大規模な教師ラベル付の画像データセットを用いて学習した画像理解タスクをすでに知っているモデルのこと。他の画像理解タスクへの応用を容易にできる。
※6 数理モデルで生成した学習用の画像に、画像を識別した教師ラベルまで自動で生成するタスクまで成功
- (参考)NEDO・産総研リリース2022年6月13日「大量の実画像データの収集が不要なAIを開発」
- (NEDO)大量の実画像データの収集が不要なAIを開発
- (産総研)大量の実画像データの収集が不要なAIを開発
※7 国際会議ICCVで発表
- 掲載誌:IEEE/CVF International Conference on Computer Vision(ICCV 2023)
- 論文タイトル:SegRCDB: Semantic Segmentation via Formula-Driven Supervised Learning
- 著者:Risa Shinoda, Ryo Hayamizu, Kodai Nakashima, Nakamasa Inoue, Rio Yokota, Hirokatsu Kataoka