近年、建設現場や工場における作業や状況の見える化など、様々な用途において画像認識技術の活用が広がっている。しかし、画像認識を新たな建設現場や工場に展開するためには、工具・材料・重機など新たな検知対象を継続的に登録することが必要となる。このような場合、従来は新たな検知対象だけでなく、既存の検知対象についてもAIに対象物の位置とそれが何であるかの情報を教える必要があるため、学習データの作成が利用者の大きな負担となっていた。
本技術は、AIの学習に曖昧な情報を活用できる「弱ラベル学習」という技術を発展させることで、AIを活用した画像認識に対象物を追加登録するときに問題となる学習データ作成の手間を削減するものである。弱ラベル学習は「学習が不安定になり精度が低下する」という問題があったが、今回NECと理研は弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすアルゴリズムを世界で初めて開発した2)。なお本技術を活用すると、80種類の検知対象物を含む画像認識において、学習データ作成時間を75%削減できることが確認された3)。
一般的に、AIを活用した画像認識において対象物を追加登録する場合、新たな検知対象のみをラベル付けしたデータでモデルの学習ができれば、作業に必要となる時間を大幅に削減することが可能。
このようにAIを活用した画像認識の学習データにおいて、一部のみがラベル付けされ、それ以外の領域は何であるかが曖昧な「弱ラベル」が付与されたデータである、とみなして学習する手法として「弱ラベル学習」がある。例えば、トラックやバスなどの車両を認識するAIに新たに「バイク」を学習させる場合、トラックやバスや背景に対してラベル付けしないことは、それらが「バイクではない」という弱ラベルを付与したことに相当する。弱ラベル学習の手法により、このように「バイク」のみをラベル付けしたデータからでも学習可能となり、データ作成の作業工数を大幅に削減できる。
完全なラベルが付与されたデータを用いてモデルを学習する場合には、出力値が正解データに近づくようにモデルを最適化する。これに対して、弱ラベル学習では、弱ラベルに基づいてモデルの予測の正しさを逐次推定しながらモデルを最適化するが、ラベルの曖昧性に起因して学習が不安定になり、高精度なモデルを学習できないという問題があった。
本技術では、学習時の不安定性を解消するための補正を加えながら学習することで、この問題を解決した。一般に、学習時に補正を加えると、学習が安定する代わりに、本来の目的である「対象物を正しく推定するモデルを学習」できる保証がなくなってしまう。今回NECと理研は、弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすアルゴリズムを世界で初めて開発した。
これにより、弱ラベルが付与されたデータからでも高精度なモデルを学習させることができる。
なお本技術は、機械学習・人工知能の分野で著名な国際会議ICML (International Conference on Machine Learning) 2021に採択され、発表している。
1) 本技術は、理研とNECの共同研究機関として設立した「理研AIP-NEC連携センター」で開発された技術である。
2) NEC調べ
3) 物体検知の公開データセットMS COCOをベースとして、新たな検知対象をモデルに加えることを想定して試算。具体的には、MS COCOの全80クラスのうち1クラスを新たな対象物とみなして、学習データ作成時に正解付けが必要な矩形数の削減率を計算(80通りの平均値)