AIによる異常検知
AIによる異常検知サービスの詳細や事例をご紹介します。これまでヒトの目で行ってきた製品やインフラ設備の異常検知をAIに代替することで、作業効率化や判断精度向上につながります。今回は、画像認識AIによる異常検知を「画像分類」と「セマンティックセグメンテーション」へタスク分解することで実現する方法をご紹介します。TDSEは豊富な実績と高度なデータ分析/AI技術力によって、複雑な課題を解決します。
複雑な課題はより単純な課題に分解して解決する
ビジネス課題は概して一見複雑です。そのような課題に対して正面きって解決しようとするとなかなかに難しいです。しかし、その課題はいくつかのより単純な課題が組み合わさって複雑にしていることがあります。そこで、複雑な課題をより単純な課題に分解して、単純化された課題それぞれに対して最適な対処をすることで、複雑な課題を解決する可能性を高めることができます。
背景ノイズを含む外観検査を「セマンティックセグメンテーション」と「画像分類」で解決
AI/機械学習による「異常検知」は様々な業務で利用されています。例えば、製造業では、生産現場の製品から不良を発見したり、生産設備の故障を予見したりする利用があります。また、医療の現場では、CTやMRIを使った画像診断で疾患を発見する際や、バイタルデータを使って体調変化を予測するといった利用がされています。ここでは、特に製造もしくはインフラ業界で行われている外観検査へのAI/機械学習の利用について詳しく紹介いたします。
製品の品質管理やインフラ設備の保全では、外観検査による異常検知作業がヒトの目視によって行われています。しかし、その作業は高い集中力と多くの時間を必要しますし、熟練作業者とそうでない作業者とでは検査の品質に差が出てしまうこともあります。このような外観検査の工程に画像認識AIを導入すれば、作業の自動化や効率化、そして安定的な検査品質を維持することが可能となります。
外観検査による異常検知といってもシーンは様々であり、対象物の構造はさることながら、対象物のある周辺環境も様々です。すなわち、対象物を画像で撮影したとしても、必ずしも対象物のみが写っているわけではなく、例えばインフラ設備の異常検知の場合は、周辺設備や背景(建物や自然)も映り込んでいます。そのような背景は、画像認識AIによる異常検知ではノイズになってしまい、検知精度に大きく影響します。
そこで、撮影した画像から対象物なる部分画像を抽出してから、その部分画像に対して異常検知を行うアプローチをとることで、撮影した画像に対してそのまま異常検知する際の難しさを解消します。
画像認識AIとしてのタスクは「画像全体から対象物を抽出するタスク」と「対象物が異常であるか否かを判定するタスク」となり、それぞれに対して最良のアウトプット(精度)をすることで、トータルとして外見検査のパフォーマンスを最大化します。また、このようにタスクを分けることで、問題点が簡素化され、対応への見通しがよくなり、より適切な方法の選択と実施が期待できます。
ディープラーニング による「画像分類」と「セマンティックセグメンテーション」
対象物が異常であるか否かを判断するタスクでは、ディープラーニングを用いた「画像分類」を行います。
画像分類とは、「画像に対してクラス分け(クラス分類)」することです。例えば、異常箇所が写っている画像は「異常」クラスとして、異常が写っていない画像を「正常」クラスとして画像を分類することです。画像分類タスクは、畳み込みニューラルネットワーク (CNN) というニューラルネットワークが良く利用されます。
CNNとは、畳み込み層とプーリング層を積み重ねたニューラルネットワークです。畳み込み層やプーリング層よって特徴量マップを作成し、全結合層によって最終的な分類を行っています。畳み込み層では、分類したい画像の局所的な特徴量を抽出し、プーリング層では、画像内の微小な位置変化に対処しています。
これまでCNNをベースとする様々なネットワークが考案されてきましたが、最近では自然言語処理の分野で大きな成果を出しているTransformerベースの画像分類ネットワークが発表され、さらにはそのTransformerとCNNを組み合わせたネットワークも発表されています。
画像全体から対象物を抽出するタスクでは ディープラーニングを用いた「セマンティックセグメンテーション (領域分類)」を行っています。セマンティックセグメンテーションとは、画像上の全ピクセル(画素)をクラス分類することです。例えば、対象物の写っている全ピクセルを同クラスとして領域分類します。セマンティックセグメンテーションの基本的なネットワークは、Fully Convolutional Network (FCN)です。このネットワークは、CNNの全結合層を畳み込み層に置き換えたものです。そうすることで「対象物がなにであるか」から「対象物がどこにあるか」というタスクになります。
このタスクのネットワークも様々考案されており、高解像度特徴量マップをエンコーダからデコーダに接続する U-Netや Dilated convolution(大域的な情報が得るのに有効な畳み込み)を取り入れた DeepLabなど、こちらのタスクも日進月歩で技術が進歩しています。
複雑なビジネス課題を適切に紐解き解決
TDSEでは、一見複雑にみえるビジネス課題を適切なタスクに分解・整理することで紐解き、それぞれタスク毎に最適なアプローチを選択することで、より確実な課題解決に導きます。