製造現場で使える軽量デバイスでも動作する異常音検知システム
木村 優志
Published: 5/31/2025, 2:10:00 AM

異常音検知の概要
異常音検知(Anomalous Sound Detection) は、製造機械や製造したモーターなどの部品の音が異常でないかを調べるための技術です。製造機械の故障をいち早く検知することで、早めにメンテナンスをおこない、生産ラインの停止を抑止します。または、単純に製造したモーターなど音の出る機械の動作を検証するために用いられます。
正常な音のみからの異常音検知
機械が故障しているような状態は、正常に動作している状態に比べ、希少です。そのため、機械の異常な音を収集するのは一般に困難です。このため、通常の機械学習のように、異常な音と正常な音を分類するような学習を行うことはできません。
そこで、正常な音のみを用いて学習し、異常な音を判別する技術が多数提案されています。
異常音検知の技術
異常音検知にはディープラーニングが用いられることが多くなってきています。代表的な技術がオートエンコーダー(自動符号化器)とSVMなどの分類機を組み合わせた手法です。
オートエンコーダーは左から音声を入力し、徐々に圧縮・符号化し、もとの音声に戻す構造のニューラルネットワークです。このオートエンコーダーで正常なときの音を符号化し、正常な音に復号する学習をします。このオートエンコーダーは正常な音のみを学習しているため、異常な音をうまく復号できません。
これを利用して入力した音と復号された音を比べて、両者のさが大きいときに異常だと判断することができます。
軽量異常音検知技術
今回は、2024年に発表された、以下の軽量異常音検知技術であるUSADを紹介します。こちらは、pytorch-movile などで実装し直せば、スマートフォンのようなデバイスでも動作するでしょう。
M. Neri and M. Carli, “Low-Complexity Attention-Based Unsupervised Anomalous Sound Detection Exploiting Separable Convolutions and Angular Loss,” in IEEE Sensors Letters, vol. 8, no. 11, pp. 1-4, Nov. 2024, Art no. 6014404, doi: 10.1109/LSENS.2024.3480450. https://github.com/michaelneri/unsupervised-audio-anomaly-detection
USAD は、入力された音声波形から周波数特徴であるメルスペクトログラムと、時間特徴であるWavegramの両方の特徴を用います。通常は、メルスペクトログラムのみを利用することが多いです。 Wavegram は、2020年にPANNsの論文で発表された技術で、音響信号の分類に高い精度を持つことが示されています。
Qiuqiang Kong, Yin Cao, Turab Iqbal, Yuxuan Wang, Wenwu Wang, and Mark D. Plumbley. “Panns: Large-scale pretrained audio neural networks for audio pattern recognition.” IEEE/ACM Transactions on Audio, Speech, and Language Processing 28 (2020): 2880-2894.
これらの特徴に対して注意機構でAttentionをかけたあと、Mobile FaceNet, ArcFace で分類します。異常音検知というとしきい値を用いる手法も多いのですが、この手法では、ArcFaceを用いて分類する方法を撮っています。
精度評価
上の表は、精度評価を表しています。数値が高いほど良い評価です。 USAD(表中の Proposed approach)は、他の手法と比べて比較的高い精度を示しています。特に、Valve や ToyCar での精度が高いです。
パラメータ数
上の表は、各手法のパラメータ数を示しています。パラメータ数は少ないほど計算量が少なく軽量です。USAD(Proposed aproach)は他の手法と比べても2番目にパラメータ数が少なく、精度も高いことがわかります。
まとめ
今回は、異常音検知の技術について紹介し、特に、軽量異常音検知手法である、USAD について紹介しました。 実際に、弊社内でもコードを動かし、動作を確認しています。