최신 이상치 검출 알고리즘과 물류 시스템에서의 적용 가능성

작성자 : 백승렬 울산과학기술원 인공지능대학원 교수 2023.04.18 게시

서론

생성 딥러닝 기법을 기반으로 한 이상치 검출 (anomaly detection)이 최근 활발히 연구되어져 왔다. 본 고에서는 최신 이상치 검출 알고리즘에 대한 리뷰와 최신 연구 이슈를 살펴보고 또한 이를 물류 시스템에 적용하여 2020년 6월 Applied Sciences 저널 실린 사례를 통해 실제적인 응용 가능성을 고찰해 보고자 한다.

이상치 검출 (anomaly detection) 문제

이상치(outlier) 검출 문제는 데이터에서 일반적인 패턴을 벗어나는 것을 찾는 문제이다. 이상치는 일반적으로 다른 데이터와는 크게 다른 값을 갖기 때문에, 이러한 값을 찾는 것은 데이터 분석에서 중요한 문제 중 하나이다. 예를 들어, 특정 상품의 판매량 데이터를 분석할 때, 특정 날짜에 대량으로 판매되었던 경우가 있다면 이는 이상치일 수 있다. 이러한 이상치는 데이터 분석 결과에 큰 영향을 미칠 수 있으므로, 데이터 분석에서 중요한 문제 중 하나이다. 이는 데이터 마이닝, 통계 분석, 기계 학습 등 다양한 분야에서 사용되며, 일반적으로 데이터 분포를 이해하고 이를 통해 이상치를 검출한다. 이상치 검출 문제는 제조업 분야 응용에서는 각종 부품에서의 불량품 검출 문제에 사용될 수 있고 (그림1), 의학 응용분야에서는 X-ray 및 내시경 사진에서 종양인 부분을 검출 (그림 2) 하는 데에도 사용이 될 수 있다.

그림1. 제조분야 이상치 검출 데이터 예시 (MvTec AD 데이터)

MVTec AD -- A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection, CVPR’19

그림2. 의료 이상치 검출 데이터 예시

Constrained Contrastive Distribution Learning for Unsupervised Anomaly Detection and Localisation in Medical Images MICCAI’21

제조 분야에서의 이상치 분석 문제.

그림 1에서 예시한 MVTec AD 데이터 셋은 제조 분야에서의 이상치 분석 문제에 대한 데이터셋을 제공한다. 병, 알약, 케이블 등 총 15개 종류의 물체에 대해 이상치 분석을 수행할 수 있는 데이터셋이며 총 3,629장의 영상을 학습을 위해 제공하고 총 1,725장의 영상을 테스트를 수행하기 위해 제공한다. 본 데이터셋을 활용하여 생성 딥러닝 모델을 활용한 이상치 분석 알고리즘들이 최근 제안되어 왔다.

생성 적대 네트워크 (generative adversarial network) 기반의 이상치 검출 알고리즘. 생성 적대 네트워크에는 임의의 노이즈 벡터 z로부터 학습 데이터셋에 존재하는 영상 x를 생성하도록 훈련하는 생성자 네트워크 (generator network) G와 원래 학습 데이터셋과 생성 네트워크가 생성해낸 데이터를 구분하는 분별자 네트워크 (discriminator network) D로 구성이 된다. 화폐 위조자의 예시를 들어보면 분별자 네트워크는 위조화폐인지 진짜 화폐인지를 구분하도록 하는 경찰의 역할을 하도록 훈련이 되며, 생성자 네트워크는 진짜에 가까운 화폐를 위조하기 위해 노력하도록 (즉, 경찰을 속이도록) 학습을 하게된다. 이를 반복하면, 생성자 네트워크가 생성해내는 데이터가 실제 학습데이터의 분포와 일치하게 된다는 것이 수학적으로 증명되어 있다. 즉, 생성자가 생성하는 데이터의 분포인 일 때 그림 3의 목적함수가 최소가 된다.

이러한 생성 적대 네트워크의 특성을 활용하여 이상치 분석을 수행할 수 있다. 생성 적대 네트워크를 정상인 데이터만을 활용하여 학습한 뒤, 실제 시험 시에는 불량품 데이터를 생성 적대 네트워크의 입력으로 주게 되면, 생성 적대 네트워크는 정상 데이터의 분포만을 배웠고 정상 데이터만을 생성하도록 학습이 되었기 때문에, 불량품 데이터 입력과 가장 유사한 정상 데이터를 생성하도록 동작된다. 이 때, 생성된 정상 데이터와 입력인 불량품 데이터 사이의 픽셀(pixel) 값의 차분을 계산하여 시각화하면 그림 4과 같이 불량인 부분만을 자동적으로 발견해내도록 동작하게 만들 수 있다. 정상 데이터만을 활용하여 학습한 생성 적대 네트워크를 활용하여 불량품 입력에 대해 불량인 부분을 검출하는 이상치 분석 네트워크가 얻어진 것이다.

생성 적대 네트워크를 통한 이상치 분석은 방금 말한 바처럼 정상인 데이터만을 활용하여 학습이 이루어지기 때문에 학습이 용이한 장점을 가진다. 세상에 존재하는 불량품은 불량 유형이 다양하기 때문에 우리가 일일이 불량인 부분을 모사(simulation)하여 만들어낼 수 없다. 반면에, 제조 공정이 정밀할수록 불량률이 낮고 실제 불량 데이터의 빈도가 낮기 때문에 데이터를 얻어내기가 불리하다. 즉, 이상치 분석을 위한 불량 데이터를 얻기가 힘들다. 따라서 90% 이상의 정상 데이터와 10% 미만의 불량 데이터만으로 이상치 분석 네트워크를 학습해내야 하는데, 이 경우 일반적인 이진 분류 (binary classification) 기법을 적용하게 되면 대부분의 기법들이 실패한다. 이유는 이러한 데이터 불균형 상황에서는 학습시에 무조건 정상데이터라고 말하면 되도록 학습이 되는 오버피팅 (overfitting) 현상이 일어나기 때문이다. 생성 적대 네트워크는 이러한 오버피팅 현상 없이 효과적으로 불량품 데이터를 분류해 낼 수 있다는 장점이 있다.

최근 성능 향상 기법. 생성 적대 네트워크를 활용한 이상치 분석 기법의 출현 이후, 이 성능을 향상시키고자 하는 후속연구는 네트워크에 랜덤성(randomness)을 주어 성능을 증가시키고자 한다. 그림 5에서처럼 여러가지 랜덤 형태로 원본 영상을 지우고, 이를 원본 영상으로 복원하도록 학습을 수행한다. 불량품인 부분은 보다 여러 번 원본과 차이가 나도록 결과 영상이 생성될 것이고, 정상인 부분은 여러 번 생성이 되더라도 원본 영상과 유사하게 생성될 것이다. 이를 이용하여 이러한 여러 번 랜덤하게 생성된 출력 영상을 합쳐 최종 불량품인 부분을 추정하는 방식의 성능 향상 기법이 제안되었다.

그림3. GAN 목적함수

https://ratsgo.github.io/generative%20model/2017/12/20/gan/

그림4. 생성된 데이터와 불량품 영상 입력의 차분으로 탐지된 이상치 영역 예시

Unsupervised anomaly detection with generative adversarial networks to guide marker discovery, IPMI'17

그림5. 성능 증대를 위한 랜덤성 추가 예시.

Reconstruction by inpainting for visual anomaly detection, Pattern Recognition'20

물류 시스템에서의 이상치 검출

본 단락에서는 물류 시스템에서의 이상치 검출 문제를 다룬 Anomaly Detection in a Logistic  Operating  System  Using the  Mahalanobis–Taguchi  Method, Applied Sciences 2020 논문을 리뷰하고자 한다. (이후 Applied Sciences 2020 논문으로 표기)

그림 6은 Applied Sciences 2020 논문에서 제안하는 자동 스토리지 시스템의 구성 요소를 보여준다. 이 시스템의 기능은 배송 예정인 제품을 저장하는 것이다. 그림에 표시된 셔틀 차량을 사용해 보관을 자동으로 관리한다. 제품을 창고에 넣거나 꺼내기 위해서는 수평이동을 위한 컨베이어와 수직이동을 위한 리프터가 사용된다. 컨베이어는 하나 이상의 부품이 고장나면 즉시 교체할 수 있으나 리프터의 수리/교체는 그리 쉽지 않다. 리프터는 제품을 수직으로 운반하고 다양한 저장 층에 분배하는 데 필수적이고 매일 24시간 작동하며, 급격한 가감속을 자주하고 제품을 싣고 내리는 동안 충격이 반복되므로 다른 시스템 구성 요소보다 더 빨리 열화될 것으로 예상된다.

그림6. 자동스토리지 시스템의 구성요소

Anomaly Detection in a Logistic Operating System Using the Mahalanobis？Taguchi Method, Applied Sciences 2020

반면, 리프터에 문제가 발생하면 다음과 같은 이유로 제품이 각 보관 층의 선반으로 이동하는 데 상대적으로 큰 영향을 미칠 수 있다. 첫째, 리프터의 기계적인 요소들이 서로 밀접하게 연결되어 결합되어 있기 때문에 고장이 났을 때 교체하는 데 시간이 걸리는 경우가 많다. 둘째, 리프터의 수리는 높은 칸막이벽으로 둘러싸인 상당히 좁은 공간에 위치하여 소수의 인원이 수리해야 하기 때문에 수평 벨트 컨베이어에 비해 많은 시간이 소요된다. 결과적으로 시스템의 이 부분에 대한 효과적인 이상 감지가 특히 중요하다. 리프터의 잠재적인 고장을 사전에 예측할 수 있다면 장비 정지로 인한 경제적 손실을 최소화할 수 있다. 따라서 Applied Sciences 2020 논문에서는 리프터 고장을 사전에 감지할 수 있는 예측 기법을 개발하였다. 기본 원리는 그림 6과 같이 리프터가 위아래로 움직이면 제품이 놓인 캐리지가 함께 위아래로 움직이는데, 이때. 리프터를 지지하는 강철 기둥 및 기타 개별 부품을 포함하여 전체 바디에 진동이 전파된다. 제안하는 방법은 전달된 진동을 가속도계로 감지하여 진동 특성의 변화를 효과적으로 포착한다.

제안된 방법에서는 진동 데이터 단위 공간 내에 생성한다. 그런 다음 이 단위 공간은 정상 진동과 이상 진동 사이의 특성 차이를 평가하는 기준으로 사용된다. 리프터의 물리적 특성은 작동 시간이 지남에 따라 점차 저하되며 진동 특성은 점진적으로 변경된다. 이는 다차원 마할라노비스 거리 (Mahalanobis distance)로 표현되며, 동작이 정상적으로 진행되고 있는지 비정상적으로 진행되는지 판단하는 기준으로 사용된다. 그림 7a,b와 같이 캐리지의 움직임을 반영한 진동 파형을 획득할수 있다. Applied Sciences 2020 논문에서는 단순화를 위해 다양한 부품 각각에 대한 손상의 마할라노비스 거리 값에 대한 영향을 분석하기 위해 대상 리프터 이동을 리프터의 하단에서 상단으로의 단방향 이동이라는 단일 조건으로 제한했으며 상승/하강 여부에 따라 리프터의 움직임이 진동 특성에 미치는 영향이 미미하게 차이가 나는 것을 실제 측정을 통해 알 수 있었다. 상승 시 파형의 샘플을 추출하여 고속 퓨리에 변환 (Fast Fourier Transform)를 사용하여 주파수 응답을 얻었고 그림 7c,d에서와 같이 주파수 특성의 변환 결과에는 여러 피크가 있다. 이는 리프터 각 부분의 구조적 공진에 의해 발생하고 공진 주파수 주변의 주파수 대역의 진동 성분은 구조물의 노화에 의해 크게 영향을 받는 것으로 제시된다. 따라서 Applied Sciences 2020 논문에서는 정상 동작 시 발생하는 현저한 피크 주파수를 스펙트럼에서 읽어 이 피크 주파수의 상하 1/12 옥타브 대역 범위에서 신호의 에너지 준위를 계산한다. 이러한 에너지 레벨은 각각의 상승에 의해 생성된 각 샘플 파형에 대해 순차적으로 계산된다. 이러한 에너지 수준에 대한 계산 결과는 그림 7c에서 x로 표시된다. 예를 들어, k번째 동작에서 x_k1에서 x_km까지 m 밴드의 에너지 레벨이 계산된다. 그림 7c와 같이 1단계부터 k단계까지의 모든 에너지 준위에서 출력되는 데이터를 이용하여 정상상태의 단위공간을 생성한다. 여기서 마할라노비스 거리 값은 일반 데이터 그룹 x가 생성하는 단위 공간의 평균값과 그룹 y의 판단 데이터 사이의 물리적 거리를 의미한다. 따라서 마할라노비스 거리가 클수록 판단 데이터 y의 주파수 특성은 일반 데이터 그룹 x와 더 다름을 의미하고 이는 마할라노비스 값이 기계 시스템의 이상 지표로 사용될 수 있음을 의미한다.

그림7. 진동 데이터에서 마할로노비스 거리를 활용한 이상치 검출기 모식도 예시

Anomaly Detection in a Logistic Operating System Using the Mahalanobis？Taguchi Method, Applied Sciences 2020

무부하 리프터의 세 가지 조건에서 가속도 파형은 그림 8에 나와 있다: 정상 상태에서 작동(그림 8(a1)), 손상된 벨트로 작동(그림 8(a2)), 손상된 가이드 휠로 작동 (그림 8(a3)). 이 모든 결과는 수신기 R1에 의해 측정되었다. Applied Sciences 2020 논문에서는 리프터 캐리지가 지상 0.3~2.8m 범위에서 지속적으로 위아래로 움직였고 마차의 각 왕복에는 8.6초가 걸렸다. 따라서 마차는 시간 당 418회 또는 하루에 10,046회 운행했다. 그림 9에서 볼 수 있듯이 작동의 상승 및 하강 단계 동안의 진동 파형은 약간 다르다. 또한 Applied Sciences 2020 논문에서는 상승 위상에 대한 진동 파형만을 사용하였다. 그림 8(a1)~(a3)의 파형을 보면 손상 유형에 따라 상당히 다른 것을 알 수 있고 시간 파형에서 얻은 스펙트로그램은 각각 그림 8(b1)~(b3)에 나와 있다. 마차가 올라가면 먼저 움직이기 시작한 다음 가속하여 최대 속도에 도달한 다음 감속하고 마침내 정상에서 멈춘다. 이 스펙트로그램에서 알 수 있듯이 진동의 주 주파수 성분의 고유 주파수는 작동 시작 시 상승하기 시작하고 감속이 시작되면 떨어지기 시작한다. 각 조건의 스펙트로그램은 약간씩 다른 특징을 가지고 있지만, 각 유형의 손상이 시간-주파수 응답에 미치는 영향을 결정하기는 어렵다. 위의 결과는 벨트 손상, 가이드 휠 손상 및 베어링 손상의 세 가지 조건에서 각각의 진동 특성에서 장비의 기계적 상태와 정상 상태의 차이를 감지할 수 있음을 시사한다.

그림8. 가속도 파형 예시.

Anomaly Detection in a Logistic Operating System Using the Mahalanobis？Taguchi Method, Applied Sciences 2020

그림9. 상승(Rise) 하강(Fall) 파형 예시.

Anomaly Detection in a Logistic Operating System Using the Mahalanobis？Taguchi Method, Applied Sciences 2020

결론

최신 이상치 검출 기법들과 물류 시스템에서의 이상치 검출 기법들을 살펴보았다. 물류 시스템에서의 이상치 검출 기법 실험에서는 정상 데이터와 이상 데이터 사이 중간 전이 데이터를 포함하지 않는 경우 전이 데이터는 각 주파수 대역의 에너지 레벨이 선형으로 감소한다고 단순히 가정하여 실험되었다. 리프터가 약 2년 동안 계속 작동되고 리프터의 가이드 휠의 기계적 상태가 정상 상태에서 비정상 상태로 점진적으로 변화하는 상황에서 프로세스 초기에 이상 상태로의 이행을 감지할 수 있음을 확인했다. 향후 연구에서는 리프터가 수년 이상 지속적으로 작동되는 상황에서 목표 리프터의 기계적 상태 변화를 정확하게 감지할 수 있다면 제안된 방법의 유효성이 검증될 수 있을 것이다.

핵심단어
자료출처
첨부파일

집필진