지능 로봇을 활용한 물류 시스템에서 시각처리 기술 기반 정확한 창고 물품 인식 기술

작성자 : 백승렬 울산과학기술원 인공지능대학원 교수 2022.11.01 게시

서론

디지털 물류 분야에서 로봇의 적용을 탐구하고 창고 (warehouse) 분야에서 효율적인 운영, 에너지 절약을 달성하기 위해 시각처리 기술을 활용한 물품 분류 연구를 수행한 논문이 MDPI sustainablity 지 ("Deep-Learning-Based Accurate Identification of Warehouse Goods for Robot Picking Operations") 에 2022년 6월 출판되었다. 본 고에서는 해당 기술의 수준을 필자의 시각을 빌려 짚어보고자 한다.

소비자의 요구는 점차 다양화되어 가고 또한 개인화되는 방향으로 발전하고 있어 주문의 정확성과 신속성은 고객 만족도를 높이는 중요한 요소가 되고 있다. 물류 보관 시스템의 운영을 보다 효율적이고 유연하게 만들고 물류 환경에서 물품을 잡고 옮기는 과정의 효율성을 향상시키기 위해 많은 기업에서 지능형 피킹 로봇 (intelligent picking robot)을 도입하기 시작했다. 창고 및 물류 분야에서 '인간을 대체하는 로봇' 붐이 일고 있으며 이러한 추세는 가속화될 전망이다.

징동 (Jingdong) 아시아 창고는 중국에서 선도적인 위치에 있다. 일반 상품의 보관 구역에서 상품이 위치한 보관 상자는 선별 장비를 통해 자동 컨베이어 벨트로 신속하게 운송된다. 선반에서 물품을 잡는 테이블까지의 과정은 완전 자동이지만 물품을 잡는 테이블에서 규칙적인 모양의 상품을 잡는 공기 흡입 로봇 팔은 아직 많은 수가 확보되지 못했다. 이러한 물품을 집는 작업은 그 복잡성과 부족한 인프라로 인해 아직 많은 수작업을 필요로 한다. 로봇 팔로 상품을 완전히 잡을 수 있고 포장 자동화가 구현된다면 그제서야 비로소 자동화 창고가 실현될 수 있을 것으로 예상된다.

창고에서 로봇이 물건을 집는 과정에서 효율적이고 정확하게 화물을 식별하는 것은 지능형 로봇 작동이 정확하게 동작하기 위한 전제조건이다. 특히나 복잡한 물류 환경에서 화물을 올바르게 식별하는 것은 쉽지 않은 기술이다. 해당 논문에서는 딥러닝 기술 중 영상 분류를 수행하는 콘볼루션 뉴럴 네트워크 (CNN: convolutional neural network)을 활용하여 임의의 형상을 하고 있는 물체에 대한 인식 모델을 구축한다. 인식 모델은 실시간으로 상품의 식별과 분류를 수행하고, 모양, 크기, 표면 재질, 무게와 같은 검색 기반의 다양한 특성과 결합하여 다양한 유형의 상품에 대해서 물품을 잡는 그랩(grab) 솔루션을 제공한다.

로봇 팔의 종류와 작동 방식

물류 및 창고 분야에서 시각 인식 기술을 적용하면 신속하고 정확하게 상품을 식별하고 분류할 수 있으며 물류 분야의 효율성을 향상시킬 수 있다. 구동 구조와 전원에 따라 로봇 팔은 주로 유압 구동, 공압 구동, 전기 구동 및 기계 구동으로 구분된다. 유압식과 전기식은 구조적인 특징이 복잡한 반면, 공압은 구조가 간단한 편이고, 기계식은 구조가 중간 정도의 복잡성을 가진다. 설치와 제어 면에서는 유압식과 공압식이 유연성을 많이 가지는 반면 전기식이 그 다음이고, 기계식이 가장 유연성이 떨어진다. 잡는 강도는 유압식이 가장 높으며, 공압, 전기, 기계식이 비슷하게 약한 강도를 가진다. 정확도 측면에서는 기계식과 전기식이 높은 정확도를 제공하고 유압식과 공압식은 적정한 정확도를 제공한다. 반응 빠르기는 공압식이 느린 편이고, 유압, 전기 및 기계식은 빠른 속도를 제공한다. 신뢰성은 유압식이 가장 높은 반면, 전기식이 중간 정도의 신뢰성을 가지며 공압과 기계식은 신뢰성이 낮다. 가격 면에서는 유압식이 가장 비싸고, 공압, 전기 및 기계식은 저렴한 편이다.

로봇팔의 작동 방식은 네가지로 요약할 수 있는데, 후크 브래킷 방식 (Hook bracket), 스프링 로드 (Spring loaded) 방식, 잡는 (Grab-type) 방식, 공기 흡입 (Air suction) 방식이다.
1) 후크 브래킷 방식은 로봇이 물품을 잡기 위해 잡기, 걸기 등의 동작을 활용하는 방식이다. 구조가 간단한 편이고, 구동 요구사항이 낮으며 수평 또는 수직으로 이송 작업을 수행할 수 있다. 대형 기계 및 장비의 구동에 적합한 방식이다.
2) 스크링 로드 방식은 잡는 동작이 주로 제품을 조이는 스프링의 힘에 달려 있는 방식으로 주로 작고 가벼운 물품을 잡는데 활용된다.
3) 잡는 방식은 기계 손가락으로 물품을 잡는 방식이며, 대상 제품에 따라 기계식 손가락의 모양과 수를 다르게 설계해야 하는 방식이다. 산업용 로봇에서 가장 일반적으로 활용되는 방식이다.
4) 공기 흡입 방식은 가스를 압축하여 압력차이를 통해 흡착을 생성하는 방식이다. 구조가 간단한 편이고 구입하기 쉬우며 조작하기 쉽고 상품 위치 지정에 대한 요구사항이 낮아 상품 배치에 유연성이 있다. 적용 범위가 넓으며 특히 제품의 한쪽 면만 접촉할 수 있는 경우에 공기 흡입 방식이 가장 쉽게 활용될 수 있다.

물품 데이터 구축

웹 크롤러를 활용하여 중국 내 3대 국내 전자상거래 업체의 공개 웹사이트에서 사진 정보를 획득하고 이를 전처리한다. 모아진 제품들은 (그림 1)과 같이 주로 생활용품이며 세면 용품, 냉동식품, 문구류, 음료, 세탁용품, 식품, 종이제품, 잡화 등의 8개 카테고리로 분류될 수 있다. 모아진 8개의 카테고리의 물품들은 최종적으로 각각 2,537장, 5,626장, 5,635장, 1,784장, 2,407장, 6,906장, 5,425장, 3,216장의 영상들로 구성이 된다.

8개의 카테고리의 물품들은 각각 아래와 같은 특성을 가진다.
1) 첫번째 카테고리인 세면 용품들은 100-150g의 무게를 가지며, 플라스틱 실린더로 포장되어 있다. 다양한 직경으로 잡는 것이 가능해야 한다.
2) 두번째 카테고리인 냉동제품들은 200-1000g의 무게를 가지며 일부는 부드러운 형태로 되어 있다. 유연한 손동작으로 잡는 것이 가능해야 한다.
3) 세번째 카테고리인 문구류는 40-100g의 무게를 가지며, 플라스틱 스트립으로 포장되어 있다.
4) 네번째 카테고리인 음료는 235-2000mL의 용량을 가지며, 유리 혹은 플라스틱 병으로 구성되어 있다.
5) 다섯번째 카테고리인 세탁제품은 110-4260g정도의 무게를 가지며, 플라스틱 용기에 담겨져 있다.
6) 여섯번째 카테고리인 식품류는 16-70g의 무게를 가지며 가벼운 진공팩으로 포장되어 있다.
7) 일곱번째 카테고리인 종이제품들은 300-400g의 무게를 가지며 부서지기 쉬운 특성이 있다.
8) 여덟번째 카테고리인 잡화제품들은 모양과 무게가 다양하다는 특성이 있다.

모아진 데이터는 모델 학습 이전에 전처리가 수행되어야 한다. 먼저 잡음(noise)가 포함된 이상치 데이터는 제거하고, 주제와 무관한 데이터는 삭제하는 등 데이터 정리를 통해 30,000개의 상품을 포함하는 데이터를 정제하였다. 모델 학습 시 과적합(overfitting)을 방지하며 학습 효율을 증대하기 위해 랜덤하게 영상을 회전하는 변환을 적용하였고, 입력 사진을 32x32사이즈로 크기 변환하였다.

물체 타입에 따라 다른 방식의 잡는 방법을 택하도록 한다.

1) 첫 번째 세면 용품들은 가장자리에 일정한 호가 있고 직경이 약간 다르기 때문에 한 손으로 잡기에는 V자형 손가락을 사용하는 것이 적합하다. 구동 방법은 공압식이고, (그림 2a)와 같다.
2) 두 번째 유형의 상품은 냉동 제품으로 잡는 효과를 안정적으로 만들고, 잡는 물건의 모양과 크기에 적응할 수 있도록 유연하고 적응력 있는 양손 쥐기 방식을 채택한다 (그림 2b). 로봇팔의 손가락 모양 조합을 자유롭게 변경할 수 있고 잡는 과정이 유연하다.
3) 세 번째 상품은 문구류로 다양한 크레용, 색연필, 오일 파스텔 등 이 범주에 속하는 물체들은 크기와 무게가 다른 직육면체 형태가 많다. 따라서 (그림 2c)와 같은 조정 기능이 있는 양손 공압 클램프를 활용한다.
4) 네 번째 유형은 음료로 일부 알코올 제품 포장재가 유리인 것을 감안하여 조이는 힘이 너무 크면 병이 파손될 수 있으므로, 흡입 컵이 있는 3관절 손이 (그림 2d)와 같이 사용되었다.
5) 다섯 번째 유형은 세탁 제품으로 잡힌 물건의 무게가 보통 110g에서 4000g정도이기 때문에 큰 파지력과 높은 제어 정확도를 가진 (그림 2e)와 같은 유압 구동식 양손 그립을 채택하였다.
6) 여섯 번째 유형은 비스킷, 케이크, 음식 등의 식품으로, 쥐는 과정에서 상품이 손상되지 않도록 보호하기 위해 (그림 2f)와 같은 흡착 컵이 있는 생체 공학 소프트웨어 로봇 팔이 상품을 잡는데 활용되었다. 포장재의 표면이 매끄럽기 때문에 진공 흡착이 원활히 형성될 수 있다.
7) 일곱 번째 유형은 펌핑지, 물티슈, 화장지, 화장지, 생리대를 포함한 종이 제품이다. (그림 2g)와 같은 모터를 활용하는 양손 개폐식 합판이 활용된다.
8) 여덜 번째 유형은 수건, 동전, 물컵, 보조 배터리, 옷걸이, 구두 솔, 칫솔, 후크와 같은 다양한 잡화 물건이며 (그림 2h)에 나온 전동식 로봇 팔을 사용하였다.