글 / 김준서 학생기자 joonseo@kaist.ac.kr, 최원혁 학생기자 dnjsgur12271029@kaist.ac.kr
KAIST 기계공학과 황보제민 교수가 이끄는 로봇인공지능연구소(RAI Lab)는 최근 역동적인 동작을 구현할 수 있는 4족 보행 로봇 ‘라이보’를 개발했다. 연구소가 설립된 지 3년도 채 되지 않았지만, 모래사장을 질주할 수 있는 보행 로봇을 개발하는 쾌거를 거둔 것이다. 이 로봇은 미래 우주 탐사나 재난 상황에서 로봇이 활용될 가능성을 제시하고, 로봇 기술의 발전에 이바지하며 새로운 산업 분야를 열어나갈 것으로 기대된다. 로봇 기술뿐만 아니라 인공지능, 자율주행 등 다양한 분야에서 연구를 이어 나가는 이 연구소를 파헤쳐보자.
인공신경망은 인간의 뇌를 모방하여 만들어진 인공지능 알고리즘으로, 입력 데이터를 받아들이고 이를 처리하여 원하는 출력값을 생성하는 모델이다. 인간의 뇌는 단순한 신호 전달 기능을 수행하는 뉴런들을 여럿 모아 복잡한 사고를 가능하게 한다. 이를 컴퓨터로 구현한 것이 바로 인공신경망이며, 이러한 신경망을 3개 이상 중첩한 구조를 ‘깊은 신경망’이라고 부른다. 인공신경망은 이미지 인식, 음성 인식, 자연어 처리, 로봇 기술 등 다양한 분야에서 활용된다.
라이보의 학습법, 강화학습은 시행착오를 통해 인공지능이 학습하는 방법의 하나다. 이러한 강화를 바탕으로 인공지능은 실수와 보상을 통해 학습하여 목표를 찾아가게 된다. 기존의 신경망들이 데이터를 기반으로 가중치와 편향을 학습하는 것과 같이, 보상이라는 개념을 사용하여 최적의 행동을 학습하는 것이 바로 강화학습이다. 라이보는 인공신경망을 활용하여 강화학습 알고리즘으로 걸음걸이를 배우며 최적의 움직임을 학습하였다.
다양한 지형에서 움직이는 라이보. ⓒ Learning quadrupedal locomotion on deformable terrain
기존 4족 보행 로봇은 정확한 지형에 대한 정보가 있어야 그 지형 위를 걸을 수 있었다. 하지만 로봇인공지능연구소에서는 실시간 정보 데이터에 의존하지 않기 위해 ‘모델 프리’라고 불리는 제어 체계를 고안했다. 이 제어 체계로 인공신경망은 다양한 환경을 학습해 지반의 특성을 구분하고 반영하므로, 지반의 변화를 계산하지 않고도 유연한 대처가 가능하다. 덕분에 라이보는 모래와 같이 변형하는 지형에서도 견고하게 보행할 수 있다.
라이보 모델링에서 입상 원뿔 모델이 사용되는 원리. ⓒLearning quadrupedal locomotion on deformable terrain
라이보가 ‘모델 프리’ 강화학습으로 변화하는 지형에 적응하게 되었지만, 데이터를 통한 학습만으로는 실제 외부 환경에서 작동할 때 성능이 감소한다. 이 때문에 접촉을 예측하기 위해 ‘입상 원뿔 모델’과 ‘쿨롱 마찰 모델’이 사용되었다. 입상 원뿔 모델은 수직 방향에서 접촉하는 지점을 점으로 지정해 힘의 작용을 계산한다. 쿨롱 마찰 모델은 수평 방향으로 작용하는 무게를 바탕으로 발생하는 마찰력을 확인한다. 두 모델을 통해 라이보는 외부 환경에서도 뛰어난 성능을 유지할 수 있다.
KAIST 기계공학과 황보제민 교수. ⓒRAI Lab
주로 보행 로봇을 연구하며, 로봇 부품 설계, 제작 및 강화학습 기반의 제어 연구도 하고 있다. 2021년에 완성한 ‘라이보’는 4족 보행 로봇으로, 보스턴 다이내믹스의 ‘스팟’보다 두 배 이상 빠르고 배터리도 오래가며, 설계가 간단해 상용화가 가능하다는 장점이 있다. 최초 개발 이후 다양한 지형에서 연구를 진행했고, 모래사장을 포함한 다양한 환경에서 자유롭게 뛸 수 있다. 현재는 ‘라이보2’의 설계와 제작, 자율주행 프로젝트를 진행하고 있다.
라이보의 하드웨어는 굉장히 단순하다. 모터와 유선기어로 이루어져 있으며, 가볍고 마찰을 줄이는 것을 목적으로 디자인하였다. 하지만 로봇의 시스템은 굉장히 복잡해 조금의 오차도 허용하지 않으려면 노하우가 필요하다. 라이보의 인공신경망은 세 개로 이루어져 있다. 첫째는 상태를 판단하는 인공신경망으로, 로봇의 움직임을 예측하고, 센서의 값에 따른 로봇의 상태를 추정한다. 다음으로 환경에 대한 인공신경망은 로봇이 처한 환경을 분류하고, 추정된 값을 기반으로 제어 인공신경망이 로봇을 제어한다. 이렇게 세 개의 인공신경망이 유기적으로 작용하여 라이보는 최적의 행동을 학습하고, 보상을 최대화하는 방향으로 움직인다.
박사 과정에서부터 기존의 모델예측제어(MPC, Model Predictive Control) 기술 분야보다 나은 로봇 제어 방법을 고민했다. 그러다 ‘인공신경망을 적용해보면 어떨까’ 하는 아이디어가 떠올랐다. 이를 적용하기 위해 시뮬레이터를 직접 개발했으며, 기존의 인공지능 알고리즘을 합쳐서 연구를 이어가자 좋은 성능이 나왔다.
사람과의 교류를 통해 일상생활에 도움을 줄 수 있다. 농장의 열매 수확을 돕거나 거리의 쓰레기를 줍고 불편한 사람들을 도와주는 로봇이 될 수도 있으며, 수색과 보초 등의 군사 용도로도 쓰일 수 있다. 내가 하는 연구가 쓸모 있고, 사람들에게 긍정적인 인상을 남기면 좋겠다. 또 이 로봇이 상용화된 제품으로 나와 사람들에게 도움과 편리함을 줬으면 한다.
크게 세 가지로 나눌 수 있다. 첫 번째는 퍼포먼스를 구현하는 것으로, 징검다리를 건너거나 장애물을 점프하는 등의 기능을 구현하는 연구다. 두 번째로는 로봇의 안정성을 높이는 것이다. 로봇이 넘어지지 않고 안정적으로 걷는다는 확신이 있어야 한다. 마지막으로는 배터리 효율의 향상이다.
로봇공학은 대부분 C++ 코딩을 많이 해서 관련 공부를 많이 했으면 좋겠고, 특히 동역학과 딥러닝 공부를 많이 할 것을 추천한다. 미리 기계공학 회사에서 경험을 쌓거나 방학 때 인턴을 하는 등 여러 경험을 해보면 좋겠다.
RAI Lab 구성원들의 단체 사진. ⓒRAI Lab
RAI Lab의 실험실 모습. ⓒRAI Lab