본문 바로가기
기계지능 및 로봇공학 다기관 지원 연구단

Machine Intelligence and Robotics Multi-Sponsored Research and Education Platform;
the leader of Industries 4.0, who develops Artificial Intelligence.

연구실소개

제어, 기계학습, 드론, 로봇, 자율주행 글보기
제어, 기계학습, 드론, 로봇, 자율주행
작성자 KAIST교수 장동의 게시일 2017.06.05 14:51 조회수 87

■ 연구책임자: KAIST 전기및전자공학과 교수 장동의

■ 이메일: dechang@kaist.ac.kr

■ 연구분야: 제어, 기계학습, 드론, 로봇, 자율주행

■ 연구목표: 본 연구실에서는 제어와 기계학습의 이론 및 응용을 연구하여 두 분야의 시너지를 이끌어내는 것을 목표로 하고 있다.

본 과제에서는 적응적 학습을 실현시키기 위한 메모리 기반의 강화학습 알고리즘의 개발과 적용을 목표로 한다. 이를 위해 작업기억(혹은 단기기억)과 장기기억으로 구분되는 메모리의 구조를 구체화하고, 학습 에이전트와 메모리 간의 관계를 고려한 학습 알고리즘을 개발한다.

 

■ 연구내용:

제어 연구실에서는 선형, 비선형제어부터 최적제어, 적응제어에 이르는 제어 전반과 강화학습을 중심으로 한 기계학습의 이론과 그 응용을 연구한다. 수학적으로 엄밀하고 구체적인 제어 이론을 기계학습에 적용하여 인공신경망의 구조와 학습 알고리즘, 연산 등을 명확하게 해석하고, 이를 바탕으로 발전된 기계학습 알고리즘을 개발, 적용하는 연구를 진행 중이다.

최근에는 일반적인 심층전방향신경망(deep feedforward neural network)의 구조와 해당 신경망을 학습시키기 위한 연산들을 엄밀하게 정의하고 표현하는 수학적 프레임워크를 개발하는 연구 성과가 있었고, 해당 연구의 후속으로 현재 이미지와 음성 인식, 자율 주행 등에 활발히 이용되고 있는 CNN(convolutional neural network)과 RNN(recurrent neural network)을 위한 수학적 프레임워크를 개발하는 연구를 진행 중에 있다.

또한, 적응형 인공지능을 위한 메모리 기반의 강화학습 알고리즘을 개발하는 연구 역시 진행 중에 있다. 현재 일반적으로 강화학습 알고리즘에서 이용되는 메모리는 경험 샘플로 구성된 리플레이 버퍼(replay buffer)로 정의되며, 각 경험 샘플은 현재 상태(current state)와 행동(action), 그에 대한 보상(reward)과 행동의 결과로 도달한 다음 상태(next state)로 구성된다. 인간의 뇌에서 기억이 처리되는 과정과 구조는 이와 다르다. 인간의 뇌에서는 감각 기관에서 수집, 저장된 정보인 감각기억이 작업기억으로 이전되고, 작업기억에서 반복 처리된 정보들이 장기기억으로 이전되며, 장기기억에 저장된 정보들은 작업기억으로 다시 이전되어 처리될 수 있다. 이와 비교했을 때, 현재 일반적으로 강화학습에서 이용되는 메모리는 그 구조와 구성이 단순하고, 인공신경망의 학습 과정에만 이용된다는 한계점을 갖는다. 따라서 본 연구실에서는 이러한 한계점을 극복하기 위하여, 작업(혹은 단기) 메모리와 장기 메모리를 고려한 강화학습 알고리즘을 연구하고 있다.

 

■ 연구실 이름: 제어 연구실

■ 연구실 홈페이지주소: https://sites.google.com/site/dongeuichang/