본문 바로가기
기계지능 및 로봇공학 다기관 지원 연구단

Machine Intelligence and Robotics Multi-Sponsored Research and Education Platform;
the leader of Industries 4.0, who develops Artificial Intelligence.

연구실소개

추론기반 능동적 데이터 수집 기술 개발 글보기
추론기반 능동적 데이터 수집 기술 개발
작성자 (주) 얄리 대표윤재민 게시일 2017.06.05 14:53 조회수 146

■ 연구책임자: 얄리 주식회사 대표 윤재민 
■ 이메일: yally@yally.com
■ 연구분야: 추론기반 능동적 데이터 수집 기술 개발

■ 연구목표: 본 연구는 AI와 인간이 서로 대화하는데 있어, 최신 트렌드를 반영한 자연스러운 대화를 가능하게 하는 것을 목표로 하고 있다. 즉, 트위터의 게시글을 크롤링하고 시나리오를 정제해서 최신 트렌드를 반영된 대화를 AI와 연속적으로 대화하고자 한다.

 

■ 연구내용: 인간과 인간이 대화하는 다양한 주제에 대한 시나리오 수작업으로 구축하는 것에는 한계가 있다. 따라서 소셜네트워크(SNS)에서 오가는 엄청난 양의 데이터로부터 의미 있고 정제된 대화 시나리오를 얻는 방법을 본 연구에서 진행했다. SNS 게시글을 파싱하는 방법으로는 위키피디아에서 추출한 어휘를 사용한다. 이렇게 검색된 URL과 하위 게시글로부터 문장을 수집한다. 수집된 문장은 기계학습을 통해 의미벡터로 표현하고, 질문과 답변을 분류해서 의미태깅한다.

 


그림 1 전체 시스템 구조

 

대화 시나리오를 구축하는 질문/답변 분류는 규칙기반과 머신러닝 방법을 결합한 하이브리드 방식으로 진행한다. 대화시나리오는 질문, 답변 모두 의미 벡터로 표현하며 하나 이상의 의미 단어가 각각의 질문 답변 문장을 대표한다. 질문과 답변 문장을 분석하여 문장은 300차원 이상의 다차원 벡터로 표현되며, 새로운 질문이 들어왔을 때 DNN알고리즘에 의해 대화의도가 분류되며, 해당 대화의도와 유사한 시나리오상의 질문을 의미벡터 네트워크상에서 최단거리로 계산하여 해당 시나리오 상의 대화를 연속으로 전개한다.
추후에는 비정상 한글 오류 수정 등 자동 텍스트 정제 방법을 고안하여 유효시나리오를 획기적으로 늘리는 방법에 대해서 연구할 예정이다.


■ 연구실 이름: 얄리 주식회사
■ 연구실 홈페이지주소: www.yally.com