(사)한국인지과학산업협회 인지기술 튜토리얼 19-2
2017년 10월 20일(금)
대전 KAIST IT 융합빌딩(N1) 다목적홀
강화학습은 인공지능 에이전트가 스스로 환경과 상호작용하며 사람이 정해준 정답 없이도 학습이 가능해 로봇의 컨트롤, 게임의 자동 플레이 등에 활발히 이용되고 있습니다. 또한 딥 러닝을 강화학습에 적용함으로써 최근 강화학습의 성능과 이용 가능성이 크게 향상되어 2016년에는 딥마인드의 강화학습 알고리즘인 알파고가 이세돌 9단과의 바둑 대국에서 승리를 거두는 등 발전이 두드러지고 있습니다. 본 튜토리얼에서는 강화학습의 기본 개념과 대표적인 학습 알고리즘, 딥 러닝을 접목한 딥 강화학습의 대표적인 모델 및 게임과 로보틱스 분야의 최신 연구 성과를 소개하고 기본적인 딥 강화학습 모델의 구현 실습을 진행하고자 하니 여러분의 많은 관심과 참여 부탁드립니다.
시 간 | 게임과 로봇에 적용되는 강화학습 |
|
09:00~09:30 | 등 록 | 09:30~11:30 |
강화학습 기본 이론 곽하녹 연구원(서울대학교) |
11:30~13:00 | 점심시간 | |
13:00~15:00 |
딥 강화학습 소개, 게임과 로봇에의 적용 최진영 연구원(서울대학교) |
|
15:00~17:00 |
게임과 로봇에의 적용실습 이의령 연구원(모두의 연구소) |
곽하녹 연구원 (서울대학교)
강화학습은 생명체의 의사결정 과정을 수학적으로 모델링하고, 이를 학습하기 위한 알고리즘이다. 강화학습을 이해하기 위해서는 먼저 MDP라는 도구를 활용해 문제를 정의하는 방법부터 이해해야 한다. 본 강의에서는 이러한 수학적인 도구를 최대한 쉽고 직관적으로 이해하는 것을 목표로 한다.
(현) 서울대학교 컴퓨터공학부 박사과정
Deep Generative Model, Deep Reinforcement Learning
최진영 연구원 (서울대학교)
Deep learning을 강화학습에 적용한 Deep Reinforcement Learning은 게임, 로봇 컨트롤 등의 다양한 과제에서 인간을 넘어서는 성능을 보여주고 있다. 본 튜토리얼에서는 가장 널리 사용되는 딥 강화학습의 baseline인 DQN과 A3C 알고리즘에 대해 다루고 이를 기반으로 게임과 로봇 분야에 적용되는 최신 모델들에 대해 소개한다.
(현) 서울대학교 컴퓨터공학부 석박사통합과정 수료
Cognitive Robotics, Deep Reinforcement Learning
이의령 연구원 (모두의 연구소)
Deep Reinforcement Learning을 실험하기 위해서 에이전트를 학습시킬 수 있는 환경이 필수적이다. 강화학습과 관련된 최신 모델들을 공개하고 있는 OpenAI(비영리 인공지능 연구 기관)는 OpenAI gym이라는 강화학습 학습 환경을 오픈소스로 제공하고 있다. 본 튜토리얼에서는 OpenAI gym의 CartPole과 Atari 게임 예제를 이용하여 딥 강화학습의 DQN과 A3C 알고리즘 실습을 수행한다.
(현) 모두의 연구소 연구원 ‘파이썬과 케라스로 배우는 강화학습 저자’
Deep Reinforcement Learning
한국인지과학산업협회 유료 회원사(2명까지) ☞ 협회 가입방법
무료 등록 예정자 (2명 까지)의 참가신청서를 작성하여 event.nacsi@gmail.com로 보내주시기 바랍니다.
학생 등록 15만원
일반 등록 35만원
학생 등록 20만원
일반 등록 40만원
카드 결제 또는 온라인 입금 후 확인 메일 발송
카드 결제 사이트 (클릭)에서 결제 후 참가신청서를 작성하여 event.nacsi@gmail.com로 보내주시기 바랍니다. (참가신청서 파일 다운로드 )
아래의 계좌에 등록비를 입금하신 후 참가신청서를 작성하여 event.nacsi@gmail.com로 보내주시기 바랍니다. (참가신청서 파일 다운로드 )
한국인지과학산업협회 사무국
T. 070-4106-1005, event.nacsi@gmail.com
대전 KAIST IT 융합빌딩(N1) 다목적홀
TEL 070-4106-1005
월평(KAIST)역 출발 시간표: 월평역 출발 → KAIST 운행
08:28(출근버스), 09:40, 10:40, 11:40, 13:40, 14:40, 15:40, 16:40, 17:40
승차 장소: 월평역 3번 출구 → 50m → 버스 정류장 옆 → KAIST 정문 하차 → KAIST IT 융합빌딩(N1) 다목적홀
정부대전청사서문정류장에서 604번 승차 → KAIST 동문 건너편(원자력안전기술원정류장) 하차
터미널 길건너 유성시외버스정류장에서 121번버스 승차 → KAIST 정문 하차 → KAIST IT 융합빌딩(N1) 다목적홀