홈 IT 직무교육 Unity환경에서 배우는 Deep 강화학습

Unity환경에서 배우는 Deep 강화학습

Unity 환경에서 배우는 딥-강화학습

상품으로 내 놓은것이 우리가 기계의 한계라 여기던 바둑에 도전한 ‘알파고‘이며 이미 이로인해 세상은 바뀌고 있습니다.
이제 우리는 인공지능이 무엇이고 기계학습이 무엇이며 더 나아가 강화학습을 통해 어떤 보상을 주어줄 것인지? 고민하는 시간을 마련 하겠습니다.

COURSE INFOMATION

교육일정 2018년9월1일 ~ 2018년10월6일
수업일정 1일,8일, 15일 , 22일 , 29일, 6일
교육시간 10:00 ~13:00[주말오전반] : 총7회수업[21시간]
교육장소 종로
교육비용 840,000원
모집인원 20명
온라인 문의 수강신청

커리큘럼

주제	강의주요내용	시간
[Phase01] 강의소개	1. 강의 진행 및 강사 소개 2. Pygame 소개 3. Pygame - 강화학습 테스트 환경 설명 4. Pygame 예시 코드 실습 5. Unity 소개 6. Unity ML-Agent 및 테스트 환경 설명 7. Unity ML-Agent 예시 코드 실습	3H
[Phase02] 딥러닝과 강화학습의 기초	1. 강화학습이란? 2. Deep Q Network 3. 간단한 딥러닝 이론 1) Neural Network 2) Convolutional Neural Network 3) Recurrent Neural Network 4. 강화학습의 용어들 5. Bellman Equation과 Q-function	3H
[Phase03] SARSA와 Q-learning	- SARSA 1. Grid World 소개 2. SARSA 이론 설명 3. SARSA 업데이트 과정 살펴보기 4. SARSA 코드 설명 및 실습 - Q-learning 1. Q-learning 이론 설명 2. Q-learning 업데이트 과정 살펴보기 3. Q-learning 코드 설명 및 실습	3H
[Phase04] Deep Q-Network	1. Q-learning의 한계 2. Deep Q network의 개선점 3. Deep Q Network 이론 4. Deep Q Network 업데이트 5. Deep Q Network의 주요 기법들 1) Experience Replay 2) Target Network 3) Frame Skipping and Stacking 6. Deep Q Network 코드 설명 및 실습	3H
[Phase05] Double DQN과 Prioritized Experience Replay	1. DQN의 overoptimistic value estimation 문제 2. Double DQN의 개요 3. Double DQN의 이론 4. Double DQN 코드 설명 및 실습 5. Prioritized Experience Replay와 기존 Experience Replay 비교 6. Prioritized Experience Replay의 이론 설명 7. Prioritized Experience Replay 코드 설명 및 실습	3H
[Phase06] Dueling DQN과 NoisyNet DQN	1. Dueling DQN의 이론 2. Dueling DQN의 코드 설명 및 실습 3. Epsilon greedy 기반 expolration과 parametric noise 기반 exploration 비교 4. NoisyNet의 이론 설명 5. NoisyNet 코드 설명 및 실습	3H
[Phase07] DPQN과 앞으로의 강화학습	1. RNN과 LSTM 2. RNN을 통한 MNIST 실습 3. DRQN의 이론 및 네트워크 구조 설명 4. DRQN 코스 설명 및 실습 5. Deep Reinforcement Learning의 현재 상황과 발전 방향	3H

온라인 문의

이름 *
연락처*
메일*

개인정보 수집 및 이용*

                수집하는 개인정보의 항목

                수집하는 목적/방법에 따라 수집하는 개인정보 항목은 다음과 같습니다.
                - 기본 개인정보 정보
                　신청자, 샌년월일, 연락처, 이메일, 회사명
                - 마케팅/서비스 이용을 위한 정보
                　신청자, 주민등록번호, 연락처, 이메일, 회사명
                - 서비스 이용 중 발생되는 정보
                　서비스 이용기록, 접속로그, 쿠키
                　결재수단에 대한 기록여부(계좌), 결재기록
                개인정보 수집 및 이용 목적

                에이콘 아카데미는 수집한 개인정보를 다음의 목적을 위해 활용합니다.
                - 서비스 제공에 관한 계약 이행 및 서비스 제공에 따른 요금정산 목적
                학습진행, 컨텐츠 제공, 구매 및 요금 결제, 물품배송 또는 청구지 등 발송
                - 회원 관리
                회원제 서비스 이용에 따른 본인확인, 개인 식별, 불량회원의 부정 이용 방지와
                비인가사용 방지, 가입 의사 확인, 연령확인, 불만처리 등 민원처리, 고지사항 전달
                - 마케팅 및 광고에 활용
                신규 서비스(제품) 개발 및 특화, 이벤트 등 광고성 정보 전달, 인구통계학적 특성에 따른
                서비스 제공 및 광고 게재, 접속 빈도 파악 또는 회원의 서비스 이용에 대한 통계
                - 고용보험 과정의 노동부 신고
                회원이 신청한 과정이 고용보험 대상 과정인 경우 고용보험 환급을 이유로 노동부에 신고하게 됩니다.
                개인 정보 보유 및 이용기간

                원칙적으로, 개인정보 수집 및 이용목적이 달성된 후에는 해당 정보를 지체 없이 파기합니다.
                단, 다음의 정보에 대해서는 아래의 이유로 명시한 기간 동안 보존합니다.
                보존 항목 : 신청자, 주민등록번호, 연락처, 이메일, 회사명
                보존 근거 : 고용보험 환급 적정성 심의
                보존 기간 : 3년
                그리고 관계법령의 규정에 의하여 보존할 필요가 있는 경우 회사는 아래와 같이 관계법령에서 정한 일정한 기간 동안 회원정보를 보관합니다.
                1) 기타 법령에 따른 보유기간/관계법 안내
                - 계약 또는 청약철회 등에 관한 기록 : 5년 (전자상거래 등에서의 소비자 보호에 관한 법률)
                - 대금결제 및 재화 등의 공급에 관한 기록 : 5년 (전자상거래 등에서의 소비자 보호에 관한 법률)
                - 소비자의 불만 또는 분쟁처리에 관한 기록 : 3년 (전자상거래 등에서의 소비자 보호에 관한 법률)
                - 본인확인에 관한 기록 보존 이유 : 정보통신 이용촉진 및 정보보호 등에 관한 법률 보존 기간 : 6개월
                - 방문에 관한 기록 보존 이유 : 통신 비밀 보호법 보존 기간 : 3개월

본인은 위 개인정보취급방침에 동의하십니까?