국가기간전략산업직종 3년 우수기관 - 고용노동부

에이콘 아카데미

IT 직무교육 Unity환경에서 배우는 Deep 강화학습

Unity환경에서 배우는 Deep 강화학습

Unity 환경에서 배우는 딥-강화학습

상품으로 내 놓은것이 우리가 기계의 한계라 여기던 바둑에 도전한 ‘알파고‘이며 이미 이로인해 세상은 바뀌고 있습니다.
이제 우리는 인공지능이 무엇이고 기계학습이 무엇이며 더 나아가 강화학습을 통해 어떤 보상을 주어줄 것인지? 고민하는 시간을 마련 하겠습니다.

COURSE INFOMATION




커리큘럼

주제 강의주요내용 시간
[Phase01]
강의소개
1. 강의 진행 및 강사 소개
2. Pygame 소개
3. Pygame - 강화학습 테스트 환경 설명
4. Pygame 예시 코드 실습
5. Unity 소개
6. Unity ML-Agent 및 테스트 환경 설명
7. Unity ML-Agent 예시 코드 실습
3H
[Phase02]
딥러닝과 강화학습의 기초
1. 강화학습이란?
2. Deep Q Network
3. 간단한 딥러닝 이론
1) Neural Network
2) Convolutional Neural Network
3) Recurrent Neural Network
4. 강화학습의 용어들
5. Bellman Equation과 Q-function
3H
[Phase03]
SARSA와 Q-learning
- SARSA
1. Grid World 소개
2. SARSA 이론 설명
3. SARSA 업데이트 과정 살펴보기
4. SARSA 코드 설명 및 실습
- Q-learning
1. Q-learning 이론 설명
2. Q-learning 업데이트 과정 살펴보기
3. Q-learning 코드 설명 및 실습
3H
[Phase04]
Deep Q-Network
1. Q-learning의 한계
2. Deep Q network의 개선점
3. Deep Q Network 이론
4. Deep Q Network 업데이트
5. Deep Q Network의 주요 기법들
1) Experience Replay
2) Target Network
3) Frame Skipping and Stacking
6. Deep Q Network 코드 설명 및 실습
3H
[Phase05]
Double DQN과 Prioritized Experience Replay
1. DQN의 overoptimistic value estimation 문제
2. Double DQN의 개요
3. Double DQN의 이론
4. Double DQN 코드 설명 및 실습
5. Prioritized Experience Replay와
기존 Experience Replay 비교
6. Prioritized Experience Replay의 이론 설명
7. Prioritized Experience Replay 코드 설명 및 실습
3H
[Phase06]
Dueling DQN과 NoisyNet DQN
1. Dueling DQN의 이론
2. Dueling DQN의 코드 설명 및 실습
3. Epsilon greedy 기반 expolration과
parametric noise 기반 exploration 비교
4. NoisyNet의 이론 설명
5. NoisyNet 코드 설명 및 실습
3H
[Phase07]
DPQN과 앞으로의 강화학습
1. RNN과 LSTM
2. RNN을 통한 MNIST 실습
3. DRQN의 이론 및 네트워크 구조 설명
4. DRQN 코스 설명 및 실습
5. Deep Reinforcement Learning의 현재 상황과 발전 방향
3H

온라인 문의

  • 이름 *
  • 연락처*
  • 메일*
  • 개인정보 수집 및 이용*
                    수집하는 개인정보의 항목
    
                    수집하는 목적/방법에 따라 수집하는 개인정보 항목은 다음과 같습니다.
                    - 기본 개인정보 정보
                     신청자, 샌년월일, 연락처, 이메일, 회사명
                    - 마케팅/서비스 이용을 위한 정보
                     신청자, 주민등록번호, 연락처, 이메일, 회사명
                    - 서비스 이용 중 발생되는 정보
                     서비스 이용기록, 접속로그, 쿠키
                     결재수단에 대한 기록여부(계좌), 결재기록
                    개인정보 수집 및 이용 목적
    
                    에이콘 아카데미는 수집한 개인정보를 다음의 목적을 위해 활용합니다.
                    - 서비스 제공에 관한 계약 이행 및 서비스 제공에 따른 요금정산 목적
                    학습진행, 컨텐츠 제공, 구매 및 요금 결제, 물품배송 또는 청구지 등 발송
                    - 회원 관리
                    회원제 서비스 이용에 따른 본인확인, 개인 식별, 불량회원의 부정 이용 방지와
                    비인가사용 방지, 가입 의사 확인, 연령확인, 불만처리 등 민원처리, 고지사항 전달
                    - 마케팅 및 광고에 활용
                    신규 서비스(제품) 개발 및 특화, 이벤트 등 광고성 정보 전달, 인구통계학적 특성에 따른
                    서비스 제공 및 광고 게재, 접속 빈도 파악 또는 회원의 서비스 이용에 대한 통계
                    - 고용보험 과정의 노동부 신고
                    회원이 신청한 과정이 고용보험 대상 과정인 경우 고용보험 환급을 이유로 노동부에 신고하게 됩니다.
                    개인 정보 보유 및 이용기간
    
                    원칙적으로, 개인정보 수집 및 이용목적이 달성된 후에는 해당 정보를 지체 없이 파기합니다.
                    단, 다음의 정보에 대해서는 아래의 이유로 명시한 기간 동안 보존합니다.
                    보존 항목 : 신청자, 주민등록번호, 연락처, 이메일, 회사명
                    보존 근거 : 고용보험 환급 적정성 심의
                    보존 기간 : 3년
                    그리고 관계법령의 규정에 의하여 보존할 필요가 있는 경우 회사는 아래와 같이 관계법령에서 정한 일정한 기간 동안 회원정보를 보관합니다.
                    1) 기타 법령에 따른 보유기간/관계법 안내
                    - 계약 또는 청약철회 등에 관한 기록 : 5년 (전자상거래 등에서의 소비자 보호에 관한 법률)
                    - 대금결제 및 재화 등의 공급에 관한 기록 : 5년 (전자상거래 등에서의 소비자 보호에 관한 법률)
                    - 소비자의 불만 또는 분쟁처리에 관한 기록 : 3년 (전자상거래 등에서의 소비자 보호에 관한 법률)
                    - 본인확인에 관한 기록 보존 이유 : 정보통신 이용촉진 및 정보보호 등에 관한 법률 보존 기간 : 6개월
                    - 방문에 관한 기록 보존 이유 : 통신 비밀 보호법 보존 기간 : 3개월
                    
    본인은 위 개인정보취급방침에 동의하십니까?

수강신청

로그인을 하셔야 수강신청을 하실수 있습니다.

교육센터 시설안내