본문 바로가기

728x90

SMALL

탐험4

Lab 05-1: 비결정론적 세계에서의 Q-learning 학습 Lab 05-1: 비결정론적 세계에서의 Q-learning 학습이번 강의에서는 여러분을 무시무시한 바람이 심하게 부는 프로즌 레이크의 세계로 초대합니다. 이전 강의에서 소개한 비결정론적(nondeterministic) 환경에서 Q-learning 알고리즘이 어떻게 동작하는지 실제로 구현하고 실습해보겠습니다. 이를 통해 비결정론적 환경에서 Q-learning이 얼마나 효과적으로 작동하는지 확인해볼 것입니다.https://www.youtube.com/watch?v=ZCumo_6qTsUhttps://www.youtube.com/watch?v=B-CZv9WD5eM 비결정론적 환경 이해하기비결정론적 환경이란 동일한 행동을 반복해도 항상 동일한 결과를 얻지 못하는 환경을 의미합니다. 예를 들어, 꽁꽁 얼어붙은 호수.. 2024. 7. 18.

Lecture 05: Q-learning을 활용한 비결정론적 세계에서의 학습 Lecture 05: Q-learning을 활용한 비결정론적 세계에서의 학습이번 강의에서는 여러분을 꽁꽁 얼어붙은 호수로 초대합니다. 이 강의에서는 비결정론적(nondeterministic) 환경에서의 Q-learning을 탐구하고, 실제로 이러한 환경에서 학습하는 방법을 알아보겠습니다. 비결정론적 환경은 행동의 결과가 불확실한 세계를 의미하며, 이는 우리 일상에서도 흔히 경험할 수 있는 상황입니다.https://www.youtube.com/watch?v=6KSf-j4LL-c 비결정론적 환경이란?비결정론적 환경에서는 같은 행동을 반복해도 항상 동일한 결과를 얻지 못합니다. 예를 들어, 얼어붙은 호수 위를 걷는 상황을 상상해 봅시다. 여러분은 오른쪽으로 이동하려고 하지만, 바닥이 미끄러워서 오른쪽으로 가.. 2024. 7. 17.

Lab 4: Q-learning을 활용한 Exploration and Exploitation와 할인된 보상 discounted reward 최적화 Lab 4: Q-learning을 활용한 탐험 및 착취와 할인된 보상 최적화Q-learning은 강화 학습의 중요한 기법 중 하나로, 주어진 환경에서 최적의 정책을 학습하는 데 사용됩니다. 이번 글에서는 Q-learning의 탐험(Exploration)과 착취(Exploitation) 전략 및 할인된 보상(Discounted Reward)에 대해 알아보고, 이를 구현하는 방법을 상세히 설명하겠습니다.Q-learning 개요Q-learning은 에이전트가 환경과 상호작용하면서 얻는 보상(reward)을 바탕으로 최적의 행동(action)을 학습하는 알고리즘입니다. 이 과정에서 중요한 두 가지 개념이 바로 탐험과 착취입니다.탐험(Exploration): 에이전트가 아직 경험하지 못한 상태(state)와 행동.. 2024. 7. 17.

길을 찾는 법: 뇌과학의 관점에서 보는 우리의 여정 https://www.youtube.com/watch?v=HAQtpVV8HZA 안녕하세요, 뇌과학 박사 장동선입니다. 오늘 여러분과 함께 길을 찾는 방법에 대해 이야기해보려고 합니다. 길을 찾는다는 것은 우리 삶에서 매우 중요한 주제입니다. 우리는 모두 인생의 여러 갈림길에서 방향을 잃고 방황할 때가 있습니다. 하지만 길을 잃는 것도 새로운 길을 찾는 과정의 일부라고 생각합니다. 이 글에서는 개미와 철새, 그리고 우리의 뇌가 어떻게 길을 찾는지, 또 우리가 어떻게 길을 찾을 수 있는지에 대해 이야기하겠습니다.자연의 길 찾기: 개미와 철새의 놀라운 능력개미를 보신 적 있으신가요? 개미들은 먹이를 찾아서 탐험을 하다가, 먹이를 찾으면 정확하게 집으로 돌아옵니다. 이는 매우 놀라운 일입니다. 철새들도 마찬가지.. 2024. 7. 13.

이전 1 다음

728x90

LIST

티스토리툴바