본문 바로가기

강화 학습3

인공지능은 왜 안 가르칠수록 더 똑똑할까? (남세동 보이저엑스 대표) https://www.youtube.com/watch?v=IsapcGYEASY AI가 인간이 이해할 수 없다는 의미와 그 배경인공지능(AI)이 인간에게 이해할 수 없는 존재로 느껴지는 이유는 여러 가지가 있습니다. AI의 작동 원리와 결과는 때로는 인간의 논리나 예측을 벗어나기 때문입니다. 특히 딥러닝과 같은 기술을 이용한 AI는 막대한 양의 데이터를 통해 학습을 진행하는데, 이러한 학습 과정과 결과는 때로는 인간이 이해하기 어려운 복잡성을 띱니다. 이번 글에서는 AI가 왜 인간이 이해할 수 없는지에 대한 이유와 배경, 그리고 이에 대한 다양한 사례와 개념을 자세히 살펴보겠습니다. AI의 신경망 구조와 학습 방법AI의 신경망은 인간의 뇌 구조를 모방하여 만들어진 복잡한 수학적 모델입니다. 이 신경망은 수.. 2024. 7. 23.
Lecture 7: DQN (Deep Q-Network) 알고리즘과 강화 학습의 이해 (DeepMind Algorithm) DQN 알고리즘과 강화 학습의 이해https://www.youtube.com/watch?v=S1Y9eys2bdg 이번 블로그 포스팅에서는 강화 학습의 핵심 알고리즘 중 하나인 DQN(Deep Q-Network)에 대해 알아보겠습니다. 지난 포스팅에서는 Q-테이블 방법을 사용하여 가치 값을 추정하고 원하는 행동을 찾아가는 방법에 대해 설명했습니다. Q-테이블 방법은 간단하면서도 잘 작동하는 방법이지만, 상태 공간이 큰 문제나 복잡한 문제에는 적합하지 않은 단점이 있었습니다. 이러한 문제를 해결하기 위해 테이블 대신 신경망을 사용하여 가치 값을 추정하는 DQN 알고리즘이 등장했습니다. 이번 포스팅에서는 DQN 알고리즘의 기본 개념과 작동 원리를 설명하고, 이를 통해 복잡한 문제를 어떻게 해결할 수 있는지 살.. 2024. 7. 20.
Lab 7-1: DQN 1 (NIPS 2013) 알고리즘 구현 Lab 7-1: DQN 1 (NIPS 2013) 알고리즘 구현https://www.youtube.com/watch?v=Fbf9YUyDFww 이번 실습에서는 2013년도에 발표된 DQN(Deep Q-Network) 알고리즘을 구현해 보겠습니다. DQN은 Q-테이블을 신경망으로 대체하여 상태 공간이 큰 문제에서도 효과적으로 학습할 수 있도록 합니다. 이 알고리즘은 Experience Replay와 타겟 네트워크를 도입하여 학습의 안정성과 효율성을 높입니다. 이번 실습에서는 이 알고리즘을 구현하고 CartPole 환경에서 학습시켜 보겠습니다.알고리즘 개요DQN 알고리즘은 다음과 같은 과정을 거쳐 학습합니다:신경망 초기화: Q 값을 추정하는 메인 네트워크와 목표 Q 값을 계산하는 타겟 네트워크를 초기화합니다.환.. 2024. 7. 20.
반응형