TensorFlow.js 예제: 강화 학습 - 스네이크 DQN

스네이크 게임을 위한 심층 Q-네트워크

설명

이 페이지는 심층 Q-네크워크(DQN)을 로드하고 이를 사용해 스네이크 게임을 플레이합니다. tfjs-node를 사용해 Node.js에서 훈련을 합니다. train.js을 참고하세요.

알고리즘

DQN을 훈련하여 현재 게임 상태가 주어지면 행동 가치를 추정합니다. 이 DQN은 2D 합성곱 신경망입니다. dqn.js를 참고하세요. 입실론 그리디 알고리즘을 사용해 훈련하는 동안 탐험과 활용 사이의 균형을 맞춥니다.

Q-가치 보기

게임 시작