Incremental Implementation이 뭔가? 행동의 가치(Action-value Methods)를 추정하는 방법에 대해서 우리는 관측된 보상의 표본 평균으로 가치를 추정했다. Incremental Implementation은 행동의 가치 추정치인 관측된 보상의 표본의 평균을 효율적으로 계산하는 방법이다. 행동의 가치 추정치 \(...
Markdown 작성할 때 다양한 Emoji Markup이 잘 정리되어 있어서 Markdown 작성시 참고하면 좋을 것 같다 (출처). People :b...
A* Algorithm for 3D Path Finding 지금까지 Graph Search Algorithm 중에서 Breath First Algorithm, Dijkstra’s Algorithm, 그리고 A* Algorithm에 대해서 알아봤다. 이제는 알고리즘을 이용해서 조금 더 흥미로운 문제로 검증해보고자 한다. 이번에는 3D Path...
Action-value Methods A k-armed Bandit Problem 에서 우리의 목적은 Value of the action (Expected total reward)를 최대화 하는 것이다. 목적을 달성하기 위해서 우리는 참 값인 Value of the action을 모르기 때문에 추정을 통해서 계산한다. 참 값인 Value of...
A* Algorithm Path Finding을 위한 Graph Search Algorithm 중에서 Breath First Algorithm와 Dijkstra’s Algorithm는 이전에 다뤘다. 이제 마지막인 A* Algorithm이다. Breath First Algorithm은 현재 위치에서 갈 수 있는 모든 방향을 다 탐색하면서 경로...
A k-armed Bandit Problem k-armed bandit problem은 아래와 같다. Consider the following learning problem. You are faced repeatedly with a choice among k different options, or actions, After each cho...
Dijkstra’s Algorithm Graph Searching Algorithm 중에서 Breath First Algorithm을 Cost 기반으로 알고리즘을 제안한것이 Dijkstra’s Algorithm이다. Cost라는 것은 아래 그림과 같이 에베레스트산과 같은 극한 지형이 있을 때 산을 가로 질러가는 것보다 산아래를 둘러가는 것이 ...
Git Alias 설정으로 편하게 하기 Git의 주요 command를 매번 수행할 때 마다 칠려면 성가신 일이다. 기존의 특정 파일을 repository에 추가하는 것은 아래와 같이 3단계를 거친다. 터미널을 열고 현재의 Local Directory에서 변경사항을 적용한다 변경 사항을 repository로 commit 이를 ...
Optimization & Loss Function 일반적으로 최적화를 위해서는 최적화 대상을 설정해야한다. 알고리즘에서는 참값과 예측값의 차이를 최적화 대상으로 선정하고 이를 Loss한다. 일반적으로 L1 loss와 L2 loss가 가장 잘 알려져있다. L1 Loss는 아래와 같이 정의된다. [Loss...
GitHub Blog와 Google Analytics 연동 Github Blog 자체적인 조회수에 대한 통계를 제공하지 않는다. Github Blog에 대한 통계를 도출하고 싶을 때 Google Analytics를 이용하면 가능하다. 연동 방법 먼저 Google Analytics에 가입을 해서 아래 그림의 순서대로 수행한다. 4...