Posts
Bekay
Cancel

Python 3.11 Python3.11 release되면서 많은 관심을 받고있다. 가장 큰 이유는 속도 측면에서 큰 개선이 있다. The Faster CPython Project is already yielding some exciting results. Python 3.11 is up to 10-60% faster than Python...

Force Directed Method에 관한 게시물은 Universität Trier의 Philipp Kindermann 교수 강의를 바탕으로 작성하였습니다. Visualization of Graph 데이터는 다양한 형태 및 특성을 가지고 있습니다. 특정 데이터셋은 Graph로 표현하는 것이 그 특성을 표현하는데 있어서 유리합니다. 예를 들...

169. Majority Element Solution class Solution: def majorityElement(self, nums): num_list = sorted(set(nums)) for selec_num in num_list: if nums.count(se...

KL Divergence는 무엇인가? Kullback-Leibler divergence(KL Divergence)는 하나의 확률분포로부터 다른 하나의 확률분포가 얼마나 다른지를 정량화한다. Bayesian theory에서 true distribution $P(X)$가 있을 때, 우리는 $P(X)$를 approximate distribution...

GPU Out of Memory Issue Pytorch를 이용하여 모델을 개발하면 아마 한번쯤은 “GPU Out of Memory”를 마주친다. GPU에 대한 이해가 깊다면, 금방 해결할 수 있지만 그렇지 않으면 당황하기 딱 좋은 Error다. 나의 경험은 강화학습을 학습을 할 때, Policy Gradient 기반 Learner를 학습할...

Diagrams: Diagram as Code Python Code만으로 Design tools 없이 전문가 처럼 깔끔한 Diagram을 그릴 수 있는 Lib이 있어서 소개한다. Diagrams 기본적으로 AWS,Azure,Kubernetes,Alibaba Cloud,Oracle Cloud의 diagram을 제공하며, Custom도 가능하다...

Objective Function Policy gradient의 objective는 결국 exptected return의 maximization! [\begin{equation} J(\theta_\pi) = \underset{\tau \sim \pi_\theta}{\mathbb{E}} [R(\tau)] \tag{1} \ \end{equation}...

Markdown LaTex Symbols 논문에서 나오는 수식들을 정리할때 자주 등장하는 symbols 위주로 정리! (내가 볼려고 하는 정리…ㅋㅋㅋ) Symbol Expression Symbol Expression \(\sum_{t=1}^{T}\) ...

Python: super() 클래스 상속 :clipboard: Code를 작성하다보면 먼저 작성한 Class를 활용하면 좋을 때가 있다. 예를 들면, 기존에 작성한 Class에서 구현한 함수를 지금 작성하는 Class에서 끌어다가 쓰고싶을 때이다. 이럴떄 사용하는 방법이 클래스 상속 super()이다. 예제를 하나 만들어보면, 먼저 더하기,...

Exploration in Reinforcement Learning 강화학습에서는 Exploration(탐험)이 굉장히 중요하다. Action value estimation에는 불확실성이 항상 존재하기 때문에 Exploration을 통해서 궁극적 학습 목표를 달성하고자 한다. ε-greedy method가 Exploration과 Exploit...