이번 포스팅에서는 토픽모델링(Topic modeling) 알고리즘 중 대표적인 Latent Dirichlet Allocation (잠재 디리클레 할당, LDA)알고리즘을 알아보고, R로 구현해보겠습니다.
살다보니 R을 쓰게되는 날도 오네요. 물론 아직 Python이 훨씬 편하긴 합니다, 앞으로도 계속 Python을 이용할 것 같구요…
[Read More]
Word2vec from scratch using keras
본 글에서는 Word2vec의 개녑을 간단히 알아보고, Keras 등을 이용하여 구현해보도록 하겠습니다.
(그림은 없습니다…꾸준히 정성들여 그림 수식 다 넣어서 포스팅하시는분들 진짜 존경…)
[Read More]
Nearly everything of information theory
그동안 대략적으로 느낌만 알고 있던 정보이론에 대해서, 공부하고 정리할 일이 생겼는데
생각보다 재밌는 개념이고 정리도 잘 된것 같아서 만든 ppt를 그대로 이미지로 첨부합니다.
[Read More]
A introduction of fastText
이번 글에서는 2017년쯤 핫했던(걸로 기억되는) fastText와 그 사용법에 대해서 정리한다.
[Read More]
Dimension reduction with sci-kit learn
2018 Spring Data Analytics @Dept. of Industrial engineering
Dimension reduction
Contents
Principal component analysis (PCA)
Truncated singular value decomposition and latent semantic analysis
Non-negative matrix factorization (NMF or NNMF)
Latent Dirichlet Allocation (LDA)
Another dimension reduction method for Visualization
[Read More]