scree plot1 PCA, 주성분 분석 PCA란?Principal Component Analysis의 약자로 데이터셋의 차원을 축소하여 분산(정보)을 최대한으로 보존하면서 상관관계가 있는 변수를 독립적인 주성분으로 변환하는 과정이다. 고차원의 데이터를 저차원으로 바꾸면서 4차원이나 5차원 혹은 그 이상의 차원에 해당하는 데이터셋을 시각화할 수 있다. 이를 통해 중요한 패턴을 찾을 수 있고, 노이즈를 제거할 수 있다. PCA의 원리PCA는 데이터의 분산을 최대화하는 방향으로 축(선)을 찾고, 데이터들을 축 위에 투영하여 분산을 반영한다. 2차원의 경우 데이터가 가장 넓게 퍼져있는 방향이고, 3차원 이상의 경우 이전 주성분에 대하여 직교하는 방향 중 가장 큰 분산을 다음의 주성분이 설명한다. 수학적으로 PCA는 공분산 행렬과 고유값을 이용하여 적.. 2025. 1. 22. 이전 1 다음