비지도학습(非指導學習, Unsupervised Learning)은
인공지능과
머신러닝의 한 방법으로, 입력 데이터에 대한 명확한 정답(레이블) 없이 모델을 학습시키는 과정이다.
비지도학습에서는 데이터의 구조나 패턴을 분석하고, 숨겨진 관계를 찾아내는 데 중점을 둔다. 대표적인 기법으로는
군집화(Clustering),
차원 축소(Dimensionality Reduction),
연관 규칙 학습(Association Rule Learning) 등이 있으며, 고객 세분화, 이상 탐지, 데이터 시각화 등의 분야에서 활용된다.
지도 학습과는 달리 정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화 하여 새로운 데이터에 대한 결과를 예측하는 방법을 비지도학습 이라고 합니다. 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하기 때문에 지도학습보다는 조금 더 난이도가 있다고 할 수 있습니다. 실제로 지도 학습에서 적절한 피처를 찾아내기 위한 전처리 방법으로 비지도 학습을 이용하기도 합니다.
비지도학습의 대표적인 종류는 클러스터링(Clustering)이 있습니다. 이 외에도 Dimentionality Reduction, Hidden Markov Model이 있습니다. 예를 들어 여러 과일의 사진이 있고 이 사진이 어떤 과일의 사진인지 정답이 없는 데이터에 대해 색깔이 무엇인지, 모양이 어떠한지 등에 대한 피처를 토대로 바나나다, 사과다 등으로 군집화 하는 것입니다.
지도/비지도 학습 모델(Semi-Supervised Learning)을 섞어서 사용할 수도 있습니다. 소량의 분류된 데이터를 사용해 분류되지 않은 더 큰 데이터 세트를 보강하는 방법으로 활용할 수 도 있습니다.