본문 바로가기

기계학습

[기계학습] 규제(데이터 확대, 가중치 감쇠) / 기계학습의 유형 / 그라운드 트루스(Ground truth)란?

규제1. 데이터 확대 

- 데이터를 더 많이 수집하면(훈련집합의 크기가 커지면) 일반화 능력이 향상

- 데이터 수집은 많은 비용이 듦

   · 그라운드 트루스(Ground Truth)를 사람이 일일이 레이블링해야 함

※ 그라운드 트루스(Ground Truth) : 이미지나 동영상에 있는 객체를 파악하기 위해 라벨링을 하는 작업

 

- 인위적으로 데이터 확대

   · 원시데이터(Raw Data)를 충분히 수집하기 어려운 상황에서는 훈련집합에 있는 샘플을 변형하여 훈련 데이터수를 확대하는 방법을 사용할 수 있음

   · 예: 이동, 회전, 크기 변형 등의 방법 적용

 

2. 가중치 감쇠

- 가중치를 작게 해줌으로써 일반화 능력을 향상시키려는 것이 목적

- 가중치 감쇠는 개선된 목적함수를 이용하여 가중치를 작게 조절하는 규제 기법

 

 

 

기계학습의 유형

1. 지도 학습

- 특징 벡터 X와 목표값 Y가 모두 주어진 상황

- 회귀와 분류 문제로 구분

- 분류 문제 예 : iRIS, MNIST

 

2. 비지도 학습

- 특징 벡터 X는 주어지는데 목표값 Y가 주어지지 않는 상황

- 군집화 과업 (고객 성향에 따른 맞춤 홍보 응용 등)

- 밀도 추정, 특징 공간 변환 과업

 

3. 준지도 학습

- 일부는 X와 Y를 모두 가지지만, 나머지는 X만 가진 상황

- 정보화 사회의 발전으로 X의 수집은 쉽지만, Y는 수작업이 필요하여 최근 중요성 부각

 

4. 강화 학습

- 목표값이 주어지는데, 지도 학습과 다른 형태임

- 예) 알파고 - 바둑 : 수를 두는 행위가 샘플인데, 게임이 끝나면 목표값 하나가 부여(이기면 +1, 지면 -1)

- 게임을 구성한 샘플들 각각에 목표값을 나누어 줌