규제1. 데이터 확대
- 데이터를 더 많이 수집하면(훈련집합의 크기가 커지면) 일반화 능력이 향상
- 데이터 수집은 많은 비용이 듦
· 그라운드 트루스(Ground Truth)를 사람이 일일이 레이블링해야 함
※ 그라운드 트루스(Ground Truth) : 이미지나 동영상에 있는 객체를 파악하기 위해 라벨링을 하는 작업
- 인위적으로 데이터 확대
· 원시데이터(Raw Data)를 충분히 수집하기 어려운 상황에서는 훈련집합에 있는 샘플을 변형하여 훈련 데이터수를 확대하는 방법을 사용할 수 있음
· 예: 이동, 회전, 크기 변형 등의 방법 적용
2. 가중치 감쇠
- 가중치를 작게 해줌으로써 일반화 능력을 향상시키려는 것이 목적
- 가중치 감쇠는 개선된 목적함수를 이용하여 가중치를 작게 조절하는 규제 기법
기계학습의 유형
1. 지도 학습
- 특징 벡터 X와 목표값 Y가 모두 주어진 상황
- 회귀와 분류 문제로 구분
- 분류 문제 예 : iRIS, MNIST
2. 비지도 학습
- 특징 벡터 X는 주어지는데 목표값 Y가 주어지지 않는 상황
- 군집화 과업 (고객 성향에 따른 맞춤 홍보 응용 등)
- 밀도 추정, 특징 공간 변환 과업
3. 준지도 학습
- 일부는 X와 Y를 모두 가지지만, 나머지는 X만 가진 상황
- 정보화 사회의 발전으로 X의 수집은 쉽지만, Y는 수작업이 필요하여 최근 중요성 부각
4. 강화 학습
- 목표값이 주어지는데, 지도 학습과 다른 형태임
- 예) 알파고 - 바둑 : 수를 두는 행위가 샘플인데, 게임이 끝나면 목표값 하나가 부여(이기면 +1, 지면 -1)
- 게임을 구성한 샘플들 각각에 목표값을 나누어 줌
'기계학습' 카테고리의 다른 글
[기계학습] 퍼셉트론 / 가중치 / 바이어스 / 가중합(feat. 시그모이드 함수) (0) | 2020.03.29 |
---|---|
[기계학습] 선형 회귀 와 최소 제곱법, 경사하강법(오차의 합 / 평균 제곱 오차(MSE) / 평균 제곱근 오차(RMSE) (0) | 2020.03.29 |
[기계학습] 과소적합과 과잉적합 / 바이어스와 분산 (0) | 2020.03.26 |
[기계학습] 기계학습이란 무엇일까? (0) | 2020.03.17 |