1. 상태 공간과 탐색
※ 상태(state)
- 특정 시점에 문제의 세계가 처해 있는 모습
※ 세계(world)
- 문제에 포함된 대상들과 이들의 상황을 포괄적으로 지칭
※ 상태 공간(state space)
- 문제 해결 과정에서 초기 상태로부터 도달할 수 있는 모든 상태들의 집합
- 문제의 해가 될 가능성이 있는 모든 상태들의 집합
- 초기 상태(initial state)
· 문제가 주어진 시점의 시작 상태
- 목표 상태(goal state)
· 문제에서 원하는 최종 상태
※ 상태 공간 그래프(state space graph)
- 상태공간에서 각 행동에 따른 상태의 변화를 나타낸 그래프
· 노드 : 상태
· 링크 : 행동
- 일반적인 문제에서는 상태공간이 매우 큼
· 미리 상태 공간 그래프를 만들기 어려움
· 탐색과정에서 그래프 생성
※ 탐색(search)이란?
- 문제의 해(sulution)가 될 수 있는 것들의 집합을 공간(space)으로 간주하고, 문제에 대한 최적의 해를 찾기 위해 공간을 체계적으로 찾아 보는 것
Ex) 선교사-식인종 강건너기 문제, 8-퍼즐 문제, 8-퀸(queen)문제, 틱-택-토(tic-tac-toe), 순회 판매자 문제(traveling salesperson problem), 루빅스 큐브(Rubik's cube)
2. 맹목적 탐색
- 정해진 순서에 따라 상태 공간 그래프를 점차 생성해 가면서 해를 탐색하는 방법
※ 깊이 우선 탐색(depth-first search, DFS)
- 초기 노드에서 시작하여 깊이 방향으로 탐색
- 목표 노드에 도달하면 종료
- 더 이상 진행할 수 없으면, 백트랙킹(backtracking, 되짚어가기)
- 방문한 노드는 재방문하지 않음
- 8-퍼즐 문제에서 루트 노드에서 현재 노드까지의 경로 하나만 유지
- 메모리 공간 사용 효율적
- 최단 경로 해 탐색 보장 불가
※ 너비 우선 탐색(breadth-first search, BFS)
- 초기 노드에서 시작하여 모든 자식 노드를 확장하여 생성
- 목표 노드가 없으면 단말노드에서 다시 자식 노드 확장
- 8-퍼즐 문제에서 전체 트리를 메모리에서 관리
- 최단 경로 해 탐색 보장
- 메모리 공간 사용 비효율
※ 반복적 깊이 심화 탐색(iterative-deepening search)
- 깊이 한계가 있는 깊이 우선 탐색을 반복적으로 적용
- 최단 경로 해 보장
- 메모리 공간 사용 효율적
- 반복적인 깊이 우선 탐색에 따른 비효율성
· 실제 비용이 크게 늘지 않음
· 각 노드가 10개의 자식노드를 가질 때, 너비 우선 탐색 대비 약 11%정도 추가 노드 생성
- 맹목적 탐색 적용시 우선 고려 대상
※ 양방향 탐색(bidirectional search)
- 초기 노드와 목적 노드에서 동시에 너비 우선 탐색을 진행
- 중간에 만나도록 하여 초기 노드에서 목표 노드로의 최단 경로를 찾는 방법
3. 정보이용 탐색(맹목적 탐색과 대비)
※ 휴리스틱 탐색
- 휴리스틱(heuristic)
· 그리스어로 찾다, 발견하다
· 시간이나 정보가 불충분하여 합리적인 판단을 할 수 없거나, 굳이 체계적이고 합리적인 판단을 할 필요가 없는 상황에서 신속하게 어림짐작하는 것
Ex) 최단 경로 문제, 8-퍼즐 문제, 8-퀸 문제
※ 언덕 오르기 방법(hill climb method)
- 지역 탐색, 휴리스틱 탐색
- 현재 노드에서 휴리스틱에 의한 평가값이 가장 좋은 이웃 노드 하나를 확장해 가는 탐색 방법
- 국소 최적해에 빠질 가능성
※ 최상 우선 탐색(best-first search)
- 확장중인 노드들 중에서 목표 노드까지 남은거리가 가장 짧은 노드를 확장하여 탐색
- 남은 거리를 정확히 알 수 없으므로 휴리스틱 사용
· 제자리가 아닌 타일의 개수
※ 빔 탐색(beam search)
- 휴리스틱에 의한 평가값이 우수한 일정 개수의 확장 가능한 노드만을 메모리에 관리하면서 최상 우선 탐색을 적용
※ A* 알고리즘
- 추정한 전체 비용 f(n)을 최소로 하는 노드를 확장해 가는 방법
- f(n) : 노드 n을 사용하는 전체 비용
· 현재 노드 n까지 이미 투입된 비용 g(n)과 목표 노드까지의 남은 비용 h(n)의 합
· f(n) = g(n) + h(n)
- h(n) : 남은 비용의 정확한 예측 불가
· h'(n) : h(n)에 대응하는 휴리스틱 함수
- f'(n) : 노드 n을 경유하는 추정 전체 비용
· f'(n) = g(n) + h'(n)
4. 게임 탐색
※ 게임 트리(game tree)
- 상대가 있는 게임에서 자신과 상대방의 가능한 게임 상태를 나타낸 트리
· 틱-택-톡(tic-tac-toc), 바둑, 장기, 체스 등
- 게임의 결과는 마지막에 결정
- 많은 수(lookhead)를 볼 수록 유리
※ mini-max 알고리즘(mini-max algorithm)
- MAX 노드
· 자신에 해당하는 노드로 자기에게 유리한 최대값 선택
- MIN 노드
· 상대방에 해당하는 노드로 최소값 선택
- 단말 노드부터 위로 올라가면서 최소-최대 연산을 반복하여 자신이 선택할 수 있는 방법 중 가장 좋은 값을 결정
※ a(알파)-B(베타) 가지치기(prumming)
- 검토해 볼 필요가 없는 부분을 탐색하지 않도록 하는 기법
- 깊이 우선 탐색으로 제한 깊이까지 탐색을 하면서, MAX 노드와 MIN 노드의 값 결정
· a(알파) - 자르기 : MIN 노드의 현재값이 부모노드의 현재 값보다 작거나 같으면, 나머지 자식 노드 탐색 중지
· B(베타) - 자르기 : MAX 노드의 현재값이 부모노드의 현재 값보다 크거나 같으면, 나머지 자식 노드 탐색 중지
※ 몬테카를로 시뮬레이션(Monte Carlo Simulation)
- 특정 확률 분포로부터 무작위 표본을 생성하고, 이 표본에 따라 행동을 하는 과정을 반복하여 결과를 확인
- 이러한 결과확인 과정을 반복하여 최종 결정을 하는 것
※ 몬테카를로 트리 탐색(Monte Carlo Tree Search, MCTS)
- 탐색 공간을 무작위 표본추출을 하면서, 탐색트리를 확장하여, 가장 좋아 보이는 것을 선택하는 휴리스틱 탐색 방법
- 4개 단계(선택, 확장, 시뮬레이션, 역전파)를 반복하여 시간이 허용하는 동안 트리 확장 및 시뮬레이션
※ 알파고의 몬테카를로 트리 탐색(Monte Carlo Tree Search, MCTS)
- 바둑판 형세 판단을 위한 한가지 방법으로 몬테카를로 트리 검색 사용
- 무작위로 바둑을 두는 것이 아니라, 프로 바둑기사들을 기보를 학습한 확장 정책망이라는 간단한 계산모델을 사용
- 확률에 따라 착수를 하여 몬테카를로 시뮬레이션을 반복하여 해당 바둑판에 대한 형세판단값 계산
- 별도로 학습된 딥러닝 신경망인 가치망을 사용하여 형세판단값을 계산하여 함께 사용
- 많은 수의 몬테카를로 시뮬레이션과 딥러닝 모델의 신속한 계산을 위해 다수의 CPU와 GPU를 이용한 분산처리
5. 제약조건 만족 문제
- 주어진 제약조건을 만족하는 조합 해를 찾는 문제
Ex) 8-퀸(queen) 문제
※ 탐색 기반의 해결방법
- 백트랙킹 탐색
- 제약조건 전파
※ 백트랙킹 탐색(backtracking search)
- 깊이 우선 탐색을 하는 것처럼 변수에 허용되는 값을 하나씩 대입
- 모든 가능한 값을 대입해서 만족하는 것이 없으면 이전 단계로 돌아가서 이전 단계의 변수에 다른 값을 대입
※ 제약조건 전파(constraint propagation)
- 인접 변수 간의 제약 조건에 따라 각 변수에 허용될 수 없는 값들을 제거하는 방식
6. 최적화
- 여러가지 허용되는 값을 중에서 기준을 가장 잘 만족하는 것을 선택하는 것
※ 목적함수(objective function)
- 최소 또는 최대가 되도록 만들려는 함수
※ 조합 최적화(combinatorial optimization)
- 순회 판매자 문제(TSP)와 같이 주어진 항목들의 조합으로 해가 표현되는 최적화 문제
· 순회 판매자 문제의 목적함수 : 경로의 길이
※ 유전 알고리즘(genetic algorithm, GA)
- 생물의 진화를 모방한 집단 기반의 확률적 탐색 기법(John holland, 1975)
- 대표적인 진화 연산(evolutionary computation)의 하나
· 유전 알고리즘, 유전자 프로그래밍(genetic programming), 진화 전략(evolutionary strategy)
- 생물의 진화
· 염색체의 유전자들이 개체 정보 코딩
· 적자생존 / 자연선택
ㅇ 환경에 적합도가 높은 개체의 높은 생존 및 후손 번성 가능성
ㅇ 우수 개체들의 높은 자손 증식 기회
ㅇ 열등 개체들도 작지만 증식 기회
· 집단의 진화
ㅇ 세대 집단의 변화
· 형질 유전과 변이
ㅇ 부모 유전자들의 교차 상속
ㅇ 돌연변이에 의한 변이
- 생물 진화와 문제 해결
· 개체 <-> 후보 해(candidate solution)
· 환경 <-> 문제(problem)
· 적합도 <-> 해의 품질
- 부모 개체 선택
· 높은 적합도의 개체가 새로운 개체를 생성할 확률이 높도록 함
· 적합도에 비례하는 선택확률
- 유전 연산자 : 새로운 개체 생성
· 교차 연산자
· 돌연변이 연산자
- 세대 교체
· 엘리트 주의(elitism)
ㅇ 우수한 개체를 다음 세대에 유지
※ 메타 휴리스틱(meta heuristics)
- 최적해는 아니지만 우수한 해를 빠르게 찾기 위한 휴리스틱적인 문제해결 전략
- 유전 알고리즘(genetic algorithm)
- 모방 알고리즘(memetic algorithm)
- 입자 군집 최적화(particle swarm optimization, PSO)
- 개미 집단 알고리즘(ant colony algorithm)
- 타부 탐색(Tabu search)
- 담금질 기법(simulated annealing)
- 하모니 탐색(Harmonic search)
- 유전 프로그래밍(genetic programming)
※ 함수 최적화(function optimization)
- 어떤 목적 함수가 있을 때, 이 함수를 최대로 하거나 최소로 하는 변수 값을 찾는 최적화 문제
※ 제약조건 최적화(constrained optimization)
- 제약 조건을 만족시키면서 목적함수를 최적화시키는 변수값들을 찾는 문제
- 기계학습 방법인 SVM의 학습에서 사용
※ 회귀(regression) 문제의 최적 함수
- 주어진 데이터를 가장 잘 근사하는 함수
- 최소 평균제곱법
· 오차 함수 또는 에너지 함수를 최소로 하는 함수를 찾는 방법
※ 경사 하강법
- 함수의 최소값 위치를 찾는 문제에서 오차 함수의 그레디언트 반대 방향으로 조금씩 움직여 가며 최적의 파라미터를 찾으려는 방법
- 그레디언트
- 데이터의 입력과 출력을 이용하여 각 파라미터에 대한 그레디언트를 계산하여 파라미터를 반복적으로 조금씩 조정
※ 최대 경사법
- 회귀 모델, 신경망 등의 기본 학습 방법
- 국소해(local minima)에 빠질 위험
- 개선된 형태의 여러 방법 존재
'인공지능' 카테고리의 다른 글
[인공지능] 명제 논리(논리식, 논리기호, 논리표) (0) | 2020.04.05 |
---|---|
[인공지능] 지식표현과 추론(프레임) (0) | 2020.04.05 |
[인공지능] 인공지능의 연구 분야(요소 기술, 주요 응용) / 인공지능의 최근 동향 / 인공지능의 영향 (0) | 2020.03.18 |
[인공지능] 인공지능이란 무엇일까? / 인공지능의 역사 (0) | 2020.03.17 |