기계학습

기계학습의 개요

기계학습의 정의

환경과의 상호 작용을 통해 데이터로부터 경험과 컴퓨터 알고리즘을 이용항 자신의 동작을 개선하는 시스템 연구 기술

기계학습의 등장 배경

  1. 비지니스 측면: 대량의 데이터로부터 일반적인 규칙을 발견하는 데이터 마이닝부터, 사용자의 관심사항을 배우는 필터링 시스템까지 사업영역 다양
  2. 정보기술 측면: 인공지능 기술의 급속한 발전, 소프트웨어 개발 기술 및 하드웨어 기술 발전

기계학습의 원리

  1. 균등의 원리(Principle of Indifference): 차이 증명할 데이터 관측 전에는 구별하지 않음
  2. 오캄의 원리(Principle of Occam’s Razor): 주어진 데이터를 설명하는 범위 내에서는 단순 모델을 선호함
  3. 양보의 원리(Principle of No Free Lunch): 학습 알고리즘의 효율과 성능은 서로 양보해야 하는 관계임

기계학습의 학습구조 및 유형

기계학습의 학습구조

기계학습의 알고리즘의 유형

유형 내용 알고리즘 활용 예시
지도학습(Supervised Learning) 입력을 출력으로 사상하는 함수를 학습하는 과정
이미 유형(class)을 구분짓는 속성(attribute)을 갖는 주어진 데이터 집합으로부터 유형을 구분하는 함수적 모델(model)을 찾아 유형을 구분짓는 속성을 갖지 않는 새로운 데이터의 유형을 구분하는 기술
Bayesian classification
Decision tree
Regression
Neural Network
hidden Markov model(HMM)
이미지 인식
OCR(이미지 문자 인식)
음성인식
NLP(자연어 인식)
추세예측(회귀분석)
비지도 학습(Unsupervised Learning) 출력이 없기에 입력 패턴들에 공통 특성 식별
유형(class)을 구분짓는 속성(attribute)을 갖지 않는 주어진 데이터 집합(training set)으로부터 데이터 자체의 상호 유사성(likelihood or distance)을 통하여 유형을 구분하는 함수적 모델(model)을 찾아 새로운 데이터의 유형을 구분하는 기술
K-Means clustering
Nearest Neighbor Clustering
EM clustering
Self-organizing feature map (SOM)
Principal component analysis (PCA)
Independent Component Analysis (ICA)
마케팅의 고객 세분화
개체의 분토 특성 분석
News Summarizing
강화학습(Reinforcement Learning) 입력에 대해 행동을 선택하고 그 행동에 대해 보상치 제공하여 학습하는 과정
데이터의 상태(state)를 인식하고 이에 반응한 행위(action)에 대하여 환경으로부터 받는 포상(reward)을 학습하여 행위에 대한 포상을 최적화 하는 정책(model)을 찾는 기술
Brute force
Monte Carlo methods
Markov Decision Processes
Value Functions
Q-Learning
Dynamic Programming
로봇제어
게임 개인화
공적 최적화

기계학습의 분류 및 구현

기계학습의 분류

분류 모델 특성
모델구축 방식 변별 모델 차이점 위주로 학습, 차별적, 분류적, 인식, 대부분의 감독학습
~ 생성 모델 유사점 위주로 학습, 묘사적, 설명적, 요인분석, 밀도 추정, 주로 무감독 학습
모델표현 방식 암묵적 학습 무의식적, 절차적인 과정에 의해 기억됨. 주로 반복적인 훈련 과정을 거침. 수치적 표상. 모델 파라미터 습득
~ 명시적 학습 의식적, 선언적 표현으로 기억됨. 일회적 학습이 가능. 기호적 표상. 모델 구조 학습
데이터획득 방식 정적 학습 학습 데이터가 고정됨. 일시적 반복 학습, 수동적 학습, 고전적인 감독 학습과 무감독 학습.
~ 동적 학습 학습 데이터가 시간에 따라 변함. 강화 학습, 온라인 학습, 점진적 학습, 능동 학습

기계학습의 구현 방법

구현방법 설명
신경망 생명체 신경조직에서 착안
단순한 소자들의 병렬, 분산 연결구조를 가지고 있음
외부로부터 받아들이는 입력에 대하여 동적 반응을 일으켜 필요한 출력을 생성
데이터 마이닝 대랑의 데이터로부터 새롭고 의미있는 정보를 추출하여 의사결정에 활용
의사결정트리 일련의 속성을 가진 객체(Object)나 상황(Situation)을 입력으로 취해 Yes/No의 결정을 출력
유전 알고리즘 자연계 생물의 유전과 진화의 매커니즘을 공학적으로 모델링
자연도태의 원리를 기초로 한 최적화(Optimization) 방법
사례기반 추론(Case Based Reasoning) 유사한 과거의 해결에 기초해서 새로운 문제를 해결하는 과정
패턴인식 데이터로부터 중요한 특징이나 속성을 추출하여 입력 데이터를 식별할 수 있는 부류로 Classification
강화학습(Reinforcement) 잘한 행동에 대해 칭찬 받고 잘못한 행동에 대해 벌을 받는 경험을 통해 자신의 지식을 습득
로봇은 어떤 상태에서 가능한 행동 중 하나를 선택, 이 결과에 따른 포상(reward)을 받고 나서 다음 상태를 알게 됨

기계학습의 응용분야

  1. 음소와 단어 인식, 신호 해석
  2. 무인 자동차 운전, 센서기반 제어 등
  3. 천제 물체 분류, Decision Tree Learning 기법 사용
응용 분야 적용 사례
인터넷 정보검색 텍스트 마이닝, 웹로그 분석, 스팸 필터링, 문서 분류, 여과, 추출, 요약, 추천
컴퓨터 시각 문자 인식, 패턴 인식, 물체 인식, 얼굴 인식, 장면전환 검출, 화상 복구
음성인식/언어처리 음성 인식, 단어 모호성 제거, 번역 단어 선택, 문법 학습, 대화 패턴 분석
모바일 HCI 동작 인식, 제스처 인식, 휴대기기의 각종 센서 정보 인식, 떨림 방지
생물정보학 유전자 인식, 단백질 분류, 유전자 조절망 분석, DNA 칩 분석, 질병 진단
바이오메트릭스 홍채 인식, 심장 박동수 측정, 혈압 측정, 당뇨치 측정, 지문 인식
컴퓨터 그래픽 데이터기반 애니메이션, 캐릭터 동작 제어, 역운동학, 행동 진화, 가상현실
로보틱스 장애물 인식, 물체 분류, 지도 작성, 무인자동차 운전, 경로 계획, 모터 제어
서비스업 고객 분석, 시장 클러스터 분석, 고객 관리(CRM), 마케팅, 상품 추천
제조업 이상 탐지, 에너지 소모 예측, 공정 분석 계획, 오류 예측 및 분류