Post

인공지능 구조 원리 - 기초

인공지능 구조 원리 - 기초

인공지능 구조 원리 교과서 책을 읽고 이해한 인공지능의 기초 지식 글 입니다.

빅데이터와 인공지능

머신러닝도 데이터를 활용하는 방법 중 하나이다.

  • 빅데이터는 패러다임(어떤 한 시대 사람들의 견해나 사고를 근본적으로 규정하고 있는 테두리로서의 인식 체계)에 대한 이야기이지 기술적 물리적 관점에서 ‘데이터양’을 논하는 주제가 아니다.
  • 패러다임 : 정보화 기술의 발전에 따라 정보화 기술의 발전에 따라 다양하고 풍부한 데이터를 자원으로 인식하고 분석해 가치를 발굴하자

머신러닝

정의: 경험을 통해 자동으로 성능을 향상시키는 컴퓨터 알고리즘의 연구 (wiki)

  • 인공지능의 목표 : 인공지능으로 인간의 지적 능력을 구현하는 것
  • 머신러닝의 목표 : 학습을 통해 성능을 향상시킬 수 있는 기계 시스템을 구현하는 것
    • 정답에 근접한 가중치(영향도) 조합을 기계가 자동으로 찾아내도록 하는 것

선형회귀

머신러닝의 가장 기초 모델

EX) 고혈압이 발병할 가능성이 높은 환자를 예측해보자.

  • 고혈압 발생에 영향을 미치는 원인들 : 식습관, 체중, 평소 운동량 등등 문제에 영향을 주는 요소들 => x1, x2, x3 변수로 표기
  • 각 변수가 문제 발생에 얼마나 큰 영향을 미치는지 중요도를 고려한 가중치 값 => w1, w2, w3 변수로 표기
  • 각 변수에 가중치를 곱하고, 이 항들의 합을 구해 우리가 원하는 문제의 답을 알아낼 수 있다.

이를 수식으로 표혀하면

H(x) = wx + b y = w1x1 + w2x2 + w3x3 + … wnxn + b

가설식을 얻을 수 있다.

여기서 b는 bias, 편향성, 데이터가 전체적으로 얼마나 치우쳐져 있는지 그 경향적 특성을 표현하기 위한 상수

좀 더 수학적으로 접근을 해보자.

XY
11
22
33

사과를 1개 사면 1원, 2개 사면 2원, 3개 사면 3원이라고 하면 y = 1 * X + 0 직선으로 표현할 수 있다. => y = wx + b 와 같은 일차 함수

선형 회귀: 어떤 현상을 선형적으로 표현

  • 그런데 가설식으로 계산기 프로그램을 사용하는 것은 아니다.
  • 계산 규칙을 주지 않고 단순히 1일 때 1, 2일 때 2, 3일 3과 같은 데이터만 주고 5일 때에는 얼마인지를 추측하는 기능을 구현하려는 것이다.
  • 즉, 확률적으로 추측해야 한다.
  • 따라서 답을 최대한 근사치로 뽑아낼 수 있는 최적의 수식을 찾아내는 것이 일반적인 머신러닝의 목표가 된다.

손실 비용 산출

현재 가설식이 얼마나 틀렸는지를 알려주자.

  • 처음에 컴퓨터는 가설식 이외에 아무런 정보가 없으므로 w와 b를 랜덤값으로 설정한다.
  • 대략 y = 0.3x + 12로 설정
  • 그럼 이제 y = 1x + 0이라는 수식이 되기 위해 컴퓨터에게 현재의 가설식이 틀렸다는 것을 알려줘야 한다.
  • 틀렸다는 것은 정답 데이터(1 => 1, 2 => 2, 3 => 3)로 알려줄 수 있다.
  • 그러면 현재 가설식이 ‘얼마나 틀렸는지’를 알려줄 수 있다.
  • 이것을 cost 또는 loss라고 한다.

손실 비용 산출 이미지

  • 손실 비용을 단순하게 그냥 더하면 서로 상쇄돼 제대로 된 cost를 구할 순 없으므로 모두 제곱 처리해 더하는 것

경사하강법

이제 손실 비용이 0에 가까워지도록 해야 정답에 가까워지므로, 컴퓨터가 cost = 0인 w값을 찾도록 해줘야 한다. 이차함수 그래프에서 cost가 0인 w값을 찾기 위해서는 현재의 w를 cost가 0이 될 때까지 계속 이동시키면 된다. 이때 cost가 0일 때에 기울기는 0이 될 것이고, 기울기를 구하는 방법은?? 미분이다.

  • 경사하강법 : 기울기를 이용해 차근차근 이동한다, 경사 타고 내려가기 알고리즘
  • 경사하강법을 이용해 cost가 0인 지점을 컴퓨터가 ‘자동으로’ 찾아가는 행위를 ‘기계가 학습한다’, ‘cost가 0에 가까운 w에 도착했다’ => ‘학습이 끝났다’

즉, ‘기계가 학습한다’라는 행위는 문제 해결에 적합한 예측식의 가중치를 컴퓨터가 자동으로 찾아가는 행위, 데이터를 보면서 컴퓨터가 에측식의 정확도를 높여가는 과정을 말한다.

경사하강법 이미지

다항선형회귀, 이진분류, 다중분류 등 해결해야할 문제에 따라 가설식이 각각 다르다.

This post is licensed under CC BY 4.0 by the author.

Trending Tags