인공지능 구조 원리3 - 기초

Posted Jun 8, 2026

By junsu

10 min read

인공지능 구조 원리3 - 기초

이미지 인식의 대표 모델

이미지로부터 의미 있는 정보를 추출하는 기술인 컴퓨터 비전 분야의 대표적 모델

CNN의 학습 방법

CNN은 학습해야 할 가중치를 ‘가로세로 넓이는 갖는 하나의 작은 면 형태의 세트’로 구성한다. 이걸 가중치 집합으로 본다. 가중치 집합을 CNN에서는 필터라 부르는데, 이 필터가 주어진 이미지를 스캐닝해서 각 화소가 갖는 특성을 주변 화소돌의 특성과 함께 학습한다.

그림2에서는 3X3 크기의 필터로 스캐닝하고, 필터의 칸 수가 9개이므로, 가운데 화소를 중심으로 주변 8개 화소들의 특성이 하나의 특성값으로 만들어진다.
필터가 읽어낸 특성값들을 나열하면 이 역시 다시 하나의 시트가 된다.
이렇게 픽셀을 하나로 묶어 그중 가장 큰 값을 취하는 방법으로 정보를 압축하거나, 아니면 또다시 필터를 적용해 특성을 읽어내는 행위를 반복하면 결국 마지막에는 하나의 숫자 하나가 된다.
이렇게 만들어지는 숫자는 주어진 이미지를 정의하는 특성값으로 사용할 수 있다.

그럼 필터는 어떻게 학습되는 걸까?

연속성이 있는 데이터에 특화된 모델

앞뒤 데이터 사이에 연관성이 있는 데이터, 시간적 또는 공간적 연속성을 갖는 데이터와 같이 ‘이전 데이터가 다음 데이터에 영향을 주는’ 데이터세트에 적합한 모델

앞뒤 데이터 사이에 연관성이 있는 데이터세트를 학습해, 그 연관성을 고려한 예측을 수행하는 모델

RNN은 트랜스포머, BERT, GPT와 같은 대규모 언어 모델들의 할아버지 격인 모델이기도 하다.

소위 ‘레이블’이 있는 데이터세트를 이용해 컴퓨터가 문제와 답을 같이 보면서 학습하는 방법

RNN은 왜 지도학습인가?

별도의 레이블 정보가 없이, 정답이 따로 제공되지 않는 데이터로부터 컴퓨터가 스스로 학습하는 방법

K-means

주어진 데이터를 분석해 특성이 유사한 데이터들을 자동으로 그룹화하는 알고리즘 ex) 고객 유형 분류, 데이터의 이상치 탐지, 문서 분류 등

인위적인 지도 정보를 주지 않은 상태(비지도)에서 컴퓨터가 자동으로 데이터를 그룹화하는 기법

GAN

육안으로는 진짜와 구분이 불가능한 가짜 인물 사진 생성 모델

진짜와 유사한 가짜 데이터를 생성하는 생성자(generator), 진짜와 가짜를 판별하는 역할을 하는 감별자(discriminator)가 서로 경쟁하도록 하는 독특한 방식의 학습 방법
생성자가 진짜 같은 가짜 데이터를 생성해 감별자에게 전달하는데, 이떄 감별자에게는 진짜 데이터가 주어질 수도, 생성자가 만든 가짜 데이터가 주어질 수도 있다.
감별자는 주어진 데이터가 진짜인지 가짜인지 맞혀야 한다.
생성자는 감별자를 속이지 못한 데이터의 특성을 계속 학습해 감별자가 맞히기 어렵게 계속 발전하고, 감별자 또한 생성자가 만든 가짜의 특성을 계속 학습해서 판별 능력을 올린다.

생성자는 진짜와 가짜의 구분이 사실상 불가능한 수준의 산출물을 만들고, 감별자가 맞히는 확률이 50%, 즉, 찍는거나 다름없는 수준이 된면 학습은 마무리된다.

학습 데이터 없이 시행착오를 통해 컴퓨터가 학습하는 방법

This post is licensed under CC BY 4.0 by the author.

Trending Tags