본문 바로가기
혁신기업&투자분석

AI는 어떻게 글을 쓰게 되었는가: GPU와 거대 언어모델 탄생의 비밀 part1

by hunique 2025. 4. 27.

최근 인공지능이 창작하는 글이 사람과 구별하기 어려울 정도로 자연스러워졌다는 소식이 곳곳에서 들려온다.
AI가 그린 그림이 예술 대회에서 입상하고, AI가 작성한 문장이 온라인에서 큰 반향을 불러일으키는 시대가 도래한 것이다.

그러나 과연 인공지능은 어떻게 ‘글쓰기’라는 인간 고유의 창조적 활동을 흉내낼 수 있게 되었을까.
그리고 이러한 흐름을 이해하는 것이, 인간이 더 나은 글쓰기를 위해 무엇을 훈련해야 하는지에 대한 실마리를 제공할 수 있을까.

본 포스팅에서는
GPU의 발전이 AI 창작 능력을 어떻게 끌어올렸는지,
이미지 생성 기술과 거대 언어모델(GPT)의 탄생 과정,
AI가 글을 쓰는 방식의 본질에 대해 심도 있게 살펴본다.


1. GPU: 인공지능 창작 시대를 연 조용한 혁명
GPU(Graphics Processing Unit)는 원래 컴퓨터 그래픽 처리를 위해 개발된 칩이었다.
게임 그래픽이나 3D 렌더링처럼, 복잡하지만 단순 반복이 많은 작업을 빠르게 처리하는 데 최적화된 장치였다.

이러한 GPU의 강점은 뜻밖에도 인공지능 분야에서 혁신을 일으켰다.
AI, 특히 딥러닝은 수많은 곱셈과 덧셈 연산병렬로 처리하는 구조를 갖는데, GPU는 본질적으로 이러한 연산에 매우 적합했던 것이다.

CPU가 소수의 코어로 복잡한 문제를 순차적으로 해결하는 반면,
GPU는 수천 개의 코어를 활용하여 단순한 계산을 동시에 대량으로 처리한다.
덕분에 딥러닝 모델의 학습 속도는 비약적으로 빨라졌으며,
복잡하고 거대한 신경망도 현실적으로 구축할 수 있게 되었다.

GPU의 등장은 인공지능 연구를 실험실 수준에서 상업적, 실용적 수준으로 끌어올린 결정적 전환점이었다.
GPT를 비롯한 거대 언어모델의 탄생 역시, 이 기반 위에서 가능했다.


2. AI는 어떻게 이미지를 그리게 되었는가: GAN과 Diffusion 혁명
GPU의 연산력을 바탕으로 인공지능은 단순한 분류 작업을 넘어 창작을 시도하게 되었다.
특히 2014년 등장한 GAN(Generative Adversarial Network, 생성적 적대 신경망)은 AI가 현실감 있는 이미지를 생성할 수 있는 길을 열었다.

GAN은 ‘생성자’와 ‘판별자’라는 두 개의 신경망이 경쟁하는 구조를 가진다.
생성자는 가짜 이미지를 만들어내고, 판별자는 그것이 진짜인지 가짜인지 구별한다.
이 경쟁 과정이 반복될수록 생성자는 판별자를 속일 만큼 정교한 이미지를 만들어내게 된다.

GAN 이후, 보다 발전된 기술로 Diffusion Model(확산 모델)이 주목받기 시작했다.
확산 모델은 초기에는 무작위 노이즈 이미지를 만들고, 이를 점진적으로 선명한 이미지로 복원해나가는 방식이다.
DALL-E 2, Stable Diffusion과 같은 시스템이 바로 이러한 기술을 기반으로 작동한다.

이제 인공지능은 단순히 기존의 그림을 모방하는 수준을 넘어,
텍스트로 설명된 장면을 읽고 창의적으로 이미지를 생성하는 단계에 도달했다.
예컨대, "여름 저녁의 바다 위를 나는 고래"와 같은 추상적이고 복합적인 장면을 만들어낼 수 있다.

이는 AI가 단순한 데이터 복제 수준을 넘어, 패턴을 조합하고 새로운 표현을 만들어내는 능력을 갖추었음을 의미한다.


3. 거대 언어모델 GPT: AI가 글을 쓰게 된 과정
이미지 생성 기술의 발전과 함께, AI는 글쓰기 영역에서도 눈부신 발전을 이뤄냈다.
그 중심에는 OpenAI가 개발한 GPT 시리즈가 있다.

• GPT-2 (2019): 대규모 텍스트 데이터를 학습하여, 자연스러운 문장을 이어가는 능력을 확보했다.
• GPT-3 (2020): 1,750억 개에 달하는 파라미터를 통해, 예시 몇 개만 보고도 다양한 작업을 수행할 수 있는 'few-shot learning' 능력을 갖추었다.
• GPT-4 (2023): 단순한 문장 생성은 물론, 복잡한 추론, 창의적 문제 해결, 긴 맥락 이해까지 가능하게 되었다.

GPT는 본질적으로,
방대한 데이터를 학습하여 패턴을 추출하고, 문맥에 맞는 다음 단어를 예측하는 시스템이다.

즉, 인간처럼 글의 의미를 '이해'하는 것이 아니라,
"이러한 문맥에서는 통계적으로 이런 단어가 등장할 확률이 높다"는 식으로 다음 말을 선택한다.

결과적으로 GPT가 생성하는 글은 매우 자연스럽고 일관성 있게 보일 수 있으나,
그 깊은 층위에서는 의도나 감정, 목적이 부재한 '패턴 기반 생성물'에 가깝다.


📝마무리: 다음 회차 예고
이제 우리는 인공지능이 GPU와 이미지 생성 기술, 그리고 거대 언어모델을 통해
어떻게 인간처럼 '글을 쓰는 것처럼' 보이게 되었는지를 살펴보았다.

하지만 본질적인 질문은 여전히 남아 있다.
"인간은 어떻게 글을 쓰는가?"
"AI와 인간 글쓰기의 결정적 차이는 무엇인가?"

다음 포스팅에서는
인공신경망과 인간의 뇌신경 구조를 비교하며,
인간 글쓰기의 본질과, 글을 잘 쓰기 위해 인간이 어떤 능력을 훈련해야 하는지를 심층적으로 분석할 예정이다.