생성형 AI(Generative AI)는
컴퓨터가 데이터를 학습하여 새로운 데이터를 생성할 수 있는 인공지능 기술로,
단순히 기존 데이터를 분석하는 수준을 넘어
새로운 콘텐츠를 만드는 데 초점을 맞춘 인공지능 분야를 말한다.
따라서 생성형 AI는 사용자의 질의를 기반으로
새로운 콘텐츠(예: 텍스트, 이미지, 음악, 비디오 등)를 만드는 능력을 갖고 있다.
새로운 콘텐츠를 만드는 생성형 AI
출처: LG CNS 블로그
Generative AI Explainer
출처: https://www.aiforeducation.io/
각 영역별로 생성형 AI를 활용하여 콘텐츠를 생성하는 사례는 다음과 같다.
텍스트: 소설이나 기사와 같은 문장 생성
이미지: 사진이나 웹툰과 같은 이미지 생성
오디오: 유튜브 영상에서 자막 생성
비디오: 쇼츠와 같은 짧은 영상 생성
이와 같이 무엇인가를 생성하는 데 특화되어 있는 생성형 AI는
인공지능의 하위 영역이라고 할 수 있다.
그리고 생성형 AI의 대표적인 모델인 챗GPT(chatGPT)는
생성형 AI 중에서도 일부 영역에 해당된다.
LLM의 진화: 상호작용 및 중첩
출처: https://doi.org/10.32604/cmes.2024.052256
(2) 발전 과정
생성형 AI는 인공지능의 하위 개념으로,
본격적인 시작은 2017년에 등장한 트랜스포머(Transformer)이다.
그러다가 2022년에 챗GPT(ChatGPT)가 등장한 이후부터 생성형 AI라는 용어가 화두가 되었다.
언어 AI의 최근 역사
출처: LLM-book.com
지금의 생성형 AI를 대표하는 오픈AI의 챗GPT, 구글의 버트 등이
트랜스포머를 기반으로 해서 만들어진 모델들이다.
What is Generative AI?
생성형 AI : 생성형 AI는 텍스트, 이미지, 비디오 등 다양한 유형의 콘텐츠를 생성하는 인공지능(AI)
출처: https://colaninfotech.com/blog/what-is-generative-ai-the-complete-guide/Evolution of Generative AI
생성형 AI는 매우 최신의 기술이지만, 생성형 AI의 핵심 기술은 수 년 전에 개발된 기술이다.
출처: https://colaninfotech.com/blog/what-is-generative-ai-the-complete-guide/
▶ Transformer (트랜스포머)
Transformer는 아주 간단한 원리로 동작하는 인공지능 모델이다.
예를 들어, ‘나는 아침에 커피를 마셨다’라는 문장에서
‘커피’라는 단어는 ‘마셨다’와 밀접하게 연관되어 있다.
이처럼 단어 사이의 관계를 파악하여 문장을 생성하는 것이
Transformer의 핵심 역할이다.
트랜스포머는 Encoder(인코더)와 Decoder(디코더)라는 두 개의 영역으로 구성되어 있다.
Encoder(인코더)
입력 문장(예: ‘나는 아침에 커피를 마셨다’)을 분석하여
각 단어가 문장 내에서 어떤 역할을 하는지, 그리고
각 단어 사이의 관계는 어떤지를 파악하여
컴퓨터가 이해할 수 있는 데이터로 바꾸는 작업을 한다.
Decoder(디코더)
Encoder에서 처리된 데이터를 바탕으로
새로운 문장을 생성한다.
예를 들어, 문장을 번역하거나 요약하는 등의 작업이 Decoder의 역할이다.
Encoder는 입력 데이터를 인코딩하고(즉, 인공지능 데이터로 바꾸고),
Decoder는 인코딩된 데이터를 디코딩하는(즉, 번역하는) 역할을 맡는다.
출처: https://skkjh.tistory.com/2
트랜스포머의 또 다른 핵심 개념은 Attention(어텐션)이다.
Attention은 모델이 문장을 처리할 때,
어떤 단어들이 중요한지 결정하고 그 중요한 단어들에
‘주목(Attention)’하여 정보를 더 잘 파악하도록 돕는다.
예를 들어, ‘커피를 마셨다’에서 ‘커피’와 ‘마셨다’가 서로 중요한 관계임을 인식하고
이를 통해 문장의 의미를 더 정확하게 이해할 수 있게 된다.
간단히 말해, 트랜스포머는 1) 문장을 분석하여 단어들 사이의 중요한 관계를 파악하고,
이를 기반으로 2) 새로운 문장을 생성하거나 변환하는 인공지능 모델이다.
딥러닝 모델인 트랜스포머는 어텐션 메커니즘을 혁신적으로 활용하여 자연어 처리(NLP) 분야에 혁명을 일으켰다.
출처: https://deepai.tn/glossary/attention-is-all-you-need-explained/
(3) 유형
생성형 AI는 텍스트 생성 AI, 이미지 생성 AI, 동영상 생성 AI로 나눌 수 있다.
▶ 텍스트 생성 AI
텍스트 생성 AI는 텍스트를 입력하면 그것에 대한 텍스트를 생성하는 생성형 AI이다.
따라서 단순 텍스트 생성뿐만 아니라 요약 및 번역 등에서도 많이 사용된다.
예를 들어, 챗GPT에게 문장의 요약을 요청하면 텍스트로 요약하여 답변하는 방식이다.
▶ 이미지 생성 AI
이미지 생성 AI는 텍스트를 입력하면 그것에 대한 그림을 그려주는 생성형 AI이다.
이미지 생성과 관련한 대표적인 서비스로는 달리(DALL·E)와
미드저니(Midjourney)가 있다.
달리와 미드저니는 이미지를 사실적으로 그려서 제공하기 때문에 많은 사람이 사용하고 있다.
예를 들어, 이미지 생성 AI인 달리에게 ‘화성에서 농사짓는 사람을 그려줘(Draw a person farming on Mars)’라고 텍스트를 입력하여 요청하면 다음과 같은 이미지를 생성한다.
이미지 생성 AI의 예시: 달리(DALL·E)
출처: https://br.pinterest.com/
▶ 동영상 생성 AI
동영상 생성 AI는 텍스트를 입력하면 그것에 대한 동영상을 만들어주는 생성형 AI이다.
오픈AI에서 2024년 2월에 발표한 소라(Sora)가 대표적인 사례이다.
예를 들어, 다음 URL에 동영상 샘플이 게시되어 있으니 확인해 볼 수 있다.
동영상 생성 AI의 예시: 소라(Sora)
[YouTube]
출처: https://openai.com/sora
(4) 장점과 한계
장점
창의적인 콘텐츠 생성이 가능하다 (예: 예술, 문학, 음악).
시간과 비용을 절약하여 업무 자동화에 기여한다.
맞춤형 응답과 사용자 경험 향상에 유리하다.
한계
사실과 다른 정보를 생성할 수 있다 (Hallucination 문제).
학습 데이터의 편향이 결과물에 영향을 미칠 수 있다.
저작권, 윤리 등 법적·사회적 이슈가 존재한다.
(5) 리더 그룹
생성형 AI를 포함하여 인공지능을 주도하는 대표 기업으로는 오픈AI, 마이크로소프트, 구글 등이 있다.
▶ 오픈AI(OpenAI)
오픈AI는 미국의 인공지능 개발사로, 2015년에 설립되어 챗GPT의 개발과 연구를 주도한 기업이다.
오픈AI는 일론 머스크(Elon Musk), 샘 올트먼(Sam Altman), 그렉 브로크만(Greg Brockman), 일리야 수츠케버(Ilya Sutskever) 등이
공동 설립자이다. 오픈AI는 비영리 조직으로 시작했으나 후에 유한책임회사로 조직 구조를 변경했다.
이 변경으로 마이크로소프트를 포함하여 더 많은 투자를 유치할 수 있었다.
오픈AI에서 개발한 챗GPT가 사람들의 관심을 받으면서 이후에 발표된
GPT 시리즈(예: GPT-4) 모델 역시 주목받고 있다.
▶ 마이크로소프트(Microsoft)
마이크로소프트는 윈도우와 오피스로 유명하지만,
오픈AI에 투자하면서 본격적으로 AI 회사로 탈바꿈하고 있다.
오픈AI에서 개발한 챗GPT 역시 마이크로소프트 클라우드 플랫폼인 애저(Azure)에서 사용 가능하다.
또한, 챗GPT를 포함하여 GPT-4가 마이크로소프트의 검색엔진인 빙(Bing)에 추가되었으며,
윈도우와 오피스에도 코파일럿(Copilot)이라는 이름으로 생성형 AI 서비스가 추가되었다.
▶ 구글(Google)
구글은 원래 검색엔진으로 시작한 기술 회사지만, 인공지능 분야의 선두 주자 중 하나이다.
구글은 단순히 정보를 검색하는 도구를 넘어서 사람들의 일상생활과 업무를 지원하는
지능형 서비스를 제공하는 방향으로 발전하고 있다. 제미나이(Gemini)는 구글에서 개발한 생성형 인공지능이다.
생성형 AI 관련 시장 점유률 (2025년 3월)
출처: https://iot-analytics.com/leading-generative-ai-companies/