산업 전반에 결합하고 있는 생성형AI (1)편 – 개념, 동향 

2023-11-17

생성형AI에 대한 관심이 식을 줄 모르고 계속되고 있습니다. 2022년 11월 등장한 챗GPT 열풍이 바야흐로 생성형AI 시대를 연 것이죠. 생성형AI란 무엇이고, 제조 분야에 미칠 영향력은 어떤 모습일까요? 

 

생성형AI(Generative AI)란?

(1) 개념 

생성형AI는 주어진 데이터를 기반으로 새로운 콘텐츠를 출력하는 능력을 가진 인공지능의 한 유형입니다. 이러한 AI 시스템은 자연어 처리, 이미지 생성, 음성 생성 등 다양한 분야에서 활용될 수 있으며, 기존 데이터나 규칙에 의존하지 않고 창의적이고 다양한 결과물을 생성할 수 있습니다. 앞의 두 문장도 대표적인 생성형 인공지능인 챗GPT로 만든 결과물이죠. 

생성형AI는 머신러닝 모델을 사용해서 사람이 만든 기존 콘텐츠의 패턴을 학습합니다. 그런데 기존 머신러닝 모델이 학습한 패턴을 기반으로 예측된 결과를 내놓았다면, 생성형AI는 여기서 한걸음 더 나아갑니다. 입력된 데이터의 속성을 모방하는 새로운 데이터, 즉 새로운 콘텐츠를 생성합니다. 

(2) 원리 

생성형 모델은 고차원의 데이터가 저차원의 ‘잠재 변수(latent variable)’에 의해 생성된다고 가정합니다. 예를 들어, 얼굴이 그려지려면 성별, 나이, 피부색, 머리 스타일, 표정 같은 겉모습 뿐만 아니라 배경, 바람, 빛 등 주변 상황도 고려해야 하는데요. 이렇게 사물과 상황의 모습을 결정하는 조건을 잠재 변수라고 합니다. 생성형 모델은 데이터 학습을 통해 이런 잠재 변수의 확률분포를 추정합니다. 그리고 나면, 본래 데이터와 같은 확률적 특성을 갖는 새로운 데이터를 임의로 생성할 수 있게 됩니다. 

생성형AI 모델의 종류

생성형AI는 기본적으로 머신러닝의 하위 범주인 딥러닝으로 구성됩니다. 딥러닝이란 인간 두뇌의 뉴런을 모방해 상호 연결된 수많은 계층으로 구성된 알고리즘이고요. 생성형AI의 초석은 같지만, 세부적으로는 다양한 종류가 존재합니다. 각각 고유한 특성이 있으며, 서로 다른 응용 분야에 적합합니다. 대표적으로 알려진 세 가지를 소개하겠습니다. 

(1) 대규모 언어 모델(LLM, Large Language Model) 

LLM은 방대한 텍스트 데이터를 학습하는 생성형AI 모델입니다. 챗GPT(Generative Pretrained Transformer)가 대표적이죠. 트랜스포머(Transformer) 아키텍처를 활용해 주어진 프롬프트(사용자가 언어 모델에 입력한 것)를 이해하고 답변을 생성합니다. 트랜스포머는 딥러닝 인공신경망 중 하나로, 순환신경망(RNN)의 한계를 극복하기 위해 만들어졌습니다. 

더 자세히 설명하자면 다음과 같습니다. RNN은 직렬처리로 순서에 맞게 학습하는 특징이 있습니다. 가령 왼쪽에서 오른쪽으로, 정해진 방향대로 언어를 처리하죠. 이 때문에 단어의 거리가 멀수록 관계를 잘 파악하지 못해 오역이 자주 발생했습니다. 반면 트랜스포머는 ‘셀프 어텐션(Self-Attention)’이라 불리는 방식을 사용합니다. 병렬처리를 통해 하나의 단어를 문장의 다른 모든 단어와 비교하는 방식인데요. 단어들 간의 관계를 아주 잘 파악해 냅니다. 즉, 입력이 아무리 길어도 중요한 모든 부분에 주의(Attention)를 기울일 수 있게 만든 것이죠. 

트랜스포머는 구글의 2017년 논문(Attention Is All You Need)[1]에서 처음 소개됐는데요. 미국 스탠퍼드대 연구팀은 2021년 8월에 발표한 논문에서 트랜스포머를 ‘기반 모델(foundation model)’로 칭했습니다[2]. 트랜스포머가 AI의 패러다임 변화를 견인하고 있다고 봤기 때문입니다. 

생성형AI 알고리즘 가운데 대규모 언어 모델 트랜스포머 아키텍처의 원리를 설명하는 그림

RNN은 직렬처리로 순서에 맞게 학습합니다. 이 때문에 단어의 거리가 멀수록 관계를 잘 파악하지 못합니다. 반면 트랜스포머는 ‘셀프 어텐션(Self-Attention)’이라 불리는 방식을 사용합니다. 병렬처리를 통해 하나의 단어를 문장의 다른 모든 단어와 비교합니다. 단어들 간의 관계를 아주 잘 파악해 냅니다. – 이미지 출처: 아하랩스

 

 

(2) 생성형 적대 신경망(GAN, Generative Adversarial Networks) 

GAN은 생성기(Generator)와 판별기(Discriminator)라는 두 가지 신경망으로 구성됩니다. 생성기는 새로운 데이터를 만들어내고, 판별기는 이 데이터의 진위 여부를 평가하죠. 두 신경망이 콘텐츠의 품질을 향상하기 위해 서로 경쟁하는 셈입니다. 

과정은 이렇습니다. 먼저 진짜 데이터를 가지고 판별기를 학습시킵니다. 판별기는 훈련 데이터의 분포를 얻습니다. 이번엔 노이즈를 가미해 생성기에서 가짜 데이터를 만들어냅니다. 처음에는 한 눈에 봐도 가짜라는 걸 알 수 있을 정도로 품질이 낮은 데이터가 나옵니다. 판별기는 이를 가짜라고 구별하겠죠. 그런 뒤 오차를 고려해 생성기는 조금 더 진짜와 가까운 데이터를 만들어냅니다. 이를 반복해 학습 데이터 분포를 따라갑니다. 그 결과 매우 사실적인 데이터를 생성하는 데 능숙해집니다. 

GAN에서 생성기는 새로운 데이터를 만들어내고, 판별기는 이 데이터의 진위 여부를 평가합니다. 두 신경망이 콘텐츠의 품질을 향상하기 위해 서로 경쟁하는 셈입니다. – 이미지 출처: 아하랩스

 

   

(3) 변이형 오토인코더(VAE, Variational Autoencoder) 

원본 데이터를 목적에 맞는 잠재변수로 추론하는 과정을 인코딩, 이렇게 부호화된 데이터를 다시 원본 데이터 형태로 복원하는 과정을 디코딩이라고 부릅니다. 이렇게 인코더와 디코더로 이뤄진 신경망을 ‘오토인코더’라고 합니다. 

신경망 가운데 오토인코더의 원리를 설명하는 그림

원본 데이터를 목적에 맞는 잠재변수로 추론하는 과정을 인코딩, 이렇게 부호화된 데이터를 다시 원본 데이터 형태로 복원하는 과정을 디코딩이라고 부릅니다. 이렇게 인코더와 디코더로 이뤄진 신경망을 ‘오토인코더’라고 합니다. – 이미지 출처: Jeremy Jordan 이미지 재구성, 아하랩스

 

여기서 한걸음 더 나아간 ‘변이형 오토인코더’는 확률 및 생성 개념이 추가로 활용되는 알고리즘입니다. 기본 오토인코더는 각 잠재변수에 대해 하나의 값을 출력하지만, 변이형 오토인코더는 각 잠재변수에 대한 확률분포를 출력합니다. 그리고 이로부터 잠재변수 값을 랜덤하게 뽑은 뒤, 이를 토대로 디코더(생성기)가 보통처럼 디코딩 합니다. 디코더에서 완전히 새로운 데이터를 생성하기 위해 개발된 모델입니다.

변이형 오토인코더의 원리를 설명하는 그림

기본 오토인코더는 각 잠재변수에 대해 하나의 값을 출력하지만, 변이형 오토인코더는 각 잠재변수에 대한 확률분포를 출력합니다. 그리고 이로부터 잠재변수 값을 랜덤하게 뽑은 뒤 디코딩 합니다. – 이미지 출처: Jeremy Jordan 이미지 재구성, 아하랩스

 

2024년, 새로운 개념의 결함 이미지 생성 기능을 만나보세요

동향 : 출시부터 진화까지 

2022년부터 기업들이 경쟁적으로 생성형AI 서비스를 출시하면서 연구 영역에 머물던 생성형AI가 본격적으로 산업 영역에서 확장되기 시작했습니다. 

(1) 생성형AI의 부상 

2022년 상반기부터 주로 텍스트를 이미지로 변환해주는 서비스가 출시되었습니다. OpenAI의 달리2(DALLE2), 구글의 이마젠(Imagen), 미드저니(Midjourney) 등입니다. 특히 20228월 스태빌리티AI가 스테이블 디퓨전(Stable Diffusion)을 오픈소스 라이선스로 배포하면서 경쟁이 본격 심화되었죠. 그리고 202211월, OpenAILLM 기반 인공지능 챗봇 서비스인 챗GTP가 출시되었습니다. 챗GPT는 두 달 만에 월 이용자 1억 명을 돌파하면서 생성형AI의 대중화 가능성을 보여주었습니다.  

(2) 검색 시장 판도 변화 

마이크로소프트는 생성형AI를 이용해 구글 독점이었던 검색 시장에 도전장을 내밀었습니다. 자사 검색엔진 빙(Bing)에 GPT-4를 결합해 엣지 브라우저를 통해 제공한 것이죠. 구글은 이에 대응하여 구글 바드(Bard)를 출시했고요. 과거 검색 시장은 ‘정확한 검색’이 가장 중요했는데요, 이제 생성형AI와 결합되어 ‘신뢰할 만한 생성 정보’를 제공한다는 새로운 패러다임으로 전환하고 있습니다. 

(3)챗봇에서플랫폼으로 진화[3] 

20233월에는 OpenAI의 플러그인이 출시됐습니다. 플러그인은 외부 서비스와 연결하는 ‘서드 파티(Third-party)’ 유형과 ‘자체 제공 서비스’로 나뉩니다. 특히 서드 파티 유형은 내외부 혁신을 끌어들이는 생태계 구축에 유리합니다. 하나의 태스크를 완료하기 위해 여러 플랫폼을 거쳐 수행해야 했던 작업을 이제는 챗GPT 안에서 모두 수행할 수 있게 됐죠. 즉, 여러 서비스를 연결하는 하나의 ‘플랫폼’으로 진화한 것입니다. 챗GPT의 출현이 2007년 ‘아이폰 모멘텀’에 비교됐다면, 챗GPT 플러그인 생태계는 AI 시대의 ‘앱스토어’로 비유할 수 있습니다.[4] 

(4) 누구나맞춤 GPT제작 및 판매 

오픈AI는 2023년 11월 6일, ‘GPT-4 터보’를 공개했습니다. 이 버전은 최신 데이터를 기반으로 학습됐고, 책 3000페이지 분량을 단일 프롬프트로에서 처리할 수 있습니다. 게다가 이미지를 이해해 설명하고 오디오를 생성하기까지 합니다.   

특히 주목할 만한 점은 누구나 개인 맞춤형 챗GPT를 만들 수 있다는 것입니다. 바로 ‘GPT 빌더’입니다. 코딩을 전혀 몰라도 대화와 업로드 방식으로 누구나 특정 작업에 맞는 인공지능 비서를 만들 수 있습니다. 월 20달러 유료 서비스인 ‘챗GPT 플러스’ 사용자만 이용할 수 있는데요.[5] GPT모델을 누구나 쉽게 사고 팔 수 있게 하는 마켓 플레이스인 ‘GPT 스토어’에 대한 구상도 나왔습니다. 오픈AI의 CEO 샘 올트먼은 “장기적으로 특정 모델에 대해서 사람들이 많이 구매하면 인센티브를 주는 ‘매출 분배’를 계획하고 있다”고 소개했습니다.[6] 

 뜨거운 감자, 생성형AI의 저작권 침해 문제

생성형AI는 학습을 위한 콘텐츠 수집 과정에서 반드시 콘텐츠를 복제하고 전송합니다. 원칙적으로 저작권자의 이용 허락을 받아야 하지만 생성형AI는 대부분 웹상에 있는 뉴스 콘텐츠 등을 허락 없이 학습에 활용합니다. 그래서 그간 생성형AI가 저작권을 침해하고 있다는 지적이 제기되어 왔죠.   

실제로 LLM 개발사를 상대로 한 작가들의 저작권 침해 소송이 증가하고 있습니다. ‘캐벌리어와 클레이의 놀라운 모험’으로 2001년 퓰리처상을 받은 작가 마이클 샤본 등은 2023년 9월, 오픈AI와 메타를 저작권법 위반으로 제소했습니다. 이들 기업이 불법 복제 버전이 포함된 데이터셋을 사용해 LLM을 훈련했다는 것이었죠. 챗GPT의 정보 수집을 차단하는 언론사도 늘어나고 있습니다. 정제된 정보가 논리적으로 작성돼 있는 뉴스 콘텐츠는 LLM 학습에 유용한 데이터로 꼽힙니다.[7] AI 개발사들은 저작권이 있는 자료를 배포해 직접 이익을 추구하는 것이 아니기 때문에 저작권법 위반이 아니라는 입장인데요. 전문가들은 이에 부정적입니다. 오픈AI만 하더라도 유료 서비스를 통해 수익 창출 구조를 갖췄기 때문입니다. AI 시대 저작권 공방은 이제 본격적으로 시작되는 추세입니다. 

 

 

‘산업 전반에 결합하고 있는 생성형AI (2)편 – 적용 사례’에서 계속됩니다.

Chloe Woo | Content Strategist

Related Stories

산업용AI 솔루션 LISA로 완벽한 실시간 이상 탐지를 경험해 보세요

산업용AI 솔루션 LISA로 완벽한 실시간 이상 탐지를 경험해 보세요

전세계 제조 업계의 스마트팩토리 전환이 가속화되면서 머신 비전을 이용한 검사 자동화, 실시간 이상 탐지, 예지보전에 대한 관심이 뜨겁습니다. 특히 반도체나 이차전지 등 혁신 제조산업 현장에서는 하루에도 수천 수만 개의 부품·제품들이 생산되는데, 사람이 불량을 일일이 찾아낸다는 것이 불가능에 가까워졌죠. 또한, 이제 고객들은 미묘한 결함도 용납하지 않기 때문에 이 요구를 충족시키려면 신속하고 정확하게 불량을 짚어내는 AI 검사 자동화가 필수입니다. 아하랩스의 LISA(Look...

Why Data CAMP Is the Ultimate Choice for Digital Twins

Why Data CAMP Is the Ultimate Choice for Digital Twins

The idea of a digital twin is to address real-world problems by rendering the physical world visible within a digital environment. Three key technologies are essential for creating a digital twin: Virtualization: This involves modeling the physical world in a virtual...

Data CAMP를 활용해 디지털 트윈의 첫걸음을 내디뎌 보세요

Data CAMP를 활용해 디지털 트윈의 첫걸음을 내디뎌 보세요

디지털 트윈 = 데이터를 가시화하여 현실의 문제를 해결한다   최근 화두로 떠오른 디지털 트윈은 디지털 환경에서 물리적인 현장을 모두 ‘가시화’해서 현실의 문제를 해결한다는 것이 핵심입니다. 디지털 트윈을 구현하는 데에는 핵심 기술 3가지가 필요한데요. 각각 물리 세계를 가상 세계에 모델링하는 가상화, 현실의 변화하는 각종 데이터를 실시간으로 반영하는 동기화, 그리고 모델링과 실시간 데이터를 활용해 해결하고자 하는 문제에 대한 최적의 답을 도출해내는 시뮬레이션입니다....

외부 데이터와 연결되는 검색증강생성(RAG) – 보안 문제는?

외부 데이터와 연결되는 검색증강생성(RAG) – 보안 문제는?

빠르게 발전하는 AI 기술과 더불어 RAG는 다양한 AI 시스템의 핵심 요소로 자리 잡을 것입니다. 하지만 반드시 해결해야 할 큰 문제가 있는데요, 바로 보안입니다. https://ahha.ai/2024/07/24/rag/ RAG가 다루는 최신 데이터는 기업 내부의 민감한 정보를 포함할 수 있습니다. 따라서 소스 데이터 암호화뿐만 아니라 벡터 저장소, 임베딩 모델, LLM 등의 시스템 구성 요소가 외부에 노출되지 않도록 방지하는 강력한 보안이 필요합니다. RAG가 특히 퍼블릭...

검색증강생성(RAG)으로 다양한 제조 문제를 신속하게 해결하세요 – 도메인별 활용 사례

검색증강생성(RAG)으로 다양한 제조 문제를 신속하게 해결하세요 – 도메인별 활용 사례

검색증강생성(RAG; Retrieval-Augmented Generation) 기술은 검색과 생성의 장점을 결합하여 사용자가 필요로 하는 정보를 보다 정확하고 신속하게 제공합니다. 특히 실시간으로 업데이트 되는 방대한 데이터 속에서 유의미한 정보를 추출할 때 매우 유용하죠. 이러한 장점을 기반으로 다양한 도메인에 접목되고 있습니다.   → [검색증강생성(RAG; Retrieval-Augmented Generation)이란? -개념, 장점] 아티클 먼저 읽어보기 ...

검색증강생성(RAG; Retrieval-Augmented Generation)이란? -개념, 장점 

검색증강생성(RAG; Retrieval-Augmented Generation)이란? -개념, 장점 

주말에 짧은 여행을 계획하려고 합니다. "서울 근교 당일치기 여행지"를 검색했더니 수십 개의 블로그 포스팅과 관광 웹사이트가 나옵니다. 하지만 광고성 글이 많아서 실제 방문자들의 후기와 팁을 찾기가 어렵습니다. 원하는 정보에 도달하기까지 여러 링크를 클릭하고 시간을 소비해야 하죠. 이처럼 기존의 검색 시스템은 사용자의 요구를 충분히 충족시키지 못하는 경우가 많았습니다. 특히 복잡한 의료 정보나 금융 정보 등을 검색할 때 그 어려움이 더 컸고요. 최근 AI 분야에서 주목받고...

웹 프론트엔드 개발자 (4년 이상)

Summary 경력(4-8년) 채용 형태 : 정규직 마감일 : 상시 채용 근무지 : 경기도 성남시 분당구 성남대로 43번길 10 (하나EZ타워) 712호 이런 일을 함께 합니다 자사에서 개발한 Smart Factory Solution의 프론트를 개발하는 업무를 수행합니다. UI Application을 위한 API 제공과, Model을 위한 데이터 변환 및 결과 처리가 주 업무입니다. 스마트 팩토리용 비전 검사 솔루션 - 프론트엔드 개발 음성 변환 솔루션 - 웹 프론트엔드...

멀티모달 대형비전언어모델(LVLM)을 활용한 산업용 이상감지 사례 

멀티모달 대형비전언어모델(LVLM)을 활용한 산업용 이상감지 사례 

✓ 대형언어모델(LLM) 아티클 먼저 읽어보기 멀티모달 트렌드 혹시 코를 막고 양파를 먹는 실험에 대해 아시나요? 실험에 참가한 많은 사람들이 본인이 먹고 있는 것이 양파인지 알아채지 못했을 뿐만 아니라, 심지어 사과를 먹고 있는 것 같다고 답한 사람도 있었습니다. 혀로 느껴지는 화학적인 맛(미각)과 식감(촉각), 그리고 냄새(후각) 정보가 모두 있어야 종합적인 음식의 맛을 느낄 수 있다는 것이 실험의 요지였죠. 너무 당연한 말이지만, 인공지능 역시 다양한 정보가 들어가야 더...

대형언어모델(LLM; Large Language Model)이 제조업을 혁신하는 방법

대형언어모델(LLM; Large Language Model)이 제조업을 혁신하는 방법

Industry 5.0, 디지털 전환(DX), 끝없는 기술 발전으로 정의되는 시대에 제조 분야는 혁신의 문턱에 서 있습니다. 이러한 변화의 핵심에는 단연 AI가 있는데요. 특히 챗GPT로 대변되곤 하는 대규모 언어 모델(LLM, Large Language Model)은 제조 현장을 엄청나게 변화시킬 잠재력이 있는 것으로 기대됩니다. 이번 아티클에서는 복잡한 인간의 언어와 각종 도메인 지식을 학습하고 생성하는 능력으로 유명한 LLM이 제조 분야에서 어떤 역할을 할 수 있는지...

설명 가능한 AI④ 제조업 활용 사례

설명 가능한 AI④ 제조업 활용 사례

"AI와 사람의 완벽한 협업 사례다" 제조 분야에서 XAI의 중요성을 설명하는 설득력 있는 사례 연구는 Siemens의 현장 실험에서 나왔습니다. 전자 제품의 비전 품질검사에서 두 그룹의 성과를 비교하한 연구인데요. 첫 번째 그룹은 기존 '블랙박스' AI의 도움을 받았고, 두 번째 그룹은 잠재적인 품질 문제에 대한 예측을 설명하기 위해 시각적 히트맵을 제공하는 AI의 도움을 받았습니다. 결과는 놀라웠습니다. 첫번째 그룹 작업자는 AI가 제공한 권장 사항을 무시할 가능성이 3배...