산업 전반에 결합하고 있는 생성형AI (1)편 – 개념, 동향 

2023-11-17

생성형AI에 대한 관심이 식을 줄 모르고 계속되고 있습니다. 2022년 11월 등장한 챗GPT 열풍이 바야흐로 생성형AI 시대를 연 것이죠. 생성형AI란 무엇이고, 제조 분야에 미칠 영향력은 어떤 모습일까요? 

 

생성형AI(Generative AI)란?

(1) 개념 

생성형AI는 주어진 데이터를 기반으로 새로운 콘텐츠를 출력하는 능력을 가진 인공지능의 한 유형입니다. 이러한 AI 시스템은 자연어 처리, 이미지 생성, 음성 생성 등 다양한 분야에서 활용될 수 있으며, 기존 데이터나 규칙에 의존하지 않고 창의적이고 다양한 결과물을 생성할 수 있습니다. 앞의 두 문장도 대표적인 생성형 인공지능인 챗GPT로 만든 결과물이죠. 

생성형AI는 머신러닝 모델을 사용해서 사람이 만든 기존 콘텐츠의 패턴을 학습합니다. 그런데 기존 머신러닝 모델이 학습한 패턴을 기반으로 예측된 결과를 내놓았다면, 생성형AI는 여기서 한걸음 더 나아갑니다. 입력된 데이터의 속성을 모방하는 새로운 데이터, 즉 새로운 콘텐츠를 생성합니다. 

(2) 원리 

생성형 모델은 고차원의 데이터가 저차원의 ‘잠재 변수(latent variable)’에 의해 생성된다고 가정합니다. 예를 들어, 얼굴이 그려지려면 성별, 나이, 피부색, 머리 스타일, 표정 같은 겉모습 뿐만 아니라 배경, 바람, 빛 등 주변 상황도 고려해야 하는데요. 이렇게 사물과 상황의 모습을 결정하는 조건을 잠재 변수라고 합니다. 생성형 모델은 데이터 학습을 통해 이런 잠재 변수의 확률분포를 추정합니다. 그리고 나면, 본래 데이터와 같은 확률적 특성을 갖는 새로운 데이터를 임의로 생성할 수 있게 됩니다. 

생성형AI 모델의 종류

생성형AI는 기본적으로 머신러닝의 하위 범주인 딥러닝으로 구성됩니다. 딥러닝이란 인간 두뇌의 뉴런을 모방해 상호 연결된 수많은 계층으로 구성된 알고리즘이고요. 생성형AI의 초석은 같지만, 세부적으로는 다양한 종류가 존재합니다. 각각 고유한 특성이 있으며, 서로 다른 응용 분야에 적합합니다. 대표적으로 알려진 세 가지를 소개하겠습니다. 

(1) 대규모 언어 모델(LLM, Large Language Model) 

LLM은 방대한 텍스트 데이터를 학습하는 생성형AI 모델입니다. 챗GPT(Generative Pretrained Transformer)가 대표적이죠. 트랜스포머(Transformer) 아키텍처를 활용해 주어진 프롬프트(사용자가 언어 모델에 입력한 것)를 이해하고 답변을 생성합니다. 트랜스포머는 딥러닝 인공신경망 중 하나로, 순환신경망(RNN)의 한계를 극복하기 위해 만들어졌습니다. 

더 자세히 설명하자면 다음과 같습니다. RNN은 직렬처리로 순서에 맞게 학습하는 특징이 있습니다. 가령 왼쪽에서 오른쪽으로, 정해진 방향대로 언어를 처리하죠. 이 때문에 단어의 거리가 멀수록 관계를 잘 파악하지 못해 오역이 자주 발생했습니다. 반면 트랜스포머는 ‘셀프 어텐션(Self-Attention)’이라 불리는 방식을 사용합니다. 병렬처리를 통해 하나의 단어를 문장의 다른 모든 단어와 비교하는 방식인데요. 단어들 간의 관계를 아주 잘 파악해 냅니다. 즉, 입력이 아무리 길어도 중요한 모든 부분에 주의(Attention)를 기울일 수 있게 만든 것이죠. 

트랜스포머는 구글의 2017년 논문(Attention Is All You Need)[1]에서 처음 소개됐는데요. 미국 스탠퍼드대 연구팀은 2021년 8월에 발표한 논문에서 트랜스포머를 ‘기반 모델(foundation model)’로 칭했습니다[2]. 트랜스포머가 AI의 패러다임 변화를 견인하고 있다고 봤기 때문입니다. 

생성형AI 알고리즘 가운데 대규모 언어 모델 트랜스포머 아키텍처의 원리를 설명하는 그림

RNN은 직렬처리로 순서에 맞게 학습합니다. 이 때문에 단어의 거리가 멀수록 관계를 잘 파악하지 못합니다. 반면 트랜스포머는 ‘셀프 어텐션(Self-Attention)’이라 불리는 방식을 사용합니다. 병렬처리를 통해 하나의 단어를 문장의 다른 모든 단어와 비교합니다. 단어들 간의 관계를 아주 잘 파악해 냅니다. – 이미지 출처: 아하랩스

 

 

(2) 생성형 적대 신경망(GAN, Generative Adversarial Networks) 

GAN은 생성기(Generator)와 판별기(Discriminator)라는 두 가지 신경망으로 구성됩니다. 생성기는 새로운 데이터를 만들어내고, 판별기는 이 데이터의 진위 여부를 평가하죠. 두 신경망이 콘텐츠의 품질을 향상하기 위해 서로 경쟁하는 셈입니다. 

과정은 이렇습니다. 먼저 진짜 데이터를 가지고 판별기를 학습시킵니다. 판별기는 훈련 데이터의 분포를 얻습니다. 이번엔 노이즈를 가미해 생성기에서 가짜 데이터를 만들어냅니다. 처음에는 한 눈에 봐도 가짜라는 걸 알 수 있을 정도로 품질이 낮은 데이터가 나옵니다. 판별기는 이를 가짜라고 구별하겠죠. 그런 뒤 오차를 고려해 생성기는 조금 더 진짜와 가까운 데이터를 만들어냅니다. 이를 반복해 학습 데이터 분포를 따라갑니다. 그 결과 매우 사실적인 데이터를 생성하는 데 능숙해집니다. 

GAN에서 생성기는 새로운 데이터를 만들어내고, 판별기는 이 데이터의 진위 여부를 평가합니다. 두 신경망이 콘텐츠의 품질을 향상하기 위해 서로 경쟁하는 셈입니다. – 이미지 출처: 아하랩스

 

   

(3) 변이형 오토인코더(VAE, Variational Autoencoder) 

원본 데이터를 목적에 맞는 잠재변수로 추론하는 과정을 인코딩, 이렇게 부호화된 데이터를 다시 원본 데이터 형태로 복원하는 과정을 디코딩이라고 부릅니다. 이렇게 인코더와 디코더로 이뤄진 신경망을 ‘오토인코더’라고 합니다. 

신경망 가운데 오토인코더의 원리를 설명하는 그림

원본 데이터를 목적에 맞는 잠재변수로 추론하는 과정을 인코딩, 이렇게 부호화된 데이터를 다시 원본 데이터 형태로 복원하는 과정을 디코딩이라고 부릅니다. 이렇게 인코더와 디코더로 이뤄진 신경망을 ‘오토인코더’라고 합니다. – 이미지 출처: Jeremy Jordan 이미지 재구성, 아하랩스

 

여기서 한걸음 더 나아간 ‘변이형 오토인코더’는 확률 및 생성 개념이 추가로 활용되는 알고리즘입니다. 기본 오토인코더는 각 잠재변수에 대해 하나의 값을 출력하지만, 변이형 오토인코더는 각 잠재변수에 대한 확률분포를 출력합니다. 그리고 이로부터 잠재변수 값을 랜덤하게 뽑은 뒤, 이를 토대로 디코더(생성기)가 보통처럼 디코딩 합니다. 디코더에서 완전히 새로운 데이터를 생성하기 위해 개발된 모델입니다.

변이형 오토인코더의 원리를 설명하는 그림

기본 오토인코더는 각 잠재변수에 대해 하나의 값을 출력하지만, 변이형 오토인코더는 각 잠재변수에 대한 확률분포를 출력합니다. 그리고 이로부터 잠재변수 값을 랜덤하게 뽑은 뒤 디코딩 합니다. – 이미지 출처: Jeremy Jordan 이미지 재구성, 아하랩스

 

2024년, 새로운 개념의 결함 이미지 생성 기능을 만나보세요

동향 : 출시부터 진화까지 

2022년부터 기업들이 경쟁적으로 생성형AI 서비스를 출시하면서 연구 영역에 머물던 생성형AI가 본격적으로 산업 영역에서 확장되기 시작했습니다. 

(1) 생성형AI의 부상 

2022년 상반기부터 주로 텍스트를 이미지로 변환해주는 서비스가 출시되었습니다. OpenAI의 달리2(DALLE2), 구글의 이마젠(Imagen), 미드저니(Midjourney) 등입니다. 특히 20228월 스태빌리티AI가 스테이블 디퓨전(Stable Diffusion)을 오픈소스 라이선스로 배포하면서 경쟁이 본격 심화되었죠. 그리고 202211월, OpenAILLM 기반 인공지능 챗봇 서비스인 챗GTP가 출시되었습니다. 챗GPT는 두 달 만에 월 이용자 1억 명을 돌파하면서 생성형AI의 대중화 가능성을 보여주었습니다.  

(2) 검색 시장 판도 변화 

마이크로소프트는 생성형AI를 이용해 구글 독점이었던 검색 시장에 도전장을 내밀었습니다. 자사 검색엔진 빙(Bing)에 GPT-4를 결합해 엣지 브라우저를 통해 제공한 것이죠. 구글은 이에 대응하여 구글 바드(Bard)를 출시했고요. 과거 검색 시장은 ‘정확한 검색’이 가장 중요했는데요, 이제 생성형AI와 결합되어 ‘신뢰할 만한 생성 정보’를 제공한다는 새로운 패러다임으로 전환하고 있습니다. 

(3)챗봇에서플랫폼으로 진화[3] 

20233월에는 OpenAI의 플러그인이 출시됐습니다. 플러그인은 외부 서비스와 연결하는 ‘서드 파티(Third-party)’ 유형과 ‘자체 제공 서비스’로 나뉩니다. 특히 서드 파티 유형은 내외부 혁신을 끌어들이는 생태계 구축에 유리합니다. 하나의 태스크를 완료하기 위해 여러 플랫폼을 거쳐 수행해야 했던 작업을 이제는 챗GPT 안에서 모두 수행할 수 있게 됐죠. 즉, 여러 서비스를 연결하는 하나의 ‘플랫폼’으로 진화한 것입니다. 챗GPT의 출현이 2007년 ‘아이폰 모멘텀’에 비교됐다면, 챗GPT 플러그인 생태계는 AI 시대의 ‘앱스토어’로 비유할 수 있습니다.[4] 

(4) 누구나맞춤 GPT제작 및 판매 

오픈AI는 2023년 11월 6일, ‘GPT-4 터보’를 공개했습니다. 이 버전은 최신 데이터를 기반으로 학습됐고, 책 3000페이지 분량을 단일 프롬프트로에서 처리할 수 있습니다. 게다가 이미지를 이해해 설명하고 오디오를 생성하기까지 합니다.   

특히 주목할 만한 점은 누구나 개인 맞춤형 챗GPT를 만들 수 있다는 것입니다. 바로 ‘GPT 빌더’입니다. 코딩을 전혀 몰라도 대화와 업로드 방식으로 누구나 특정 작업에 맞는 인공지능 비서를 만들 수 있습니다. 월 20달러 유료 서비스인 ‘챗GPT 플러스’ 사용자만 이용할 수 있는데요.[5] GPT모델을 누구나 쉽게 사고 팔 수 있게 하는 마켓 플레이스인 ‘GPT 스토어’에 대한 구상도 나왔습니다. 오픈AI의 CEO 샘 올트먼은 “장기적으로 특정 모델에 대해서 사람들이 많이 구매하면 인센티브를 주는 ‘매출 분배’를 계획하고 있다”고 소개했습니다.[6] 

 뜨거운 감자, 생성형AI의 저작권 침해 문제

생성형AI는 학습을 위한 콘텐츠 수집 과정에서 반드시 콘텐츠를 복제하고 전송합니다. 원칙적으로 저작권자의 이용 허락을 받아야 하지만 생성형AI는 대부분 웹상에 있는 뉴스 콘텐츠 등을 허락 없이 학습에 활용합니다. 그래서 그간 생성형AI가 저작권을 침해하고 있다는 지적이 제기되어 왔죠.   

실제로 LLM 개발사를 상대로 한 작가들의 저작권 침해 소송이 증가하고 있습니다. ‘캐벌리어와 클레이의 놀라운 모험’으로 2001년 퓰리처상을 받은 작가 마이클 샤본 등은 2023년 9월, 오픈AI와 메타를 저작권법 위반으로 제소했습니다. 이들 기업이 불법 복제 버전이 포함된 데이터셋을 사용해 LLM을 훈련했다는 것이었죠. 챗GPT의 정보 수집을 차단하는 언론사도 늘어나고 있습니다. 정제된 정보가 논리적으로 작성돼 있는 뉴스 콘텐츠는 LLM 학습에 유용한 데이터로 꼽힙니다.[7] AI 개발사들은 저작권이 있는 자료를 배포해 직접 이익을 추구하는 것이 아니기 때문에 저작권법 위반이 아니라는 입장인데요. 전문가들은 이에 부정적입니다. 오픈AI만 하더라도 유료 서비스를 통해 수익 창출 구조를 갖췄기 때문입니다. AI 시대 저작권 공방은 이제 본격적으로 시작되는 추세입니다. 

 

 

‘산업 전반에 결합하고 있는 생성형AI (2)편 – 적용 사례’에서 계속됩니다.

우아영 아하랩스 책임연구원

Related Stories

산업용AI 솔루션 LISA로 완벽한 실시간 이상 탐지를 경험해 보세요

산업용AI 솔루션 LISA로 완벽한 실시간 이상 탐지를 경험해 보세요

전세계 제조 업계의 스마트팩토리 전환이 가속화되면서 머신 비전을 이용한 검사 자동화, 실시간 이상 탐지, 예지보전에 대한 관심이 뜨겁습니다. 특히 반도체나 이차전지 등 혁신 제조산업 현장에서는 하루에도 수천 수만 개의 부품·제품들이 생산되는데, 사람이 불량을 일일이 찾아낸다는 것이 불가능에 가까워졌죠. 또한, 이제 고객들은 미묘한 결함도 용납하지 않기 때문에 이 요구를 충족시키려면 신속하고 정확하게 불량을 짚어내는 AI 검사 자동화가 필수입니다. 아하랩스의 LISA(Look...

Why Data CAMP Is the Ultimate Choice for Digital Twins

Why Data CAMP Is the Ultimate Choice for Digital Twins

The idea of a digital twin is to address real-world problems by rendering the physical world visible within a digital environment. Three key technologies are essential for creating a digital twin: Virtualization: This involves modeling the physical world in a virtual...

Data CAMP를 활용해 디지털 트윈의 첫걸음을 내디뎌 보세요

Data CAMP를 활용해 디지털 트윈의 첫걸음을 내디뎌 보세요

디지털 트윈 = 데이터를 가시화하여 현실의 문제를 해결한다   최근 화두로 떠오른 디지털 트윈은 디지털 환경에서 물리적인 현장을 모두 ‘가시화’해서 현실의 문제를 해결한다는 것이 핵심입니다. 디지털 트윈을 구현하는 데에는 핵심 기술 3가지가 필요한데요. 각각 물리 세계를 가상 세계에 모델링하는 가상화, 현실의 변화하는 각종 데이터를 실시간으로 반영하는 동기화, 그리고 모델링과 실시간 데이터를 활용해 해결하고자 하는 문제에 대한 최적의 답을 도출해내는 시뮬레이션입니다....

생산 자재 변경으로 인한 검사 ‘데이터 드리프트’를 잡아낸 사례(DQI 모델) 

생산 자재 변경으로 인한 검사 ‘데이터 드리프트’를 잡아낸 사례(DQI 모델) 

Challenge   항상 일정한 광학 이미지가 촬영돼야 모델을 제대로 학습시키고 양/불량 판정 정확도를 높일 수 있음. 그러나 제조 현장의 다양한 요인 변화로 인해 ‘데이터 드리프트’가 발생하면서 생산품에 결함이 없음에도 NG가 발생하는 경우가 잦아 품질 검사 효율이 낮아짐 비용 및 관리 복잡도를 높이지 않으면서 검사 이미지가 제대로 촬영되고 있는지 실시간으로 알 수 있는 방안 필요 Approach   검사 이미지가 기존에 학습시킨 Reference...

[경력] 스마트팩토리 AI 솔루션 셋업 엔지니어링 및 개발 (3년 이상)

Summary 경력(3년 이상) 채용 형태 : 정규직 마감일 : 상시 채용 근무지 : 경기도 성남시 분당구 성남대로 43번길 10 (하나EZ타워) 712호 https://ahha.ai/2024/02/13/teamse/ 솔루션 엔지니어링 팀을 소개합니다 솔루션 엔지니어링(SE) 팀은 기술 및 분석 역량을 바탕으로 AHHA Labs 솔루션의 가치를 고객에게 전달합니다. LISA 및 Data CAMP 프로덕트를 이해하고, 고객의 요구와 목표에 부합하는 솔루션을 제공하기 위해...

[신입] 스마트팩토리 AI 솔루션 셋업 엔지니어링 및 개발

Summary 신입 채용 형태 : 정규직 마감일 : 상시 채용 근무지 : 경기도 성남시 분당구 성남대로 43번길 10 (하나EZ타워) 712호 https://ahha.ai/2024/02/13/teamse/ 솔루션 엔지니어링 팀을 소개합니다 솔루션 엔지니어링(SE) 팀은 기술 및 분석 역량을 바탕으로 AHHA Labs 솔루션의 가치를 고객에게 전달합니다. LISA 및 Data CAMP 프로덕트를 이해하고, 고객의 요구와 목표에 부합하는 솔루션을 제공하기 위해 산업현장에 필요한...

[경력] QA Engineer (3~8년)

Summary 경력(3~8년) 채용 형태 : 정규직 마감일 : 상시 채용 근무지 : 경기도 성남시 분당구 성남대로 43번길 10 (하나EZ타워) 712호 이런 일을 함께 합니다 [주 업무] 테스트 케이스 설계: 기획서를 바탕으로 제품의 최종 테스트를 설계합니다. 테스트 수행 및 보고: 계획된 테스트 케이스를 바탕으로 테스트를 수행합니다. 테스트 결과를 공유하고 발생한 에러에 대한 이력 관리를 수행합니다. [보조 업무] UI & UX 의견 개진: 사용 경험을 바탕으로...

[AW2024] 표면 결함 검사의 조명 제어는 AI Light Palette로

[AW2024] 표면 결함 검사의 조명 제어는 AI Light Palette로

아하랩스는 지난 3월 27일부터 29일까지 서울 코엑스에서 열린 ‘2024 자동화산업전(이하 AW2024)’ 전시회를 성황리에 마쳤습니다. 450개 기업이 참여해 역대 최대 규모로 개최되었는데요. 아하랩스 부스에도 많은 고객님이 방문해 아하랩스의 인공지능 솔루션에 대해 다양한 의견과 질문을 나누어 주셨습니다. 깊은 감사의 말씀드립니다.    아하랩스 팀은 이번 전시회에서 스마트 조명 시스템을 선보였습니다. 바로, 머신비전 하드웨어 솔루션 전문 기업인 주식회사...

[AW2024] 라벨링 없이 정상 영상만 있어도 AI 학습&활용 가능

[AW2024] 라벨링 없이 정상 영상만 있어도 AI 학습&활용 가능

아하랩스는 지난 3월 27일부터 29일까지 서울 코엑스에서 열린 ‘2024 자동화산업전(이하 AW2024)’ 전시회에 참가했습니다. 이번 전시회는 450개 기업이 참여해 역대 최대 규모로 개최되었는데요. 아하랩스 부스에도 많은 고객님이 방문해 아하랩스의 인공지능 솔루션에 대해 다양한 의견과 질문을 나누어 주셨습니다. 깊은 감사의 말씀드립니다.    라벨링 없이 정상 데이터만으로 AI 학습과 실시간 불량 검출까지   아하랩스 팀은 전시회 현장에서 다양한 제품의...

ESG 경영에서 탄소 중립이란? – 개념, 국내외 동향, 해결해야 할 문제 등

ESG 경영에서 탄소 중립이란? – 개념, 국내외 동향, 해결해야 할 문제 등

ESG 경영은 환경(Environmental), 사회(Social), 지배구조(Governance)의 영문 첫 글자를 따서 만든 개념입니다. 환경 보호, 사회적 책임, 투명하고 공정한 경영 활동을 통해 지속 가능한 발전을 추구하는 경영 방식을 의미하죠.   이와 관련하여 특히 최근 전세계 정부와 기업이 관심을 기울이고 있는 개념이 있습니다. 바로 '탄소 중립'입니다. 탄소 중립의 중요성은 ESG 경영의 환경적 측면과 밀접하게 연관되어 있습니다.   이번 아티클에서는 탄소...