산업 전반에 결합하고 있는 생성형AI (1)편 – 개념, 동향 

2023-11-17

생성형AI에 대한 관심이 식을 줄 모르고 계속되고 있습니다. 2022년 11월 등장한 챗GPT 열풍이 바야흐로 생성형AI 시대를 연 것이죠. 생성형AI란 무엇이고, 제조 분야에 미칠 영향력은 어떤 모습일까요? 

 

생성형AI(Generative AI)란?

(1) 개념 

생성형AI는 주어진 데이터를 기반으로 새로운 콘텐츠를 출력하는 능력을 가진 인공지능의 한 유형입니다. 이러한 AI 시스템은 자연어 처리, 이미지 생성, 음성 생성 등 다양한 분야에서 활용될 수 있으며, 기존 데이터나 규칙에 의존하지 않고 창의적이고 다양한 결과물을 생성할 수 있습니다. 앞의 두 문장도 대표적인 생성형 인공지능인 챗GPT로 만든 결과물이죠. 

생성형AI는 머신러닝 모델을 사용해서 사람이 만든 기존 콘텐츠의 패턴을 학습합니다. 그런데 기존 머신러닝 모델이 학습한 패턴을 기반으로 예측된 결과를 내놓았다면, 생성형AI는 여기서 한걸음 더 나아갑니다. 입력된 데이터의 속성을 모방하는 새로운 데이터, 즉 새로운 콘텐츠를 생성합니다. 

(2) 원리 

생성형 모델은 고차원의 데이터가 저차원의 ‘잠재 변수(latent variable)’에 의해 생성된다고 가정합니다. 예를 들어, 얼굴이 그려지려면 성별, 나이, 피부색, 머리 스타일, 표정 같은 겉모습 뿐만 아니라 배경, 바람, 빛 등 주변 상황도 고려해야 하는데요. 이렇게 사물과 상황의 모습을 결정하는 조건을 잠재 변수라고 합니다. 생성형 모델은 데이터 학습을 통해 이런 잠재 변수의 확률분포를 추정합니다. 그리고 나면, 본래 데이터와 같은 확률적 특성을 갖는 새로운 데이터를 임의로 생성할 수 있게 됩니다. 

생성형AI 모델의 종류

생성형AI는 기본적으로 머신러닝의 하위 범주인 딥러닝으로 구성됩니다. 딥러닝이란 인간 두뇌의 뉴런을 모방해 상호 연결된 수많은 계층으로 구성된 알고리즘이고요. 생성형AI의 초석은 같지만, 세부적으로는 다양한 종류가 존재합니다. 각각 고유한 특성이 있으며, 서로 다른 응용 분야에 적합합니다. 대표적으로 알려진 세 가지를 소개하겠습니다. 

(1) 대규모 언어 모델(LLM, Large Language Model) 

LLM은 방대한 텍스트 데이터를 학습하는 생성형AI 모델입니다. 챗GPT(Generative Pretrained Transformer)가 대표적이죠. 트랜스포머(Transformer) 아키텍처를 활용해 주어진 프롬프트(사용자가 언어 모델에 입력한 것)를 이해하고 답변을 생성합니다. 트랜스포머는 딥러닝 인공신경망 중 하나로, 순환신경망(RNN)의 한계를 극복하기 위해 만들어졌습니다. 

더 자세히 설명하자면 다음과 같습니다. RNN은 직렬처리로 순서에 맞게 학습하는 특징이 있습니다. 가령 왼쪽에서 오른쪽으로, 정해진 방향대로 언어를 처리하죠. 이 때문에 단어의 거리가 멀수록 관계를 잘 파악하지 못해 오역이 자주 발생했습니다. 반면 트랜스포머는 ‘셀프 어텐션(Self-Attention)’이라 불리는 방식을 사용합니다. 병렬처리를 통해 하나의 단어를 문장의 다른 모든 단어와 비교하는 방식인데요. 단어들 간의 관계를 아주 잘 파악해 냅니다. 즉, 입력이 아무리 길어도 중요한 모든 부분에 주의(Attention)를 기울일 수 있게 만든 것이죠. 

트랜스포머는 구글의 2017년 논문(Attention Is All You Need)[1]에서 처음 소개됐는데요. 미국 스탠퍼드대 연구팀은 2021년 8월에 발표한 논문에서 트랜스포머를 ‘기반 모델(foundation model)’로 칭했습니다[2]. 트랜스포머가 AI의 패러다임 변화를 견인하고 있다고 봤기 때문입니다. 

생성형AI 알고리즘 가운데 대규모 언어 모델 트랜스포머 아키텍처의 원리를 설명하는 그림

RNN은 직렬처리로 순서에 맞게 학습합니다. 이 때문에 단어의 거리가 멀수록 관계를 잘 파악하지 못합니다. 반면 트랜스포머는 ‘셀프 어텐션(Self-Attention)’이라 불리는 방식을 사용합니다. 병렬처리를 통해 하나의 단어를 문장의 다른 모든 단어와 비교합니다. 단어들 간의 관계를 아주 잘 파악해 냅니다. – 이미지 출처: 아하랩스

 

 

(2) 생성형 적대 신경망(GAN, Generative Adversarial Networks) 

GAN은 생성기(Generator)와 판별기(Discriminator)라는 두 가지 신경망으로 구성됩니다. 생성기는 새로운 데이터를 만들어내고, 판별기는 이 데이터의 진위 여부를 평가하죠. 두 신경망이 콘텐츠의 품질을 향상하기 위해 서로 경쟁하는 셈입니다. 

과정은 이렇습니다. 먼저 진짜 데이터를 가지고 판별기를 학습시킵니다. 판별기는 훈련 데이터의 분포를 얻습니다. 이번엔 노이즈를 가미해 생성기에서 가짜 데이터를 만들어냅니다. 처음에는 한 눈에 봐도 가짜라는 걸 알 수 있을 정도로 품질이 낮은 데이터가 나옵니다. 판별기는 이를 가짜라고 구별하겠죠. 그런 뒤 오차를 고려해 생성기는 조금 더 진짜와 가까운 데이터를 만들어냅니다. 이를 반복해 학습 데이터 분포를 따라갑니다. 그 결과 매우 사실적인 데이터를 생성하는 데 능숙해집니다. 

GAN에서 생성기는 새로운 데이터를 만들어내고, 판별기는 이 데이터의 진위 여부를 평가합니다. 두 신경망이 콘텐츠의 품질을 향상하기 위해 서로 경쟁하는 셈입니다. – 이미지 출처: 아하랩스

 

   

(3) 변이형 오토인코더(VAE, Variational Autoencoder) 

원본 데이터를 목적에 맞는 잠재변수로 추론하는 과정을 인코딩, 이렇게 부호화된 데이터를 다시 원본 데이터 형태로 복원하는 과정을 디코딩이라고 부릅니다. 이렇게 인코더와 디코더로 이뤄진 신경망을 ‘오토인코더’라고 합니다. 

신경망 가운데 오토인코더의 원리를 설명하는 그림

원본 데이터를 목적에 맞는 잠재변수로 추론하는 과정을 인코딩, 이렇게 부호화된 데이터를 다시 원본 데이터 형태로 복원하는 과정을 디코딩이라고 부릅니다. 이렇게 인코더와 디코더로 이뤄진 신경망을 ‘오토인코더’라고 합니다. – 이미지 출처: Jeremy Jordan 이미지 재구성, 아하랩스

 

여기서 한걸음 더 나아간 ‘변이형 오토인코더’는 확률 및 생성 개념이 추가로 활용되는 알고리즘입니다. 기본 오토인코더는 각 잠재변수에 대해 하나의 값을 출력하지만, 변이형 오토인코더는 각 잠재변수에 대한 확률분포를 출력합니다. 그리고 이로부터 잠재변수 값을 랜덤하게 뽑은 뒤, 이를 토대로 디코더(생성기)가 보통처럼 디코딩 합니다. 디코더에서 완전히 새로운 데이터를 생성하기 위해 개발된 모델입니다.

변이형 오토인코더의 원리를 설명하는 그림

기본 오토인코더는 각 잠재변수에 대해 하나의 값을 출력하지만, 변이형 오토인코더는 각 잠재변수에 대한 확률분포를 출력합니다. 그리고 이로부터 잠재변수 값을 랜덤하게 뽑은 뒤 디코딩 합니다. – 이미지 출처: Jeremy Jordan 이미지 재구성, 아하랩스

 

2024년, 새로운 개념의 결함 이미지 생성 기능을 만나보세요

동향 : 출시부터 진화까지 

2022년부터 기업들이 경쟁적으로 생성형AI 서비스를 출시하면서 연구 영역에 머물던 생성형AI가 본격적으로 산업 영역에서 확장되기 시작했습니다. 

(1) 생성형AI의 부상 

2022년 상반기부터 주로 텍스트를 이미지로 변환해주는 서비스가 출시되었습니다. OpenAI의 달리2(DALLE2), 구글의 이마젠(Imagen), 미드저니(Midjourney) 등입니다. 특히 20228월 스태빌리티AI가 스테이블 디퓨전(Stable Diffusion)을 오픈소스 라이선스로 배포하면서 경쟁이 본격 심화되었죠. 그리고 202211월, OpenAILLM 기반 인공지능 챗봇 서비스인 챗GTP가 출시되었습니다. 챗GPT는 두 달 만에 월 이용자 1억 명을 돌파하면서 생성형AI의 대중화 가능성을 보여주었습니다.  

(2) 검색 시장 판도 변화 

마이크로소프트는 생성형AI를 이용해 구글 독점이었던 검색 시장에 도전장을 내밀었습니다. 자사 검색엔진 빙(Bing)에 GPT-4를 결합해 엣지 브라우저를 통해 제공한 것이죠. 구글은 이에 대응하여 구글 바드(Bard)를 출시했고요. 과거 검색 시장은 ‘정확한 검색’이 가장 중요했는데요, 이제 생성형AI와 결합되어 ‘신뢰할 만한 생성 정보’를 제공한다는 새로운 패러다임으로 전환하고 있습니다. 

(3)챗봇에서플랫폼으로 진화[3] 

20233월에는 OpenAI의 플러그인이 출시됐습니다. 플러그인은 외부 서비스와 연결하는 ‘서드 파티(Third-party)’ 유형과 ‘자체 제공 서비스’로 나뉩니다. 특히 서드 파티 유형은 내외부 혁신을 끌어들이는 생태계 구축에 유리합니다. 하나의 태스크를 완료하기 위해 여러 플랫폼을 거쳐 수행해야 했던 작업을 이제는 챗GPT 안에서 모두 수행할 수 있게 됐죠. 즉, 여러 서비스를 연결하는 하나의 ‘플랫폼’으로 진화한 것입니다. 챗GPT의 출현이 2007년 ‘아이폰 모멘텀’에 비교됐다면, 챗GPT 플러그인 생태계는 AI 시대의 ‘앱스토어’로 비유할 수 있습니다.[4] 

(4) 누구나맞춤 GPT제작 및 판매 

오픈AI는 2023년 11월 6일, ‘GPT-4 터보’를 공개했습니다. 이 버전은 최신 데이터를 기반으로 학습됐고, 책 3000페이지 분량을 단일 프롬프트로에서 처리할 수 있습니다. 게다가 이미지를 이해해 설명하고 오디오를 생성하기까지 합니다.   

특히 주목할 만한 점은 누구나 개인 맞춤형 챗GPT를 만들 수 있다는 것입니다. 바로 ‘GPT 빌더’입니다. 코딩을 전혀 몰라도 대화와 업로드 방식으로 누구나 특정 작업에 맞는 인공지능 비서를 만들 수 있습니다. 월 20달러 유료 서비스인 ‘챗GPT 플러스’ 사용자만 이용할 수 있는데요.[5] GPT모델을 누구나 쉽게 사고 팔 수 있게 하는 마켓 플레이스인 ‘GPT 스토어’에 대한 구상도 나왔습니다. 오픈AI의 CEO 샘 올트먼은 “장기적으로 특정 모델에 대해서 사람들이 많이 구매하면 인센티브를 주는 ‘매출 분배’를 계획하고 있다”고 소개했습니다.[6] 

 뜨거운 감자, 생성형AI의 저작권 침해 문제

생성형AI는 학습을 위한 콘텐츠 수집 과정에서 반드시 콘텐츠를 복제하고 전송합니다. 원칙적으로 저작권자의 이용 허락을 받아야 하지만 생성형AI는 대부분 웹상에 있는 뉴스 콘텐츠 등을 허락 없이 학습에 활용합니다. 그래서 그간 생성형AI가 저작권을 침해하고 있다는 지적이 제기되어 왔죠.   

실제로 LLM 개발사를 상대로 한 작가들의 저작권 침해 소송이 증가하고 있습니다. ‘캐벌리어와 클레이의 놀라운 모험’으로 2001년 퓰리처상을 받은 작가 마이클 샤본 등은 2023년 9월, 오픈AI와 메타를 저작권법 위반으로 제소했습니다. 이들 기업이 불법 복제 버전이 포함된 데이터셋을 사용해 LLM을 훈련했다는 것이었죠. 챗GPT의 정보 수집을 차단하는 언론사도 늘어나고 있습니다. 정제된 정보가 논리적으로 작성돼 있는 뉴스 콘텐츠는 LLM 학습에 유용한 데이터로 꼽힙니다.[7] AI 개발사들은 저작권이 있는 자료를 배포해 직접 이익을 추구하는 것이 아니기 때문에 저작권법 위반이 아니라는 입장인데요. 전문가들은 이에 부정적입니다. 오픈AI만 하더라도 유료 서비스를 통해 수익 창출 구조를 갖췄기 때문입니다. AI 시대 저작권 공방은 이제 본격적으로 시작되는 추세입니다. 

 

 

‘산업 전반에 결합하고 있는 생성형AI (2)편 – 적용 사례’에서 계속됩니다.

Chloe Woo | Content Strategist

Related Stories

산업용AI 솔루션 LISA로 완벽한 실시간 이상 탐지를 경험해 보세요

산업용AI 솔루션 LISA로 완벽한 실시간 이상 탐지를 경험해 보세요

전세계 제조 업계의 스마트팩토리 전환이 가속화되면서 머신 비전을 이용한 검사 자동화, 실시간 이상 탐지, 예지보전에 대한 관심이 뜨겁습니다. 특히 반도체나 이차전지 등 혁신 제조산업 현장에서는 하루에도 수천 수만 개의 부품·제품들이 생산되는데, 사람이 불량을 일일이 찾아낸다는 것이 불가능에 가까워졌죠. 또한, 이제 고객들은 미묘한 결함도 용납하지 않기 때문에 이 요구를 충족시키려면 신속하고 정확하게 불량을 짚어내는 AI 검사 자동화가 필수입니다. 아하랩스의 LISA(Look...

Why Data CAMP Is the Ultimate Choice for Digital Twins

Why Data CAMP Is the Ultimate Choice for Digital Twins

The idea of a digital twin is to address real-world problems by rendering the physical world visible within a digital environment. Three key technologies are essential for creating a digital twin: Virtualization: This involves modeling the physical world in a virtual...

Data CAMP를 활용해 디지털 트윈의 첫걸음을 내디뎌 보세요

Data CAMP를 활용해 디지털 트윈의 첫걸음을 내디뎌 보세요

디지털 트윈 = 데이터를 가시화하여 현실의 문제를 해결한다   최근 화두로 떠오른 디지털 트윈은 디지털 환경에서 물리적인 현장을 모두 ‘가시화’해서 현실의 문제를 해결한다는 것이 핵심입니다. 디지털 트윈을 구현하는 데에는 핵심 기술 3가지가 필요한데요. 각각 물리 세계를 가상 세계에 모델링하는 가상화, 현실의 변화하는 각종 데이터를 실시간으로 반영하는 동기화, 그리고 모델링과 실시간 데이터를 활용해 해결하고자 하는 문제에 대한 최적의 답을 도출해내는 시뮬레이션입니다....

서비스 기획자 (5년 이상 Lead)

Summary 경력(5년 이상 Lead) 채용 형태 : 정규직 마감일 : 상시 채용 근무지 : 경기도 성남시 분당구 성남대로 43번길 10 (하나EZ타워) 712호 서비스 기획팀을 소개합니다 서비스 기획팀은 제품 개발실 소속으로 고객의 제품 사용성을 최고 수준으로 유지하기 위해 시장/경쟁사 조사, 제품 기획, UI/UX 기획 및 CS (제품 개선 등)의 업무를 이끌어 나가기 위해 존재합니다. 서비스 기획자와 UI/UX 디자이너 및 그래픽 디자이너로 구성되어 있으며, 제품...

“산업 자동화계 ‘안드로이드’ 목표” UAO(Universal Automation Organization)란?

“산업 자동화계 ‘안드로이드’ 목표” UAO(Universal Automation Organization)란?

오늘날 산업 자동화는 더욱 복잡하고 고도화된 요구를 충족하기 위해 빠르게 진화하고 있습니다. 그러나 많은 기업이 여전히 새로운 기술 도입과 확장성에 어려움을 겪고 있는데요. 이에 대한 해법으로 떠오른 것이 바로 UAO(Universal Automation.Org)입니다. 이번 아티클에서는 UAO가 기존 자동화 시스템의 한계를 어떻게 극복하고 있는지, 그리고 ‘개방형 산업 자동화’라는 개념이 산업의 미래에 어떤 의미를 가지는지에 대해 살펴보겠습니다.   ...

3단계 품질검사 파이프라인으로 타이어 원단의 불량 유무&위치&유형을 자동 검사한 사례

3단계 품질검사 파이프라인으로 타이어 원단의 불량 유무&위치&유형을 자동 검사한 사례

Challenge   타이어 원단을 만드는 압연공정에 자동 품질검사 부재(육안 검사) 원단 자체 불량으로 인한 완성품 폐기  Approach   3단계 품질검사 파이프라인 구축 1. Anomaly Detection: 실시간 이상 감지를 통해 불량 유무 판단 2. Classification: 불량 유형 분류 3. PLC 설비 데이터 수신: 불량 위치 계산 검사 결과에 따라 PLC 제어 검사 현황과 상세 이력을 조회할 수 있는 대시보드 구축 Result...

도메인 특화 대규모 비전 모델(LVM)이 온다

도메인 특화 대규모 비전 모델(LVM)이 온다

일반 LVM vs. 도메인 특화 LVM   (1) 도메인 특화 LVM의 등장 배경   LVM(Large Vision Model)이 컴퓨터 비전 분야에서 놀라운 성과를 보여준 것은 사실이지만, 이를 실제 산업에서 응용하려고 하자 한계가 드러났습니다. 언어의 경우, 일상에서 사용하는 한국어의 구조와 전문 영역에서 사용하는 한국어의 구조가 (전문 용어만 제외하고는) 크게 다르지 않아서 LLM을 전문 영역에 쓰기가 비교적 수월합니다. 반면에 이미지나...

원격 시스템 구축으로 배터리 조립 설비의 관제 효율을 300% 높인 사례

원격 시스템 구축으로 배터리 조립 설비의 관제 효율을 300% 높인 사례

Challenge   전기차용 배터리 조립 설비는 규모가 매우 크고 구성이 복잡해, 설비 상태를 모니터링하고 알람에 대처하는 인원이 다수 근무해야 함 그러나 경고 알람의 상당수는 간단한 초기화 동작만으로 해결되는 경알람으로, 사람이 직접 이동해서 대처하는 비효율을 제거할 필요가 있음 목표: 원격 모니터링 및 제어 시스템 구성을 통한 성인화(省人化; 낭비를 제거해 필요 인원을 줄임) Approach   제조 빅데이터 통합관리 솔루션 Data CAMP를 이용해...

“기계도 사람처럼 봅니다” – 대규모 비전 모델(LVM)

“기계도 사람처럼 봅니다” – 대규모 비전 모델(LVM)

사람의 모든 감각수용기의 70%가 눈에 있다는 사실을 아시나요? 시각이 다른 감각보다 생존에 더 큰 영향을 준다는 뜻일 겁니다. 이 사실을 고려했을 때, 사람이 기계와 원활하게 상호작용하려면 사람이 보는 것을 기계도 똑같이 보고 판단할 수 있어야 한다는 생각을 해볼 수 있습니다. 이를 가능케 하는 기술이 바로 ‘대규모 비전 모델(LVM; Large Vision Model)’입니다. 이번 아티클에서는 LVM의 정의와 특징을 알아봅니다. 그리고 이어지는 아티클에서...

제조 시계열 데이터(Time series Data)는 왜 중요할까? 

제조 시계열 데이터(Time series Data)는 왜 중요할까? 

제조업에서 시계열 데이터를 효과적으로 활용하면 생산 효율을 높이고, 품질을 향상시키며, 비용을 절감하는 등 제조 과정 전반에서 큰 가치를 창출할 수 있습니다. 아래는 제조업에서 시계열 데이터를 활용하는 주요 사례입니다. 1편: 시계열 데이터 개념 먼저 읽기 2편: 머신러닝/딥러닝 기법으로 제조 시계열 데이터 분석하기 1. 실시간 모니터링 및 성능 최적화(Condition Monitoring and Performance Optimization) 제조업에서 사용되는...