2024-10-17 | 인사이트 리포트

도메인 특화 대규모 비전 모델(LVM)이 온다

Chloe Woo | Content Strategist

human cell

일반 LVM vs. 도메인 특화 LVM

 

(1) 도메인 특화 LVM의 등장 배경

 

LVM(Large Vision Model)이 컴퓨터 비전 분야에서 놀라운 성과를 보여준 것은 사실이지만, 이를 실제 산업에서 응용하려고 하자 한계가 드러났습니다.

언어의 경우, 일상에서 사용하는 한국어의 구조와 전문 영역에서 사용하는 한국어의 구조가 (전문 용어만 제외하고는) 크게 다르지 않아서 LLM을 전문 영역에 쓰기가 비교적 수월합니다.

반면에 이미지나 영상은 그렇지 않습니다. 예컨대 병원에서 초음파 검사를 했을 때, 아무리 들여다봐도 뭐가 뭔지 알아볼 수 없는 경험을 해보신 적 있을 거예요. 사람, 자동차, 나무, 의자처럼 일상생활에서 흔히 접할 수 있는 사물은 달리 공부하지 않아도 누구나 알지만, 이러한 전문 영역에서 나오는 이미지를 알아보려면 특별한 훈련이 필요하기 때문입니다.

이는 컴퓨터도 마찬가지입니다. 인터넷 이미지를 학습한 LVM을 특정 산업 영역에 적용하기는 어려운 것이죠. 요컨대, 특정 도메인에서 요구되는 세부적인 분석을 수행하려면 고도의 맞춤형 학습이 필요합니다.

 

(2) 도메인 특화 LVM이란?

 

특정 산업 또는 작업의 요구에 최적화된 데이터와 학습 방법을 사용한 대규모 비전 모델을 ‘도메인 특화 LVM(Domain Specific Large Vision Model)’이라고 합니다. 인터넷에서 수집한 일반 이미지가 아니라, 산업 도메인의 공개되지 않은 데이터를 대규모로 학습한 LVM이죠.

도메인 특화 LVM은 일반 LVM보다 해당 도메인에서 더 높은 성능을 제공합니다. 세계적인 석학으로 꼽히는 앤드류 응 교수가 설립한 Landing AI 사에 따르면 “LVM은 LLM과 2~3년의 기술 격차를 보이지만, 도메인 특화 LVM은 일반 LVM보다 성능이 뛰어나다”고 합니다. LLM과의 기술 격차도 그만큼 더 적은 셈입니다.

domain specific lvm

Image Credit: AHHA Labs

 

 

도메인 특화 LVM의 이점

 

  • 적은 데이터 요구량: 일반 LVM에 비해 도메인 특화 LVM은 레이블 데이터의 30% 이하만 필요하고 오류가 훨씬 적습니다. 성능은 높지만, 계산에 필요한 리소스는 더 적게 사용합니다. [자료]
  • 빠른 개발 시간: 도메인 특화 LVM을 파인튜닝(다음 항목에서 더 자세히 설명합니다)해서 사용하면 특정 애플리케이션 개발에 소요되는 시간과 비용을 크게 줄일 수 있습니다. 예를 들어, 제조업 내 서로 다른 공정에서 발생하는 다양한 결함을 탐지하는 프로젝트를 훨씬 빨리 시작할 수 있죠.
  • 다양한 프로젝트 유연성: 파인튜닝된 도메인 특화 모델은 이차전지 제조의 다양한 프로젝트에서 활용될 수 있습니다. 예를 들어, 배터리 셀 내부 결함 탐지, 생산 라인의 자동화된 검사, 생산 공정 중 발생하는 불량 원인의 분석 등이 모두 가능합니다. 파인튜닝된 모델은 이처럼 특정 도메인 내에서 다양한 작업을 유연하게 처리할 수 있습니다.

domain specific lvm performance

도메인 특화 LVM은 10~30%의 라벨링 데이터를 가지고 36~52% 더 적은 오류를 냅니다. Image Credit: Landing AI

 

 

도메인 특화 LVM을 활용하는 방법

(1) 파운데이션 모델(Foundation Model) 구축

 

도메인 특화 LVM은 일반 LVM, LLM처럼 파운데이션 모델의 역할을 할 수 있습니다.

파운데이션 모델이란 대규모 데이터셋을 기반으로 훈련된 범용 모델입니다. 특정 작업에 맞춰 사용되기 전까지는 일반적인 형태를 유지하죠. ‘파인튜닝(Fine-tuning)’ 과정을 통해 특정 애플리케이션에 맞춰 최적화합니다.

 

(2) 파인튜닝(Fine-tuning)

 

이미 훈련된 파운데이션 모델에 특정 데이터를 추가 학습시키는 방법입니다. 기존 모델을 세부적으로 조정해 새로운 작업을 더 효과적으로 수행하게 만드는 과정이죠.

예를 들어 GPT 같은 언어 모델은 처음에 다양한 일반적인 텍스트 데이터를 학습합니다. 그리고나서, 특정 분야(예: 금융, 법률, 의료)에 맞게 파인튜닝되어 더 전문적인 언어 모델로 발전하죠.

이와 마찬가지로, 컴퓨터 비전에서도 도메인 특화 파운데이션 모델을 파인튜닝해서 활용하는 접근법이 점점 중요해지고 있습니다.

 

(3) 활용 예시

 

반도체 제조업을 예시로 들어보겠습니다. 반도체 제조는 고도의 정밀성을 요구하는 산업입니다. 각 공정에서 발생하는 미세한 결함을 조기에 발견하고, 생산 효율성을 극대화하기 위해 비전 AI를 활용하는 것이 중요합니다.

하지만 서로 다른 수많은 공정의 데이터를 처음부터 완전히 학습시켜 모델을 구축하는 것은 매우 비효율적이며, 시간과 비용이 많이 걸릴 수 있습니다. 전문 제조업에 AI를 도입할 때 가장 큰 어려움이라고 볼 수 있습니다.

여기서 파운데이션 모델의 강점이 두드러집니다. 반도체 특화 파운데이션 LVM을 먼저 구축합니다. 그러고나면 파인튜닝을 통해 각 공정별 맞춤 모델을 훨씬 빠르게 구축할 수 있습니다. 즉, 특정 공정 데이터를 추가 학습시켜 공정 특화 모델로 발전시킬 수 있습니다.

domain specific lvm_semiconductor

도메인 특화 LVM은 일반 LVM에 비해 반도체 이미지의 특성을 더 잘 예측합니다. Image Credit: doi.org/10.1117/12.2658434

 

 

산업별 활용 예시

  • 의료: 질병 진단과 치료 계획 수립을 지원합니다. 현미경 사진, X선, MRI, CT, 초음파 같은 의료 이미지 및 영상을 정밀하게 분석하고 이상을 더 높은 정확도로 감지할 수 있습니다. 생체 조직의 변화를 탐지해 암과 같은 질병의 초기 단계를 감지하거나, 신약 개발에서 생물학적 반응과 치료 효과를 평가하는 데 활용할 수 있습니다.
  • 자율주행 자동차: 차선 유지, 보행자 및 장애물 인식, 실시간 추적, 자동 제동 등의 작업을 수행할 수 있습니다. 실시간으로 주변 환경을 종합적으로 인식해 더욱 안전한 주행을 지원합니다.
  • 스마트 농업: 작물의 성장 상태, 병충해 여부, 영양 상태 등을 자동으로 파악할 수 있습니다. 이를 통해 수확 시기를 예측하거나, 드론 및 농업 로봇과 결합해 대규모 농작물 관리에서 효율성을 극대화할 수 있습니다.
  • 로봇공학: 멀티모달 모델을 활용해 산업 현장에서 로봇과 더욱 원활한 상호작용을 할 수 있습니다. 예를 들어, 로봇이 이미지와 자연어 텍스트를 이해하고 지시를 수행하도록 설계하는 것이죠. 로봇은 카메라로 촬영한 이미지 및 영상을 분석하고, 이를 바탕으로 행동 지침을 수행합니다.
  • 지리 공간 분석: 위성 이미지와 항공 사진을 수집하고 분석해 농업, 삼림 모니터링, 산불 모니터링, 각종 재난 대응, 도시 개발 등 다양한 분야에서 활용할 수 있습니다. 고해상도 위성 이미지를 실시간으로 처리하여 지구상의 변화에 대한 정보를 제공합니다.
  • 제조업: 산업 현장에서 품질 관리, 설비 예지보전 등의 작업을 수행합니다. 제조업에서 대량 생산된 제품을 실시간으로 검사하여 결함 여부를 확인하고, 불량품을 자동으로 걸러냅니다. 물류 창고에서 재고를 자동 파악하고, 포장 라인에서 오류를 감지하는 데 활용됩니다. 이를 통해 자동화 수준을 높이고, 생산 효율을 극대화할 수 있습니다.
  • 금융: 계약서나 서명 이미지에서 패턴과 이상 징후를 분석해 사기 감지를 강화할 수 있습니다. 또, 차트나 그래프 같은 시각적 데이터를 해석해 알고리즘 트레이딩의 의사결정을 지원할 수 있습니다.

 

결론

대규모 비전 모델(LVM), 더 나아가 도메인 특화 LVM은 앞으로 다양한 산업 분야에서 필수적으로 사용되며, 또 한 번 중요한 혁신을 일으킬 것입니다. 자율주행, 의료, 제조, 농업 등 여러 분야에서 LVM은 고도화된 이미지 분석을 통해 복잡한 문제를 해결하고 효율성을 극대화하는 역할을 수행할 것입니다. 단순한 데이터 분석을 넘어, 실시간 의사결정과 자동화된 작업을 가능하게 하여 산업 전반의 생산성을 크게 향상시킬 것입니다.

아하랩스 팀은 특히 다양한 제조업에서 다수의 비전 태스크를 성공적으로 수행한 경험을 보유하고 있습니다.

특히 산업 기반의 데이터를 풍부하게 확보해 두어서, LVM 도입에 차별화되는 경쟁력을 지니고 있습니다.

여러 산업 현장에서 파일럿 프로젝트를 진행한 후, 양산에의 도입률이 65% 이상입니다. 이처럼 높은 성공률을 기반으로 신뢰받는 파트너로 자리매김했습니다.

아하랩스 팀은 제조업의 다양한 비전 과제를 해결하며 쌓아온 기술적 역량과 경험을 바탕으로 고객의 요구에 맞춘 최적의 솔루션을 제공할 수 있습니다.

지금 더 나은 성과를 만들어보세요.

 

아하랩스 팀이 수행한 다양한 비전 태스크 성공 사례를 더 읽어보세요.

생산 자재 변경으로 인한 검사 ‘데이터 드리프트’를 잡아낸 사례(DQI 모델) 

이상탐지(Anomaly Detection) 딥러닝 모델을 활용해 정상 데이터만으로 검사 자동화 도입

‘1종 오류’ 찾아내는 딥러닝 모델로 ‘과검’ 발생률 감소