본문으로 바로가기
GPU 인프라

생성형 AI, 딥러닝, 빅데이터 등 4차 산업 비즈니스에 사용되는 GPU의 다양한 사양을 확인해 보세요.

AI 서비스를 위한
고성능 GPU 인프라를 제공합니다.

가비아는 대규모 연산 작업이 필요한 비즈니스에 필요한 인프라를 지원합니다.

가비아 IDC

AI/GPU 서비스

GPU 모델 사양 비교
구분 H100 L40 L4 RTX 4090 RTX 4080 A100 A6000 A5000 RTX 3090 RTX 3080
아키텍쳐 Hopper Ada Lovelace Ada Lovelace Ada Lovelace Ada Lovelace Ampere Ampere Ampere Ampere Ampere
GPU 메모리 80GB 48GB 24GB 24GB 16GB 80GB 48GB 24GB 24GB 10GB
CUDA 코어 18,432 18,176 7,680 16,384 9,728 6,912 10,752 8,192 10,496 8,704
Tensor 코어 640 568 240 336 304 432 336 256 328 272
인터페이스 SXM PCle PCle PCle PCle SXM PCle PCle PCle PCle
최대 전력 700W 300W 72W 450W 450W 400W 300W 230W 350W 320W
  • CUDA(Compute Unified Device Architecture)는 GPU에서 수행하는 병렬 처리 알고리즘을 C 프로그래밍 언어를 비롯한 산업 표준 언어를 사용하여 작성할 수 있도록 하는 GPGPU 기술입니다.
  • Tensor 코어는 ‘행렬 곱셈+덧셈’장치로서 딥러닝에서 빠르면서도 높은 정확도의 모델을 만들 때 매우 유용하게 사용됩니다.
  • SXM과 PCIe방식
    - SXM 방식은 NVLink를 이용한 높은 대역폭으로 대규모 병렬작업이나 딥러닝에 유리하나, GPU 전용 서버만 장착이 가능하고 PCIe 방식에 비해 상대적으로 전력 소모율이 높습니다.
    - PCIe 방식은 인터페이스 호환성이 좋으므로 여러 종류의 서버에 장착이 가능하나 SXM 방식에 비해 상대적으로 성능이 약간 낮은편입니다.
아키텍처 특징
Hopper Ada Lovelace Ampere
4세대 NVLink, 3세대 NVLink 스위치 3세대 RT코어, 4세대 Tensor코어 2세대 RT코어, 3세대 Tensor코어
2세대 MIG(Multi-Instance GPU) 딥 러닝 슈퍼 샘플링 3.0(DLSS 3) 3세대 NVLink
트랜스포머 엔진 가상화 지원 MIG(Multi-Instance GPU)
성능의 한계를 극복한 고전력 IDC

고전력 공급부터 항온, 항습 등 서버에 최적화된 환경을 제공합니다.

드림마크원 가좌센터

  • 제공전력: 랙당 6.6kW(30A) ~ 13.2kW(60A)
  • 랙수: 900EA (3.3kW 기준 1,300EA)
  • 총 수전용량: 10MW, IT Power 6MW
  • 소재지: 인천 서구 가좌동(‘24년 2월 오픈)
  • 주요 특징
    · 생성형AI 전용 고전력 데이터센터 구성(랙당 최대 20kW)
    · 서버와 메인전기설비가 있는 본관, 비상발전을 담당하는 별관으로 분리
    · 그린데이터센터 인증 취득(2023, 한국데이터센터연합회 발급)

SK브로드밴드 가산센터

  • 제공전력: 랙당 4kW(18A) ~ 20kW(90A)
  • 랙수: 7,500EA (랙당 4~20kW 제공 가능)
  • 총 수전용량: 80MW, IT Power 46MW
  • 소재지: 서울 금천구 가산동 (‘21년 7월 오픈)
  • 주요 특징
    · 서울 시내 최대 규모 DC (지상10층, 지하 5층, 연면적 21,000평)
    · Uptime사의 Tier Ⅲ 인증 취득
    · 전력설비 2N 구조(99.99999% 가용성)
    · 제공 랙사이즈: 52U (2500x600x1200)
    · 층별 데이터홀 옆에 UPS룸 위치: 전력 손실 최소화 및 전력 품질 향상
    · 7단계로 구성된 물리 보안
구축 사례

가비아 GPU 인프라 서비스를 이용하고 있는 고객 구축 사례를 소개합니다.

  • 업스테이지

    디지털혁신을 넘어 AI 혁신을 실현하는,
    세계를 대표하는 AI 전문기업

    주요사업

    • Document AI
      OCR(광학문자인식) 기술을 활용하여 스캔된 문서를 문자로 인식
    • 아슉업(AskUp)
      자체 개발한 사전 학습 언어모델 Solar를 적용한 카카오톡 챗봇

    서비스 구성

    • GPU 코로케이션(6.6kW, 30A) 서비스 이용 중
  • 클레온

    진정한 소통을 위한 디지털 휴먼 개발

    주요사업

    • 클론
      1장의 사진과 목소리로 만드는 디지털 휴먼
    • 챗 아바타
      대화가 가능한 다양한 컨셉의 디지털 휴먼
    • 클링
      원본과 동일한 음색으로 더빙언어에 입모양까지 변환

    서비스 구성

    • GPU 서버호스팅, GPU 코로케이션(4.4kW, 20A) 서비스 이용 중
  • 무하유

    자연어를 이해하는 AI기술로 업무 자동화 실현

    주요사업

    • 표절 검사
      텍스트와 이미지의 표현적 유사성 검사를 넘어 의미적 유사성을 찾는 유사도 검사
    • 생성 AI 탐지
      한국어에 특화된 생성 AI 탐지 기술로 GPT가 생성한 문장을 찾아냄
    • 내용 평가
      문맥상 의미를 파악하여, 내용을 평가하고 AI가 생성한 문장을 팩트 체크

    서비스 구성

    • GPU 서버호스팅, 고전력 코로케이션(4.4kW, 20A) 서비스 이용 중
  • 틸다

    머신러닝을 통한 최적의 비즈니스 의사 결정 지원

    주요사업

    • ArgMax 서비스
      처방적 분석 머신러닝을 통한 의사결정 지원
    • 적용 분야
      소매업, 보험/금융, 공장설비, 공급망관리, 제조업 및 헬스케어&바이오

    서비스 구성

    • GPU 서버호스팅, GPU 코로케이션(4.4kW, 20A) 서비스 이용 중
  • 포트레이

    AI로 생체정보를 분석해 신약 개발 지원

    주요사업

    • potraiDRUG
      약물의 현미경적 수준의 조직내 분포를 분석하는 플랫폼
    • potraiTME
      성공적인 임상시험을 위한 AI기반 바이오마커 생산 플랫폼
    • potraiMOA
      신약의 투입 전후 모든 전사체들의 변화를 공간적으로 추적해 약물의 기전을 밝혀내는 플랫폼
    • potraiTARGET
      빅데이터 기반 Target mapping 플랫폼

    서비스 구성

    • GPU 서버호스팅, GPU 코로케이션(4.4kW, 20A) 서비스 이용 중
AI / GPU 서비스 상담
AI / GPU 에 대해 무엇이든 물어보세요.
상담 신청하기
도움이 필요하신가요?
AI / GPU 전문가가 자세한 상담을 도와드립니다.

02-3473-3911