빅데이터 분석에 특화된 GPU 기반의 데이터베이스.
SQream은 데이터 처리에 최적화된 GPGPU(General Purpose GPU) 기반의 데이터베이스이자 빅데이터 분석 플랫폼입니다. 수천 개의 코어를 활용하여 대용량의 데이터를 효율적으로 병렬 처리할 수 있어 빅데이터 분석 시 유사 솔루션 대비 높은 성능을 발휘합니다. Samsung Cloud Platform에서 구성과 안정성에 대해 사전 검증이 되었으며, 웹 기반 콘솔을 통해 쉽고 간편하게 설치하여 사용할 수 있습니다.
- 쿼리 성능 및 호환성
SQream DB는 기존에 사용하던 ANSI-92 기반의 표준 SQL 쿼리를 변경 없이 그대로 사용할 수 있으며, 병렬 처리가 가능한 관계형 대수 연산용 쿼리로 자동으로 변환해줍니다. 따라서 GPU Core는 최적화된 쿼리를 기반으로 대량의 병렬 연산을 효율적으로 수행할 수 있습니다.
- 빅데이터 분석 최적화
빅데이터 분석에 적합한 Columnar 데이터베이스 방식 적용으로 OLAP(On-Line Analytical Processing)을 효율적으로 수행할 수 있어, 계정별, 일별 집계 연산 등 통계학적 분석에 최적화되어 있습니다. 또한 유사한 데이터 타입을 모아서 저장하는 압축 알고리즘을 사용하여 데이터 압축 기능을 제공합니다.
- GPU 기반 아키텍처
컬럼 구조로 저장되는 데이터는 100만 건 단위로 묶은 ‘청크(Chunk)’로 관리되며, Chunk 단위로 데이터를 스캐닝하고 처리합니다. 모든 컬럼에 인덱스를 부여하는 대신 청크에 메타데이터를 부여함으로써, 데이터 처리 및 I/O 시간이 획기적으로 감소되어 GPU 메모리 트랜잭션이 효율적으로 수행됩니다.
- 개별 확장성 제공
SQream DB는 스토리지, Compute 노드, GPU 각 컴포넌트를 독립적으로 확장할 수 있어, 데이터가 증가할 경우 스토리지 용량만 추가로 확보하여 확장하는 등 컴포넌트별 확장이 가능합니다.
- 아키텍처 다이어그램
- 고성능 데이터 처리 기술
NVIDIA CUDA 프레임워크를 통한 Massively Parallel Processing 기술 적용
대용량 통계학적 분석 처리에 최적인 아키텍처 적용 : 압축 알고리즘 처리 및 Group By를 사용한 데이터 분류 (COUNT, SUM, AVG, MAX, MIN 등)
병렬처리(Parallel Execute) 엔진을 탑재하여 압축해제 없이 동시 Query 가능
- 무한 수평적 확장 가능한 클러스터 아키텍처
SQream 고유의 로드 밸런서를 통해 비어 있는 GPU에 워크로드 자동 할당
GPU는 최대 8조각까지 Split 가능하며 이를 통해 Concurrency를 최대화
- DB 생성 및 관리
Auto Provisioning(Single 기준), Lifecycle 관리
필요 스펙에 따라 VM 선택
OS 디스크 외 추가 연결 스토리지 제공
서브넷/IP, NAT IP, Security Group 연계 설정 제공
이중화 구성, 모니터링, 백업/복구 등 관리 기능은 별도 매뉴얼 제공(사용자 구성 항목)
- 요금 기준
SQream DB는 설치형 서비스로 제공되며, VM 이용요금 외에 별도의 추가 요금 없이 제공됩니다.
SQream DB 라이선스 요금은 마켓플레이스에서 제공되며, 세부요금 내역을 해당상품 요금에서 확인하시기 바랍니다.
'BigData-DataAnalytics' 카테고리의 다른 글
DATA OPS (0) | 2023.12.17 |
---|---|
CLOUD HADOOP (0) | 2023.12.17 |
VMWARE GREENPLUM(DBAAS) (0) | 2023.12.17 |
VERTICA(DBAAS) (0) | 2023.12.17 |
ELASTICSEARCH(MANAGED) (0) | 2023.12.17 |