전체 글 101

DATA WRANGLER

쉽고 빠르게 데이터를 탐색하고 원하는 형태로 재구성해주는 서비스. Data Wrangler는 수집된 Raw 데이터를 사용자에게 익숙한 엑셀 형태의 시각적인 데이터로 변환하여 제공하며, 이를 통해 데이터를 정리하고 분석하는 시간을 줄일 수 있습니다. 데이터 탐색부터 변환까지 데이터 처리 과정은 모두 시각적으로 확인 가능하며, 데이터 프로파일 정보, Join 유형 및 조건, 데이터 원천 등을 클릭만으로 간편하게 확인할 수 있습니다. 특징 시각적 데이터 준비 웹 기반으로 편리하게 Self Service로 데이터 전처리가 가능합니다. 데이터를 탐색하고 원하는 데이터를 로드하여, 시각적으로 확인하면서 데이터의 보정, 변환 등을 처리하는 데이터 처리 함수를 제공합니다. 데이터 프로파일링 기반 탐색 데이터 프로파일링..

DATA FLOW

다양한 소스로부터 데이터를 추출/변환/전송하고 데이터 처리 흐름을 자동화하는 서비스. Data Flow는 다양한 데이터 소스로부터 대용량의 데이터를 추출하고, 스트림/배치 데이터의 변환/전송에 대한 처리 흐름을 시각적으로 작성하는 데이터 처리 흐름 도구로, 오픈소스 Apache NiFi를 제공합니다. Data Flow는 Samsung Cloud Platform의 Kubernetes Engine 클러스터 환경에서 단독으로 사용하거나, 다른 애플리케이션 SW와 함께 사용할 수 있습니다. 특징 편리한 설치 Data Flow는 표준 Kubernetes 클러스터 환경에서 웹 기반 콘솔을 통해 손쉽게 설치가 가능합니다. 오픈소스 Apache NiFi 기반의 확장형 클러스터링에 필요한 아키텍처를 자동으로 구성하여, ..

DATA OPS

데이터 처리 작업을 위한 워크플로우를 작성하고 작업 수행을 자동화하는 서비스. Data Ops는 주기적, 반복적으로 발생하는 데이터 처리 작업에 대해 워크플로우를 작성하고 작업 스케줄링을 자동화하는 Apache Airflow 기반의 관리형 워크플로우 오케스트레이션 서비스입니다. Samsung Cloud Platform의 Kubernetes Engine 클러스터 환경에서 단독으로 사용하거나, 다른 애플리케이션 SW와 함께 사용할 수 있습니다. 특징 편리한 설치 및 관리 Data Ops는 표준 Kubernetes 클러스터 환경에서 웹 기반 콘솔을 통해 손쉽게 설치가 가능합니다. Apache Airflow와 관리 모듈이 자동 설치되며, 통합 대시보드를 통해 웹 서버 및 스케줄러의 실행 상태에 대한 통합 모니터..

CLOUD HADOOP

쉽고 빠른 빅데이터 처리/분석을 위한 Hadoop 클러스터를 제공하는 서비스. Samsung Cloud Platform은 빅데이터 처리 및 분석에 활용하는 Hadoop 클러스터를 제공합니다. Cloud Hadoop을 통해 소규모 컴퓨팅 자원을 활용하여 대용량 데이터의 클러스터링 및 병렬 처리가 가능합니다. 또한 Apache 오픈소스를 기반으로 상호 호환성이 검증된 Hadoop Ecosystem과 관리 환경을 제공하여 편리하게 사용할 수 있습니다. 특징 손쉬운 빅데이터 분석 환경 구성 클러스터 생성을 위한 기존의 복잡한 인프라 작업 없이, 어디서든 Samsung Cloud Platform에서 자동화 된 클러스터 설치가 가능합니다. 다양한 오픈소스 프레임워크 설치를 지원하여 손쉬운 빅데이터 분석 시스템 구성..

SQREAM

빅데이터 분석에 특화된 GPU 기반의 데이터베이스. SQream은 데이터 처리에 최적화된 GPGPU(General Purpose GPU) 기반의 데이터베이스이자 빅데이터 분석 플랫폼입니다. 수천 개의 코어를 활용하여 대용량의 데이터를 효율적으로 병렬 처리할 수 있어 빅데이터 분석 시 유사 솔루션 대비 높은 성능을 발휘합니다. Samsung Cloud Platform에서 구성과 안정성에 대해 사전 검증이 되었으며, 웹 기반 콘솔을 통해 쉽고 간편하게 설치하여 사용할 수 있습니다. 특징 쿼리 성능 및 호환성 SQream DB는 기존에 사용하던 ANSI-92 기반의 표준 SQL 쿼리를 변경 없이 그대로 사용할 수 있으며, 병렬 처리가 가능한 관계형 대수 연산용 쿼리로 자동으로 변환해줍니다. 따라서 GPU Co..

VMWARE GREENPLUM(DBAAS)

초 대용량 정형 및 비정형 데이터 분석 플랫폼. VMware Greenplum은 엔터프라이즈 분석을 위한 PostgreSQL 기반의 대규모 데이터 병렬처리 분석 플랫폼으로 향상된 트랜잭션 처리 및 스트리밍 수집을 지원하여 다양한 데이터 분석 워크로드를 처리할 수 있습니다. Samsung Cloud Platform은 단일 인스턴스나 중요 데이터의 안정적인 관리를 위해 고가용성 구성, 백업/복구, 패치, 파라미터 관리, 모니터링 등 DB관리 기능을 추가하여 데이터베이스의 생명주기 내 업무를 자동화할 수 있습니다. 특징 고성능 병렬 처리 데이터 분산, 병렬 처리 아키텍처를 적용하여 페타급의 대용량 데이터도 한 클러스터에서 분석이 가능하며, 데이터 용량 및 처리량이 증가하면 Segment 노드를 추가하여 선형적..

VERTICA(DBAAS)

대용량 데이터 분석/처리를 위한 Data Warehouse 기반의 고가용성 엔터프라이즈 데이터베이스. Vertica는 하나의 엔진을 통해 다양한 곳에서 들어오는 데이터들을 이동 없이 조회와 같은 기본분석은 물론 머신러닝 등의 AI 분석을 수행할 수 있는 데이터 분석 플랫폼입니다. Samsung Cloud Platform은 단일 인스턴스나 중요 데이터의 안정적인 관리를 위해 고가용성 구성, 백업/복구, 패치, 파라미터 관리, 모니터링 등 DB관리 기능을 추가하여 데이터베이스의 생명주기 내 업무를 자동화 할 수 있습니다. Vertica(DBaaS) 서비스는 엔터프라이즈 빅데이터 분석 플랫폼인 Vertica를 제공합니다. Vertica의 소프트웨어 라이선스는 기존 보유 라이선스를 사용 가능하며 (BYOL, B..