메뉴보기

온프레미스 데이터 레이크 혁신, ‘오브젝트 스토리지’에 주목!

발행일자 | 2021.03.04 00:05

[데이터 인텔리전스 솔루션] 데이터 혁신 우선 순위, 효성인포메이션시스템 오브젝트 스토리지 ‘HCP’

이제 데이터가 기업 성공의 핵심 기반이 됐다. 기업들은 일상적인 데이터 관리 업무를 넘어 혁신과 비즈니스 가치 확대에 집중할 수 있는 방향으로 활용해야 한다. 효과적인 데이터 ‘운영’ 방안이 절실 해졌다. 데이터 중심의 비즈니스 민첩성을 확보하려면 데이터 관리의 흐름을 분석하고 비즈니스의 방향을 설정해야 한다.

AI 시대 데이터 활용방식, 데이터옵스


데이터 운영에서 데이터옵스(DataOps)가 주목받고 있다. 적합한 데이터를 적시에 올바른 장소로 가져올 수 있는 프로세스를 자동화해 데이터의 잠재력을 최대한 발휘하는 전략 실행 방법이기 때문이다. 개발과 운영을 함께하는 데브옵스와 같이 분석, 데이터 및 비즈니스 팀을 하나로 통합해 비즈니스 의사 결정의 품질과 예측 가능성을 향상시키고 가치 창출 시간을 단축한다.

효성인포메이션시스템이 제시하는 데이터옵스는 AI 시대의 데이터 활용 방식을 의미한다. 비즈니스 인사이트를 빠르게 찾기 위해 필요한 민첩하고 자동화된 데이터 관리 방식을 제공하는 솔루션, 방법론, 서비스 전체를 포함한다.

데이터옵스는 조직 전체의 데이터 관리자와 소비자 간 데이터 플로우 커뮤니케이션 통합 및 자동화 향상에 중점을 둔 협업적 데이터 관리 규칙으로 등장했다. 데이터옵스는 분석 속도, 거버넌스, 에지 투 클라우드 운영 민첩성 등 3가지 핵심요소가 만족돼야 한다. 데이터옵스를 구체화하려면 탐색, 메타데이터 관리, 정책 기반 거버넌스∙유지관리, 자동화된 데이터 통합 및 데이터 파이프라인 구축 기술이 필요하다.

데이터옵스의 혜택
<데이터옵스의 혜택>

빅데이터 저장 및 관리를 위한 데이터 레이크

클라우드가 등장하기 전 대다수 엔터프라이즈의 데이터는 온프레미스에 위치했다. 많은 애플리케이션에서 데이터가 동시에 사용되고 데이터 웨어하우스(DW)에 저장됐다. 데이터 증가에 따라 정형 데이터는 물론 비정형 데이터까지 관리할 필요성이 생기자 데이터 관리 프로세스가 복잡해지고, 이에 대한 해결책으로 데이터 레이크(Data Lake)가 인기를 끌고 있다.

높은 확장성과 경제성을 자랑하는 클라우드가 데이터 레이크의 대안으로 제시되며 많은 기업이 데이터를 클라우드로 이전하기 시작했다. 기업들은 비용 절감과 운영 효율성을 동시에 달성하기 위해 데이터를 멀티 클라우드에 저장하기 시작했다.

그러나 데이터 관리의 복잡성은 심화되고 있다. 기업들은 사일로화 된 다수의 개별 데이터 레이크를 클라우드로 이전할 때는 ▲다양한 유형의 데이터의 저장 ▲애플리케이션과 데이터 저장소 ▲새로운 데이터 환경에서 데이터 운영의 통제 ▲ 필요한 시점에 필요한 데이터를 찾는 방법 등에 대한 고민이 있다.

여기에 에지(edge) 시스템의 등장은 데이터 관리 문제를 더욱 복잡하게 만든다. 시장 조사기관 가트너는 2025년까지 기업이 생성하는 데이터의 75%가 전통적인 중앙집중식 데이터센터 및 클라우드 밖에서 생성∙처리될 것으로 전망했다. 이 같은 복잡성은 산업 또는 사물인터넷(IoT) 환경뿐 아니라 원격 오피스, 지점, 금융업, 병원, 소매점 등에도 적용된다.

기업은 엣지에서 코어, 클라우드에 이르는 복잡성을 줄이고 비즈니스 민첩성을 확보해야 한다. 유연한 데이터 인프라를 통해 데이터는 필요할 때 바로 그 장소에 있어야 하고 데이터를 저장하기 위한 비용 효율적인 방법이 있어야 한다.

분리된 개별적인 데이터 레이크에서 단일의 논리적인 데이터 레이크로 이동하는 것은 사일로를 제거하고, 비용 효율적으로 데이터를 이전시키는 유연한 데이터 인프라를 갖추게 한다. 따라서 기업은 필요할 때마다 필요한 곳에서 데이터를 이용할 수 있다.

미래형 스토리지 ‘오브젝트 스토리지’의 부상

차세대 데이터 레이크 환경 구현을 위한 대안으로 오브젝트 스토리지가 부상하고 있다. 오브젝트 스토리지는 데이터를 파일이나 블록이 아닌 객체로 관리한다. 객체에는 모든 유형의 정형∙비정형 데이터가 포함된다.

객체마다 데이터, 메타데이터(데이터에 대한 컨텍스트 정보), 분산 데이터를 쉽게 검색할 수 있는 고유 식별자가 포함된다. 풍부한 메타데이터는 데이터 사용과 기능에 대한 중요한 정보를 제공한다. 오브젝트 스토리지는 데이터 사일로 간 장벽을 없애 비정형 데이터를 더 스마트하게 만들고, 데이터 가치와 접근성을 한층 높여준다.

엔터프라이즈에서 빛을 발하는 오브젝트 스토리지
<엔터프라이즈에서 빛을 발하는 오브젝트 스토리지>

기업들은 단순한 데이터의 보관 및 보호를 넘어 더 많은 기능이 필요 해졌다. 사물인터넷 센서 데이터, 동영상, 이미지 같은 새로운 데이터 소스와 유형은 물론 방대한 과거 데이터에서 가치를 추출할 수 있어야 한다. 바로 오브젝트 스토리지가 필요한 이유다. 오브젝트 스토리지는 기업이 컴퓨팅 환경을 현대화하고 혁신을 창출하며 디지털 트랜스포메이션을 주도하는데 필요한 데이터 분석 역량을 구축하는 플랫폼이 되고 있다.

오브젝트 스토리지는 사실상 용량 제한이 없고 비용도 낮다. 전체 데이터 전략을 고민하는 기술 의사결정자의 경우 데이터 레이크로 알려진 대규모 중앙 저장소를 선호한다. 데이터 레이크는 데이터 사일로(silo) 현상을 방지하고 비즈니스에 가치를 제공하는 데이터 분석을 위해 여러 소스에서 데이터를 취합하는데 도움이 된다. 오브젝트 스토리지는 데이터 분석, 머신러닝, 인공지능을 방대한 데이터 저장소에 적용하는데 가장 효과적인 기술로 평가되고 있다.

고성능 오브젝트 스토리지는 워크로드를 엄청나게 빠른 속도로, 향후 필요한 확장성까지 고려해 즉각적으로 활용할 수 있다. 미래 워크로드에는 실시간 로그 집계부터 IoT 워크로드, 고성능 데이터베이스의 트랜잭션 로그 등 거의 모든 데이터 작업이 포함된다. 이들 각각의 데이터에 사용자 지정 메타데이터를 적용해 조직 내 활용 가치를 더욱 높일 수 있다.

예전 같으면 수년 동안 모니터링 환경에 원본 포맷으로 저장됐을 로그 데이터를 오브젝트 스토리지에 모두 취합해 애플리케이션 부하와 라이선싱 비용을 대폭 줄여준다. 트랜잭션 기록이 한층 풍부해지고 데이터도 정상화돼 온프레미스든 퍼블릭 클라우드든 위치에 상관없이 분석 수요가 생기면 언제라도 사용할 수 있다.

비정형 데이터 운영 최적화하는 효성인포메이션시스템 ‘HCP’ 오브젝트 스토리지 솔루션

효성인포메이션시스템은 국내 오브젝트 스토리지 시장을 개척하고 현재까지 꾸준히 사업을 전개하고 있다. 최다 레퍼런스 확보를 통한 풍부한 경험과 노하우가 강점이다. 대표적인 오브젝트 스토리지 솔루션 ‘HCP(Hitachi Content Platform)’는 대규모 비정형 데이터 환경의 안정적 운영과 공유 서비스를 단일 플랫폼에서 지원한다.

비정형 데이터의 탁월한 저장 관리 기술력을 기반으로 퍼블릭 클라우드 및 빅데이터 솔루션과 원활한 연계가 가능하다. 스토리지 용량 추가가 유연하고 스토리지 관리 비용이 절감되며 비즈니스 민첩성이 향상된다.

효성인포메이션시스템 오브젝트 스토리지 솔루션 'HCP'
<효성인포메이션시스템 오브젝트 스토리지 솔루션 'HCP'>

HCP는 데이터 레이크 환경 구현에 인기가 높다. AI 기반 데이터 레이크 환경 구현을 위해 멀티 테넌트 구성으로 원본/가공 데이터 저장 및 관리 자동화를 통한 효과를 높여준다.

원본 데이터는 오브젝트 스토리지에 1차로 저장하고 분류, 학습 서버를 통해 원본 데이터를 압축해제, 분류, 정제하여 가공된 파일을 2차로 저장한다. 각 서버 애플리케이션과 HCP 데이터 엑세스는 REST API로 연동되며, 데이터를 각 테넌트, 네임스페이스로 구성하여 스토리지 레벨 데이터 자동 관리화 기능을 제공한다.

BI/DW 영역의 데이터 플랫폼 시스템으로도 활용할 수 있다. 빅데이터 등 대내 정보계 업무 시스템과 데이터 공유가 가능하며, 대용량 데이터의 보호 및 웜 데이터의 조회 필요 시 신속한 데이터를 제공한다. 전사 S3 데이터 레이크 전환에도 활용 가능하다. 대규모 비정형 데이터 운영이 가능하며, 대용량 데이터 전송/처리를 위한 고성능을 지원한다.

HCP는 티어1 워크로드를 고속으로 지원하는 최적의 스토리지 솔루션 1순위로 기업들이 주목하고있다. 빅데이터 플랫폼 '펜타호', 머신러닝 기반 데이터 카탈로그 솔루션 '루마다 데이터 카탈로그', 루마다 데이터 옵티마이저 등과 함께 폭넓은 데이터 레이크 프레임워크를 구성하고 있다.

민첩하고 가시적인 데이터 레이크 서비스 제공과 머신러닝 분석으로 고객의 데이터를 혁신하며 비즈니스 경쟁력을 높이고 있다.

이향선기자 hyangseon.lee@nextdaily.co.kr

[알림] 전자신문인터넷과 넥스트데일리는 오는 3월 25일 목요일 오전 10시부터 오후 4시까지 “2021 데이터 인텔리전스 & 시큐리티” 무료 온라인 컨퍼런스를 개최한다. 이번 컨퍼런스에서는 데이터 산업의 주요 글로벌 리더 기업들의 데이터 관련 기술과 활용 정보를 소개한다. 기업들이 데이터 활용에 필요한 인사이트를 얻고 비즈니스를 향상시키는 효율적인 솔루션 도입과 활용 방안을 다양한 사례를 통해 제시한다.

칼럼

많이 본 기사

실시간 기사