하버드 비즈니스 리뷰(Harvard Business Review)의 발표에 따르면, 기업들은 비즈니스 의사결정 시 자사의 데이터 중 50% 미만의 정형 데이터와 1% 미만의 비정형 데이터만을 활용하는 것으로 나타났다. 그러므로 기업이 비즈니스에 성공을 거두려면 방대한 양의 정형 및 비정형 데이터에 대한 간편하고도 신속한 분석이 필요하다.

효성인포메이션시스템(대표 정태수)은 히타치 그룹(Hitachi, Ltd, 이하 히타치)의 완전 자회사인 히타치 밴타라(Hitachi Vantara)가 자사의 데이터 통합 및 분석 플랫폼 소프트웨어 펜타호(Pentaho)의 최신 버전을 출시했다고 밝혔다.

펜타호 8.2버전은 히타치의 오브젝트 스토리지 플랫폼 HCP(Hitachi Content Platform) 및 다른 제품 포트폴리오와의 통합이 강화돼 주요 산업 분야 기업들이 비정형 데이터를 기반으로 다양한 활용사례들을 구현하도록 지원한다. 또한, 하이브리드 클라우드 환경과 확장된 분석 에코시스템 기능 활용을 지원한다.

100% GUI 기반의 간편한 환경에서 데이터 수집과 통합부터 머신러닝 모델 구축, 고급 분석, 모델 업데이트, 시각화 및 리포팅을 하나의 워크플로우로 구현해 기업의 빅데이터 처리 및 분석 효율성을 대폭 향상시키는 것이 강점이다. 뿐만 아니라, 병렬처리, 서버 클러스터링 및 AEL(Adaptive Execution Layer)를 통해 고속 빅데이터 처리를 지원한다.

펜타호 8.2는 HCP와의 통합을 통해 기업들이 정형 데이터 소스뿐 아니라, 문자, 영상, 오디오, 이미지, 소셜 미디어, 클릭스트림(clickstreams) 및 로그 파일과 같은 비정형 데이터 소스를 포함하는 데이터 파이프라인을 구축하고, 인사이트를 도출해 비즈니스 가치를 높일 수 있도록 지원한다.

금융 서비스 기관은 무역 거래 데이터와 이메일 커뮤니케이션 데이터 간의 상관관계를 분석함으로써 컴플라이언스 요구사항을 보다 쉽게 충족시킬 수 있다. 의학 연구자들은 환자와 약물 복용 관련한 데이터를 비정형화된 자기 공명 영상(MRI) 데이터와 통합해 신약 개발 과정에서 도움을 얻을 수 있다.

소매업자들은 가게 내부의 영상과 판매시점관리(point-of-sale, POS) 데이터를 결합 분석해 고객의 쇼핑 선호도 및 매장 내 개별 브랜드들의 고객 방문량 추세를 파악할 수 있다. 사법기관은 영상 기록과 범죄 보고서를 결합해 증거를 보다 빠르게 수집하고, 의사결정을 개선하면서 지속적으로 규제를 충족시킬 수 있다.

NoSQL 데이터베이스, 마이크로소프트 애저(Microsoft Azure), 아마존(Amazon) 및 구글(Google) 퍼블릭 클라우드 서비스 및 온프레미스 환경의 오브젝트 스토리지가 데이터 레이크의 새로운 대안으로 떠오르면서, 기업들은 데이터 관리 및 규제 준수를 위한 데이터 거버넌스 분야의 최상의 투자 방안을 모색하고 있다.

HCP와 통합된 펜타호 8.2는 데이터를 HCP로 이동시켜 데이터 레이크를 구축, 데이터 준비, 정제 및 표준화를 수행해 데이터 관리가 향상되고 클라우드 타깃에 적합한 데이터 유형을 결정하고 준비된 데이터를 클라우드 환경으로 전송해 불필요한 데이터 전송량을 줄이고 비용을 보다 잘 관리할 수 있다.

펜타호 8.2는 써드파티 제품 및 기술들로 구성된 분석 에코시스템에 대한 지원을 확대해 기업들의 데이터 파이프라인 및 분석 프로젝트 최적화를 돕는다.

기업들은 인기 있는 오픈소스 메시징 프로토콜인 AMQP(Advanced Messaging Queuing Protocol)를 통해 엣지 디바이스 상의 스트리밍 데이터를 새로운 IoT 활용사례 구현을 위한 클라우드 환경으로 읽기(read) 및 퍼블리시(publish)할 수 있다.

고객관리 암호화 키(Customer Managed Encryption Key, CMEK)에 대한 지원을 통해 기업들은 구글 클라우드 스토리지(Google Cloud Storage) 및 구글 빅쿼리(Google BigQuery) 환경의 데이터에 접근하는 동시에, 데이터 암호화 키를 제어하고 데이터 보호를 강화할 수 있다.

기업들은 파이썬으로 구축된 머신러닝 및 딥러닝 모델을 운영하고, API로 사이킷런(Scikit-learn) 및 텐서플로우(TensorFlow) 라이브러리에 연결할 수 있다. 기업들은 상용화된 버전의 오픈JDK에서 오픈소스 무료 버전의 오픈JDK로 전환할 수 있다.

효성인포메이션시스템 DATA사업팀 최태욱 부장은 “펜타호는 빅데이터 분석 과정을 모두 자동화하며, 최신 데이터에 따라 기존의 모델을 민첩하게 업데이트할 수 있어 기업의 빅데이터 분석 생산성을 높인다. 이미 효성인포메이션시스템은 데이터를 다루고 관리하는 분야에서 축적한 전문성 및 기술지원 능력을 바탕으로 국내 기업의 빅데이터 프로젝트 기획부터 구축 및 구현에 이르기까지 전 과정을 지원하고 있다. 펜타호가 빅데이터 관련 문제를 해결하는 데 명쾌한 청사진을 제시할 것이다”고 말했다.

이향선기자 hslee@nextdaily.co.kr

관련기사

저작권자 © 넥스트데일리 무단전재 및 재배포 금지