數據處理
阿里云計算開放數據處理服務(Open Data Processing Service,ODPS)是飛天平臺上的大規(guī)模分布式數據處理服務,它以RESTfulAPI 的形式支持基于描述性查詢語言SQL 的數據處理,并提供MapReduce的并行計算框架。ODPS 重點面向數據量大(PB 級別)且實時性要求不高的OLAP(On-Line AnalyticalProcessing)應用,適用于海量數據統計、數據建模、數據挖掘、數據商業(yè)智能等互聯網應用。
計算性能
基于數據驅動的多級流水線并行計算框架,支持Map、Reduce、Join、Union 等多種數據節(jié)點處理模式,支持直接使用SQL 語句對海量數據進行離線分析。通過數據分裂將海量數據散布在整個集群內部,數據容量瓶頸問題得以解決。同時,計算壓力也被平均分布在集群內部,很好地解決了計算性能問題。
高可用性
系統提供錯誤監(jiān)控機制,對于故障采取自動遷移,采用多份備份來確保數據的安全性,系統達到高可用性。
語法兼容
提供與ANSI SQL 高度兼容的語法支持,支持用戶復雜的數據分析需求。提供Client 工具、RESTful 開放接口以及Java SDK 來為用戶服務,用戶可以根據自己的需求選擇合適的方式來使用該服務