大数据分析平台
大数据分析是指对规模巨大的数据库进行分析。大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。所谓大数据并不仅仅是指海量数据,而更多的是指这些数据都是非结构化的、残缺的、无法用传统的方法进行处理分析的数据。
而对于大数据的分析应该从以下六个方面进行:
1.Analytic Visualizations(可视化分析):不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观的展示数据,让数据自己说话,让观众听到结果。
2.Data Mining Algorithms(数据挖掘算法):可视化是给人看的,数据挖掘就是给机器看的。集群、分割、孤立点分析还有其他的算法让我们深入数据内部,挖掘价值。这些算法不仅要处理大数据的量,也要处理大数据的速度。
3.Predictive Analytic Capabilities(预测性分析能力):数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断。
4.Semantic Engines(语义引擎):我们知道由于非结构化数据的多样性带来了数据分析的新的挑战,我们需要一系列的工具去解析,提取,分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。
5.Data Quality and Master Data Management(数据质量和数据管理):数据质量和数据管理是一些管理方面的最佳实践。通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。
6.Data storage and data warehouse(数据存储和数据仓库):数据仓库是为了便于多维分析和多角度展示数据按特定模式进行存储所建立起来的关系型数据库。在商业智能系统的设计中,数据仓库的构建是关键,是商业智能系统的基础,承担对业务系统数据整合的任务,为商业智能系统提供数据抽取、转换和加载(ETL),并按主题对数据进行查询和访问,为联机数据分析和数据挖掘提供数据平台。
泓维明昊大数据分析平台亮点:
1.数据接入系统:泓维明昊数据接入系统作为底层基础支撑性服务,是大数据分析平台的核心组成部分。它通过提供多种数据接入工具,将来自互联网的结构化和非结构化的数据进行统一的汇聚接入,并为大数据分析平台提供原始数据支撑。
2.数据储存系统:泓维明昊数据储存系统作为数据采集的上层系统和数据分析共享的支撑系统,也是大数据分析平台的核心组成部分。它能够满足对结构化数据、非结构化数据和半结构化数据的统一储存和查询的需求。
3.数据分析系统:泓维明昊数据分析系统作为大数据平台提供数据深度挖掘和分析服务的核心系统,利用分布式存储和并行计算框架,结合多种分布式计算引擎,对各类结构化、半结构化的信息资源进行快速的分布式计算、并提供基于关联、聚类、分类、预测等类算法库的数据挖掘分析开发工具包。
4.平台管理系统:泓维明昊大数据分析平台提供数据资源管理、目录管理、用户权限、组织人员管理、数据接入和共享服务运行监控、日志审计及平台运维等平台运行和系统管理功能。



京公网安备 11010802030905号