产品与工具

PiFlow

PiFlow是一个简单易用,功能强大的大数据流水线系统。它具有如下特性:1)易用性:提供所见即所得的web界面配置流水线,非常直观地监控流水线状态,查看流水线日志,同时提供检查点功能。2)扩展性强:支持用户自定义开发组件,满足用户的特定需求。3)性能优越:基于分布式计算引擎Spark开发。4)功能强大:提供100+个数据处理组件,包括spark、mllib、hadoop、hive、hbase、solr、redis、memcache、elasticSearch、jdbc、mongodb、http、ftp、xml、csv、json等。

Fork on Github.
Rabbit

Rabbit, inspired by the "serverless" trend in cloud computing and big data processing, has the ambitions to bridge the IaaS to Apache Ambari seamlessly and coordinate Ambari Services into a high-level data management workspace.

Fork on Github.
PiDB

基于属性图模型的数据融合管理工具,引入了Blob存储和Ai算法,将图片、录音等非结构化数据作为属性存储在图中。实现了知识图谱对非结构化数据存储的支持,并可以从非结构化数据中抽取信息,参与图谱的查询。丰富了知识图谱的功能。 其中将Ai处理部分抽象为AiPM模块,通过Docker将各种Ai算法的依赖屏蔽,用户可以通过图查询语言直接检索非结构化数据中的信息。

Fork on Github.
DVIZ
DVIZ

一款所见即所得的数据可视化平台。 DVIZ允许使用者可以快速的制作可视化并以云服务的形式对外发布。其特点包括:1.支持文本文件、数据库及数据服务三大类共十一种数据源,特别支持多种不同的数据服务。2.支持包括地图在内的十种可视化形式。3.支持多个可视化之间的关联配置。4.支持一键发布为云服务。

Online Demo. 报道.