Apache HAWQ - 大规模并行 SQL 分析处理引擎

HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。 Apache HAWQ 具有大规模并行处理很多传统数据库以及其他数...

收藏 131
更新于 2018/10/01
Apache HAWQ

OpenSOC - 安全大数据分析框架

OpenSOC:安全大数据分析框架。OpenSOC已经加入Apache工程改名为Apache Metron。 思科在 BroCON 大会上亮相了其安全大数据分析架构 OpenSOC,引起了广泛关...

收藏 263
更新于 2014/12/20

GoPlus - 数据科学语言

GoPlus(Go+)是一门静态类型语言,与 Go 语言完全兼容。其代码样式类似脚本,并且比 Go 更具可读性,专门用于数据科学。 简单对比: GoPlus 代码 a := [1, 2, 3...

收藏 45
更新于 2020/07/30

DataSphere Studio - 一站式数据应用开发管理门户

DataSphere Studio(简称DSS)是微众银行大数据平台——WeDataSphere,自研的一站式数据应用开发管理门户。 基于 Linkis 计算中间件构建,可轻松整合上层各数据应用...

收藏 178
更新于 2020/07/14

Crate - 数据存储系统

Crate Data 是一个开源的大规模的可伸缩的数据存储系统,无需任何系统管理需求。提供强大的搜索功能。用于存储各种表格数据、非结构化数据和二进制对象。并可通过 SQL 进行检索。易于安装和使...

收藏 340
更新于 2019/02/26
Crate

WhereHows - 数据发现和管理工具

WhereHows 是 LinkedIn 公司一个用于大数据发现和管理的工具,集成了所有主要的数据处理系统,可以进行分类收集和元数据操作。方便内部员工发现公司内部的数据,跟踪数据集的移动和查看各...

收藏 142
更新于 2016/03/10

Apache Eagle - Hadoop 数据安全方案

Apache Eagle 是 eBay 公司推出的分布式实时安全监控引方案,该项目已正式加入 Apache 成为孵化项目。Apache Eagle 提供一套高效分布式的流式策略引擎,具有高实时、...

收藏 176
更新于 2017/06/05
Apache Eagle

Sketchify - 手绘风格数据可视化工具

Sketchify是一个js工具,可将任何包含SVG图形的DOM元素转换为手绘风格的效果。它基于Rough.js 用法 将由svg组成的现有图形转换为草图模式。运行以下代码: const o...

收藏 158
更新于 2019/11/25

Apache Tajo - 分布式数据仓库系统

Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟 完全分布式的 SQL 查询处理,基于存储雨 HDFS...

收藏 203
更新于 2016/05/20

Heka - 数据收集和整理工具

来自 Mozilla 的 Heka 是一个用来收集和整理来自多个不同源的数据的工具,通过对数据进行收集和整理后发送结果报告到不同的目标用于进一步分析。

收藏 78
更新于 2014/03/07

Apache CarbonData - 华为大数据存储方案

Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以...

收藏 144
更新于 2018/11/19
Apache CarbonData

Jupyter Notebook - Web 交互式计算笔记本平台

Jupyter Notebook 是一个基于 Web 的交互式计算笔记本环境。 Jupyter Notebook 允许用户创建和共享各种内容,包括实时代码、方程式、可视化和叙述文本的文档。它的用...

收藏 19
更新于 2019/11/13

Apache Griffin - 开源数据质量解决方案

Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告...

收藏 131
更新于 2018/12/14
Apache Griffin

Apache Iceberg - 跟踪超大规模表的新格式

Apache Iceberg 是一种新的表格格式,用于存储和分析大型的、移动缓慢的表格数据。它的工作方式类似于 SQL 表,它旨在改进内置在 Hive、Presto 和 Spark 中的事实上的...

收藏 42
更新于 2020/05/28
Apache Iceberg

Linkis - 计算中间件

Linkis是一个打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspar...

收藏 108
更新于 2020/06/16
Linkis

TDW - 腾讯分布式数据仓库

腾讯分布式数据仓库项目,在Hadoop和hive的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法,支持PB级的存储和TB级的计算等。 这个项目主要的应用场...

收藏 72

Apache Edgent - 面向物联网设备的运行时

Apache Edgent 是一种编程模型和具有微内核风格的运行时,可嵌入到网关和小型的物联网设备中。Apache Edgent 能用于对来自器材、车辆、系统、应用、设备和传感器(例如树莓派或智...

收藏 95
更新于 2018/01/05
Apache Edgent

Suro - 数据管道服务

Netflix 开源了一个叫做Suro的工具,它能够在数据被发送到不同的数据平台(如Hadoop、Elasticsearch)之前,收集不同应用服务器上的事件数据,这项创新技术具备成为大数据主流...

收藏 156

TipDM - 数据库建模平台和挖掘工具

TipDM数据挖掘建模平台是基于Python引擎、用于数据挖掘建模的开源平台。平台提供数量丰富的数据分析与挖掘建模组件,用户可在没有编程基础的情况下,通过拖拽的方式进行操作,将数据输入输出、数据...

收藏 146

Apache Airflow - 数据管道监控工具

Airflow 被 Airbnb 内部用来创建、监控和调整数据管道。任何工作流都可以在这个使用 Python 编写的平台上运行(目前加入 Apache 基金会孵化器)。 Airflow 允许工作...

收藏 63
更新于 2019/01/09
Apache Airflow

没有更多内容

加载失败,请刷新页面