DataSphere Studio - 一站式数据应用开发管理门户

DataSphere Studio(简称DSS)是微众银行大数据平台——WeDataSphere,自研的一站式数据应用开发管理门户。 基于 Linkis 计算中间件构建,可轻松整合上层各数据应用...

收藏 497
更新于 2020/07/14
DataSphere Studio

HTools - Hadoop集群监控工具

HTools是一款专业的Hadoop管理工具,不管您是非专业IT人士,还是多年经验的技术人员,本工具都会为您提供优质的管理服务和轻松的操作过程, 释放无谓的工作压力,提高Hadoop的管理水平。...

收藏 234
更新于 2013/12/24

MapReduce - 大规模数据集软件架构

MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(化简)",和他们的主要思想,都是从函数式编程语言借来的,还有...

收藏 70
更新于 2020/12/10

OpenSOC - 安全大数据分析框架

OpenSOC:安全大数据分析框架。OpenSOC已经加入Apache工程改名为Apache Metron。 思科在 BroCON 大会上亮相了其安全大数据分析架构 OpenSOC,引起了广泛关...

收藏 263
更新于 2014/12/20

Jupyter Notebook - Web 交互式计算笔记本平台

Jupyter Notebook 是一个基于 Web 的交互式计算笔记本环境。 Jupyter Notebook 允许用户创建和共享各种内容,包括实时代码、方程式、可视化和叙述文本的文档。它的用...

收藏 20
更新于 2019/11/13

Crate - 数据存储系统

Crate Data 是一个开源的大规模的可伸缩的数据存储系统,无需任何系统管理需求。提供强大的搜索功能。用于存储各种表格数据、非结构化数据和二进制对象。并可通过 SQL 进行检索。易于安装和使...

收藏 345
更新于 2020/10/30
Crate

Sketchify - 手绘风格数据可视化工具

Sketchify是一个js工具,可将任何包含SVG图形的DOM元素转换为手绘风格的效果。它基于Rough.js 用法 将由svg组成的现有图形转换为草图模式。运行以下代码: const o...

收藏 163
更新于 2019/11/25

WhereHows - 数据发现和管理工具

WhereHows 是 LinkedIn 公司一个用于大数据发现和管理的工具,集成了所有主要的数据处理系统,可以进行分类收集和元数据操作。方便内部员工发现公司内部的数据,跟踪数据集的移动和查看各...

收藏 142
更新于 2016/03/10

Linkis - 计算中间件

Linkis是一个打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspar...

收藏 423
更新于 2021/01/21
Linkis

Apache Eagle - Hadoop 数据安全方案

Apache Eagle 是 eBay 公司推出的分布式实时安全监控引方案,该项目已正式加入 Apache 成为孵化项目。Apache Eagle 提供一套高效分布式的流式策略引擎,具有高实时、...

收藏 176
更新于 2017/06/05
Apache Eagle

Heka - 数据收集和整理工具

来自 Mozilla 的 Heka 是一个用来收集和整理来自多个不同源的数据的工具,通过对数据进行收集和整理后发送结果报告到不同的目标用于进一步分析。

收藏 78
更新于 2014/03/07

Apache Tajo - 分布式数据仓库系统

Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟 完全分布式的 SQL 查询处理,基于存储雨 HDFS...

收藏 203
更新于 2016/05/20

Apache CarbonData - 华为大数据存储方案

Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以...

收藏 145
更新于 2018/11/19
Apache CarbonData

MLF - 大数据机器学习框架(弥勒佛)

让天下没有难做的大数据模型! 功能 下面是弥勒佛框架解决的问题类型,括号中的斜体代表尚未实现以及预计实现的时间 监督式学习:最大熵分类模型(max entropy classifier),决策树...

收藏 195
更新于 2016/05/03

Apache Griffin - 开源数据质量解决方案

Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告...

收藏 131
更新于 2018/12/14
Apache Griffin

Apache Iceberg - 跟踪超大规模表的新格式

Apache Iceberg 是一种新的表格格式,用于存储和分析大型的、移动缓慢的表格数据。它的工作方式类似于 SQL 表,它旨在改进内置在 Hive、Presto 和 Spark 中的事实上的...

收藏 43
更新于 2020/05/28
Apache Iceberg

TipDM - 数据库建模平台和挖掘工具

TipDM数据挖掘建模平台是基于Python引擎、用于数据挖掘建模的开源平台。平台提供数量丰富的数据分析与挖掘建模组件,用户可在没有编程基础的情况下,通过拖拽的方式进行操作,将数据输入输出、数据...

收藏 151

Apache Airflow - 数据管道监控工具

Airflow 被 Airbnb 内部用来创建、监控和调整数据管道。任何工作流都可以在这个使用 Python 编写的平台上运行(目前加入 Apache 基金会孵化器)。 Airflow 允许工作...

收藏 74
更新于 2021/01/05
Apache Airflow

Rain - Rust 实现的分布式计算框架

Rain 是一个 Rust 实现的轻巧且强大的分布式计算框架,适用于处理大规模的基于任务的管道。 Rain 旨在降低分布式计算世界的入门门槛,目的是提供一个轻巧而强大的分布式框架,该框架具有直观...

收藏 50
更新于 2018/07/11
Rain

DataX Web - 分布式数据同步工具

DataX Web是在DataX之上开发的分布式数据同步工具,提供简单易用的操作界面,降低用户使用DataX的学习成本,缩短任务配置时间,避免配置过程中出错。用户可通过页面选择数据源即可创建数据...

收藏 201
更新于 2020/07/01

没有更多内容

加载失败,请刷新页面