编辑推荐

加载中

Hue - Hadoop 图形化用户界面

Hue 是运营和开发Hadoop应用的图形化用户界面。Hue程序被整合到一个类似桌面的环境,以web程序的形式发布,对于单独的用户来说不需要额外的安装。

收藏 575
更新于 2014/11/10
Hue

Nanocubes - 大数据可视化工具

Nanocubes 是一个大数据可视化的工具,32Tb Twitter数据,在一台16GB内存的机器上流畅、交互式地可视化。 运行 Nanocubes 你需要一个支持 WebGL 的浏览器,目前...

收藏 368

Curve - 分布式存储系统

CURVE 是网易开源的高性能、高可用、高可靠分布式存储系统,具有非常良好的扩展性。基于该存储底座可以打造适用于不同应用场景的存储系统,如块存储、对象存储、云原生数据库等。CURVE 的设计开发...

收藏 105
更新于 2020/08/01

ROOT-framework - 欧洲核子研究中心-数据处理框架

ROOT 是一个模块化的科学软件工具包,它是一个数据处理框架,提供了大数据处理、统计分析、可视化和存储所需的所有功能,主要使用 C++ 编写而成,同时可集成 Python 和 R 等其它语言。 ...

收藏 102
更新于 2019/08/20

Scribe - Facebook大量数据处理

Scribe旨在帮助Facebook处理服务器上的大量数据,正像Scribe网页所述“如经常访问Facebook,请使用Scribe。”具体而言,Scribe就是一台服务器,实时收集用网站日志信息。

收藏 70

Apache Arrow - 内存数据交换格式

Apache Arrow是Apache基金会下一个全新的开源项目,同时也是顶级项目。它的目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。 用户在应用大数据分析时除了将Hadoop等大...

收藏 99
更新于 2020/07/30

AresDB - 基于 GPU 运算的实时分析存储引擎和查询引擎

AresDB 是 Uber 开源的一个基于 GPU 运算的实时分析存储引擎和查询引擎。具备低查询延迟、高数据刷新率和高效内存和磁盘存储管理。AresDB 要求 CUDA Toolkit 的支持。...

收藏 43
更新于 2019/01/31
AresDB

Apache Trafodion - 分布式SQL引擎

概览 Trafodion提供了一个基于Hadoop平台的交易型分布式SQL引擎。它是一个擅长处理交易型负载的Hadoop大数据解决方案。其主要特性包括: 完整的ANSI SQL 92/99语言支...

收藏 131
更新于 2018/03/20
Apache Trafodion

MR4C - C++ 的 MapReduce​ 框架

MR4C 是 Google 开发的 C++ 的 MapReduce 框架,你可以在 Hadoop 架构中执行本地代码。 依赖: tested with Ubuntu 12.04 and Cent...

收藏 45
更新于 2015/02/24

WDT - 数据传输工具

WDT 是一个嵌入式函数库( embeddedable library),也是命令行工具,旨在尽可能快速地用多个 TCP 路径在 2个系统之间传送文件。WDT 意思是 Warp speed Da...

收藏 16

MacroBase - 数据分析工具

MacroBase 是一个数据分析工具,利用机器学习优先处理大型数据集。 具体来说,MacroBase 是一个新的分析监督引擎,旨在进行大型数据集和数据流优先处理。与传统的分析引擎不同,Macr...

收藏 16
MacroBase

openLooKeng - 高性能数据虚拟化引擎

openLooKeng 是一款高性能数据虚拟化引擎,提供统一 SQL 接口,具备跨数据源/数据中心分析能力以及面向交互式、批、流等融合查询场景。同时增强了前置调度、跨源索引、动态过滤、跨源协同、...

收藏 12

Apache MADlib - 大数据机器学习工具

Apache MADlib 是为数据科学提供的 SQL 大数据机器学习工具。Apache MADlib 拥有强大的大数据分析能力。Apache MADlib 支持 Postgres, Pivot...

收藏 19

Vespa - 开放大数据服务引擎

Vespa 是雅虎开源的针对大数据集的低延迟计算引擎。它存储和索引数据,以便在服务时间对数据进行查询、选择和处理。 Vespa 可实现: 使用类似 sql 的查询和非结构化搜索来选择内容 组织所...

收藏 10
Vespa

SF1R - 海量数据引擎

什么是SF1R SF1R是一个分布式的存储搜索一体化海量数据引擎。SF1R来自于iZENECloud团队多年的 研发成果,并且已经在商业网站上经受住了严苛的考验。2014年,iZENECloud...

收藏 21

Annoy - 求近似最近邻的库

Annoy 是 Spotify 开源的高维空间求近似最近邻的库,在 Spotify 使用它进行音乐推荐。最邻近搜索(Nearest Neighbor Search, NNS)又称为“最近点搜索”...

收藏 8
Annoy

Pothos framework - 数据流拓扑图开发框架

Pothos 项目是一个完善的数据流框架,用于创建互相连接的数据处理模块拓扑图。数据处理的拓扑图可以进行图形化的设计和测试,并应用到设备网络。 Pothos framework API 是平滑的...

收藏 7

Weld-Project - 用于数据分析应用程序的高性能运行时

Weld 使用 Rust 语言编写,可以使用 LLVM 编译器框架,为整个数据分析工作流生成高效的并行运行的代码。CSAIL 曾开发出了几个将速度推向极限的大数据加速项目,比如 Milk 和 T...

收藏 2

Differential Privacy - 差异隐私库

Differential Privacy 是一个差异隐私库。该项目包含了 ε-差异隐私算法的 C++ 库,可用于生成包含私有或敏感信息的数字数据集的聚合统计信息。此外还提供了一个随机测试器来检查...

收藏 7
更新于 2019/09/06

HPAT - 基于编译器的大数据框架

HPAT 是一个基于编译器的大数据框架,使用 Python 编写。 高性能分析工具包(HPAT)是一个基于编译器的框架,用于群集/云环境中的大数据分析和机器学习,既易于使用又非常快速;它比 Ap...

收藏 3

没有更多内容

加载失败,请刷新页面

返回顶部
顶部