编辑推荐

加载中

Hue - Hadoop 图形化用户界面

Hue 是运营和开发Hadoop应用的图形化用户界面。Hue程序被整合到一个类似桌面的环境,以web程序的形式发布,对于单独的用户来说不需要额外的安装。

收藏 575
更新于 2014/11/10
Hue

OpenFEA - 可视化大数据分析挖掘工具

一、简介 FEA是一站式大数据敏捷分析中间件,融合了内存计算、机器学习、交互分析、可视化分析等技术,涵盖数据收集、数据探索、构建模型、发布模型、可视化展示、分析门户等功能,无需复杂编程即可快速实...

收藏 269
更新于 2017/06/01

Jupyter Notebook - Web 交互式计算笔记本平台

Jupyter Notebook 是一个基于 Web 的交互式计算笔记本环境。 Jupyter Notebook 允许用户创建和共享各种内容,包括实时代码、方程式、可视化和叙述文本的文档。它的用...

收藏 19
更新于 2019/11/13

Apache Griffin - 开源数据质量解决方案

Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告...

收藏 131
更新于 2018/12/14
Apache Griffin

Linkis - 计算中间件

Linkis是一个打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspar...

收藏 108
更新于 2020/06/16
Linkis

Apache Airflow - 数据管道监控工具

Airflow 被 Airbnb 内部用来创建、监控和调整数据管道。任何工作流都可以在这个使用 Python 编写的平台上运行(目前加入 Apache 基金会孵化器)。 Airflow 允许工作...

收藏 63
更新于 2019/01/09
Apache Airflow

Luigi - 开源大数据工具

Luigi 是一个 Python 模块,可以帮你构建复杂的批量作业管道。处理依赖决议、工作流管理、可视化展示等等,内建 Hadoop 支持。

收藏 68
更新于 2014/10/15

PackOne - 大数据软件栈部署与管理工具

PackOne 致力于实现主流大数据软件在云端的快速弹性部署。通过对云 API 和 Apache Ambari API 的联合调用,完成 Hadoop、Spark、NiFi、PiFlow、Kyl...

收藏 102
更新于 2019/07/10
PackOne

ScrapydWeb - 用于 Scrapyd 集群管理的 web 应用

ScrapydWeb 是一个用于 Scrapyd 集群管理的 web 应用,支持 Scrapy 日志分析和可视化。 特性: Scrapyd 集群管理 支持所有 Scrapyd JSON API ...

收藏 87
更新于 2019/08/31

GrimoireLab - 用于软件开发分析的工具集

GrimoireLab 是一个用于软件开发分析的工具集。它包括一组协调的工具,用于从支持软件开发(存储库)的系统中检索数据,将其存储在数据库中,通过计算相关指标来丰富它,并使其易于运行分析和可视...

收藏 74
更新于 2019/08/28
GrimoireLab

xarray - 在 NumPy 多维数组中加入变量名与坐标索引

xarray 是一个开源 Python 包,它可以使处理多维数组更加简单、高效并有趣。xarray 在原始类 NumPy 多维数组中引入了标签化的变量名称和坐标索引,实现了更直观、更简洁和更加不...

收藏 22
更新于 2019/07/25
xarray

Facebook-Prophet - 大规模预测工具

prophet是一个可以通过 Python 和 R 语言使用的预测工具 Prophet。并非所有的预测问题都可以通过同一种程序(procedure)解决。Prophet 是为我们在 Facebo...

收藏 46
更新于 2017/02/28

Yellowbrick - 机器学习模型选择可视化分析与诊断工具

Yellowbrick是一套视觉诊断工具,它扩展了Scikit-Learn API,允许人为操纵模型选择过程。 简而言之,Yellowbrick将scikit-learn与matplotlib结...

收藏 8

Ibis - Python 数据分析框架

Ibis 是一个新的 Python 数据分析框架,目标是让数据科学家和数据工程师们处理大型数据时,能够像处理小中型数据一样的高效。为了实现这个目标,我们将启用 Python 来作为 Apache...

收藏 20

Faust - Python 流处理

Faust 是一个流处理库,将想法从 Kafka Streams 移植到 Python。 它在 Robinhood 用于构建高性能的分布式系统和实时数据管道,每天处理数十亿个事件。 Faust ...

收藏 7
Faust

TonY - 构建在 Hadoop YARN 上的 TensorFlow 框架​​​​​​​

TensorFlow on YARN (TonY) 是一个构建在 Hadoop YARN 上的 TensorFlow 框架。 TonY 可以将单节点或分布式 TensorFlow 训练作为 Ha...

收藏 10
更新于 2018/09/16
TonY

Annoy - 求近似最近邻的库

Annoy 是 Spotify 开源的高维空间求近似最近邻的库,在 Spotify 使用它进行音乐推荐。最邻近搜索(Nearest Neighbor Search, NNS)又称为“最近点搜索”...

收藏 8
Annoy

Koalas - Apache Spark Pandas API

通过扩充Apache Spark的Python DataFrame API以与Pandas兼容,Koalas项目在与大数据交互时提高了数据科学家的工作效率。 Pandas是Python中事实上的...

收藏 6

Coronavirus Tracker API - 跟踪新冠病毒感染情况的 API

Coronavirus Tracker API 是一个简单快速的 API,用于跟踪全球新冠病毒(SARS-CoV-2)的感染情况,包括有关确诊病例、死亡人数和康复人数。使用 FastAPI 框架...

收藏 2

wradlib - 天气雷达数据处理

python 天气雷达数据处理包。 wradlib 使用 Travis CI 进行持续集成。这意味着一旦将新代码推送到 wradlib 存储库,Travis 将运行一组测试。若测试顺利进行,将在...

收藏 4

没有更多内容

加载失败,请刷新页面

返回顶部
顶部