大数据查询引擎 PrestoDB

大数据查询引擎 PrestoDB

Apache
Java 查看源码»
跨平台
Facebook
2013-06-13
红薯

Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是 Hive 的 10 倍以上。

PrestoDB 是 Facebook 推出的一个大数据的分布式 SQL 查询引擎。可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。

Presto 可以查询包括 Hive、Cassandra 甚至是一些商业的数据存储产品。单个 Presto 查询可合并来自多个数据源的数据进行统一分析。

Presto 的目标是在可期望的响应时间内返回查询结果。Facebook 在内部多个数据存储中使用 Presto 交互式查询,包括 300PB 的数据仓库,超过 1000 个 Facebook 员工每天在使用 Presto 运行超过 3 万个查询,每天扫描超过 1PB 的数据。此外包括 Airbnb 和 Dropbox 也在使用 Presto 产品。

Presto 是一个分布式系统,运行在集群环境中,完整的安装包括一个协调器 (coordinator) 和多个 workers。查询通过例如 Presto CLI 的客户端提交到协调器,协调器负责解析、分析和安排查询到不同的 worker 上执行。

此外,Presto 需要一个数据源来运行查询。当前 Presto 包含一个插件用来查询 Hive 上的数据,要求:

  • Hadoop CDH4

  • 远程 Hive metastore service

Presto 不使用 MapReduce ,只需要 HDFS

要求:

  • Mac OS X or Linux

  • Java 7, 64-bit

  • Maven 3 (for building)

  • Python 2.4+ (for running with the launcher script)

加载中

评论(2)

qwfys
qwfys
~~~~
靖先生
靖先生
国内唯一一个Cassandra中文社区 innosql.cn,知识分享、收录、互动交流平台

Presto 0.220 发布,Facebook 开源的大数据查询引擎

Presto 0.220 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2019/05/19 07:23

开源分布式 SQL 查询引擎 Presto 成立软件基金会

Presto 的创建者近日宣布成立 Presto 软件基金会,这是一个致力于推进 Presto 开源分布式 SQL 查询引擎的非盈利组织。 Presto 是 Facebook 开源的一个大数据的分布式 SQL 查询引擎,可对从数...

2019/02/04 08:08

Presto 0.206 发布,Facebook 开源的大数据查询引擎

Presto 0.206 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2018/07/19 07:25

Presto 0.199 发布,Facebook 开源的大数据查询引擎

Presto 0.199 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2018/04/24 07:27

Presto 0.190 发布,Facebook 开源的大数据查询引擎

Presto 0.190 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2017/12/08 07:17

Presto 0.187 发布,Facebook 大数据查询引擎

Presto 0.187 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2017/10/21 07:34

Presto 0.182 发布,Facebook 开源的大数据查询引擎

Presto 0.182 发布了,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2017/08/04 09:03

Presto 0.180 发布,Facebook 大数据查询引擎

Presto 0.180 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2017/07/01 07:26

Presto 0.179 发布,Facebook 大数据查询引擎

Presto 0.179 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2017/06/16 07:20

Presto 0.175 发布,Facebook 大数据查询引擎

Presto 0.175 发布了,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。 Pr...

2017/05/08 07:20

没有更多内容

加载失败,请刷新页面

5
回答
persto现在国内用的人多不多,怎么考虑这个persto问题呀?

persto现在国内用的人多不多,怎么考虑这个persto问题呀?

2016/07/27 14:18

没有更多内容

加载失败,请刷新页面

没有更多内容

在此等待facebook Presto 开源

在此等待facebook Presto 开源,大家一起等吧

2013/06/20 19:50
89
0
Presto

将时间戳转字符串 format_datetime(from_unixtime(time / 1000), 'yyyy-MM-dd HH:mm:ss') 多多使用WITH语句 使用Presto分析统计数据时,可考虑把多次查询合并为一次查询,用Presto提供的子查...

2019/01/24 11:13
221
0
Presto系列 | Presto基本介绍

CLANNAD 前言 Presto是一款Facebook开源的MPP架构的OLAP查询引擎,可针对不同数据源执行大容量数据集的一款分布式SQL执行引擎。因为工作中接触到Presto,研究它对理解SQL Parser、常见算子的...

09/20 22:55
14
0
Presto系列 | Presto基本介绍

前言 Presto是一款Facebook开源的MPP架构的OLAP查询引擎,可针对不同数据源执行大容量数据集的一款分布式SQL执行引擎。因为工作中接触到Presto,研究它对理解SQL Parser、常见算子的实现(如...

09/26 12:31
15
0
presto

/opt/smc/presto-server-0.52/presto --server ******:8081 --catalog hive --schema log,default --output-format TSV select * from sys.node; 查看 node 节点 select * from sys.query; 查...

2014/10/24 18:21
74
0
Introducing Presto

1 Presto简介 Presto是一个开源的分布式SQL查询引擎,支持从GB到PB数据量上的交互式分析查询。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的...

2017/08/14 09:30
80
0
presto 架构

presto 介绍 是Facebook开源的,完全基于内存的并⾏计算,分布式SQL交互式查询引擎 是一种Massively parallel processing (MPP)架构,多个节点管道式执⾏ ⽀持任意数据源(通过扩展式Connect...

2018/09/19 12:14
505
0
Facebook、Uber、Twitter和阿里巴巴成立了Presto基金会,以大规模处理分布式数据处理

作者:Craig Ross 托管在Linux基金会下,使用中立的治理模型扩展社区 旧金山,CA,2019年9月23日 - Linux基金会,一个通过开源实现大规模创新的非盈利组织,今天宣布,Presto,一个被广泛采用...

2019/09/27 06:48
2
0
presto搭建

1.Presto简介 Presto是由Facebook开源,完全基于内存的并行计算以及分布式SQL交互式查询引擎。它可以共享Hive的元数据,然后直接访问HDFS中的数据,同时支持Hadoop中常见的文件格式比如文本,...

2019/10/27 10:13
28
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部