首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >R2 SQL新增聚合分析功能,赋能边缘数据计算

R2 SQL新增聚合分析功能,赋能边缘数据计算

原创
作者头像
用户11764306
发布2026-02-03 15:28:52
发布2026-02-03 15:28:52
310
举报

Cloudflare Introduces Aggregations in R2 SQL for Data Analytics

某中心近日宣布在其R2 SQL服务中支持聚合功能。这项新特性允许开发者对存储在R2中的数据运行SQL查询。该增强功能将R2 SQL的使用范围扩展到基础过滤之外,使其对分析型工作负载更加有用,而无需依赖单独的数据仓库工具。

R2 SQL 现已支持 SUM、COUNT、AVG、MIN 和 MAX 等聚合函数,以及 GROUP BY 和 HAVING 子句。这些聚合功能让开发者能够通过R2数据目录直接对存储在R2中的数据进行SQL分析,从而快速汇总数据、发现趋势、生成报告以及识别日志中的异常模式。除了聚合功能外,此次更新还引入了模式发现命令,包括 SHOW TABLES 和 DESCRIBE。

某中心的三位技术专家总结道:

无论您是在生成报告、监控高流量日志以发现异常,还是仅仅试图发现数据中的趋势,您现在都可以在某中心的开发者平台内轻松完成所有工作,而无需管理复杂的OLAP基础设施或将数据移出R2。

另一位技术专家在其通讯中评论道:

某中心通过R2 SQL的聚合支持,持续将数据计算推向边缘,扩展了开发者能够在边缘合理运行的工作负载类型。

该中心的专家们解释了如何通过使用分散-收集和混洗策略来构建分布式 GROUP BY 执行,以便直接基于R2数据目录运行分析:

不含"HAVING"和"ORDER BY"的聚合查询可以以类似于过滤查询的方式执行。对于过滤查询,R2 SQL会选择一个节点作为查询执行的协调器。该节点分析查询并咨询R2数据目录,以确定哪些Parquet行组可能包含与查询相关的数据。每个Parquet行组代表一个相对较小的工作单元,可以由单个计算节点处理。协调器节点将工作分发到多个工作节点,并收集结果返回给用户。

某中心还单独宣布,R2数据目录现在支持Apache Iceberg表的自动快照过期功能,这与自动压缩功能相辅相成,后者通过将小数据文件合并为更大文件来优化查询性能。相关产品经理评论道:

这两者相辅相成,因为快照过期功能帮助进行的元数据清理/管理将加速这些聚合查询的性能,尤其是在启用压缩的情况下。

该中心最近还发布了一篇深度技术文章,详细记录了其分布式查询引擎的工作原理。

由于R2 SQL仍处于公开测试阶段,其支持的SQL语法在未来可能会发生变化。一篇文档页面涵盖了当前的限制和最佳实践。FINISHED

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 [email protected] 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 [email protected] 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Cloudflare Introduces Aggregations in R2 SQL for Data Analytics
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档