智能工控

聊聊分布式 SQL 数据库Doris(六)-牛翰网

聊聊分布式 SQL 数据库Doris(六)

负载均衡 此处的负载均衡指的是FE层的负载均衡. 当部署多个 FE 节点时,用户可以在多个 FE 之上部署负载均衡层来实现 Doris 的高可用。官方文档描述: 负载均衡 。 实现方式 实现方式有多种,如...
猿柒的头像-牛翰网钻石会员猿柒1年前
0486
UData+StarRocks在京东物流的实践-牛翰网

UData+StarRocks在京东物流的实践

1 背景 数据服务与数据分析场景是数据团队在数据应用上两个大的方向,行业内大家有可能会遇到下面的问题: 1.1 数据服务 烟囱式开发模式:每来一个需求开发一个数据服务,数据服务无法复用,难...
猿柒的头像-牛翰网钻石会员猿柒1年前
0448
聊聊分布式 SQL 数据库Doris(七)-牛翰网

聊聊分布式 SQL 数据库Doris(七)

LSM-Tree Doris的存储结构是类似LSM-Tree设计的,因此很多方面都是通用的,先阅读了解LSM相关的知识,再看Doris的底层存储与读取流程会清晰透彻很多,LSM基本知识如下: 原理:把各种数据先用log...
猿柒的头像-牛翰网钻石会员猿柒1年前
05513
聊聊分布式 SQL 数据库Doris(八)-牛翰网

聊聊分布式 SQL 数据库Doris(八)

稀疏索引 密集索引:文件中的每个搜索码值都对应一个索引值,就是叶子节点保存了整行. 稀疏索引:文件只为索引码的某些值建立索引项. 稀疏索引的创建过程包括将集合中的元素分段,并给每个分段...
猿柒的头像-牛翰网钻石会员猿柒1年前
04311
聊聊分布式 SQL 数据库Doris(九)-牛翰网

聊聊分布式 SQL 数据库Doris(九)

优化器的作用是优化查询语句的执行效率,它通过评估不同的执行计划并选择最优的执行计划来实现这一目标。 CBO: 一种基于成本的优化器,它通过评估不同查询执行计划的成本来选择最优的执行计划。...
猿柒的头像-牛翰网钻石会员猿柒1年前
05511
Apache Paimon流式湖仓学习交流群成立-牛翰网

Apache Paimon流式湖仓学习交流群成立

Apache Paimon是一个流式数据湖平台。致力于构建一个实时、高效的流式数据湖平台。这个项目采用了先进的流式计算技术,使企业能够实时处理和分析大量数据。Apache Paimon 的核心优势在于它对于...
猿柒的头像-牛翰网钻石会员猿柒1年前
0257
袋鼠云产品功能更新报告08期|近百项全新功能和优化,你要的都在这里!-牛翰网

袋鼠云产品功能更新报告08期|近百项全新功能和优化,你要的都在这里!

欢迎来到袋鼠云08期产品功能更新报告!在瞬息万变的市场环境中,我们深知客户的需求与期待,因此,我们及时推出袋鼠云最新产品更新及优化,包括数据治理中心、Hive SQL 性能优化、新插件等,助...
猿柒的头像-牛翰网钻石会员猿柒1年前
0345
构建满足流批数据质量监控用火山引擎DataLeap-牛翰网

构建满足流批数据质量监控用火山引擎DataLeap

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 面对今日头条、抖音等不同产品线的复杂数据质量场景,火山引擎 DataLeap 数据质量平台如何满足多样的需...
猿柒的头像-牛翰网钻石会员猿柒1年前
05112
ClickHouse(16)ClickHouse日志引擎Log详细解析-牛翰网

ClickHouse(16)ClickHouse日志引擎Log详细解析

日志引擎系列 这些引擎是为了需要写入许多小数据量(少于一百万行)的表的场景而开发的。 这系列的引擎有: StripeLog Log TinyLog 共同属性 引擎: 数据存储在磁盘上。 写入时将数据追加在文件...
猿柒的头像-牛翰网钻石会员猿柒1年前
0515
【开源项目推荐】通用SQL数据血缘分析工具——Sqllineage-牛翰网

【开源项目推荐】通用SQL数据血缘分析工具——Sqllineage

大家好,我是独孤风,从本周开始,争取每周为大家带来一个优秀的开源项目推荐。 开源项目不仅促进了技术的发展和普及,还为全球范围内的开发者和用户社区建立了一个共享知识、协作和创新的平台...
猿柒的头像-牛翰网钻石会员猿柒1年前
0277