智能工控

Apache DolphinScheduler 支持使用 OceanBase 作为元数据库啦!-牛翰网

Apache DolphinScheduler 支持使用 OceanBase 作为元数据库啦!

DolphinScheduler是一个开源的分布式任务调度系统,拥有分布式架构、多任务类型、可视化操作、分布式调度和高可用等特性,适用于大规模分布式任务调度的场景。目前DolphinScheduler支持的元数据...
猿柒的头像-牛翰网钻石会员猿柒1年前
05111
大型集团企业数据治理方案,以“应用驱动”的数据治理策略 | 行业方案-牛翰网

大型集团企业数据治理方案,以“应用驱动”的数据治理策略 | 行业方案

数据治理是推动大型集团企业转型升级、提升竞争优势、实现高质量发展的重要引擎。 通过搭建大数据平台,实现对业务系统数据的采集、清理、建模、整合,建立一个符合业务需求的数据决策平台,形...
猿柒的头像-牛翰网钻石会员猿柒1年前
04911
ELT已死,EtLT才是现代数据处理架构的终点!-牛翰网

ELT已死,EtLT才是现代数据处理架构的终点!

提到数据处理,经常有人把它简称为“ETL”。但仔细说来,数据处理经历了ETL、ELT、XX ETL(例如,Reverse ETL、Zero-ETL)到现在流行的EtLT架构几次更迭。目前大家使用大数据Hadoop时代,主要都...
猿柒的头像-牛翰网钻石会员猿柒1年前
03411
【共建开源】手把手教你贡献一个 SeaTunnel PR,超级详细教程!-牛翰网

【共建开源】手把手教你贡献一个 SeaTunnel PR,超级详细教程!

Apache SeaTunnel是一个非常易于使用的、超高性能的分布式数据集成平台,支持海量数据的实时同步。每天可稳定高效同步数百亿数据,已被近百家企业投入生产使用。 现在的版本不支持通过jtds的方...
猿柒的头像-牛翰网钻石会员猿柒1年前
04311
直播预约丨《实时湖仓实践五讲》第二讲:实时湖仓功能架构设计与落地实战-牛翰网

直播预约丨《实时湖仓实践五讲》第二讲:实时湖仓功能架构设计与落地实战

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。 《实时湖...
猿柒的头像-牛翰网钻石会员猿柒1年前
04611
一个平台搞定数据治理,让数据资产发挥价值-牛翰网

一个平台搞定数据治理,让数据资产发挥价值

根据北京研精毕智信息咨询发布的调查报告,2018-2021年,全球数据存储量由30ZB上升至55ZB左右,年平均增长率约为27.8%。到2022年,数据总存储量进一步增加至65ZB以上,较2021年同期新增了约10ZB...
猿柒的头像-牛翰网钻石会员猿柒1年前
05711
聊聊分布式 SQL 数据库Doris(八)-牛翰网

聊聊分布式 SQL 数据库Doris(八)

稀疏索引 密集索引:文件中的每个搜索码值都对应一个索引值,就是叶子节点保存了整行. 稀疏索引:文件只为索引码的某些值建立索引项. 稀疏索引的创建过程包括将集合中的元素分段,并给每个分段...
猿柒的头像-牛翰网钻石会员猿柒1年前
04311
聊聊分布式 SQL 数据库Doris(九)-牛翰网

聊聊分布式 SQL 数据库Doris(九)

优化器的作用是优化查询语句的执行效率,它通过评估不同的执行计划并选择最优的执行计划来实现这一目标。 CBO: 一种基于成本的优化器,它通过评估不同查询执行计划的成本来选择最优的执行计划。...
猿柒的头像-牛翰网钻石会员猿柒1年前
05511
车企数据治理实践案例,实现数据生产、消费的闭环链路 | 数字化标杆-牛翰网

车企数据治理实践案例,实现数据生产、消费的闭环链路 | 数字化标杆

随着业务飞速发展,某汽车制造企业业务系统数量、复杂度和数据量都在呈几何级数的上涨,这就对于企业IT能力和IT架构模式的要求越来越高。加之企业大力发展数字化营销、新能源车等业务,希望通过...
猿柒的头像-牛翰网钻石会员猿柒1年前
04611
数据资产入表在即,企业如何把握机遇,进行数据资产管理?-牛翰网

数据资产入表在即,企业如何把握机遇,进行数据资产管理?

数据作为新时代重要的生产要素之一,数据资产化的相关工作正在提速。自今年10月1日起,中国资产评估协会制定的《数据资产评估指导意见》正式施行。同时,《企业数据资源相关会计处理暂行规定》...
猿柒的头像-牛翰网钻石会员猿柒1年前
05711