分类
标签
排序
HBase Shell操作&Flink写入HBase
一、HBase Shell操作 1、基本操作 1)进入HBase客户端命令行 [root@bigdata1 hbase]$ bin/hbase shell 2)查看帮助命令 hbase(main):001:0> help 3)查看当前数据库中有哪些表 hbase(main):0...
Linux Zookeeper在Docker 安装与简单通信
一、在本地计算机上安装Docker 1.安装Docker (安装最新的Docker版本) yum install docker-ce docker-ce-cli containerd.io docker-bulidx-plugin docker-compose-plugin 2.查看Docker版本并启...
聊聊流式数据湖Paimon(一)
翻译自 Apache Paimon官方文档 概览 概述 Apache Paimon (incubating) 是一项流式数据湖存储技术,可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。 简单来说,Paimon的上...
数仓调优实践丨SQL改写消除相关子查询
本文分享自华为云社区《【调优实践】SQL改写消除相关子查询》,作者: 门前一棵葡萄树 。 一、子查询 GaussDB(DWS)根据子查询在SQL语句中的位置把子查询分成了子查询、子链接两种形式。 子查询S...
聊聊流式数据湖Paimon(二)
当前的问题 Apache Paimon 最典型的场景是解决了 CDC (Change Data Capture) 数据的入湖;CDC 数据来自数据库。一般来说,分析需求是不会直接查询数据库的。 容易对业务造成影响,一般分析需求...
聊聊流式数据湖Paimon(三)
概述 如果表没有定义主键,则默认情况下它是仅追加 表类型(Append Only Table)。 根据桶(Bucket)的定义,我们有两种不同的仅追加模式:'Append For Scalable Table'和'Append For Queue';两种...
GaussDB(DWS)中的分布式死锁问题实践
本文分享自华为云社区《GaussDB(DWS)中的分布式死锁问题实践》,作者: 他强由他强 。 1、什么是分布式死锁 分布式死锁是相对于单机死锁而言,一个事务块中的语句,可能会分散在集群里多个节点...
Flink计算TopN
在 Apache Flink 中实现高效的 Top N 数据处理,尤其是涉及时间窗口和多条件排序时,需要精细地控制数据流和状态管理。 普通计算TopN: 1. 定义数据源(Source) 首先,我们需要定义数据源。这...
数栈UI5.0设计实战|B端表单这样设计,不仅美观还提效
表单是B端产品中最常见的组件之一,主要⽤于数据收集、校验和提交。比如登陆流程的账号密码填写,注册流程的邮箱、用户名等信息填写,都是表单应用的常见案例,在数栈产品中也是出现频率⾮常⾼...
聊聊流式数据湖Paimon(四)
Partial Update 数据打宽 通过不同的流写不同的字段,打宽了数据的维度,填充了数据内容;如下所示: --FlinkSQL参数设置 set `table.dynamic-table-options.enabled` = `true`; SET `env.state...