分类
标签
排序
从理论到实践,实时湖仓功能架构设计与落地实战
在上篇文章中,我们向大家解释了为什么实时湖仓是当前企业数字化转型过程中的解决之道,介绍了实时计算和数据湖结合的应用场景。(“数据驱动”时代,企业为什么需要实时湖仓?) 在这篇文章中...
节点安装Java 1.8
下载jdk-8u361-linux-x64.tar.gz 官网地址 https://www.oracle.com/java/technologies/downloads 国内镜像 https://repo.huaweicloud.com/java/jdk/ 上传jdk-8u361-linux-x64.tar.gz 到node1 以...
低代码平台探讨-MetaStore元数据缓存
背景及需求 之前提到我们模型驱动的实现选择的是解释型,需要模型的元数据信息,在接到请求后动态处理逻辑. 此外,应用的通用能力中还包括:页面dsl查询,菜单查询等. 而且后期加入触发器,用户自定义...
部署HDFS集群
上传hadoop-3.3.4.tar.gz到/export/server 解压 tar -zxvf hadoop-3.3.4.tar.gz -C /export/server/ # 快捷方式 ln -s /export/server/hadoop-3.3.4 hadoop Hadoop安装包目录结构 目录 说明 bin...
两台实体机器4个虚拟机节点的Hadoop集群搭建(Ubuntu版)
安装Ubuntu Linux元信息 两台机器,每台机器两台Ubuntu Ubuntu版本:ubuntu-22.04.3-desktop-amd64.iso 处理器数量2,每个处理器的核心数量2,总处理器核心数量4 单个虚拟机内存8192MB(8G),...
使用命令操作HDFS文件系统
HDFS文件系统基本信息 HDFS作为分布式存储的文件系统,有其对数据的路径表达方式。 HDFS同Linux系统一样,均是以/作为根目录的组织形式 Linux: /usr/local/hello.txt HDFS: /usr/local/hello....
广告策划师如何做 AB 测试
更多技术交流、求职机会,欢迎关注 字节跳动数据平台微信公众号,回复【1】进入官方交流群 近年来,随着消费者的心理需求逐步趋向于精神层面、科技的迭代迅速以及市场环境的复杂性逐步上升,我...
直播预约丨《实时湖仓实践五讲》第三讲:实时湖仓在袋鼠云的落地实践之路
如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。 《实时湖...
灵活、可用、高扩展,EasyMR 带来全新 Yarn 的队列管理功能及可视化配置
YARN(Yet Another Resource Negotiator)是 Hadoop 生态系统中的资源调度器,主要用于资源管理和作业调度。YARN 自身具备队列管理功能,通过对 YARN 资源队列进行配置和管理,实现集群资源的分...
火山引擎 ByteHouse:只需 2 个方法,增强 ClickHouse 数据导入能力
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 作为企业数字化建设的必备要素,易用的数据引擎能帮助企业提升数据使用效率,更好提升数据应用...