分类
标签
排序
实时数仓-持续更新
镜像服务器清理 对于整个机器 rm -rf /tmp/* rm -rf /usr/tmp/* rm -rf /var/log/* rm -rf /var/run/log/* rm -rf /root/* rm -rf /paimon 对于Dinky rm -rf /opt/service/dinky-release-1.17-1...
全链路解析如何构建数据资产管理框架及落地实践
“数智基建+数智应用”赋能分享02期实录,该分享课件已上传至官网 ️课件下载https://www.dtstack.com/resources/1085?src=dsyfwh 以下为本次分享的回顾: 在企业数字化转型的浪潮中,数据已然...
HTTP接口数据也能定时同步入湖?用DolphinScheduler×SeaTunnel快速搞定!
背景与目标 我们之前曾评估使用过SeaTunnel做CDC入湖验证:SeaTunnel-CDC入湖实践,这些场景都是能直连数据库的场景,业务需求中经常会出现无法直连数据库做CDC进行数据同步的场景,而这些场景...
【Uber 面试真题】SQL :每个星期连续5星评价最多的司机
大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。 本文是第一篇,也是【SQL 周周练】系列的第一篇。该系列是挑选或自编具有一些...
CAD图纸智能搜索三大突破:图纸秒搜技术、相似度匹配与AI语义搜索
前言 在制造业、建筑设计和工程管理等相关领域,CAD图纸是核心资产,但海量图纸的管理与检索长期存在三大痛点: 全文检索难:传统方式需逐张打开图纸人工查找,耗时耗力;- 相似图纸匹配低效:...
Windows资源管理器漏洞复现与研究(CVE-2025-24071和CVE-2025-24054)
没有绝对安全的系统 近期又发现Windows7、8、10、11、Server平台的通用漏洞:攻击者发给你一个文本文件,甚至都不用打开,就可能中招。下班后写写技术博客,分享给各位。 该漏洞攻击隐蔽性非常...
读数据科学伦理:概念、技术和警世故事08隐私保护数据挖掘
1. ε-差分隐私 1.1. 差分隐私的概念是由辛西娅·德沃克(Cynthia Dwork)提出的,是数据科学的黄金标准之一,它将隐私纳入其中 1.2. 差分隐私的目标是让社会科学家共享有用的统计...
多源多表写入、数据格式增强,SeaTunnel 2.3.11 重磅更新来了!
我们很高兴地宣布 Apache SeaTunnel 2.3.11 正式发布!作为一个专注于高性能、可扩展的数据集成平台,SeaTunnel 始终致力于为开发者和数据工程团队提供更强大、更灵活的异构数据处理能力。本次 ...
读红蓝攻防:技术与策略15手机攻击
1. 危害系统的执行步骤 1.1. 蓝队的主要任务之一是全面了解网络杀伤链,以及如何利用它来攻击组织的基础设施 1.2. 红队可以使用模拟练习来识别违规行为,这种练习的结果有助于增...
读商战数据挖掘:你需要了解的数据科学与分析思维03数据挖掘流程
1. 数据挖掘流程 1.1. 数据挖掘是一门手艺 1.1.1. 涉及大量科学与技术的应用,而如何恰当地应用这些科学与技术也是一门艺术 1.2. 数据挖掘也有一套易于理解的流程,可以将...