分类
标签
排序
【数分基本功】 两种不同的用户活跃度,留存率居然完全一致!
大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。 本文是第 4 篇,也是【数分基本功】系列的第 1 篇。该系列会讲一些数据分析的...
读数据科学伦理:概念、技术和警世故事02FAT流程框架
1. 概述 1.1. 任何一种框架或核查表都会很快过时(因此需要定期更新):数据源、技术、应用程序和伦理考量都在不断地变化 1.2. 将FAT流程框架作为通用的指导准则 2. 三个...
读数据科学伦理:概念、技术和警世故事01数据科学伦理导读
1. 数据科学伦理的兴起 1.1. 数据科学实践包括:获取数据、(预)处理数据、分析数据、对数据进行建模、评估结果,然后使用模型或结果学习知识、支持论点或做决策 1.2. 数据科...
【SQL 周周练】爬取短视频发现数据缺失,如何用 SQL 填充
大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。 本文是第 5 篇,也是【SQL 周周练】系列的第 4 篇。该系列是挑选或自创具有一...
读数据自助服务实践指南:数据开放与洞察提效21读后总结与感想兼导读
1. 基本信息 数据自助服务实践指南:数据开放与洞察提效 [美] 桑迪普·乌坦坎达尼 (Sandeep Uttamchandani) 著 机械工业出版社,2022年05月出版 1.1. 读薄率 书籍总字数271千字,笔...
【Uber 面试真题】SQL :每个星期连续5星评价最多的司机
大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。 本文是第一篇,也是【SQL 周周练】系列的第一篇。该系列是挑选或自编具有一些...
HTTP接口数据也能定时同步入湖?用DolphinScheduler×SeaTunnel快速搞定!
背景与目标 我们之前曾评估使用过SeaTunnel做CDC入湖验证:SeaTunnel-CDC入湖实践,这些场景都是能直连数据库的场景,业务需求中经常会出现无法直连数据库做CDC进行数据同步的场景,而这些场景...
读数据自助服务实践指南:数据开放与洞察提效20成本管理服务
1. 成本管理服务 1.1. 为了利用云中可用的无限资源,企业需要无限的预算 1.1.1. 成本管理对于确保数据平台的有限预算与业务优先级的有效配合至关重要 1.1.2. 由于有众多选...
SeaTunnel二次开发进阶:企业级复杂场景下的亿万级数据处理与智能容错机制
作者:史德昇 随着数据来源的不断复杂化及业务需求的快速演进,通用的数据集成框架在实际落地过程中往往面临诸多挑战:数据结构不规范、字段缺失、敏感信息混杂、数据语义不清等问题频繁出现。...
读数据自助服务实践指南:数据开放与洞察提效19质量可观测性服务
1. 质量可观测性服务 1.1. 数据用户需要确保峰值实际上反映了真实情况,而不是有数据质量问题的结果 1.2. 导致质量问题的情况 1.2.1. 不正确的源模式更改 1.2.2. 数据...