Oracle共175篇

Apache DolphinScheduler:深入了解大数据调度工具

Apache DolphinScheduler:深入了解大数据调度工具-牛翰网
一、海豚调度介绍 Apache DolphinScheduler 是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景,提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
04210

大数据技术发展史

大数据技术发展史-牛翰网
什么是大数据 大数据(Big Data)是指在传统数据处理方法难以处理的情况下,需要新的处理模式来具有更强的决策力、洞察发现力和过程优化能力的海量、高增长率和多样化的信息资产。大数据的特征...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
0245

实战讲解|Trino 在袋鼠云数栈的探索与实践

实战讲解|Trino 在袋鼠云数栈的探索与实践-牛翰网
当前随着企业内外部数据源的不断扩展和积累,数据呈现出大规模、多样化、质量参差不齐等显著特征。如何有效激活这些结构复杂且类型多样的数据资产,挖掘其深层价值,已成为众多企业亟待解决的实...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
04513

用 CloudCanal 做跨互联网数据库双向同步

用 CloudCanal 做跨互联网数据库双向同步-牛翰网
简介 CloudCanal 推出 跨互联网安全数据同步 方案之后,有一些商业客户落地,效果良好,不过客户也反馈了一些改进和新需求,其中最大的一个需求即双向同步防循环。 近期 CloudCanal 版本支持了...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
0437

【新手友好】用Pyspark和GraphX解析复杂网络数据

【新手友好】用Pyspark和GraphX解析复杂网络数据-牛翰网
从零开始 在本文中,我们将详细介绍如何在Python / pyspark环境中使用graphx进行图计算。GraphX是Spark提供的图计算API,它提供了一套强大的工具,用于处理和分析大规模的图数据。通过结合Pytho...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
04912

Apache DolphinScheduler 3.1.8 保姆级教程【安装、介绍、项目运用、邮箱预警设置】轻松拿捏!

Apache DolphinScheduler 3.1.8 保姆级教程【安装、介绍、项目运用、邮箱预警设置】轻松拿捏!-牛翰网
概述 Apache DolphinScheduler 是一个分布式易扩展的可视化 DAG 工作流任务调度开源系统。适用于企业级场景,提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。 Apache Do...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
02415

OLAP引擎也能实现高性能向量检索,据说QPS高于milvus!

OLAP引擎也能实现高性能向量检索,据说QPS高于milvus!-牛翰网
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 随着LLM技术应用及落地,数据库需要提高向量分析以及AI支持能力,向量数据库及向量检索等能力“异军突...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
0419

【金猿人物展】白鲸开源CEO郭炜:数据要素是未来数据“新能源”产业么?

【金猿人物展】白鲸开源CEO郭炜:数据要素是未来数据“新能源”产业么?-牛翰网
纵观2023年中国数据行业发展与2024年数据产业趋势,就不得不提到2023年全年国家全年强调的数据要素的概念以及在2023年12月中国国家数据局等17个部门联合印发了《“数据要素×”三年行动计划(20...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
04214

ByConity 社区回顾|ByConity 和开发者们一起展望未来,携手共进!

ByConity 社区回顾|ByConity 和开发者们一起展望未来,携手共进!-牛翰网
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 新年伊始,我们想在这里感谢一群 ByConity 社区的小伙伴们。 正是因为有社区的开发者的支持,截止到 20...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
04910

ClickHouse(21)ClickHouse集成Kafka表引擎详细解析

ClickHouse(21)ClickHouse集成Kafka表引擎详细解析-牛翰网
目录 Kafka表集成引擎 配置 Kerberos 支持 虚拟列 资料分享 参考文章 Kafka表集成引擎 此引擎与Apache Kafka结合使用。 Kafka 特性: 发布或者订阅数据流。 容错存储机制。 处理流数据。 老版Ka...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
0406

开源大数据集群部署(二)集群基础环境实施准备

开源大数据集群部署(二)集群基础环境实施准备-牛翰网
作者:櫰木 环境准备 本次使用到的二进制软件包目录为:系统初始化前提是操作系统已完成安装、各个主机之间网络互通,系统常用命令已安装,本默认这些前提条件已具备,不在阐述。 1 主机环境初...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
0388

作业帮基于 DolphinScheduler 的数据开发平台实践

作业帮基于 DolphinScheduler 的数据开发平台实践-牛翰网
摘要 随着任务数量、任务类型需求不断增长,对我们的数据开发平台提出了更高的要求。本文主要分享我们将调度引擎升级到 Apache DolphinScheduler 的实践经验,以及对数据开发平台的一些思考。 1...
牛柒柒的头像-牛翰网钻石会员牛柒柒3个月前
02512