分类
标签
排序
白鲸开源CEO郭炜在2024 DataOps发展大会上获聘专家
2024年5月15日,白鲸开源CEO郭炜在2024 DataOps发展大会上被正式聘任为DataOps专家,并获得了荣誉证书。本次大会由中国通信标准化协会主办,中关村科学城管委会提供支持,大数据技术标准推进委...
首次尝试SeaTunnel同步Doris至Hive?这些坑你不能不避
笔者使用SeaTunnel 2.3.2版本将Doris数据同步到Hive(cdh-6.3.2)首次运行时有如下报错,并附上报错的解决方案: java.lang.NoClassDefFoundError: org/apache/hadoop/hive/metastore/api/MetaExc...
DashVector x 通义千问大模型:打造基于专属知识的问答服务
本教程演示如何使用向量检索服务(DashVector),结合LLM大模型等能力,来打造基于垂直领域专属知识等问答服务。其中LLM大模型能力,以及文本向量生成等能力,这里基于灵积模型服务上的通义千问...
推荐系统:精排多目标融合与超参数学习方法
帕累托最优指的是这样一种社会状态:当且仅当不减少其他人的效用就无法增加任何一个人的效用时,这种社会状态就称之为帕累托最优。 1 导引 1.1 推荐系统基本架构 在介绍多目标融合模块之前,我...
别再发邮件了,必须在开源之夏后台申请,50%的人竟然都没有报名成功!
引言 近期我们注意到很多学生朋友通过邮件向导师申请报名,请注意!!!这是无效的,请必须通过“开源之夏”官方后台申请报名,请仔细参考这篇【报名攻略】 所以,我们特此举办这次宣讲会,目...
逻辑升级,深度解析如何实现业务中的且或组件
在业务实现的过程中,时常会出现且或关系逻辑的拼接。逻辑运算的组合使用,是实现复杂业务规则和决策支持系统的关键技术。 目前袋鼠云的指标管理平台、客户数据洞察平台、数据资产平台都有在使...
阿里 Canal 实时同步 MySQL 增量数据至 ClickHouse 数据库
主要实现思路 1、在clickhouse中创建MySQL引擎表。 2、根据MySQL引擎表的信息创建目标表。 3、实现canal实时增量同步MySQL数据到clickhouse。 MySQL 的准备 修改配置文件开启 Binlog [root@hado...
【最新】别再发邮件了,必须在开源之夏后台申请,50%的人竟然都没有报名成功!
引言 近期我们注意到很多学生朋友通过邮件向导师申请报名,请注意!!!这是无效的,请必须通过“开源之夏”官方后台申请报名,请仔细参考这篇【报名攻略】 所以,我们特此举办这次宣讲会,目...
EasyMR 基于国产化信创的适配实践技术详解
国产化信创,即采用国产信息技术产品和服务,构建自主可控的信息技术体系。近年来,随着国家对网络安全和信息安全的重视程度不断提高,国产化信创已经成为国家战略的重要组成部分,并呈现出以下...
2024-2030数据集成成熟度曲线(一)
作者 | 郭炜 导读:最新发布的《技术成熟度曲线2024》全面评估数据集成技术架构的7个维度,包括技术成熟度、技术难度、业务价值、技术成熟周期、管理协作难度、大模型结合等评估维度,报告篇幅...