跟着Nature Communication学作图:R语言ggpubr包画箱线图并添加显著性P值 论文 Microbiomes in the Challenger Deep slope and bottom-axis sediments #code-availability 对应代码链接 人工智能 2025年04月18日 130 点赞 0 评论 7117 浏览
数据倾斜导致子任务积压 业务背景: 一个流程中,有两个重要子任务:一是数据迁移,将kafka实时数据落Es,二是将kafka数据做窗口聚合落hbase,两个子任务接的是同一个Topic GroupId。上游Topic的 tps高峰达到5-6w。 问题描述: 给 24个 TaskManager(CPU) 都会出现来不及消费的情况。 问题原因: 做窗口聚合的任务的分组字段,分组粒度太小,hash不能打散,数据倾斜严重,导致少 人工智能 2025年06月11日 126 点赞 0 评论 7230 浏览
AI 的工具集专栏:选对工具做对事,高效玩转 AI 时代 AI 的工具集专栏:选对工具做对事,高效玩转 AI 时代 AI 的工具集专栏:选对工具做对事,高效玩转 AI 时代,本文介绍 “AI 的工具集专栏”,围绕主流 AI 工具展开,介绍其基本情况、优势、适用场景及使用技巧。学习该专栏能提升多种能力,包括识别和选择 AI 工具ÿ 人工智能 2025年08月14日 46 点赞 0 评论 7232 浏览
72、重要的事情 苏菲想知道,周青子接下来还会说些什么? 苏菲仔细的想了想周青子和自己的关系,觉得自己还是有必要的将她的信件在看看······想知道周青子还会说出什么样让自己不痛快的话来。 因为已经受过了一次的好朋友的打击,再次重新的阅读这封信的前半部分的时候,苏菲的心里已经没有一开始那么难受了,但是心里还会有些堵得慌,忍耐着继续的看下去。 接下来的内容,周青子没有在说苏菲的不是,而是将宋韩和那个女生的故事,当然是 人工智能 2025年04月07日 152 点赞 0 评论 7323 浏览
华为十年架构师实战经验总结:大规模分布式系统架构与设计实战 前言 本篇是从程序员到首席架构师十多年职业生涯的实战经验总结,系统讲解构建大规模分布式系统的核心技术与实现方法,包含开源的Fourinone系统的设计与实现过程,手把手教你掌握分布式技术。 通过学习这个系统的实现方法与相关的理论,读者可快速掌握分布式系统的理论并设计自己的分布式系统。 image.png 本篇从分布式计算的基本概念开始,解剖了众多流行概念的本质,深入讲解分布式系统的基本 人工智能 2025年05月28日 70 点赞 0 评论 7362 浏览
265. 【数据库运维】hdfs,10T硬盘被撑爆 最近遇到一个很坑,我一个 6 节点的分布式数据库,一个节点 10T 的硬盘,经过一层又一层的手动翻 hdfs 本地目录去找大文件,终于找到源头,一个 dncp-block-verification.log.curr 占了 5.6T,心中一个个问号冒出来时,非常义愤填膺:这玩意也能撑这么大?比我数据文件还要大? image.png 今天才假期第二天,客户那边就来催了,“解决方案商量好了吗 人工智能 2025年06月06日 165 点赞 0 评论 7464 浏览
R可视化——图形绘制过程中如何实现局部放大? 数据及基础图形的绘制 1、数据——以R自带数据集iris为例 df<-iris image.png 2、基于ggplot2包绘制散点图 #加载绘图包 library(ggplot2) library(ggthemes) #绘图 p<-ggplot(df, aes(Sepal.Length, Sepal.Width, color = Species)) + geom_p 人工智能 2025年04月22日 92 点赞 0 评论 7469 浏览
Apache Doris vs Clickhouse vs Greenplum 架构比对 Apache Doris、Clickhouse 、Greenplum都是基于MPP架构的实现的可用于数仓分析的数据库管理系统。下边通过具体的架构设计分析三者的区别。 Apache Dodis 官网描述 Apache Doris是一个现代化的MPP分析型数据库产品。 架构图 主从架构 架构描述 1. 高可靠 Apache Doris 使用了主从架构进行设计。通过Fronted 人工智能 2025年06月10日 150 点赞 0 评论 7499 浏览
Flink 侧流输出源码解析 Flink 侧流输出源码解析 Flink 的 side output 为我们提供了侧流(分流)输出的功能,根据条件可以把一条流分为多个不同的流,之后做不同的处理逻辑,下面就来看下侧流输出相关的源码。 先来看下面的一个 Demo,一个流被分成了 3 个流,一个主流,两个侧流输出。 SingleOutputStreamOperator<JasonLeePOJO> process = 人工智能 2025年05月31日 107 点赞 0 评论 7519 浏览
零基础也能玩转AI!手把手教你用GpuGeek训练图像分类器 文章目录 引言 GpuGeek介绍 1. 平台核心优势 (1)弹性算力网络:按需调度,极致性价比 (2)全栈开发工具链:开箱即用,极速部署 (3)国产化适配:昇腾NPU + MindSpore生态 2. 典 人工智能 2025年05月25日 160 点赞 0 评论 7571 浏览