大数据

二、Kafka核心架构与分布式存储

思维导图 一、Kafka定位与核心特性 Kafka不仅是传统的消息队列中间件,更被官方定义为新一代的分布式事件流平台。它在海量流式计算场景中占据绝对核心地位,具备以下底层物理特性: 高吞吐与高并发:摒弃缓慢的随机寻址,深度依赖操作系统的页缓存与磁盘的顺序追加写。单机即可支撑每秒百万级的高并发数据吞吐。 可靠性与持

时序数据库选型指南:从大数据视角看IoTDB的核心优势

声明:文章为本人真实测评,非广告,无推广,为用户体验文章引言:在工业4.0与物联网技术深度融合的今天,时序数据已成为企业数字化转型的核心资产。据IDC预测,到2025年全球物联网设备产生的数据量将突破79.4ZB,其中时序数据占比超过60%。面对海量设备产生的高频、多维、有序数据&#xf

【SpringCloud】注册中心 && 服务注册 && 服务发现 && Eureka

文章目录 Ⅰ. 背景 一、问题描述 二、注册中心 三、CAP理论 四、常见的注册中心 ① Zookeeper ② Eureka ③ Nacos CAP对比 Ⅱ. Eureka介绍 Ⅲ. 搭建EurekaServer 一、创建Eureka-server子模块 二、引入eureka-server依赖 三、添加maven项目构建插件 四、完善启动类 五、编写配置文件

Hadoop完全分布式集群搭建

一、修改主机名在Centos7中直接使用root用户执行hostnamectl命令修改,重启(reboot)后永久生效。之后重启mobaXterm二、修改连接会话的名称选中对应的连接——单击鼠标右键——rename session——输入会话的新名称即可三、关闭防火墙1.查看防火墙状态2.停止防火墙但是注意,这个命令只是暂时关闭防火墙&#xf

Kafka - 在微服务架构中的应用:服务解耦与异步通信

👋 大家好,欢迎来到我的技术博客! 💻 作为一名热爱 Java 与软件开发的程序员,我始终相信:清晰的逻辑 + 持续的积累 = 稳健的成长。 📚 在这里,我会分享学习笔记、实战经验与技术思考,力求用简单的方式讲清楚复杂的问题。 🎯

什么是SparkONYarn模式

1. 什么是 Spark on YARN?Spark on YARN 是 Apache Spark 的一种部署模式,允许 Spark 应用程序在 Hadoop YARN 集群上运行,充分利用 YARN 的资源管理和调度能力。这种模式将 Spark 与 Hadoop 生态深度集成,使企业能够在同一集群上统一管理批处理、流处理、交互式查询等多种工

Spring Boot 集成 RabbitMQ 详细教程:从入门到生产实践

📌 关键词:Spring Boot、RabbitMQ、消息队列、AMQP、消息可靠性、死信队列、延迟消息、生产级配置 适用人群:Java 后端开发者、微服务架构师、系统集成工程师 技术栈:Spring Boot 3.x + RabbitMQ 3.12+ + Java 17 一、为什么选择 RabbitMQ&

大数据实例-基于Python的体育比赛数据分析,基于数据可视化的体育比赛数据分析(源码+LW+部署文档+全bao+远程调试+代码讲解等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围::小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫

Kafka 的 ACK 机制详解

1.ACK 机制的基本概念ACK(Acknowledgment)即确认机制,是 Kafka 生产者和 Broker 之间的一种消息确认约定。生产者在发送消息后,需要等待 Broker 端的确认信号,以此判断消息是否成功发送。这一机制主要是为了保证消息不会因为网络问题或 Broker 故障而丢失,确保数据的可靠性。

Windows 下 Kafka 安装教程(保姆级)

一、准备工作✅ 1. 安装 Java JDK(Kafka 依赖 Java 运行环境)Kafka 是基于 Java 的,必须先安装 JDK。一般学到kafka的同学肯定已经安装好了JDK了,这一步我就不写了,具体可以参考其他文章。⚠️ 注意:Kafka 3.9.0 要求本地必须安装 JDK 17 或以上版本。JDK