大数据

计算机毕业设计Hadoop+Spark+DeepSeek-R1大模型民宿推荐系统 hive民宿可视化 民宿爬虫 大数据毕业设计(源码+文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、

window下安装并启动kafka

进入Kafka官网:Apache Kafka下载最新版Kafka 2.将Kafka路径配置到windows环境变量下(KAFKA_HOME),并将其添加到path中(方法同上) 3.进入E:\midware\kafka_2.13-3.9.0,创建2个自定义文件夹mydata,mylog 4.修改zk的配置文件

一文带你学会zookeeper(了解、安装、集群、使用)

概述:         1、zookeeper是一个开源的分布式的服务协调框架(Apache项目)         2、zookeeper从设计模式的角度来理解:是一个基于观察者模式的分布式服务管理框架,他负责存储和管理大家都关心的数据,然后接收观察者的注册,一旦这些数据发生变化,zoo

conda 环境配置国内镜像加速(2025)

以下是在 conda 环境中配置国内镜像以加速conda和pip指令的完整代码和步骤: 一、配置 conda 国内镜像通过修改 conda 配置文件,添加国内镜像源(推荐清华、中科大镜像)。在Anaconda Prompt中执行以下命令:# 添加Anaconda官方镜像 conda config --add channels h

基于Python的交通数据分析应用-hadoop+django

开发语言:Python 框架:django Python版本:python3.8 数据库:mysql 5.7 数据库工具:Navicat12 开发软件:PyCharm 系统展示管理员登录管理员功能界面交通数据界面交通预测界面看板展示摘要系统采用B/S开发模式,以Django框架和Python语言为核

Kafka可视化工具KafkaTool工具的使用

Kafka Tool工具 介绍使用Kafka的小伙伴,有没有为无法直观地查看 Kafka 的 Topic 里的内容而发过愁呢?下面推荐给大家一款带有可视化页面的Kafka工具:Kafka Tool (目前最新版本是 3.0.2) 注意:以前叫Kafka Tool现在官方已更名为Offset Explorer,为了

六种主流ETL工具的比较与Kettle的实践练习指南--MySQL、hive、hdfs等之间的数据迁移

        在数据集成和数据仓库建设中,ETL(Extract, Transform, Load)工具扮演着至关重要的角色。本文将对六种主流ETL工具进行比较,并深入探讨Kettle的实践应用。一、六种主流ETL工具比较1. DataPipeline 设计及架构:专为超大数据量、高度复杂的数据链路设计的灵活、可扩展的数据交

【Java 开发日记】RabbitMQ 里面的交换机是什么,你用过哪种?

目录交换机是什么?我用过的交换机类型(及详细介绍)① 直连交换机② 扇出交换机③ 主题交换机④ 头交换机总结与对比交换机是什么?在 RabbitMQ 中,交换机 是消息路由机制的核心。你可以把它想象成一个邮局分拣员。 生产者 发送消息时,它不是直接把消息放到队列里,而是发送到 交换机。 然后&#

Spark详解

1. 相关概念        Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。1.1 知识了解关于分布式 单机:单进程,单节点; 伪分布式:多进程,单节点; 分布式:多进程,多节点。 分布式的核心是切分数据,减少数据规模。 关于计算    &