大数据 - 小智博客

保姆式 Hadoop之HBase分布式数据库的搭建与使用

一、实验准备1、VWware Workstation2、HBase压缩包，hbase-2.4.4-bin.tar.gz；3、前期安装好了Zookeeper集群；二、实验步骤1、安装HBase1.1上传并解压（1）上传，打开xftp8，将hbase-2.4.4-bin.tar.gz上传到Hadoop1中

大数据 2025年05月26日 153 点赞 0 评论 12490 浏览

大数据应用开发生态搭建（Hadoop3.x）

大数据生态搭建（Hadoop3.x） 文章目录大数据生态搭建（Hadoop3.x） 1、简介 2、准备虚拟机 **2.1、安装Centos7** 2.2、**关闭防火墙、配置虚拟机网络环境、安装JDK、修改主机名、克隆虚拟机和配置主机IP映射** 1、关闭防火墙 2、设置固定IP 3、修改主机名 4、安装JDK 5、克

大数据 2025年12月14日 116 点赞 0 评论 12494 浏览

Flink 入门详解（核心概念、数据流模型、部署模式、入门示例、常用命令、学习建议）

🚀 Flink 入门详解一、Flink 是什么？Apache Flink 是一个分布式、可扩展、高吞吐量、低延迟的流处理框架，支持流处理 (Streaming) 和批处理 (Batch)。特点： 特性说明实时流处理数据以事件流方式处理，支持事件时间和乱序事件批处理基于流处理模型，也可处

大数据 2026年01月12日 106 点赞 0 评论 12516 浏览

【免费下载】 WinUtils各版本集合：Windows用户的Hadoop利器

WinUtils各版本集合：Windows用户的Hadoop利器【下载地址】winutils各版本集合本仓库是专为Windows用户设计的Hadoop辅助工具集合。它包含了从2.6.0至3.0.0的九个不同版本的`winutils.exe`以及相关库文件（如`hadoop.dll`），这些文件在Wind

大数据 2026年05月17日 120 点赞 0 评论 12551 浏览

三、Hadoop 常用命令集总览

Hadoop 常用命令集总览在大数据处理领域，Hadoop 作为一种广泛应用的分布式系统基础架构，其重要性不言而喻。熟练掌握 Hadoop 的常用命令对于高效的数据处理和分析工作至关重要。本文将对 Hadoop 的常用命令进行专业而详尽的列举，并结合实例进行深入讲解。一、HDFS 命令 1. 文件和目录操作 hadoop fs -ls：

大数据 2025年04月26日 35 点赞 0 评论 12556 浏览

目录一、商品数字化转型面临的现状分析（一）运营方向分析（二）商品归类分析二、商品数字化管理建设分析三、基础建设——商品信息数字化（一）商品信息质量数字化的目的（二）多维度的商品质量评分基本属性评分市场表现评分供应链评分售后服务评分合规性评分（三）数据采集与分析（四）可视化与决策支持四、应用建设——供给、供需、交易场景数字化（一）供给阶段：提高商品供给质量与商家选品效率数据驱动的选品决策智能采购管理

大数据 2025年04月27日 164 点赞 0 评论 12657 浏览

深入解析 systemd 服务启动失败问题：以 Kafka 服务为例

个人名片 🎓作者简介：java领域优质创作者 🌐个人主页：码农阿豪 📞工作室：新空间代码工作室（提供各种软件服务) 💌个人邮箱：[2435024119@qq.com] 📱个人微信：15279484656 &#x1f310

大数据 2025年04月26日 89 点赞 0 评论 12694 浏览

保姆级·在Windows本地配置并运行Kafka

目录一.下载并安装Idea：进入idea官网：IntelliJ IDEA 下载最新版idea（安装及其他问题请参考其他大佬的文章） 二.下载并安装JDK：1.进入idk官网：JDK 下载最新版jdk2.将jdk路径配置到windows环境变量下（JAVA_HOME），并将

大数据 2025年05月25日 179 点赞 0 评论 12701 浏览

SpringBoot整合Kafka、Flink实现流式处理

引言在当今大数据处理领域，实时数据流处理变得越来越重要。Apache Kafka作为一个高吞吐量的分布式流处理平台，结合Apache Flink这一强大的流处理框架，可以构建出高效的实时数据处理系统。本文将指导您如何在SpringBoot应用中整合Kafka和Flink，从而实现一个完整的实时数据处理流水线。 1. 技术栈介绍在开始具体实现

大数据 2025年08月19日 141 点赞 0 评论 12724 浏览

Flink消费Kafka实时写入Doris

本文模拟实际生产环境，通过FileBeat采集日志信息到Kafka，再通过Flink消费Kafka实时写入Doris。文章目录 Filebeat采集日志到Kafka Flink消费Kafka实时写入Doris 方式一（String数据流） 方式二（RowData数据流） 总结

大数据 2025年04月17日 127 点赞 0 评论 12735 浏览

大数据

首页

IT互联网

大数据

列表

默认

浏览次数

发布时间