大数据计算资源基础知识,以及5个核心技术讲解(hadoop、mapreduce、hive、spark、flink)
大数据计算资源基础知识
大数据处理基本背景大数据处理面临的主要挑战是数据量太大,无法在单台机器上高效处理。因此,需要分布式系统将数据和计算任务分散到多台机器上协同完成。根据处理方式和应用场景的不同,发展出了不同类型的计算资源。
批处理计算资源背景:最早的大数据处理方式,主要处理已经存储好的大量历史数据。
MapReduce&