人工智能

kafka集群部署

基本信息: 环境: centos 7.9 集群信息: ip:10.10.5.26 ip:10.10.5.25 ip:10.10.5.24 服务信息: zookeeper版本 3.6.3 kafka版本:2.8.1 1.安装Zookeeper #上传安装包,并创建zookeeper目录 mkdir -p /usr/local/zookeeper tar -xzvf zookeeper-3.6.3.t

检验正态分布方法的汇总

在数据分析过程中,往往需要数据服从正态分布,正态分布,也称“常态分布”,又名高斯分布,在求二项分布的渐近公式中得到。很多方法都需要数据满足正态分布,比如方差分析、独立t检验、线性回归分析(因变量)等。如果说没有这个前提可能会导致分析不严谨等等。所以进行数据正态性检验很重要。那么如何进行正态性检验?接下来进行说明。 一、检验方法 SPSSAU共提供三种正态性检验的方法,分别是描述法

推荐系统的技术栈

推荐系统是一个非常大的框架,有非常多的模块在里面,完整的一套推荐系统体系里,不仅会涉及到推荐算法工程师、后台开发工程师、数据挖掘/分析工程师、NLP/CV工程师还有前端、客户端甚至产品、运营等支持。我们作为算法工程师,需要掌握的技术栈主要就是在算法和工程两个区域了,所以这篇文章将会分别从算法和工程两个角度出发,结合两者分析当前主流的一些推荐算法技术栈。 首先从推荐系统架构出发,一种分法是将整个推荐

圆周率⭕️

      圆周率的历史:1500多年前,南北朝时期的祖冲之计算出圆周率π的值在3.1415926和3.1415927之间,并且得出了两个用分数表示的近似值:约率为22/7,密率为355/113。       圆周率是圆的周长与直径的比值,一般用希腊字母π表示,是一个在数学及物理学中普遍存在的数学常数。π也等于圆形之面积与半径平方之比,是精确计算圆周长、圆面积、球体积等几何形状的关键值。在分析学里

数据安全知识

一、备份结构: 常见的数据备份系统主要有Host-Base、LAN-Base和基于SAN结构的LAN-Free、Server-Free等多种结构。 二、备份类型: 备份类型主要有三种:全备份,增量备份,差异备份。 除此之外,很多备份软件在这个基础上还延伸出一些缩短备份或者恢复时间的备份方式,例如辅助副本备份、合成完全备份等。 三、CDP与CDM的区别: CDP(continuous data pr

MATLAB机械工程

  一些比较复杂的运动结构,需要用到分析计算,精确动作位置。这时就需要计算机的运算能力了,使用MATLAB来计算设计求解,求出设计零件的相关零件尺寸。再进行设计优化,直接画出零件,这样可以更快产出设计成果。   这个软件主要是用于工程计算,主要功能有,数学计算,算法开发,数据采集,系统建模仿真,工程图开发,应用软件开发等。当然对外我来说只能用到其中一部分功能,各个方向原理基本相通。其集中于数值计算

Spark入门及环境搭建

一、Spark是什么 Spark是Apache下的一个用于大规模数据处理的统一分析引擎,Unified engine for large-scale data analytics. Spark还是一个支持多语言的(Python、SQL、Scala、Java、R),可以在单节点或者集群上用作数据工程、数据科学和机器学习的内存计算引擎。 Spark借鉴了MapReduce的思想发展而来,保留了其分布式

2022-10-30备课双曲线第一节

双曲线的定义,动态演示图形形成情况。新课本上作图软件改版,所以出现了一些字母的变动。 标准方程公式的推导过程需要独立完成,训练数学运算。 如何区分焦点在哪个坐标轴上。为何有这种操作,如何理解和讨论呢? 哪种情况下不讨论焦点的位置直接使用模糊的双曲线方程形式? 假设模糊形式的注意事项,后面呈现异号的表示形式。 第三定义的推导过程,探究形式给出来,课本已经提醒仿照3.1节例3,结果一些同学有方向,细

Hbase_读写流程

Hbase架构图 image.png Hbase写操作 image.png 执行put命令,put 'namspace:table','rowkey','clonmu','value' 1.客户端首先访问zookeeper,获取存储元数据meta表所在的ReginServer地址. 2.客户端去访问该rs上的元数据,获取存储表的region分区所在的ReginServer