人工智能

kafka集群部署

基本信息: 环境: centos 7.9 集群信息: ip:10.10.5.26 ip:10.10.5.25 ip:10.10.5.24 服务信息: zookeeper版本 3.6.3 kafka版本:2.8.1 1.安装Zookeeper #上传安装包,并创建zookeeper目录 mkdir -p /usr/local/zookeeper tar -xzvf zookeeper-3.6.3.t

大数据之Spark

1、Spark与Hadoop Hadoop 已经成了大数据技术的事实标准,Hadoop MapReduce 也非常适合于对大规模数据集合进行批处理操作,但是其本身还存在一些缺陷。特别是 MapReduce 存在的延迟过高,无法胜任实时、快速计算需求的问题,使得需要进行多路计算和迭代算法的作业过程十分低效。 根据 Hadoop MapReduce 的工作流程,可以分析出 Hadoop MapRedc

单细胞细胞比例分析方法列举

1.利用箱线图比较两类样本的某个细胞比例差异 比较直观,但是缺点在于如果单细胞样本个数过少且异质性大,导致很难有统计学显著意义 library(ggpubr) data <- data.frame(Cancer = c(0.5, 0.6, 0.8, 0.2), Normal = c(0.2, 0.3, 0.7, 0.4),

R稀疏矩阵转化稠密矩阵|使用as.matrix()报错:Cholmod error 'problem too large'

在进行一些数据分析是经常会需要将一个数据对象转化为矩阵,以及稀疏矩阵(sparse matrix)和稠密矩阵之间的互化。 问题&报错 在R环境中,用的非常普遍的函数就是as.matrix(),但是,当转化的稀疏矩阵对象非常巨大的时候,例如细胞数目非常多的单细胞数据,R就会报如下类似的错误: Error in asMethod(object) : Cholmod error 'probl

Hisat2+FeatureCounts+DESeq2流程+作图!

featureCounts是一个用来统计count数的软件,运行的速度飞快,比之前用的htseq-count快了好多好多。 照例先说一下怎么下载这个软件: wget tar -zxvf subread-1

scanpy数据整合批次效应去除原理

引用:葬花朴 1.scanpy.external.pp.mnn_correct** 第一步:将表达量按细胞进行归一化,计算细胞之间归一化后的Euclidean距离。 第二步:识别MNN(mutual nearest neighbors, 相互最近的邻居):假设两个batch,寻找batch1中每一个细胞的在batch2中最近的k个细胞(knn1),对batch2进行相同操作(knn2),knn1和

飞算JavaAI炫技赛:一天完成学生成绩综合统计分析系统开发(含源码)

目 录 引言 需求分析与规划 飞算 JavaAI 开发实录 优化与调试 成果展示 总结 引言随着信息化教学的深入推进,学生成绩管理和分析系统已成为学校教学改革和质量提升的重要保障。这些系统可以帮助教师快速查询和分析考试成绩,从而识别学生的学习需求和差距,实施更加个性化的教学策略。本项目正是在这种背景下产生的,旨在开发一个功能完备的

pnpm 是什么?它和 npm、 yarn 有什么区别?

pnpm.png pnpm 是什么?和 npm 什么关系? 现代前端开发中离不开 npm, npm 是 Node Package Manager 的缩写,顾名思义就是 Node 包管理器,我们使用它发布、安装和卸载 NodeJS 包。 那最近很火的 pnpm 是啥呢?跟 npm 有什么关系? 首先解读一下他的名字,根据官方介绍,p 就是 performance(性能卓越的、高性能的)

2. 从机器学习的基本概念开始

从我个人意愿来说呢,更想跳过这一章节。为什么呢?因为对我自己而言,再重温机器学习的基本概念,意义并不大,毕竟算法的代码实现都在玩了,基本概念也是清楚的,又不用参加考试,那么就更没有必要将概念教条式的背下来了。 不过,考虑到学习机器学习的还是存在一批“纯白”,甚至于是转行过来的,这些概念就有似乎有必要了。记得前段时间,我有个前同事,就报了一个人工智能的学习班。她的专业以及技能偏向,应属于广告营销领域