人工智能

结合Seurat批量去除环境RNA污染(SoupX)2022-05-19

相似关键词 背景RNA,环境RNA,RNA污染,游离RNA background mRNAs, ambient RNA, RNA contamination, cell free mRNAs 适用背景 去除环境RNA污染是处理单细胞数据的可选项。环境RNA污染简单来说就是由于实验原因导致某些基因的转录本扩散到大多数细胞,使得部分基因在大多数细胞中均出现高表达的现象,从而影响我们对细胞类型的定义以

《计算机与人脑》:准确度

准确度这一章,是我看的最容易理解的章节。这一节,讲的是模拟计算机有限的准确度,以及数字计算机可扩展的准确度的特性。 模拟计算机,由于通过机械等控制,其准确度跟制作工艺等是强相关的。这就导致了要想达到1:1000没问题,但是想要达到1:10000,或者1:100000,就有难度了,更高的准确度就更夸张了(所以喽,外星文明想在飞船上加一道刻度,就等于带走了大英百科全书,这个只能是一个美好的科学幻想了,

Multi-task Learning 理论(多任务学习)

一. 多任务学习理论 1.1 多任务学习的定义 如果有个任务(传统的深度学习方法旨在使用一种特定模型仅解决一项任务),而这个任务或它们的一个子集彼此相关但不完全相同,则称为多任务学习(以下简称为MTL) 。通过使用所有个任务中包含的知识,将有助于改善特定模型的学习 多任务学习本质上是迁移学习的一种方式,通过共享表示信息,同时学习多个相关任务,使这些任务取得比单独训练一个任务更好的效果,可以在一定程

又见8+基于单细胞marker基因的纯生信文章,仍然可以模仿并超越!

本文的思路是通过单细胞数据分析识别了某种免疫细胞特有的marker基因,然后利用这些基因进行预后模型的构建。事实上,预后模型的文章已经不好发了,甚至有的审稿人看到预后模型就反感,因为实在是太多了,而且预测效能普遍不行。那么如何做的比这篇文章还要好呢?鉴于最近泛癌分析以及肿瘤分型分析比较好发,小编做的免疫细胞marker的泛癌分析以及肿瘤分型,内容是这些文章的2倍以上,均发表到8+杂志

2022-05-26我的数据是用主成分分析还是冗余分析呢?1

背景 主成分分析PCA(Principal Component Analysi)和冗余分析RDA(Redundancy analysis)都是数据分析的一种方法,都是在做降维处理,我遇到数据的时候该选择那种方法做呢? 首先什么是降维? 将多维空间(多个原始测定指标)的数据点尽可能排列在可视化的低维空间。简单理解就是,测定的一种原始指标(比如株高)就是一个维度。假设,我为了了解某个物种的几个品种的生

心理学研究方法(35)

中原焦点团队网络中26期坚持分享第951天(20220914) 多元回归运算与分析的步骤: 1、求出回归方程中的常数,从而从X1、X2的值插入方程获得Y值 2、求出所说明的变异值,即复相关系统,以了解Y的总变异中有多少份量是由于Y对X的回归 3、对回归结果进行统计显著检验,考察Y对于X的回归系数是否有显著性 4、需要决定不同的自变量在解释Y时的相对重要性 显著性检验主要包括三方面:对复相关系数的检

一文梳理金融风控建模全流程(Python)

一、信贷风控简介 信贷风控是数据挖掘算法最成功的应用之一,这在于金融信贷行业的数据量很充足,需求场景清晰及丰富。 信贷风控简单来说就是判断一个人借了钱后面(如下个月的还款日)会不会按期还钱。更专业来说,信贷风控是还款能力及还款意愿的综合考量,根据这预先的判断为信任依据进行放贷,以此大大提高了金融业务效率。 与其他机器学习的工业场景不同,金融是极其厌恶风险的领域,其特殊性在于非常侧重

【R语言】--- 回归分析最优拟合模型及作图

因变量和自变量间的拟合关系对于生态学而言极其重要,很多因变量和自变量间关系是一元线性回归,然而很多数据并不一定是直线关系,而是需要探索其曲线拟合关系。这种曲线关系并非直观看出,而是需要进行统计检验,通过比较拟合度及其显著性,来选择最优拟合模型。 赤池信息准则(Akaike information criterion, AIC)和贝叶斯信息准则(Bayesian information criter

纳米AI超级智能体,保姆级入门教程(文末送邀请码)

官网下载客户端打开网页纳米AI下载客户端。打开客户端,选择智能体。万能工具案例广场旅行规划智能体已经集成了高德地图 mcp、网页生成。MCP 免费工具箱采集小红书笔记 AI新闻智能播报助手除了直接使用现有工具,纳米AI还允许用户创建个性化智能体。作为经常需要研究各类AI技术的博主,我尝试创建了一个专属的"早报播音员",让他帮我