人工智能

Celonis与SAP通信解析

       无论是Data Job还是Replication Cockpit的数据抽取,都基于Celonis特意为SAP开发的抽取器。该抽取器确保建立起可持续稳定的数据管道在Celonis和SAP之间。只有在建立了这样的管道之后,用户才可以抽取数据。 前面的两篇文章,使用Celonis Data Job 抽取数据, 使用Replication Cockpit抽取数据。我们谈到了如何抽取数据,现在

提取TCGA中mRNA或lncRNA表达矩阵

前面给大家讲解过新版的TCGA数据库中,RNAseq的表达矩阵中加入了一列gene type。 ☞TCGA数据库悄咪咪更新了—RNAseq没有HTSeq-Counts了 我们在合并表达矩阵的时候,可以把这一列加入到矩阵里面 ☞合并新版TCGA表达矩阵R代码叕更新了—RNA类型也给你提出来 ☞零代码合并新版TCGA数据库RNAseq表达谱数据 然后根据type这一

统计学习方法5.6 - 7.2笔记

5.6 决策树 -- CART算法 CART是二叉结构树。多叉可以转换成二叉,表示是和非 在CART算法中分类树是怎么形成的,要先确定特征选择的标准,之前是信息熵,引申出信息增益,都是表示不同特征下的分类能力,CART算法用的是基尼指数,同样是度量不同特征的分类能力 基尼指数 机器学习中用来度量不确定性,基尼指数越大,不确定性越高 现实中不知道样本属于某个类别的概率pk

面积的定义应该突出数学本质

8月7日,阅读《小学数学教材中的大道理》P238-253 如果问你什么是面积,你会怎么回答? "物体表面或封闭图形的大小就是它们的面积。"这个概念是不是感觉特别熟悉?教科书上是这么写的,我们也一直是这么教孩子们的。并没有感觉有什么不妥。 今天读了张奠宙老师的《深入浅出,平易近人——怎样测量长度、面积和体积》一文,有了不一样的认识。 张老师对长度、面积和体积进行了概念梳理,提出长度、面积和体积都是几

SAS编程-Efficacy:如何利用Logistic回归模型预测事件发生概率?

项目中一张Table需要基于Logistic回归模型,输出某事件发生的概率。该模型中,因变量为二分类资料,表示事件发生与否;自变量为定量资料。Table中需要输出,当自变量为特定值时,事件发生的概率以及对应的可信区间。 这篇文章简单介绍回归模型,然后分享Logistic回归模型预测概率的SAS程序实现。 1. 回归模型简介 我们常说的自变量(X)与因变量(Y)的关系是,自变量影响因变

motifmatchr

motifmatchr的作用就是分析众多的序列和众多的motifs, 从中找到哪个序列包含哪个motif. 它的核心函数就是matchMotifs,最大特点就是快,因为它用的是MOODS C++库用于motif匹配。 尽管Bioconductor上也有很多工具能够做motif匹配,比如说Biostrings::mathcPWM, TFBSTools::searchSeq,但是motifmatchr

正弦交流电的三要素

正弦电流的波形i=Imsin(ωt+φ) 式中 Im——幅值;    φ——初相位;    ω——角频率。 幅值、初相位和角频率统称为正弦量的三要素。正弦量在任一瞬间的值称为瞬时值,已知正弦量的三要素,即可确定正弦量的瞬时值。 (1)幅值 正弦量瞬时值中的最大值称为幅值,表示交流电的强度,用Im表示。 (2)角频率 在单位时间内正弦量变化的角度称为角频率,反映了正弦量的变化快慢程度,用W表示,单位

利用nnls进行反卷积运算

相比较SVR而言,这里有另外一种解决单细胞反卷积的方法,nnls(非负最小二乘) 文章链接:《Bulk tissue cell type deconvolution with multi-subject single-cell expression reference》 核心思想 Xjp 代表给定tissue的 sample j 中gene g的mRNA分子数 Xjpc 代表给定

从头到尾,建一个kylin多维分析Cube

实践到第三次了,作一下比较完整的记录。 一,启动kylin测试的docker,保证Hive命令能正常执行 docker run -d --name kylin -p 7070:7070 -p 8088:8088 -p 50070:50070 -p 8032:8032 -p 8042:8042 -p 16010:16010 apachekylin/apache-kylin-standalone

Linux流控框架:TC和Netfilter

摘取自 Linux TC(Traffic Control)框架原理解析 Linux内核内置了一个Traffic Control框架,可以实现流量限速,流量整形,策略应用(丢弃,NAT等)。从这个框架你能想到别的什么吗?或许现在不能,但是我会先简单说一下,和TC框架比较相似的是Netfilter框架,但是二者却又有很大的不同。 在精通了Netfilter框架之后,再来体会TC框架会简单得多,特别是,