人工智能

统计学习方法5.6 - 7.2笔记

5.6 决策树 -- CART算法 CART是二叉结构树。多叉可以转换成二叉,表示是和非 在CART算法中分类树是怎么形成的,要先确定特征选择的标准,之前是信息熵,引申出信息增益,都是表示不同特征下的分类能力,CART算法用的是基尼指数,同样是度量不同特征的分类能力 基尼指数 机器学习中用来度量不确定性,基尼指数越大,不确定性越高 现实中不知道样本属于某个类别的概率pk

十年之约|十年人间:第12个月(07/2022),浅谈AI觉醒

Blade Runner 2049 七月一班的, 十年之约, 我已经走到第12个月。 (2021/08/16—2022/07/16) 一、Cyberpunk电影 其实我对自己不太关心的事情基本不会关注,以致在AI觉醒这件事情上从来没让思辨多驻留一会儿,以为就是个机器人罢了,替代人们工作就好,没想过有朝一日它会“懂事”了。因而说在这件事情上是孤陋寡闻都一点不为过。 就是现在我还是写不

XXL-JOB日常实用进阶,包括分片任务,阻塞处理策略,路由策略,运行模式

主要包括XXL-JOB日志清理,包括分片广播任务,阻塞处理策略,路由策略,运行模式,创建子任务 如果查看XXL-JOB基本使用和整合SpringBoot,请参考我另一篇文章:XXL-JOB基本配置使用 导语:XLL-JOB是分布式任务调度平台,常见功能特性: 1、简单:支持通过Web页面对任务进行CRUD操作,操作简单,容易上手 2、动态:支持动态修改任务状态,启动/停止任务,以及终止运行中的任

iMAP: 单细胞数据整合工具天花板

说在前面 Immugent在前段时间的一篇推文中:SciBet:一个软件解决单细胞注释所有烦恼介绍了张泽民老师课题组开发的单细胞注释软件:SciBet。本次,生信宝库继续推出精品,介绍一下同样是张泽民老师在2021年开发出的对单细胞数据集进行整合的软件:iMAP。 相应的文章发表在Genome Biology杂志上,篇名为“iMAP: integration of multiple single-

606. 【系统架构】系统架构因何而来

随着软件组件化开发方式的发展,如何在设计阶段对软件系统进行抽象,获取系统蓝图以支持系统开发中的决策成为迫切而现实的问题,分析问题的根源和产生的原因,以下现象应该获得关注: 软件复杂、易变,其行为特征难以预见,软件开发过程中需求和设计之间缺乏有效的转换,导致软件开发过程困难和不可控。 随着软件系统的规模越来越大、越来越大复杂,整个系统的结构和规格说明就显得越来越大重要。 对于大规模的复杂软件系统,

数据中台的数据清理

本来我想是根据现在流程的模式建立数据中台,但是我发现同样的目的下也许有一个其他方案 首先在数据采集和数据清洗上,由于数据源是多种多样,现在是需要导入的大数据平台中,然后进行清洗。但是,现在的数据源很多是excel,需要先导入到Mysql中,在导入的大数据平台平台上,一方面通过开发工具支持excel解析很慢,另一方面目前也没有大数据平台,等到建立起ODS层还不知道猴年马月呢。 今天看了Tableau

可观测系统之构建监控系统

一套运行微服务的基础设施并部署了很多组件,这些组件组合起来为用户提供各种功能。问题来了,如何确保能够对这些组件的交互情况以及基础设施的执行情况了如指掌。当出现不符合预期的情况时,要尽可能早地知道,这是至关重要的。如何搭建一套监控系统,就可以收集相关的度量指标,观察系统的运行情况和配置相关的告警,进而才可以抢先采取行动保证系统的平稳运行。 稳固的监控技术栈可以收集来自基础设施和微服务的度量指标,并使

跟着Nature Medicine学作图--复杂热图

复杂热图.png 从这个系列开始,师兄就带着大家从各大顶级期刊中的Figuer入手,从仿照别人的作图风格到最后实现自己游刃有余的套用在自己的分析数据上!这一系列绝对是高质量!还不赶紧点赞+在看,学起来! 参考文献 本期分享的是昨天更新的Nature Medicine上面那篇文章中的一个复杂热图! 这个热图可以说是高端大气上档次!配色自然不必多说,非常有特色的就是单元格中的

关于圆的拓展定理

关于圆的拓展定理 一、圆的切线 如图,圆O与直线AB只有一个公共点,那么我们就说直线AB与圆O相切。 1.关于切线的相关定理: 切线的判定定理:经过半径外端且垂直于这条半径的直线是圆的切线。(经过半径外端+垂直于半径==直线是切线) 切线的性质定理:圆的切线垂直于经过切点的半径。(直线是切线==垂直于半径+经过半径外端(即切点) 推论1:经过圆心且垂直于切线的直线必过切点。(经过圆心