人工智能
【如何使用Jellyfish进行Kmer频数统计分析?】2022年版本
软件概述
将基因组等序列文件,按长度为K的字符串进行切割、归类以及频数统计。
软件安装
软件版本:2.3.0
wget
# 1151287 (1.1M)
# 安装包就1.1M,可以说是压缩效率非常高了
./configure
Sending build context to Docker daemon 数据很大
正在部署一个docker软件
进行docker build的时候发现文件非常大
Sending build context to Docker daemon xxGB
心中出现疑虑为何会这么大,是不是把自己有个文件夹几个T的数据也传过去了。查了一下果然
Docker client会发送Dockerfile同级目录下的所有文件到Dockerdaemon。
解决的方式:
在一个新的文件夹中进行
读《财富的起源》13
制造有趣的外生因素
传统经济学理论就像碗中球,无论我们让球滚到碗中的什么地方,它都会回到同一个均衡点上。
震动一开始就会让球离开均衡点,不断地在碗内滚动。当我们压弯碗的一边(请想象这是一只橡胶碗),改变约束的形状,最终球会根据碗的新形状而在一个新的均衡点停下。
模型限制之外的变量被称为外生变量,而模型限制内的变量则被称为内生变量。典型的外生变量包括客户喜好、技术创新、政府调控和天气变化。
在传统经
NLP之从句子中提取单词步骤
浅层自然语言处理技术可以用来从句子中提取单词,其步骤为:
1、将句子转换为小写
2、删除停顿词(这些是在一种语言中常见的词。诸如 for、 very、 and、 of、 are 等词是常见的停止词)
3、从给定的文本序列中提取 n-gram,即 n 个项目的连续序列(简单地增加 n,模型可以用来存储更多的上下文)
4、分配一个句法标签(名词,动词等)
5、通过语义/语法分析器方法从文本中提取知识,
心理学研究方法(33)
中原焦点团队网络中26期坚持分享第949天天(20220912)
因素分析法是由斯皮尔曼首先提出,所以称他为因素分析之父。因素分析的主要用途是从众多变量的交互相关中找出起决定作用的基本因素,为建立科学理论提供明确的证据。
因素分析法的定义是从大量测量数据中决定基本变量数目和性质的一种方法。
因素分析就注意的问题:在因素分析时,不要过分解释相关系数的意义;防止测量差误引起的分析错误;重视样本的选择;
大数据没做什么好事儿
如果不仔细思考,说到大数据,总觉得是技术进步,应该是个好事儿。但是实际情况呢?我生活中接触到的大数据,作恶似乎更多。
网上购物的大数据杀熟。淘宝、京东等购物网站,登录与不登录,给你的价格不一样。登录后算老客户,所以给的价格更高,不宰你宰谁。携程等订房、订服务等网站,也是熟客价格更高。虽说可以用优惠给新客,这样可以招徕更多的新客。但是如果越是老用户价格越高,就没法解释啦。这种大数据杀熟,学名叫做价格