生信log34|dbNSFP的phyloP30_score的来源-以提取hg38_phyloP30way.bw(bigwig)数据为例

dbNSFP数据库收录了PhyloP值的数据,并且是tsv格式的,为了对一下数据库,就去官网找了相关的数据,但是看了一圈并没有现成的tsv。看了一圈资料也没看出怎么得出dbNSFP里面的phyloP这个唯一值怎么来的。后面尝试了很多,才发现原来如此简单:就是把官网上的bw文件转成 bedGraph文件即可,但是这个做法会把7.9G的数据拓展至50G左右,转换数据需慎重。 1、工具准备及其用法

day16ChIP-seq下载数据

要实战之前,要有数据和软件两样。 一、数据 从网上下载数据,最好的办法是本节最后的方法直接用sratoolkit里的fastq-dump命令。 下面的是学习过程,但是走弯路了,——按照day18更新版本操作更简便,而且直接能转换成样本名称 1. jimmy大神早前的帖子里用了ChIP-seq实战 和视频里不一样。 2.从GEO下载数据 可以详见手把手教你如何从GEO下载数据。 方法一:从网页下,

【Linux指南】文件内容查看与文本处理

引言在Linux系统中,对文件内容的查看与处理是日常操作的核心环节。当我们通过文件系统操作命令(如ls、cd)定位到目标文件后,更需要深入了解文件内部的内容。从查看小文件的cat命令到处理大文件的more/less工具,从简单的文本编辑到复杂的正则表达式过滤,这些工具构成了Linux文本处理的基础体系。本文将系统

红黑树简单了解

先引入一个问题: 假设有一个大小为10, 000的数组,按大小进行排序,如 【1,3,8,15...】,假设我要在这个数组中查询是否存在 888 这个数字,那么这个算法我们要怎么写呢? 当然肯定有人会说,写个循环遍历一下不就好了吗? 这种做法不能说是错的,但是却不是最好的方法。 这里使用二分查找法的话,效率会更高的。 什么是二分查找法? 【内容来自百度百科】二分查找也称折半查找(Binary S

算法练习:只有两个键的键盘(数学法,动态规划)

一.前言 又到了记录代码的时候了,这道题来自LeetCode,只有两个键的键盘: 最初记事本上只有一个字符 'A' 。你每次可以对这个记事本进行两种操作: Copy All(复制全部):复制这个记事本中的所有字符(不允许仅复制部分字符)。 Paste(粘贴):粘贴 上一次 复制的字符。 给你一个数字 n ,你需要使用最少的操作次数,在记事本上输出 恰好 n 个 'A' 。返回能够打印出 n 个 '

【Linux】指令 + 压缩与解压

Linux 一.Linux基本指令 1.grep 2.zip和unzip 1.Linux中的压缩文件发送Windows中 2.Linux中接收Windows中压缩文件 3.tar(重要) 1.Linux与Linux互传压缩文件 4.bc 5.uname 二.Linux相关知识点 1.Linux常用热键 2.关机操

在脚本里面调用conda创建的环境

事情源于,我在写脚本的时候,在脚本里面插入了一句 conda activate 环境名, 然后出现如下的报错提示 CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'. To initialize your shell, run $ conda init <

Fabric.js 橡皮擦的用法(包含恢复功能)

本文简介 点赞 + 关注 + 收藏 = 学会了 本文介绍 Fabric.js 的橡皮擦功能。 file Fabric.js 的基础包并没有包含橡皮擦模块,如果你的项目需要使用橡皮擦,要使用定制版的 Fabric.js 。 本文需要有 Fabric.js 基础知识。 如果你还不清楚什么是 Fabric.js ,我墙裂建议你点赞 《Fabric.js 从入门到目中无人》。 同时最好了解