愿武艺晴小朋友一定得每天都开心!
4个转录组两对之间的相似性该如何衡量,文献中有一种方法是用GSEA的NES值来衡量;
具体的代码如下:
library(clusterProfiler)
library(GSEABase)
library(ggplot2)
library(fgsea)
library(enrichplot)
library(readxl)
#第一步:底部的genelist准备 (通常是所有BulkRNAseq测到的基因 n≈28000,都参加排序)
data = read_excel("./ for gsea.xlsx",sheet = "fasting vs fed")
geneList = data$`fasting/fed`
names(geneList ) = data$Name
head(geneList)
geneList = sort(geneList,decreasing = T)
head(geneList)
tail(geneList)
#第二步:上部的genelist准备
#这里可以对样本2 vs control2的转录本,取多组子集。#例如上调基因分3组:第一组是:log2FC大于0;第二组是:log2FC大于1;第三组是:log2FC大于2;#下调基因也分3组:第一组是:log2FC小于0;第二组是:log2FC小于-1;第三组是:log2FC小于-2;#然后把6组合并为一个gmt文件。
geneset <- read.gmt(file.