GSVA包进行基因集变异分析
本站寻求有缘人接手,详细了解请联系站长QQ1493399855
基因集变异分析(GSVA)是一种非参数、无监督的方法,用于通过表达数据集的样本估计基因集富集的变异。GSVA在坐标系中执行更改,将数据从逐个样本矩阵的基因转换为逐个样本矩阵的基因集,从而允许对每个样本的路径富集进行评估。这种新的GSVA富集分数矩阵有助于以途径为中心应用标准分析方法,如功能富集、生存分析、聚类、CNV途径分析或跨组织途径分析。
# if (!requireNamespace("BiocManager", quietly = TRUE))
# install.packages("BiocManager")
#
# BiocManager::install("GSVA")library(GSEABase)
library(GSVA) p <- 10000 ## number of genes
n <- 30 ## number of samples
## simulate expression values from a standard Gaussian distribution
X <- matrix(rnorm(p*n), nrow=p,dimnames=list(paste0("g", 1:p), paste0("s", 1:n)))
X[1:5, 1:5]## sample gene set sizes
gs <- as.list(sample(10:100, size=100, replace=TRUE))
## sample gene setsgs <- lapply(gs, function(n, p)paste0("g", sample(1:p, size=n, replace=FALSE)), p)names(gs) <- paste0("gs", 1:length(gs))# Estimates GSVA enrichment scores.
gsva.es <- gsva(X, gs, verbose=FALSE)
class(gsva.es) # "matrix" "array"
dim(gsva.es)
gsva.es[1:5, 1:5]## gsva.es 列为样本品,行为不同基因集的富集分数,
## gsva.es矩阵可以用limma,DESeq2等进行差异化分析