获取KEGG通路的基因列表做单细胞GSEA、GSVA分析

使用KEGG通路的基因列表进行单细胞GSEA GSVA分析的过程，我们需要遵循以下步骤：

获取KEGG通路的基因列表：这通常涉及使用专门的R包，如KEGGREST或biomaRt，来查询KEGG数据库并检索特定通路的基因列表。
准备单细胞表达数据：这包括加载单细胞RNA-seq数据，通常使用Seurat或其他单细胞分析包进行预处理。
执行GSVA分析：使用GSVA包对单细胞数据执行基因集变异分析（GSVA），根据KEGG通路的基因列表评估每个单细胞样本的通路活性。
可视化GSVA结果：最后，基于GSVA分析结果，绘制热图或其他类型的图表来展示不同单细胞样本中通路活性的变化。

今天我们主要关注第一步，如何获取KEGG通路的基因列表？

问题来源

不管是转录组数据还是单细胞数据都可以做gsva分析。gsva需要两个文件作为输入：

1. 表达矩阵

2. 基因集

表达矩阵容易获得，但是如果我们想做kegg数据库的通路分析怎么办？如何获取kegg的通路列表？

获取kegg的通路列表代码

方法一：使用msigdb

 library(msigdbr)    genesets = msigdbr(species = "Homo sapiens"  ) #msigdbr提供多个物种的基因集数据    # View(msigdbr_collections()) #查看msigdbr包中所有的基因集    unique(genesets$gs_subcat)  # 有多个数据库来源的基因集可选，这里选用KEGG    genesets <- subset(genesets, gs_subcat=="CP:KEGG", select = c("gs_name", "gene_symbol"))    unique(genesets$gs_name) #查看有多少条通路（186个）

但是这里面的kegg只有186个基因集合

方法二使用 KEGGREST

#BiocManager::install("KEGGREST")    #BiocManager::install("EnrichmentBrowser")    library("KEGGREST")    library("EnrichmentBrowser")    KEGGREST:: listDatabases()    KEGGREST::keggList(database ='kegg')    keggList("organism") ## returns the list of KEGG organisms with    #step2: check and obtain a list of entry identifiers (in this case: sar) and associated definition for a given database or a given set of database entries.    res <- keggList("pathway", "hsa") ## returns the list of human pathways    length(res)    res=as.data.frame(res)    head(res)    #step 3: download the pathways of that organism:    hsapathway <- downloadPathways("hsa")    head(hsapathway)    idTypes(org = 'hsa' )    #step 4: retrieve gene sets for an organism from databases such as GO and KEGG:    hsa_kegg_genesets <- getGenesets(org = "hsa", db = "kegg",                                     gene.id.type = "SYMBOL",                                     cache = TRUE, return.type="list")        #step5: Parse and write the gene sets to a flat text file in GMT format for other pathway enrichment analysis programs (e.g., GSEA):    writeGMT(hsa_kegg_genesets, gmt.file = "kegg_hsa_kegg_genesets_gmt")    save(hsa_kegg_genesets,file = "~/heart_muscle/hsa_kegg_genesets.rds")

我们可以看到这里的kegg数据集合有357个

做gsva分析

 library(GSVA);print(getwd())  load("~/heart_muscle/hsa_kegg_genesets.rds")  genesets_kegg=hsa_kegg_genesets  print(length(hsa_kegg_genesets))  #kegg---  gssea.res <- gsva(expr, genesets_kegg [1:50], method="ssgsea",kcdf="Poisson",min.sz > 3,max.sz=200 ,parallel.sz=10 )   saveRDS(gssea.res, paste0(new_dir,file_name,"_gssea.res_kegg.rds"  )  )    gssea.df <- data.frame(Genesets=rownames(gssea.res),gssea.res, check.names = F)  write.csv(gssea.df,  paste0(new_dir,file_name,"gssea_res_kegg.csv" ), row.names = F)        # ssgsea-----  #library(GSVA);print(getwd())  #gssea.res <- gsva(expr, genesets_GO [1:50], method="ssgsea",kcdf="Poisson",min.sz > 3,max.sz=200 ,parallel.sz=10 )  #,parallel.sz=10  #saveRDS(gssea.res, paste0(new_dir,file_name,"_gssea.res_go.rds"  )  )    #gssea.df <- data.frame(Genesets=rownames(gssea.res), gssea.res, check.names = F)  #write.csv(gssea.df,  paste0(new_dir,file_name,"gssea_res_go.csv"), row.names = F)   #print("done-------");print(getwd())

这里的expr是行为基因列为样本的表达矩阵。

参考：https://biobeat.wordpress.com/category/r/https://www.researchgate.net/post/How_i_can_get_a_list_of_KEGG_pathways_and_its_list_of_genes

分析完成之后，可以使用新得到的通路矩阵进行差异分析。下期见~

看完记得顺手点个“在看”哦！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/761936.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

获取KEGG通路的基因列表做单细胞GSEA、GSVA分析

问题来源

不管是转录组数据还是单细胞数据都可以做gsva分析。gsva需要两个文件作为输入：

获取kegg的通路列表代码

但是这里面的kegg只有186个基因集合

做gsva分析

相关文章

HTML与Logic java基础面试题

【设计模式】Java 设计模式之责任链模式（Chain of Responsibility）

申请Github Education获取免费Copilot权限（2024.3.18实测成功）

Python：柱状-折线图

RPC浅析，加密数据解析

Linux第82步_“gpio子系统”下的使用KEY开关灯

HTTPS 协议原理

Cell发表的单细胞整合方法：LIGER，很好用！

C++语言学习（二）—— C++语言的基本知识

docker 容器挂掉，无法exec 进入bash 怎么修改容器里的文件

IDEA通过内网穿透实现固定公网地址远程SSH连接本地Linux服务器

[音视频学习笔记]六、自制音视频播放器Part1 -新版本ffmpeg，Qt +VS2022，都什么年代了还在写传统播放器？

基于python+vue渔船出海及海货统计系统的设计与实现flask-django-php-nodejs

抖音视频爬虫下载软件|可导出视频分享链接|视频批量采集工具

AI绘画可以稳定生成中文了：白嫖阿里云部署AnyText

python共享单车信息系统的设计与实现flask-django-php-nodejs

探索Code Llama 70B：Meta让AI辅助编程更易获得的举措

【Unity】从0到1的横版2d制作笔记-DAY3

python家政服务系统flask-django-php-nodejs

解决mini2440 LCD(型号：P43)驱动的背光失效问题

获取KEGG通路的基因列表 做单细胞GSEA、GSVA分析

问题来源

不管是转录组数据还是单细胞数据都可以做gsva分析。gsva需要两个文件作为输入：

获取kegg的通路列表代码

但是这里面的kegg只有186个基因集合

做gsva分析

相关文章

获取KEGG通路的基因列表做单细胞GSEA、GSVA分析