NCBI GEO王炸:GEO2R直接分析RNA-seq数据,几家欢喜几家愁?

GEO2R是NCBI GEO团队针对上传到GEO的芯片数据开发的一款在线差异分析、可视化作图工具,是广大数据分析人员的福音。然而,一直以来GEO2R仅针对芯片数据,对于越来越多的测序数据,只能下载所上传的matrix矩阵,进行分析,若没有上传表达矩阵,或者基因组版本不合适的话,往往还得下载原始数据重新分析,耗时耗力。

NCBI GEO团队推出了一项“王炸”更新:GEO2R可以直接分析RNA-seq测序数据了

小伙伴们:喜大泪奔(喜闻乐见、大快人心、普天同庆、奔走相告)!

同事和我:工作要丢了么?时代抛弃我,连声招呼都不打啊!

1,NCBI GEO为什么要给我们准备RNA-seq count数据?

A major barrier to fully exploiting and reanalyzing the massive volumes of public RNA-seq data archived by SRA is the cost and effort required to consistently process raw RNA-seq reads into concise formats that summarize the expression results. To help address this need, the NCBI SRA and GEO teams have built a pipeline that precomputes RNA-seq gene expression counts and delivers them as count matrices that may be incorporated into commonly used differential expression analysis and visualization software.

大白话就是:SRA服务器上存了大量数据,一般人要分析,得下载,得比对,费时费力,反正数据在他们NCBI服务器上,服务器闲着也是闲着,直接套个pipeline把RNA-seq基因表达count处理好,放出来供大家使用。不知道又要革了多少人的命。

2,支持的物种

目前仅人类。小鼠的在路上,预计2023年秋。

3,数据类型:

raw count:可以下载用DESeq2,edgeR或者limma voom进行后续的差异分析。

Normalized counts:根据测序深度和测序长度标准化的count,包括:FPKM (Fragments Per Kilobase Million,双端)、RPKM(Reads Per Kilobase Million,单端)和TPM(Transcripts Per Kilobase Million)

注释:基因id,gene symbol,descrption,gene ontology等。

4,分析流程

使用hisat2将物种为human,类型为transcriptomic的数据比对到GCA_000001405.15 参考基因组上。比对率大于50%的用featureCounts输出raw count文件。注释数据库用的Annotation Release 109.20190905.

5,如何下载?

https://www.ncbi.nlm.nih.gov/geo/download/?acc= GSE30970

直接换成自己的GSE号就行了

6,局限

GEO上的数据太杂了,GEO team没有对数据质量等深入检查(合不合适他们不管,先跑了再说),所以有以下局限性:

1)counts表达矩阵可能跟已发表文章的不一致

这个很容易理解,不同软件,甚至不同版本算出来的都不一样。

2)超过50%比对率的transcriptomic数据用于分析,所以质检可能很松,并且缺样品

上传的数据类型多样,可能不能直接比较,例如RNA-seq和RIP-seq都在矩阵里,但是不好直接比较。

3)Normalized矩阵文件并非充分标准化的。

对生信数据分析行业带来的冲击:

1)GEO的RNA-seq分析几乎要变得免费,无门槛了

2)有了表达矩阵,直接省了下载、比对的时间,极大提高了工作效率

3)有了统一标准?

4)大规模利用GEO数据的时代又来了

5)伦理问题

微生信助力高分文章,用户167000 谷歌学术3100

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/832223.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ENZO:Insulin(胰岛素)ELISA kit

胰岛素是一种由胰岛β细胞合成分泌的肽类激素。它促进葡萄糖从血液中吸收到组织中,并以糖原和脂肪的形式储存起来;此外胰岛素还抑制肝脏产生葡萄糖。通过控制葡萄糖水平,胰岛素成为脂肪和碳水化合物代谢的调节器。当由于缺乏胰岛素分泌而失去…

成都最大视听产业园更新数字影像创作空间,影像技术打造沉浸式体验

国际数字影像产业园,位于成都金牛区的心脏地带,借助数字影视制作技术的力量,努力“破墙而出”,耕耘数字影像技术研发和创新创作的热土。 随着科技的飞速发展,数字影像已经成为成都文创产业的重要组成部分。为了满足国际…

航天系统工程介绍

01 什么是系统工程 系统工程(SE)是一个视角、一个流程、一门专业,正如以下三种代表性定义所阐明: 系统工程是一种使系统能成功实现的跨学科的方法和手段。系统工程专注于:在开发周期的早期阶段定义客观需要与所要求的…

【考研数学】只做《1800》和真题,能不能考90分?

网上的经验贴推荐的习题册,说自己刷完以后最后考了130 你以为自己也能和大佬一样,刷完数学也能考那么高 但实际上很多人是1800、660、880刷题刷下来最后考了四五十的 他们也不会在网上说 刷题多少,或者是刷哪一本习题册并不能衡量你最后能…

实力登榜!蓝卓入选2024中国未来独角兽TOP100企业

日前,由民建中央、中国科协指导,民建浙江省委会、中国投资发展促进会联合主办的第八届万物生长大会中国未来独角兽大会在杭州举办。 会上,《2024中国未来独角兽TOP100榜单》隆重揭晓。其中,蓝卓在全国参评企业中脱颖而出&#xff…

RK3568 学习笔记 : 精简 u-boot env 默认复杂的多种引导启动设置

前言 环境: 正点原子 Atompi-CA1 RK3568 开发板、正点原子 DLRK3568 开发板,(一时脑热买了两块 RK3568 开发板),Atompi-CA1 RK3568 开发板比较小巧,利于一些前期的嵌入式 Linux 开发学习与实践。 RK3568 开…

VGA项目:联合精简帧+双fifo+sobel算法 实现VGA显示(未完)

前言:该项目实际上是在很多基础的小练习上合成起来的,例如涉及到uart(rs232)的数据传输、双fifo流水线操作、VGA图像显示,本次内容在此基础上又增添了sobel算法,能实现图像的边沿监测并VGA显示。 文章目录…

假期的最后一天...

今天是假期最后一天,这个假期我也跑了不少高速,说实话,看到了梅大高速塌方事故,心情一直不是滋味... 我就在思考,我们究竟在追求什么? 有人说生命是脆弱的,也有人说生命是顽强的,是呀…

Unity MeshRenderer 入门

概述 在项目制作过程中,肯定缺少不了模型的使用,那就一定接触过MeshRenderer,也许还有你不理解的地方,接下来让我们来学习一下这部分的内容吧。 Mesh Filter(网格过滤器) Mesh:提供一个网格的参考&#xf…

医学图像处理:nii格式转换(3D切片为2D)

目录 NIFTI文件结构 读取NII文件 ITK-SNAP安装 使用方法 NII转PNG NIFTI文件结构 NIFTI 格式,是一种用于存储和交换医学成像数据的文件格式,特别适用于神经影像学领域。NIFTI文件通常有两个扩展名:.nii(用于图像数据&#xf…

VMP 简单源码分析

虚拟机 获取CPU的型号 实现了一个指令集解释器,每个操作码对应一个特定的处理函数,用于执行相应的指令操作。在执行字节码时,解释器会根据操作码查找并调用相应的处理函数来执行指令。 截获异常 先由虚拟机处理 处理不了再抛出异常 priva…

MySql#MySql安装和配置

目录 一、卸载不需要的环境 二、安装mysql yum 源 三、开始安装 四、如果保证安装成功呢? 五、MySql 启动! 六、登录mysql 七、配置文件说明 八、设置开机启动! 本次安装是在Linux环境在centos7中完成 首先先将自己切换成root 一、…

基于springboot实现图书电子商务网站系统项目【项目源码+论文说明】

基于springboot实现图书电子商务网站系统演示 摘要 社会发展日新月异,用计算机应用实现数据管理功能已经算是很完善的了,但是随着移动互联网的到来,处理信息不再受制于地理位置的限制,处理信息及时高效,备受人们的喜爱…

flowable流程跳转或退回到网关上的用户节点后流程走不下去了

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码: https://gitee.com/nbacheng/ruoyi-nbcio 演示地址:RuoYi-Nbcio后台管理系统 http://218.75.87.38:9666/ 更多nbcio-boot功能请看演示系统 gitee源代码地址 后端代码: h…

【JVM】class文件格式,JVM加载class文件流程,JVM运行时内存区域,对象分配内存流程

这篇文章本来只是想讲一下class文件格式,讲着讲着越讲越多。JVM这一块吧,知识比较散比较多,如果深研究下去如死扣《深入理解Java虚拟机》,这本书很深很细,全记住是不可能的,其实也没必要。趁这个机会直接把…

如何快速找出文件夹里的全部带有中文纯中文的文件

首先,需要用到的这个工具YTool: 度娘网盘 提取码:qwu2 蓝奏云 提取码:2r1z 步骤 1、打开工具,切换到批量复制文件 2、鼠标移到右侧,点击搜索添加 3、设定查找范围、指定为文件、勾选 包含全部子文件夹&…

FP16与BF16区别

二者都是占用16bit空间。 FP16由1个符号位、5个指数位和10个尾数位组成。FP16在表达小数时具有较高的精度,但表示的最大范围相对BF16比较小。相比BF16,在表达较大的数时更容易出现上溢的情况。BF16由1个符号位、8个指数位和7个尾数位组成。相比于FP16&a…

RFC 791 (1)-导论

目录 浅论 IP是啥 IP可以管啥 操作 范例查看 提示:本系列将会开始RFC文档阅读,这里会给出我的一些笔记 浅论 我们这篇RFC文档描述的是IP和ICMP协议,我们都知道,在传统的OSI七层或者是现在被简化的五层:应用层&…

2024年Q1季度果酒行业线上市场数据分析:女性消费力量强劲!

随着短视频推广和健康饮酒理念的盛行,果酒凭借酒精度数低、口味丰富、富含多种营养成分等优势逐渐受到了消费者的青睐。 Q1季度,消费者对果酒需求依旧旺盛。根据鲸参谋数据显示,今年Q1季度,线上电商平台(某猫&#xf…

6S管理,真的有必要吗?

工厂里的物料不知道是什么时间堆放的,不知道这个是谁的,不知道还有没有用,不知道该不该处理掉,越积越多,想要的东西总是找不着,不要的东西总是“碍手碍脚”……可怕的是大家对这一些现象习以为常。 说起6S…