使用BWA、GATK、Samtools软件进行基因测序

本文介绍如何使用E-HPC集群运行BWA、GATK、Samtools软件进行基因测序计算。背景信息 生命科学领域内基因测序技术的飞速发展,人类发现的基因序列以指数级增长,对于如此数量庞大的基因进行同源性搜寻、比对、变异检查等,往往伴随着巨大的...

基因计算工作流

场景描述 本文适合利用容器服务Kubernetes版上的工作流引擎进行大规模基因测序的场景。阿里云工作流引擎基于开源项目Argo实现,支持并发、循环、重试等多种执行策略典型的基因计算过程,把数据分批进行计算,按照规定好的步骤依次完成计算...

应用场景

基因测序 基因测序是一种新型基因检测技术,能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性。基因测序技术能锁定个人病变基因,提前预防和治疗,目前一个广为人知的用途是针对唐氏综合征的无创产前基因检测。随着基因...

ack-workflow

组件介绍 ack-workflow基于原生Argo Workflow开发,支持您在集群中部署大型工作流,主要面向标准化的工作流场景,例如AI推理、自动驾驶仿真、基因测序任务等。安装ack-workflow 您可以通过容器服务ACK的组件管理页面安装ack-workflow,具体...

产品优势

阿里云基因分析平台是由阿里云完全托管,专门服务于基因测序行业的公有云产品。与传统的HPC集相比,无需任何前期投入,完全享有云计算敏捷灵活、按需付费和超大规模的优势。并且产品围绕基因行业的数据和应用特点,开发了众多专业能力,...

实践教程概览

使用BWA、GATK、Samtools软件进行基因测序 本教程介绍如何使用E-HPC集群运行BWA、GATK、Samtools软件进行基因测序计算。在进行基因测序时,您可以使用BWA构建索引及比对记录,再使用Samtools对比对记录进行排序,然后使用GATK去除重复序列...

常见问题

由于基因测序数据下机存在批次性,因此在投递分析时也存在明显的批次性,但同步提交大量任务时由于资源需求急速增加将导致任务并发调度性能降低,因此强烈建议客户在上传数据的同时分批提交分析任务,避免大量数据全部上传完成之后再统一...

计费概述

计费示例 以用户在基因分析平台中,选择使用的 sentieon/dnaseq 应用,分析一个30x的全基因测序样本为例。平台收费明细如下:30x WGS测序样本,~90G fastq文件 使用 sentieon/danseq:201911-v1.1 基因分析应用,5小时完成费用总计 应用步骤...

应用场景

高性能计算 适用于大规模高性能科学计算、并行计算、仿真计算等场景,如气象预报、生物制药、基因测序、图像处理等。推荐使用 弹性高性能计算E-HPC,弹性高性能计算可以将计算能力积聚,用并行计算方式解决更大规模的科学、工程和商业问题...

什么是弹性高性能计算E-HPC

弹性高性能计算将计算能力积聚,用并行计算方式解决更大规模的科学、工程和商业问题,在科研机构、石油勘探、金融市场、气象预报、生物制药、基因测序、图像处理等行业均有广泛的应用。产品架构 弹性高性能计算的产品架构如下图所示。弹性...

文件系统存储类型

大数据分析 低频存储可以为基因测序数据、GIS地理信息数据、票据影像数据和音频录音文件数据等海量非结构化的数据提供低成本、大容量的存储空间,同时还可以实时访问数据。备份存储 若您使用通用型NAS作为MySQL、Redis、MongoDB等数据库的...

解密ADB高效基因检测系统

通过高通量基因测序仪(High-throughput Sequencing),对核酸序列进行测序。为保证高通量测序仪的精度,可以将较长的核苷酸序列切成小的分片,分别进行测序。在读取基因序列时,基因序列的数据大小一般为50PB~200PB。通过高通量测序之后,...

常见问题

基因行业:基因测序、交付、诊断等基因上下游业务的数据存储需求,结合云上强大的计算能力,可以实现大数据的存储+计算+分析方案。OSS适合存储什么?OSS适合存储论坛网站与软件应用中的附件、高清图片、音视频、备份文件等,以及各种App...

本地SSD型

基因测序类应用,详情请参见 案例说明 磁盘类KV型数据库,例如RocksDB、ClickHouse OLTP、高性能关系型数据库进行WAL优化等 NoSQL数据库,例如Cassandra、MongoDB、HBase Elasticsearch等搜索场景 其他频繁将数据写入磁盘的I/O密集型应用,...

基于最后一次访问时间的生命周期规则

生命科学场景 基因测序生成的大量业务数据,往往需要根据数据的最后访问时间而非最后修改时间来判断数据的冷热。按以往,客户只能手动通过日志分析或其他方式进行数据冷热的分层管理。但如果选用基于最后一次访问时间的生命周期规则,则可...

实例规格族

实例是能够为您的业务提供计算服务的最小单位,不同的实例规格可以提供的计算能力不同。本文为您介绍在售的所有ECS实例规格族,包括每种实例规格族的特点、在售规格和适用场景。根据业务场景和使用场景,ECS实例可以分为多种实例规格族。...

应用场景

BatchCompute 广泛应用于电影动画渲染、生物数据分析、多媒体转码、金融保险分析等领域。典型案例 电影动画渲染 阿里云渲染云解决方案基于 BatchCompute 搭建。...生物数据分析 生物基因企业利用 BatchCompute 完成大规模基因测序分析。

AGS概览

阿里云基因计算AGS(Alibaba Cloud Genomics Service)是由阿里云推出极速、低成本、高精度的基因测序二级分析的云服务,主要提供以容器平台为基础的生物信息工作流服务和无需搭建集群,开箱即用的加速API服务。本文介绍什么是AGS及其...

CPFS并行文件存储

基因测序数据组装 基因序列组装需要海量的并发计算作业,CPFS并行文件存储 提供高达百GB的访问带宽,可以满足成百上千个节点同时访问的需求,破除文件IO访问瓶颈,任务完成时间缩短到原来的50%。石油勘探业务分析 大量地质数据需要计算、...

利用实体批量投递运行任务

假设用户有10个全基因测序的样本数据需要分析,我们通过以下步骤详细介绍如何通过基因分析平台来“一键”高效简便的完成所有工作。创建工作空间,获取分析应用 创建batch-submit-demo工作空间,如已有可用工作空间也可忽略该步骤。在应用...

创建WDL工作流

更多信息,请参见 通过AGS处理全基因测序WGS。步骤一:部署应用 构建WDL工作流所需的组件被打包成为一个Helm Chart,作为一个应用放在应用市场中,避免了复杂的环境配置,方便进行一键部署。登录 容器服务管理控制台。在控制台左侧导航栏...

历史功能发布记录(2020年及之前)

全部 应用中心概述 2020年04月 功能名称 功能描述 发布地域 相关文档 ACK基因计算AGS商用化开放 基因计算服务是阿里云基于容器Kubernetes技术面向生物行业提供的基因大数据计算服务,具有高效、弹性、可靠的优点,相比传统的基因计算过程...

基因实体表格

基因实体表格介绍 基因数据除测序文件(如FASTQ,BAM等)外,还需要包括临床、样本、实验等相关元数据信息,这些组合在一起,才能形成生物医学多组学的大数据。除使用阿里云对象存储OSS为基因数据文件提供安全、可靠、无限的存储空间外,...

应用场景

生命科学 生物信息学:使用E-HPC对大量生物基因组进行测序等处理,从而获取基因组信息和数据分析结果,来解决生物和医学领域的难题。动力学模拟:使用E-HPC进行大规模的分子动力模拟,来预测分析生物蛋白质分子、脂质分子间的相互作用和...

应用场景

典型应用场景包括基因数据分析、测序生产自动化和基因云平台开发等。基因数据分析 为任意规模用户,提供开箱即用的基因分析服务,效率高,成本低,灵活可靠,最快30分钟即可获取海量数据的计算结果。提供常用的生信流程和最佳参数配置,...

Databricks Runtime

Regeneron开源库Glow的优化版本,具有所有功能以及:Spark SQL支持读取和写入变量数据 通用工作流程元素的功能 常见查询模式的优化 与Apache Spark并行的Turn-key pipelines:DNA序列 RNA序列 肿瘤正常测序(MutSeq)联合基因分型 ...

基因数据文件

本文介绍基因分析平台中基因数据文件的使用方法,包括上传、下载、删除等操作。基因分析平台并不直接提供基因数据的存储功能,而是依赖于阿里云 对象存储OSS 来帮助用户管理自己的基因数据文件。在开通基因分析平台时,由用户授权给基因...

入门概述

本文介绍开始使用基因分析平台前的准备工作,产品基本功能和使用流程,帮助您快速上手。准备工作 使用基因分析平台产品前,请确保您已经开通了阿里云账号并完成实名认证。相关操作参考如下:阿里云账号注册流程 个人实名认证 企业实名认证 ...

工作空间

本文介绍基因分析平台中工作空间的使用方法。基因分析平台中的所有操作,都必须在工作空间内进行。用户可以通过工作空间进行基因数据、分析应用和运行任务的管理,满足数据隔离、权限控制、费用统计等业务需求。创建工作空间 在工作空间...

基因分析应用

本文介绍基因分析平台中的应用定义,如何在工作空间中创建、编辑和运行应用。基因数据分析工作,需要用户使用不同的生物信息学工具软件,进行一系列复杂的计算过程,才能得到最终的分析结果。以遗传病的数据分析举例,需要进行数据质控、...

什么是基因分析平台?

结合阿里云海量的存储计算资源、连通测序上下游的用户网络、以及数据和应用的生态合作伙伴,基因分析平台广泛用于基因组学数据从样本到报告的分析全过程,可以作为不同应用系统计算底座,全方位满足基因组学科学研究和临床应用的需要。...

欠费说明

本文介绍基因分析平台产生欠费之后的服务状态和处理策略。如果您账户的可用额度(含阿里云账户余额、代金券、优惠券等)小于待结算的账单,即被判定为账户欠费。警告 当平台欠费后会影响正在执行的运行任务,系统会提醒或通知您,请及时...

控制台快速开始

本文介绍如何通过产品控制台,在两分钟内快速完成一个基因分析任务,帮助用户熟悉基因平台基本操作。点击应用仓库中的 sentieon/dnaseq 公共应用。点击“安装运行”,选择已创建的工作空间,如默认创建的“default-workspace”,点击安装。...

产品动态

本文介绍基因分析平台的版本变更信息,包括发布时间、版本变更内容、核心功能特性等信息。2021年5月 发布时间 版本变更内容 核心功能特性 2021-05-28 基因分析平台公测发布(北京、深圳地域首发)生信流程开发、版本化管理和计算分析,支持...

服务条款

阿里云基因分析平台(Genomics Computing Platform)的服务条款,请参见 阿里云产品服务协议。

GetPublicDataset-查询公共数据集详情

请求参数 名称 类型 必填 描述 示例值 DatasetName string 是 数据集名称 西蒙斯基因组多样性计划 Attributes array 否 指定需要查询的属性列表 string 否 查询属性 DatasetName,DatasetDescription,About,AccessRequirements,Copyright,...

产品公告

本文介绍基因分析平台产品通知公告和活动信息。优惠通知 基因分析平台目前正式公测上线,为所有新用户提供按量付费7折的优惠活动,生效时间 从2021年6月1日开始到2021年11月31日结束。优惠后的产品定价信息如下:计费项 说明 公测优惠期间...

Sentieon

本文介绍了阿里云基因分析平台集成的第三方软件(Sentieon)的使用方法。关于Sentioen ​Sentieon® 成立于2014年,拥有算法、软件和系统调优的专业团队,开发了众多高度优化生物信息分析应用,获得precisionFDA组织的挑战赛的冠军,并在...

使用限制

本文介绍基因分析平台功能相关的一些限制,以便您更好地使用。可用地域 基因分析平台支持的地域如下表所示,用户只能在可用地域内创建工作空间用于基因数据的管理和分析工作。地域 备注 华北2(北京)cn-beijing 华南1(深圳)cn-shenzhen ...

使用平台公共应用

本文介绍如何使用平台公共应用进行基因数据分析。基因分析平台的 应用仓库 提供了不同研究领域和分类的公共应用,这些都是权威的、经过验证的行业最佳实践,并且提供了常见的运行参数,真正的帮助用户实现开箱即用的基因数据分析。浏览公共...
共有6条 < 1 2 3 4 ... 6 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用