GeneDock拥有国内领先的团队,为用户搭建了符合国际标准的安全体系,通过高效的数据技术让用户轻松使用我们的数据分析平台,从而帮助合作伙伴在医学健康和公共卫生领域不断进行创新。我们的合作机构包括:三甲医院、疾控中心、医疗检验机构、健康管理公司等,更参与了水稻云平台和CDC云平台的建设和管理。
海量并发
随着测序技术的进步以及基因信息逐渐应用于临床和健康领域,生物基因行业对于复杂基因数据的传输、存储、计算要求越来越高。由于基因数据的特殊性,海量数据的传输瓶颈极大限制了对内的行业协作以及对外的业务拓展,而复杂基因数据的深入分析也给本地计算存储资源带来了很大压力。我们GeneDock正是在这一行业背景下选择云计算为生物基因行业提供解决方案。
我们团队评估了目前的数据处理技术以及生信行业实际需求,选定阿里云作为主要的计算资源供应商。首先,阿里云在数据安全领域提供的服务可以对我们的基因数据安全方案提供很好的补充;其次,我们面对的企业级用户分布在全国范围,对数据传输有很高的要求,而阿里云提供的传输基础设施可以满足不同地域的用户快速传输数据的需求;另外,阿里云方便的结算系统也很适合我们初创时期的管理和运营环境。
为了满足生信行业的需求,我们提供了安全、高效、易用、开放的数据技术和系统平台,帮助用户解决本地资源瓶颈和远程传输交付的困难。基于云计算技术,用户可以在全国任何地方使用我们开发的基因数据压缩算法完成海量数据快速稳定的传输,并可实时登录平台对数据进行管理,实现远程交付、权限控制等功能,确保用户的数据始终处于安全掌握之中。另外,我们在云计算资源的基础上搭建了分布式基因数据分析系统,用户可利用无上限的弹性计算资源在短时间内完成大量数据分析工作,从而缩短了整个业务流程的时间,使企业交付能力不再受本地计算资源的限制。
节约成本
此外,在阿里云架构基础上,我们搭建了符合基因数据国际安全标准的架构平台,用户可以将基因数据安全地存储在我们的平台上,并可利用基于云计算开发的接口与已有的业务系统实现无缝对接,降低迁移成本。我们还使用容器化技术在云端部署了多个生信分析标准流程,并提供了一系列配置和调试工具,方便生信人员在云端完成流程配置工作。
我们利用阿里云提供的多项服务,逐步打通了生信分析由本地化转向云端分布式的整体流程,帮助用户享受云计算带来的业务流程自动化和运营成本降低。我们相信,未来基因数据的大规模传输和分析一定是基于云的,这也是“为生命计算”的GeneDock价值所在。
我们选择使用阿里云对海量基因数据进行快速稳定的处理,极大提高了基因数据的解读效率,实现了持续稳定的批量交付。阿里云能够提供大规模的作业调度、高吞吐量的性能、低廉的价格和优秀的技术服务,为初创公司的发展提供了更加多元的优质选择,帮助我们将更多的精力集中于核心业务的开发与维护,实现"为生命计算"的愿景。
架构图
架构解读
- GeneDock提供了多种版本客户端用于基因数据的传输,并支持专用于基因数据的压缩算法和校验方式。用户上传的基因数据会存储在OSS中。
- 而在数据分析过程中,用户通过GeneDock前端搭建的WebServer访问后台的基因数据服务和调度系统,并可灵活选择使用ECS或BatchCompute进行数据分析。
- 整个数据生命周期均处在云监控和RAM访问控制的管理下,用户可随时查看自己数据的访问记录,确保数据安全。