- 时间:2017 年 11 月 08 号(星期三),美西时间(Pacific Time)6:00 PM
- 地点:YouTube live stream
- 主讲人: 舒江(University of Nebraska-Lincoln)
OSG101:基于高通量计算平台的生物数据分析
随着生物数据类型和数量的快速增长,数据分析在生命科学研究中的重要性日益增加。越来越多的生物课题开始结合 “大数据” 和“高计算”的概念,从海量数据中寻找具有稳定性和普适性的生物发现。然而随之产生的计算成本也逐渐成为目前阻碍学科发展的众多瓶颈之一。在这一期在线沙龙活动中,我将为大家介绍一个高通量计算的平台,Open Science Grid(OSG)。可能在生物领域里,OSG 的名字还很陌生。不过大家可能知道,2017 年的诺贝尔物理学奖授予了三位领导 LIGO 项目的物理学家。但是你也许不了解,LIGO 项目在过去的三年时间里,一共在 OSG 的平台运行了 2420 万的统计计算脚本,使用了超过 1900 万 CPU Hour 的计算资源。OSG 如此强大,谁用谁知道。希望通过这次活动,让大家简单的了解以下的内容:
-(1)什么叫高通量计算?
-(2)什么样的数据分析流程适合高通量计算?
-(3)高通过量计算 vs 高性能计算?
-(4)如何使用 OSG?一个基于 microRNA 的范例。
-(5)如果在 OSG 上进行复杂 workflow 的管理?