论坛风格切换切换到宽版
  • 575阅读
  • 1回复

[活动]科学家让每个人的电脑都能参与攻克疾病研究 [复制链接]

上一主题 下一主题
离线ultra517
 

发帖
2
C币
5
威望
0
贡献值
0
银元
0
铜钱
5
人人网人气币
0
只看楼主 倒序阅读 使用道具 楼主  发表于: 2012-10-21
现在,位于加拿大布法罗市 Hauptman-Woodward Medical Research Institute (HWI) 的科学家们已经对 9400 多种蛋白质进行了超过 8600 万次的结晶实验。作为结果,他们获得了超过 8600 万张通过 X 射线结晶学高通量拍摄管道的蛋白质的照片。每张照片都需要进行分析,以确定实验的结果是晶体、沉淀物、相位分离、表面效应还是无变化。

这些研究人员所遇到的难题之一是这些数据集的规模实在太大,存储容量总计超过了 25 TB(相当于 9000 多张 DVD)。IBM 的“蓝色基因”(Blue Gene) 超级计算机为这阶段的工作提供了帮助,它通过一种特殊的图像压缩算法对这些图像进行无损压缩。研究人员还面临另一个挑战,即在一台计算机上全面分析一张图像以确定结晶化结果大约需要 10 个小时。按照这种进度,研究人员几乎需要 10 万年才能分析完现有的这些照片。
World Community Grid 与“征服癌症”项目

借助 World Community Grid 强大的计算能力,Ontario Cancer Institute (OCI)、Princess Margaret Hospital 以及 University Health Network 的科学家们能够对通过 HWI 高通量结晶化管道拍摄的 8600 万幅现有的蛋白质图像进行处理。World Community Grid 运行 OCI 的研究人员开发的 CrystalVision 程序,分析每幅图像的特征,以确定结晶化拍摄的结果:晶体、微晶体、相位分离、表面效应、沉淀物还是无变化。

如果是晶体,检晶仪就对该蛋白质执行最优化过程,以确定该结晶的最优化条件,进而执行衍射实验以确定蛋白质的结构。此外,科学家还可以根据结晶拍摄的结果,将已成功结晶的蛋白质与具有相似特性但结构未知的蛋白质进行对比。这可以作为对这些未知结构的蛋白质进行结晶的出发点,进而能够确定它们的结构。

如果产生的晶体结构不佳或不够大,科学家们仍可利用这些信息来帮助他们更好地确定产生结构良好的晶体所必需的条件。举例来说,他们可能了解到蛋白质 X 在条件 A 下产生了微晶体,而蛋白质 A 在条件 Z 下也产生了微晶体。基于这些信息,他们能够进行其他实验来推断出需要最优化哪些条件才能产生更大、结构更好的晶体。

分析这个实验的结果还能够帮助研究人员更好地理解蛋白质结晶学的基本原理。利用 World Community Grid,全面的结晶学图像分析首次得以完成,而由于其计算的复杂性,这在以前是不可能完成的任务。这个实验又使 CrystalVision 得到改进,从而能够提供更快更准确的图像分类。

蛋白质结晶学管道的改进使研究人员能够更快地确定多种与癌症相关的蛋白质的结构。这将提高我们对这些蛋白质功能的理解,并能帮助我们发现可能的药物介入方法,以便攻克这种致命的疾病。

* 还存在其他一些用于理解蛋白质的结构和功能的方法,包括同样在 World Community Grid 上运行的“人类蛋白质组折叠”项目所采用的方法。基于这项工作的性质,改进所有研究方法对于完善我们对人类机体和疾病的认识非常重要。
评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
离线ultra517

发帖
2
C币
5
威望
0
贡献值
0
银元
0
铜钱
5
人人网人气币
0
只看该作者 沙发  发表于: 2012-10-21



BOINC
伯克利开放式网络计算平台(Berkeley Open Infrastructure forNetwork  Computing,简称BOINC)是目前主流的分布式计算平台之一,由加州大学伯克利分校的电脑学系发展出来的分布式计算系统。它本身设计成用于SETIhome项目,但逐渐在其他领域包括数学、医学、天文学、气象学等。BOINC现时旨在为各研究者提供汇集全球各地大量个人电脑的强大运算能力。直至2012年3月25日,BOINC活跃: 290,743 志愿者, 472,834 计算机。
24 小时平均: 6.300 PetaFLOPS.

运行原理安BOINC软件的个人电脑在闲置时会使用个人电脑的CPU进行运算。即使个人电脑正被使用,假如仍有空闲的CPU周期,BOINC也会用作计算。如果使用者的电脑装有支持NVIDIACUDA或ATI  Stream技术的图形处理器(GPU),某些BOINC项目的计算速度将比单纯使用CPU的版本提高2至10倍(2)。
当参与者使用个人电脑参与BOINC项目时,BOINC会与项目的服务器通信,服务器会向个人电脑提供工作包(Workunit,简称为WU),然后个人电脑会对工作包作出运算。完成后BOINC会把结果上传至项目的服务器。
每个项目有它的服务器,它用作协调各参与电脑的工作,包括发送工作包、接收已处理的结果、核对大量的结果再作处理,成为研究人员需要的数据。由于个别的个人电脑可能会在运算过程出现错误,所以服务器一般会把同一工作包传送至多个参与者,并比较各个结果。
BOINC设有积分系统,积分间接反映参与者的贡献。因为在BOINC上可以运行的项目千差万别,比如项目A的工作包在某台电脑上需要3个小时完成,而项目B的工作包在该电脑上需要30个小时才能完成,显然用完成的工作包的数目来衡量工作量是不可行的;类似的,电脑性能也有差别,用CPU时间来衡量工作量更是不行的。积分系统只能通过一定的算法得到参与者实际完成的计算量。
BOINC 从版本 6.4.5 起,开始支持GPU运算,目前有GPUgrid.net、SETIhome、Milkywayhome、A.UAhome、Collatz Conjecture、DNETCHome等多个GPU 专案。

说白了就是下载一个数据包程序运行,再把数据包,返回总站上。

详细操作和下载请到 中国分布式计算总站




项目
旧BOINC标志随着BOINC普及,越来越多研究都使用BOINC,以下是依功能分类的项目列表: (粗体显示**重要工程)
生物学、医学DockingHome — 研究更深入的蛋白质键结和反应的原子等级构造和细节,并借由其研究结果来研发药物以治疗人类疾病。
DrugDiscoveryHome — 研发药物以治疗人类疾病。
Malaria Control — 模拟疟疾的影响及控制。
Predictorhome — 预测蛋白质的结构,目前已停止运作。
Proteinshome — 推论DNA的次序,目前已停止运作。
GPUGRID.net — 研究分子生物动力学相关的研究,主要运行环境为支援CUDA的NVidia GPU。
Rosettahome — 研究蛋白质的折叠。
RALPHHome — RosettaHome的测试专案。
SIMAP(Similarity Matrix of Proteins) - 一个蛋白质同源计算序列并可以对这些序列数据提供专业的检索工具的数据库。
TANPAKU—利用布朗动力学方法计算蛋白质的结构,目前已停止运作。
POEMHOME — 利用能量法来研究蛋白质的结构。
MindModelingHome — 研究人类脑部的认知科学。
SuperlinkTechnion — 帮助科学家研究人类基因及其异常所产生的疾病。
The Lattice Project — 美国马里兰大学的研究生物资讯学领域相关的分布式计算平台。
Virtual Prairie
CelsHome
RNA world —研究分析生物中RNA的分子结构。
DNAHome—研究有关生物中DNA的基因调控作用。




目前世界有许多能为人类造福的项目都因计算不足而搁浅,或者没有很快完成!因此,我呼吁大家利用CPU的闲置计算能力,帮忙做做计算,也是为人类做贡献!通过加入分布式计算,你就可以为这些项目出一份力,大家可以进入******中国分布式计算总站******下载客户端,然后选择自己感兴趣的项目,加入以后就是自动下载任务,自动计算,自动上传结果,并且计算的优先级是最小的,也就是说只有CPU空闲时才计算,如果你有任务,CPU会优先计算你的任务,因此电脑一点都不卡,还可以手动调节CPU的利用率

BOINC和Folding.home的成果都是公开的

中国大量生物、医药类研究引用了Folding.home的研究成果


如:

《药物发现网格设计与实现》
张文举(1) 陈曙东(1) 刘了(3) 马范援(1) 沈建华(2)
(1)上海交通大学计算机系,上海200030 (2)中科院上海药物研究所,上海201203 (3)江南计算技术研究所,无锡214083


《一种分布式网格计算框架以及在大规模分子动力学模拟中的应用》
王文睿(1) 陈国良(1) 邢利荣(2) 陈华平(1) 孙广中(1) 单久龙(1)
(1)中国科学技术大学国家高性能计算中心,安徽合肥230027 (2)上海电力学院数理系,上海201300


《GROMOS96分子动力学模拟的并行优化算法》
王文睿 陈国良 孙广中
中国科学技术大学计算机系国家高性能计算中心,合肥230027
快速回复
限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
 
上一个 下一个