康奈尔大学高级计算中心(CAC)宣布正在同NVIDIA、Dell以及MathWorks合作,在新研究中使用MATLAB程序对通用GPU进行性能测试。
该研究将在NVIDIA GPU上使用MATLAB应用程序测试GPU计算的数据处理能力。康奈尔大学尤为关注以下两个方面:一是在桌面上借助MathWorks并行计算工具箱使用多GPU,另一个就是通过MATLAB分布式计算服务器使用GPU集群。
康奈尔大学在Dell C6100服务器上进行该研究。其中Dell C6100服务器包括了C410x PCIe扩展机箱,通过C410x PCIe扩展机箱服务器能够连接到NVIDIA Tesla M2070 GPU。
康奈尔大学高级计算中心的主管David Lifka说道:“我们选用了具有8个节点(每个节点包括8个CPU核心)以及8个NVIDIA Tesla M2070 GPU(每个具有448个CUDA核心)的设备进行测试。对于需要并行处理大量数据的研究人员来说,该测试环境非常有价值。”
例如,来自康奈尔大学医学中心,密歇根大学医疗系统以及罗格斯大学计算的影像学和生物信息学实验室的研究人员正在使用NVIDIA GPU和MATLAB进行模板匹配以加速并改进对癌细胞的诊断。使用MATLAB内置的GPU函数,研究人员的代码处理效率提高了14.7倍(从86.9秒降低为5.9秒)。对于每天需要处理众多大规模图像的病理学家来说,效率的提升非常显著。相比之下,在GPU上运行MATLAB代码要比没有使用GPU的C++代码快了4.8倍。而且由于MATLAB针对GPU进行了优化,所以用户不必学习另一门编程语言就能够利用GPU的计算能力。
在另一个项目中,Theo Damoulas是可持续计算研究所(Institute for Computational Sustainability,ICS)的一名助理研究员,该研究所由美国国家科学基金会建立并由Carla Gomes教授所领导。Theo Damoulas通过综合使用MATLAB内置的GPU函数以及CUDA代码,动态时间规划(Dynamic Time Warping)计算的效率提升了12倍。动态时间规划使用机器学习以及信号分析技术通过鸟飞行时的叫声自动识别出其物种,非常耗费计算资源。自动进行物种分类要比手动快很多而且也更准确,要做的第一步是创建大规模的网络记录,为详细了解单个物种的迁移模型奠定基础。
该项目是可持续计算研究所极具代表性的研究,通过在可持续研究中引入计算思维旨在为平衡环境,经济以及未来可持续发展需求提供解决方案。可持续计算研究所包括了来自众多组织的科学家,这些组织包括康奈尔大学,包德恩学院、保护基金会、哈佛大学、俄勒冈州立大学以及西北太平洋国家实验室。
David Lifka指出:“随着在康奈尔大学持续进行GPU性能测试和生产性运行,为提升科研人员使用MATLAB GPU计算的整体体验,高级计算中心将不断总结经验教训并探索移植MATLAB代码的最佳实践。”
康奈尔大学之前部署了一个用于实验的包括512个核心的MATLAB资源,该项目由美国国际科学基金会所赞助,为与美国普度大学合作的研究团体使用高端资源提供了一条途径。超过五十五万个任务在该MATLAB资源上运行,有利地促进了研究,学生学习以及科学网关(Science Gateway)应用。