NVIDIA今天正式颁布发表了最新版并行计较开辟东西CUDA 6,比拟此前的CUDA 5。5有着性的庞大前进。CUDA 6能够让并行编程史无前例的轻松,可以或许显著节流开辟人员的时间和精神,而通过GPU加快可带来最多8倍于CPU模式的机能提拔。可间接拜候CPU内存、GPU显存,无需正在相互之间手动拷贝数据,可正在大量编程言语中更简单地添加GPU加快支撑。x86 CPU、GPU内存池可正在统一空间内进行寻址,但那仅仅是简单的内存办理,CUDA 6则正在现有的内存池布局上添加了一个同一内存系统,法式员能够间接拜候任何内存/显存资本,或者正在的内存空间内寻址,而不消管涉及到的到底是内存仍是显存。不外留意,CUDA 6并不是完全不需要数据拷贝,只不外将这个工做从法式员那里接过来从动施行罢了,因而和AMD hUMA异构同一寻址架构是纷歧样的。
别的值得一提的是,NVIDIA此前曾经颁布发表下代GPU Maxwell将会支撑同一虚拟内存,但它要到来岁才会发布。他们找到了完全通过软件施行同一内存的方式,所以就提前这么做了,Maxwell则会有某种硬件层面的同一内存手艺(大概机能更高),但具体细节还有待发布。
简单地用GPU加快库替代已有的CPU库,BLAS(根本线性代数法式集)、FFTW(快速傅立叶变换)计较即从动提速最多8倍。从头设想的BLAS、FFT GPU库,单个节点可从动支撑最多八颗GPU,双精度浮点机能可跨越9TFlops,而且支撑最多512GB的更大负载。CUDA 6目前只是纸面颁布发表,2014岁首年月才会下载。有需要的可注册插手CUDA-GPU开辟者项目。