NVIDIA dévoile une nouvelle famille de GPU Tesla basée sur son architecture de calcul GPU NVIDIA. Les nouveaux GPU Tesla K10 et K20 de NVIDIA sont des accélérateurs de calcul construits pour traiter les problèmes HPC les plus complexes dans le monde. Conçus pour la haute performance et l'efficacité énergétique extrême, Kepler est, d'après le fondeur, trois fois plus efficace que son prédécesseur, l'architecture Fermi, qui elle-même établissait un nouveau standard pour le calcul parallèle lors de son introduction il y a deux ans.
“Fermi a été un véritable pas en avant dans le calcul parallèle“, déclare Bill Dally, directeur scientifique et senior vice président de la recherche chez NVIDIA.”Cette architecture avait mis l'informatique accélérée par GPU au premier plan du calcul haute performance et avait attiré des centaines de milliers de développeurs vers la plateforme de calcul GPU. Kepler va révolutionner le marché du GPU en s’imposant largement dans l'informatique technique grâce à leur facilité d'utilisation et à l'étendue de leur champ d'application. “
NVIDIA a développé un ensemble de technologies d'architecture pour rendre les GPU Kepler plus performants et tout en restant très économes en énergie. Le fonduer décrit ces technologies ainsi :
le multiprocesseur de flux SMX – C'est le bloc de construction fondamental de tous les GPU, le multiprocesseur de flux SMX, a été repensé de fond en comble pour la haute performance et l'efficacité énergétique. Il fournit jusqu'à trois fois plus de performance par watt que le multiprocesseur de flux Fermi, d'où la possibilité de construire un superordinateur offrant un pétaflop de performance de calcul dans seulement 10 racks de serveurs. L'efficacité énergétique du multiprocesseur de flux SMX a été obtenue en multipliant par 4 son nombre de cœurs de l’architecture CUDA, tout en réduisant la vitesse d'horloge de chaque cœur et en augmentant la puissance de crénelage des parties du GPU au repos ainsi qu'en maximisant la zone du GPU consacrée au traitement parallèle des cœurs en lieu et place d'une logique de contrôle.
le parallélisme dynamique – Cette fonctionnalité permet aux threads GPU de faire naître de manière dynamique de nouveaux threads, les GPU pourront ainsi s'adapter dynamiquement aux données. Elle simplifie grandement la programmation parallèle, en autorisant l'accélération GPU d'un ensemble plus large d'algorithmes courants, tels que le maillage adaptatif, les méthodes multipolaires rapides et les méthodes multigrilles.
Hyper-Q – Cette innovation permet à plusieurs cœurs du processeur d'utiliser simultanément les cœurs CUDA sur un seul GPU Kepler. Cela augmente considérablement l'utilisation du GPU, en réduisant les temps de repos du CPU et en faisant évoluer la programmation. Hyper-Q est idéal pour les applications de cluster qui utilisent MPI.
“Nous avons conçu Kepler en nous focalisant sur trois points : la performance, l'efficacité et l'accessibilité,” affirme Jonah Alben, vice-président senior de l'ingénierie GPU et principal architecte de Kepler chez NVIDIA. “Cette architecture représente une étape importante dans le calcul accéléré par GPU et devrait favoriser la prochaine vague d'innovations dans la recherche informatique. “
Aperçu de la plateforme de programmation parallèle CUDA 5
En plus de l'architecture Kepler, NVIDIA publie une avant-première de la plateforme de programmation parallèle CUDA 5. Disponible pour plus de 20.000 membres du GPU Computing Registered Developer program de NVIDIA, cette plateforme préliminaire permettra aux développeurs de découvrir les moyens de tirer parti des nouveaux GPU Kepler, y compris le parallélisme dynamique.
Le modèle de programmation parallèle CUDA est prévu pour être largement disponible au cours du troisième trimestre de 2012. Les développeurs peuvent accéder à la pré-version en s'inscrivant au GPU Computing Registered Developer program sur le site web de CUDA