Translate

jueves, 27 de marzo de 2014

Más detalles de la tecnología NVIDIA NVLink


NVLink posibilita CPU y GPU estrechamente integrados y con acceso a memoria unificado.

NVIDIA NVLink es la nueva interconexión de alta velocidad que estará presente en los futuros GPUs Nvidia basados en la arquitectura gráfica Pascal y superiores. La interconexión permite que GPU y CPU compartan datos de cinco a doce veces más rápido de lo que lo hacen en la actualidad. Esto eliminará los cuellos de botella en aplicaciones Big Data y ayudará a preparar el camino, para una nueva generación de supercomputadores exa-escala de 50 a 100 veces más rápidos que los sistemas más poderosos de la actualidad.
La nueva interconexión NVLink se desarrolló en conjunto con IBM, que la incorporará en las futuras versiones de sus CPU POWER, pues sus características facilitan a los desarrolladores la modificación de aplicaciones de análisis de datos y provee de alto rendimiento para aprovechar los sistemas híbridos (acelerados por CPU+GPU).

NVlink vs PCI Express 3.0

Los GPU actuales están conectados a los CPU basados en x86, mediante la interfaz PCI Express (PCIe), lo que limita la capacidad del GPU de acceder al sistema de memoria del CPU (DRAM), el cual es de cuatro a cinco veces más lento que el sistema de memoria del GPU (VRAM).
PCIe representa un cuello de botella aún mayor entre el GPU y los CPU IBM POWER, los que tienen un ancho de banda mayor que el de los CPU x86. Como la interfaz NVLink coincidirá con el ancho de banda de los sistemas de memoria típicos de un CPU, permitirá que las GPU accedan a la memoria de la CPU con todo su ancho de banda.
Esta interconexión de alto ancho de banda mejorará de forma impresionante el rendimiento de las aplicaciones aceleradas por GPU. Debido a las diferencias del sistema de memoria (los GPU tienen memorias rápidas pero pequeñas, y los CPU tienen memorias grandes pero lentas), las aplicaciones de computación acelerada suelen mover los datos de la red o del almacenamiento en disco, hacia la memoria del CPU, para luego, copiar los datos en la memoria del GPU antes de que este pueda procesarlos.

Con NVLink, los datos se mueven entre la memoria de la CPU y la memoria de la GPU a velocidades mucho más altas, lo que hace que las aplicaciones aceleradas por la GPU se ejecuten mucho más rápido.

Ventajas de NVLINK sobre PCI Express 3.0

Por años PCI Express ha sido la tecnología predilecta para conectar desde grandes sistemas de cómputo, servidores, hasta GPU de escritorio, debido a su gran ancho de banda, actualmente las GPU utilizan la tercera generación de la tecnología (PCI Express 3.0) para comunicarse con la unidad central de proceso o CPU, pero esto limita la capacidad de la GPU de acceder al sistema de memoria de la CPU, el cual es de cuatro a cinco veces más lento que los sistemas de memoria utilizado en las GPUs modernas. Por este motivo la tecnología de interconexión NVLink pretende igualar los anchos o equiparar los anchos de bandas de ambos sistemas de memoria GPU <-> CPU para permitir un acceso expedito entre ambos sistemas y con un gran ancho de banda.

       Sistema tradicional basados en PCI Express (single GPU y Multi-GPU)

Este alto-ancho de banda mejorará dramáticamente el rendimiento de software y aplicaciones que sean acelerados por esta combinación de GPU y CPU, mediante una interfaz que eliminará los cuellos de botella y las esperas (latencias) en el procesado de grandes volúmenes de datos. Estos son de vital importancia para por ejemplo mover información en grandes redes de datos, servidores o sistemas de almacenamiento, los cuales usualmente mueven estos datos al sistema de memoria de la CPU y luego copian los datos a la memoria de la GPU antes de ser procesados por esta última. Con NVLink la información se moverá entre el sistema de memoria de la GPU y el sistema de memoria de la CPU a una mayor velocidad, con un gran ancho de banda y con menos tiempo de acceso (latencias), haciendo de las aplicaciones aceleradas por GPU mucho más rápidas.
Sistema basados en PCI Express con NVLink (single GPU y Multi-GPU)
En la conferencia el CEO de NVIDIA  Jen-Hsun Huang mostró un módulo a modo de ejemplo que incorporaba una GPU basada en Pascal (obviamente una maqueta nada funcional de momento) con tecnología NVLink. Este módulo era un tercio del tamaño de una placa PCIe estándar utilizado en los GPU actuales, este módulo posee conectores que permiten conectarlo en la placa madre, mejorando el diseño de los sistemas y la integridad de la señal.
Según NVIDIA, la tecnología NVLINK permitirá crear la próxima generación de supercomputadores “exascale”, con un alto grado de eficiencia energética, los cuales podrán superar los 1000 PetaFLOPS, lo que representa en primera instancia casi 30 veces más potencia de cómputo en operaciones de punto flotante que los actuales supercomputadores más veloces del mercado.
NVIDIA a futuro seguirá soportando la tecnología PCI Express, ya que NVLink será usada para conectar GPUs con CPUs compatibles con NVLink como así también proveer altos anchos de banda para conexiones directas entre múltiples GPUs, también a pesar de los altos anchos de banda, NVLink será también más eficiente energéticamente por bit transferido que PCIe, aunque como ya mencionamos es una tecnología dirigida principalmente al mercado de supercomptuación, servidores, redes etc.

Unified Memory o Memoria Unificada.


El movimiento de datos más rápido, aunado a otro recurso conocido como Unified Memory, simplificará la programación del GPU. Unified Memory permite que el programador trate la memoria del CPU (DRAM) y GPU (VRAM) como un solo bloque de memoria; sin preocuparse de que los datos residan en la memoria del CPU o del GPU.
Aunque las futuras GPU NVIDIA seguirán admitiendo PCIe, NVLink se usará para conectar los GPU a las CPU compatibles con NVLink, así como para brindar una conexión de alto ancho de banda directamente entre múltiples GPU. También, a pesar de su alto ancho de banda, NVLink brinda un uso mucho más eficiente de energía/bit transferido (en comparación con PCIe).

Memoria 3D o 3D Memory

Otras de las novedades que anuncio NVIDIA para su arquitectura Pascal, es la memoria 3D o 3D memory, no es una implementación nueva debemos decirlo, ya que en las memorias Flash se utiliza desde hace años la técnica de apilar chips uno arriba del otro para mejorar la densidad de los chips de memoria, reducir el consumo y el espacio que ocuparían varios chips de memoria dispersos en un PCB.
NVIDIA con 3D Memory pretende crear memorias de mayor densidad y reducido tamaño para incorporar estos chips dentro del mismo empaque de la GPU, esto permitirá a la GPU obtener datos de la memoria de manera mucho más rápida de lo que se hace actualmente con chips que están en la periferia de la GPU mediante enrutamiento externo.
Esto le permitirá a las futuras GPU con memoria 3D impulsar el rendimiento y la eficiencia, permitiendo incluso crear GPU más compactas y de mayor rendimiento en dispositivos más pequeños, apuntando con esto también a los dispositivos móviles.
La arquitectura Pascal soportará el sistema de memorias apiladas (stacked memory) con múltiples capas de memorias DRAM integradas verticalmente en un solo empaque con la GPU, esto resultará también en mejores anchos de banda para el sistema de memoria de la GPU, doblar la cantidad de memoria que acompañe a la GPU y cuadruplicar su eficiencia energética comparado con los chips de memoria GDDR5 que son ubicados fuera de la GPU.


Tarjetas de video Nvidia equipadas con NVLink

NVLink requerirá de una nueva ranura de interconexión física y eléctricamente incompatible con PCIe, por lo que las tarjetas de video Nvidia con conexión NVLink, no podrán usarse en las ranuras PCIe tradicionales, sino en nuevos equipos equipados con ranuras NVLink.
En este punto podemos deducir que NVLink estará presente únicamente en la línea de tarjetas profesionales para cómputo acelerado por GPU Tesla de Nvidia, productos grado servidor/super-computador que podrán tomar ventaja inmediata de todas las bondades descritas de NVLink.
Las tarjetas de video equipadas con GPUs GeForce y Quadro basados en la arquitectura gráfica Pascal, continuarán usando la interfaz PCI Express 3.0 tradicional (aunque probablemente las soluciones dual-GPU o superiores, cuenten con conexión NVLink interna entre los 2 GPUs o más que las conformen).

Conclusiones

Podríamos decir que NVLink es la respuesta de Nvidia a las tecnologías rivales AMD CrossFire XDMA (interconexión dedicada entre GPUs) y hUMA (controlador de memoria unificado), combinando lo mejor de ellas en una única tecnología, la que inicialmente estará parcialmente disponible para el consumidor (tarjetas de video multi-GPU… ¿será que se vienen soluciones tri/quad-GPU Nvidia al estilo de 3dfx Voodoo 5 6000 “4x VSA-100”?).
NVIDA apunta con la arquitectura Pascal alcanzar anchos de banda de memoria que lleguen hasta los 1000 GB/s o 1 TB/s, comparado con los 300+ GB/s que alcanzan las GPUs más potentes de la actualidad.
El acceso unificado a memoria será una característica de momento limitada al sector servidor.

Mas Información:

No hay comentarios.:

Publicar un comentario