Saltar al contenido
ᐅ HielosMendez – Información digital que te dejara helado 🧊🥶

Arquitectura Carrizo de AMD detallada y explorada

AMD ha sacado los detalles de su APU Carrizo: su arquitectura móvil de próxima generación y la versión final de la arquitectura Bulldozer que debutó en 2011. Y en general, Carrizo se encuentra en una posición extraña. Por un lado, representa el pináculo del largo esfuerzo de AMD para mejorar la eficiencia de la arquitectura Bulldozer y reducir su consumo de energía. Incorpora una serie de novedades genuinas para AMD, incluida la primera implementación de la compañía de escalamiento de frecuencia y voltaje adaptativo (a diferencia de DVFS, la tecnología que usa Intel), su primer decodificador de video de alta eficiencia que se implementará en hardware y la primera APU para utilizar las tecnologías de compresión de color y ahorro de ancho de banda que AMD debutó por primera vez con su Tonga / R9 285 independiente el otoño pasado. También es el primer SoC de “gran núcleo” que AMD ha construido, y la primera parte que la compañía ha diseñado con bibliotecas de alta densidad tanto para la CPU como para la GPU.

Por otro lado, es el último de su línea y se envía incluso cuando los ojos y las lenguas se han vuelto hacia la arquitectura Zen de próxima generación de AMD. Todavía no hemos tenido la oportunidad de probar el hardware de envío, pero las afirmaciones de rendimiento de AMD para su nuevo hardware son significativas. Si el chip funciona como se afirma, podría ofrecer una competencia más fuerte por las ganancias de computadoras portátiles de bajo consumo que AMD ha presentado nunca antes.

Carrizo: bajo el capó

Ya hemos cubierto algunas de las funciones de optimización de energía de Carrizo y las nuevas capacidades en artículos anteriores, por lo que nos centraremos aquí en los detalles que AMD no ha revelado anteriormente, incluidos los detalles de ciertas mejoras centrales.

Carrizo1

Como revelamos anteriormente, las cachés de datos L1 en Excavator están duplicando su tamaño a 32K, en comparación con 16K. Los cachés de datos L1 en Excavator y los procesadores de clase Bulldozer anteriores son únicos para cada núcleo (el caché de instrucciones L1 se comparte entre un par de núcleos). AMD afirma haber mantenido las latencias de caché idénticas a pesar de duplicar su tamaño, al tiempo que mejora los mecanismos de captación previa de la CPU.

Carrizo2

No está claro cuánta energía absoluta ahorró AMD al mejorar la caché L1, pero la memoria caché tiende a consumir bastante energía. Cada nivel de caché está diseñado para hacer diferentes compensaciones entre costo, latencia de acceso y consumo de energía: la caché L1, que se encuentra más cerca de la CPU, probablemente consume la mayor cantidad de energía por bit de almacenamiento.

También se ha mejorado la predicción de rama, con búferes de destino de rama más grandes (lo que mejora la eficiencia del predictor de rama). También hay soporte para nuevas instrucciones que incluyen, sobre todo, AVX2. Las instrucciones MOVBE, SMEP y BMI2 son más especializadas y tratan con capacidades específicas o manipulación de bits. No es probable que el rendimiento en aplicaciones de propósito general cambie mucho con respecto a estas capacidades, aunque existe la posibilidad de que AVX2 pueda ofrecer sus propias ganancias de rendimiento.

La nueva APU también es compatible con lo que Microsoft ahora llama Modern Standby (título anterior: Connected Standby). Intel tuvo muchos problemas para enviar controladores Connected Standby de 64 bits para Windows 8 / 8.1, razón por la cual ciertos sistemas permanecieron en versiones de 32 bits del sistema operativo durante bastante tiempo. Por el contrario, AMD nos dijo que priorizó el soporte de 64 bits para Modern Standby en Windows 10 y que espera que el sistema operativo admita el modo en su hardware listo para usar.

Reproducción de video y consumo de energía

La CPU, por supuesto, es solo la mitad de la ecuación. AMD también ha realizado una serie de mejoras de bajo nivel en el lado de la GPU de Carrizo, incluidos varios cambios que deberían mejorar significativamente la duración general de la batería. Los chips AMD anteriores usaban la GPU para escalar y procesar imágenes durante la reproducción de video, pero este es un uso relativamente ineficiente de ese silicio. Al rediseñar la ruta del video, AMD pudo reducir sustancialmente el consumo de energía.

Carrizo4

Según las notas a pie de página de AMD, un Carrizo de 15 W que usa Metro Video Player para reproducir un video de 1920 × 1080 consume 2,43 W sin soporte de refuerzo y 1,90 W con refuerzo. Un diseño de referencia Kaveri 3GHZ de 19W consume 4.8W para realizar la misma tarea (el soporte de refuerzo no está disponible en Kaveri). Por lo tanto, incluso en el peor de los casos, sin una base, Carrizo debería consumir la mitad de la potencia de su predecesor. El gráfico en la esquina superior derecha muestra de dónde AMD extrae sus mejoras: algunas de ellas son arquitectónicas, otras provienen del diseño de SoC de Carrizo y algunas usan el soporte subyacente mencionado anteriormente.

A continuación, está el decodificador de video unificado mejorado, o UVD. Carrizo es la primera APU de AMD que ofrece soporte para decodificación H.265 / HEVC en hardware. También se admite la decodificación 4K para H.264, junto con 4K MJPEG. Lo que es más impresionante acerca de la unidad UVD es que ha sido rediseñado para un mayor ancho de banda y una puerta de potencia mucho mejor.

Carrizo6

Según AMD, agregar una compuerta de energía dinámica al decodificador de video puede mejorar la duración de la batería durante la reproducción de video hasta en 30 minutos. El resultado de estas mejoras es una reducción de potencia de la plataforma del 50% para un Carrizo de 15W en comparación con una plataforma de referencia Kaveri de 19W.

Carrizo7

Dada la importancia del video en línea, ya sea que se trate de YouTube, Twitch o Netflix, el enfoque de AMD en reducir el consumo de energía de su plataforma tiene mucho sentido.

Mejoras de GCN

La implementación de GCN de Carrizo es un núcleo de tercera generación que incorpora las mejoras que AMD introdujo por primera vez con Tonga, también conocido como R9 285. Carrizo es también la primera APU de AMD en implementar las características de preferencia de cómputo, cambio de contexto y calidad de servicio de la GPU que AMD presentó por primera vez en sus hojas de ruta HSA hace años.

Carrizo10

Aún no está claro exactamente qué impacto tendrán estas características en el rendimiento de la APU en las cargas de trabajo de HSA. Cuando revisamos Kaveri, descubrimos que AMD realizó una serie de mejoras adicionales para acceder a las latencias y calcular el rendimiento de la carga de trabajo que no había revelado inicialmente. Si Carrizo se basa aún más en estas ganancias, el rendimiento de la carga de trabajo heterogénea debería ser bastante impresionante. AMD alude indirectamente a tales ganancias de rendimiento, pero no ofreció muchos detalles.

Carrizo9

AMD no solo hizo un puerto directo de Tonga a una APU, sino que rediseñó el chip para usar transistores de menor potencia e implementó islas de voltaje separadas para cada área del SoC. El resultado es una GPU que puede utilizar las ocho CU, incluso en envolventes de potencia de 15 W, al tiempo que alcanza objetivos de rendimiento gráfico hasta un 60% más altos que Kaveri dentro de la misma envolvente de potencia:

Carrizo11

Los resultados de Futuremark citados aquí no necesariamente nos dicen qué esperar del rendimiento de los juegos en el mundo real, pero ciertamente apuntan en una dirección positiva. Según las notas al pie de AMD, la compresión de color delta de Carrizo mejora el rendimiento en un promedio de 5-7% cuando se mide en 24 juegos a 1920 × 1080.

Las puntuaciones reales de FutureMark 3DMark 11 entre Kaveri y Carrizo fueron (a 19 W a 15 W): 1220 (Kaveri) frente a 1581 (Carrizo) con la gestión consciente de la temperatura de la piel (STAPM) habilitada y 1220 frente a 2120 con STAPM inhabilitado. En la envolvente de potencia de 35 W para ambos núcleos, Kaveri obtuvo un puntaje de 2184 en 3DMark 11 frente a 2500 para Carrizo. Las ganancias totales en la envolvente de 15 W fueron del 30-73% dependiendo de STAPM, en comparación con una ganancia del 14,4% en la envolvente de 35 W.

Rendimiento de la CPU de Carrizo

AMD no entregó una gran cantidad de datos de referencia, pero las diapositivas que compartió son bastante interesantes. Si está familiarizado con la popular prueba de renderizado de Cinebench, probablemente sepa que la prueba no es nada halagadora para AMD. Según Sunnyvale, Carrizo ofrece una gran ganancia de rendimiento en Cinebench en el objetivo de TDP de 15 W, gracias a una combinación de IPC mejorado y frecuencias más altas.

Carrizo3

Las mejoras son menores a 35W porque Carrizo no está optimizado para esa envolvente de potencia, pero el chip aún genera un rendimiento mejorado en más del 10% en la carga de trabajo de un solo subproceso, a pesar de una frecuencia base más baja en comparación con Kaveri. La versión de subprocesos múltiples administra ganancias de ~ 15%.

Carrizo12

AMD duplicó los tubos de decodificación en su motor UVD 6 y afirma que esto, combinado con la compatibilidad con HSA en aplicaciones como Handbrake, ofrecerá un rendimiento de transcodificación que puede superar al Core i5-5300U con QuickSync. Nuevamente, tendremos que verificar estas afirmaciones.

Conclusión

Desde que Bulldozer debutó, AMD ha estado librando una guerra en dos frentes para mejorar el rendimiento y la eficiencia energética de su CPU insignia, todo mientras se desangra la cuota de mercado y lanza una iniciativa diseñada para promover métodos de computación completamente nuevos. Cada revisión de APU desde Trinity en adelante ha ofrecido un mejor rendimiento por vatio, TDP más bajos y una mejor duración de la batería. Carrizo parece dispuesto a llevar adelante esa tendencia. Esa es una conclusión tentativa, sin duda, quiero ver el hardware de envío antes de declarar el chip ganador, pero AMD ha sido claro y específico sobre cómo se enfocó en envolventes de menor potencia y las mejoras que hizo para alcanzar sus objetivos.

Actualmente, se espera que los sistemas Carrizo estén en el mercado a fines de junio o principios de julio. Si la plataforma cumple su promesa, veremos computadoras portátiles AMD con una duración de batería mucho mejor y características de rendimiento general en sobres de 19 W que pueden competir de manera más efectiva con las plataformas Intel Core i3 y Core M.