Saltar al contenido
ᐅ HielosMendez – Información digital que te dejara helado 🧊🥶

La APU Bobcat de próxima generación de AMD podría ganar a lo grande en portátiles y tabletas, si se lanza a tiempo

Hace un año, escribí una historia con la hipótesis de que el éxito a largo plazo de AMD podría depender de los futuros procesadores basados ​​en Bobcat en lugar de Bulldozer. Lo escribí antes de saber que Krishna y Wichita, las dos secuelas de 28 nm de Brazos construidas en GlobalFoundries, habían sido canceladas. AMD finalmente admitió esto y puso dos nuevos diseños basados ​​en Brazos en la hoja de ruta: Kabini y Temash. Kabini apunta a factores de forma de netbook / notebook, con Temash planeado como el seguimiento del primer SoC de tableta de AMD, con nombre en código Hondo.

Hasta la fecha, las APU para tabletas de AMD han encontrado muy poco mercado, aunque la compañía afirma que mostrará múltiples victorias en diseño en CES. Después de pasar algún tiempo con Surface y Ativ Smart PC de Samsung, creo que AMD tiene una oportunidad real de recuperar participación de mercado en 2013, siempre que Kabini pueda realizar envíos a tiempo. Se espera que el chip portátil de 28nm llegue al segundo trimestre del próximo año; Temash, la parte de la tableta, probablemente se lanzará en la segunda mitad de 2013.

Un poco de historia

La CPU Bobcat de AMD fue diseñada para competir con la Atom de Intel en el extremo superior de la curva de potencia y rendimiento de esa CPU. Cada diseño de microprocesador se puede considerar como un equilibrio entre el consumo de energía, el rendimiento y la dificultad de fabricación. De los tres nuevos chips que AMD entregó en 2011, Bobcat es el único que llegó a los tres. Bulldozer no cumplió con sus objetivos de consumo de energía y rendimiento; Llano golpeó a ambos, pero fue difícil de fabricar.

Brazos (que es la APU) apareció con su cara de juego, justo cuando las ventas de netbooks comenzaron a caer. Sigue siendo una parte importante de las ventas de AMD, pero la atención se ha centrado principalmente en el hardware x86 de gran núcleo de AMD. Con Atom, Intel se ha centrado en mejorar el consumo de energía y pasar a SoC en lugar de impulsar el rendimiento bruto (el primer Atom fuera de servicio, Valleyview, llega en 2014). Eso significa que 28nm Kabini / Temash tiene la oportunidad de reavivar una batalla de rendimiento en este segmento del mercado.

Jaguar de AMD

AMD reveló una cantidad significativa de información sobre Jaguar en Hot Chips en agosto pasado. El nuevo núcleo refina y pule mucho de lo que hizo que Brazos tuviera éxito, sin cambiar significativamente gran parte del hardware subyacente. Desde una perspectiva de alto nivel, los dos son casi idénticos.

Diagrama de bloques de Bobcat

Diagrama de bloques de Bobcat

Bobcat está arriba, Jaguar abajo.

Diagrama de bloques de Jaguar

Disposición del bloque de Jaguar

Casi, pero no del todo. Y eso es realmente alentador. Analista de arquitectura de CPU Agner Fog describe Bobcat [PDF, page 168] como tener «un diseño de tubería bien equilibrado sin cuellos de botella obvios». Cuando se trata del diseño de la CPU, la mayoría de los cambios son evolutivos e iterativos.

Una mejora de la parte delantera de Jaguar es la adición de cuatro búferes de bucle de 32 bytes. Los búferes de bucle se utilizan para almacenar una pequeña cantidad de instrucciones ya decodificadas. Esto es útil cuando la CPU está ejecutando ciclos estrechos; asegura que los decodificadores no tengan la tarea de decodificar las mismas instrucciones repetidamente. Esto ahorra energía y acelera la ejecución general.

Diseño entero de jaguar

Jaguar agrega una etapa de tubería para aumentar la frecuencia, pero mantiene el decodificador de dos números de Bobcat. En el lado entero, el núcleo recoge la unidad divisora ​​de hardware de Llano. Anteriormente, la división de enteros se manejaba a través de la unidad de punto flotante, lo que provocaba un retraso significativo. Jaguar también incluye soporte para SSE4.2, AVX y cuenta con un búfer de orden de lectura (ROB) más grande.

FPU de Jaguar

Los mayores cambios entre Jaguar y Bobcat están en el lado de la ecuación de FPU. Las unidades FPU ahora tienen 128 bits de ancho, en comparación con 64 bits en Bobcat. El chip admite AVX de 256 bits al dividir las operaciones en un par de uops de 128 bits, como lo hacen Bulldozer y Piledriver. El rendimiento de la FPU no coincidirá con Trinity: Jaguar solo puede decodificar dos instrucciones por ciclo de reloj, en comparación con cuatro para el núcleo más grande, pero debería mejorar sustancialmente con respecto a Bobcat.

Caché Jaguar L1

Lo siguiente son las cachés L1 / L2. Las mejoras de L1 que se enumeran aquí están diseñadas para reducir las penalizaciones de latencia y mejorar el ancho de banda de la FPU. Al igual que Bobcat, el L1 de Jaguar se divide en un caché de instrucciones de 32K y un caché de datos de 32K y es asociativo de conjuntos de dos vías.

La caché L2 es un poco diferente.

Caché L2 de Jaguar

Cada núcleo Bobcat tenía un 512K L2 conectado directamente, sincronizado a la mitad de la velocidad de la CPU. Con Jaguar, AMD ha optado por adjuntar un único caché compartido a las CPU. Este grupo de caché está conectado a través de una unidad de interfaz L2, que se ejecuta a la velocidad máxima del procesador. La caché L2 en sí todavía se ejecuta al 50% del reloj del núcleo.

Seguir esta ruta tiene varias ventajas para AMD. En primer lugar, hace que haya más L2 total disponible para cualquier núcleo único en un programa de un solo subproceso. El número total de núcleos admitidos aumenta a cuatro (Bobcat era estrictamente un diseño de doble núcleo) y simplifica el diseño del chip. Las búsquedas de datos y las fallas de caché L2 deberían mejorarse con el nuevo diseño.

Jaguar IPC

AMD proyecta una ganancia de IPC del 15% y una ganancia de frecuencia del 10% para la nueva pieza. Eso coloca al núcleo en una posición muy interesante.

Posicionamiento general de Jaguar

AMD está hablando de Jaguar / Kabini únicamente como una pieza de cuatro núcleos, pero esperamos que la empresa será lanzar un SKU de doble núcleo. Es una forma sensata de aumentar el rendimiento y mejorar la disponibilidad.

Página siguiente: todo se reduce al posicionamiento y la sincronización