Saltar al contenido
ᐅ HielosMendez – Información digital que te dejara helado 🧊🥶

YouTube diseñó su propio hardware de transcodificación de video

Este sitio puede ganar comisiones de afiliados a partir de los enlaces de esta página. Condiciones de uso.

La tasa de videos en Internet se ha disparado, año tras año, al igual que la cantidad de videos que YouTube publica por año. Desafortunadamente, las CPU y GPU no ofrecen el tipo de mejoras de rendimiento anual que alguna vez ofrecieron. Enfrentado a una tasa cada vez más lenta de mejora del silicio y cantidades de video en rápido aumento, YouTube decidió construir su propia unidad de transcodificación de video, o VCU, con nombre en código Argos.

La empresa ha revelado su esfuerzo de Argos tanto en un entrada en el blog y un papel, dependiendo de qué tan profundo en los detalles le apetezca profundizar. Según YouTube, mover cargas de trabajo a la VCU ha mejorado la eficiencia entre 20 y 33 veces, dependiendo de los detalles exactos de la transmisión. El nuevo chip de YouTube está diseñado para ser capaz de transcodificar a un objetivo de resolución a la vez, o de apuntar a múltiples resoluciones simultáneamente.

Un componente clave del ahorro de energía de YouTube es el hecho de que las pilas de software y hardware están diseñadas explícitamente para funcionar entre sí. La arquitectura física del sistema se muestra a continuación:

Hay más codificación que decodificación de núcleos en cada iteración del ASIC, y más de un ASIC en cada tarjeta VCU. Esta solución ha sido diseñada para escalado denso. La transcodificación de un video a múltiples resoluciones de salida simultáneamente es parte de cómo YouTube logra sus mejoras de eficiencia energética, ya que «permite compartir de manera eficiente los parámetros de control obtenidos mediante el análisis de la fuente (por ejemplo, detección de desvanecimientos / destellos)», según la compañía. Es mucho más preferible manejar estas transcodificaciones en paralelo (MOT) que hacerlo una a la vez (SOT), ya que evita la decodificación redundante. Al menos algunas de las mejoras de eficiencia energética que se alegan provendrán de evitar el trabajo redundante. Generalmente se prefiere MOT a SOT, ya que evita decodificaciones redundantes para el mismo grupo de salidas.

Imagen de YouTube

En MOT, el video se decodifica una vez, se escala a todas las resoluciones de destino y luego se codifica en todos los destinos relevantes. YouTube señala que también diseñó el ASIC para poder procesar múltiples MOT y SOT simultáneamente para aumentar aún más la eficiencia. El codificador real está diseñado para codificar H.264 y VP9 en hardware mientras busca tres marcos de referencia. Tiene una arquitectura canalizada, almacenes de referencia locales para la estimación de movimiento y puede acelerar la codificación de entropía, pero Google señala que el chip está «optimizado para objetivos de potencia / rendimiento / área». Cada núcleo de codificador es capaz de codificar 4K a 60 fps en tiempo real, con 10 núcleos por ASIC y varios ASIC por tarjeta.

YouTube ya está elaborando planes para un acelerador de próxima generación que también sería capaz de decodificar AV1 en hardware. En general, se considera que VP9 es el competidor de código abierto para HEVC, mientras que AV1 es un seguimiento más avanzado que se espera que ofrezca mayores ahorros de ancho de banda.

Argos representa el tipo de proyecto específico de la empresa que hemos visto más en los últimos años, ya que Intel ha luchado por mejorar el rendimiento de su CPU, pero esto no es estrictamente un problema de CPU. Los bloques de decodificación de GPU integrados en una GPU Ampere o RDNA2 claramente no estaban especializados para la tarea que YouTube tenía en mente. Este es el tipo de trabajo semi-personalizado que en teoría uno podría ver a AMD asumiendo, pero AMD no parece haber perseguido acuerdos de fabricación externos para su IP de manera tan agresiva. Sabemos que la compañía está trabajando en un acuerdo con Samsung para una solución de gráficos móviles basada en Radeon IP, y se asocia con Sony y Microsoft para juegos de consola, pero no mucho más allá de eso, al menos, no públicamente.

Hace diez años, Google, Facebook y Amazon comenzaron a revolucionar silenciosamente el mercado de servidores pagando a los ODM para que construyeran servidores para ellos directamente en lugar de comprar hardware estandarizado listo para usar de empresas como Dell o HPE. Hoy en día, estas mismas empresas están diseñando su propio silicio personalizado para cubrir varios casos de uso de la industria de la nube. Las CPU y GPU aún dominan el espacio del consumidor, pero los aceleradores especializados y los chips especialmente diseñados se están infiltrando en la empresa en cantidades cada vez mayores. También es interesante ver que YouTube de manera bastante deliberada no respalda HEVC o incluso discutiendo el soporte futuro para VVC / H.266. Cualquier elusión de estos estándares probablemente se deba a enredos de regalías y tarifas de licencia.

Imagen destacada de YouTube.

Ahora lee: