Por Phil Burr, director de producto en Lumai
Aunque la óptica se ha utilizado en los centros de datos durante décadas, ahora está llegando cada vez más lejos al corazón del centro de datos: los procesadores y aceleradores que ejecutan las cargas de trabajo del centro de datos. Pero, ¿Cómo hemos llegado hasta aquí y cuáles son las perspectivas de futuro?
La comunicación óptica tiene la ventaja de un gran ancho de banda, una baja latencia y una baja pérdida de energía. Aunque inicialmente se utilizó para facilitar el tráfico hacia y desde los centros de datos, desde entonces se ha utilizado dentro del propio entorno del centro de datos, normalmente en la parte superior del rack (TOR) para crear enlaces de alta velocidad entre los conmutadores de la parte superior del rack de los distintos racks. Los grandes flujos de datos utilizados en la IA, donde las interconexiones de baja latencia y gran ancho de banda son cruciales, no han hecho más que acelerar el uso de las comunicaciones ópticas.
Como ejemplo de la importancia de la óptica, Google ha desarrollado su propio conmutador óptico, que utiliza componentes ópticos de espacio libre para reducir la latencia y el consumo de energía de su red. Al utilizar óptica de espacio libre, Google ha evitado la necesidad de convertir señales entre los dominios óptico y eléctrico en cada conmutador.
Google afirma que su red personalizada mejora el rendimiento en un 30 por ciento, consume un 40 por ciento menos de energía, incurre en un 30 por ciento menos de gastos de capital, reduce la finalización del flujo en un 10 por ciento y ofrece un tiempo de inactividad 50 veces menor en toda su red. Esto significa que los nodos se pueden conectar y desconectar rápidamente si dejan de funcionar o si necesitan repararse.
El auge de las interconexiones ópticas
Recientemente, ha habido una tendencia creciente hacia el uso de interconexión óptica dentro del propio rack. Impulsada por los requisitos de gran ancho de banda y baja latencia de la IA (ya que los modelos de IA se distribuyen en docenas de nodos de procesamiento), la interconexión óptica está ayudando a que estos sistemas de múltiples nodos funcionen lo más rápido posible. Como siempre, la velocidad es fundamental.
La interconexión óptica es un área llena de innovación. Hay empresas emergentes que desarrollan conmutación de paquetes totalmente óptica, lo que evita la necesidad de convertir señales entre los dominios eléctrico y óptico, lo que permite un ahorro significativo en consumo de energía y latencia.
Otros están aplicando la óptica a la capa siguiente, donde se está trabajando para desarrollar interconexiones totalmente ópticas de chip a chip o incluso de chip de silicio a chip de silicio. En este caso, el ancho de banda de las comunicaciones es aún mayor. Para que se produzca este avance, la óptica coencapsulada es fundamental. Las fundiciones y las empresas de encapsulado de chips están invirtiendo mucho en esta capacidad.
Del cambio al procesamiento
La óptica no solo se utiliza para conmutación, también se puede utilizar para procesamiento. Tiene ventajas similares en cuanto a velocidad, potencia y eficiencia.
¿Por qué utilizar la óptica para el procesamiento? La demanda de procesamiento de IA está aumentando a un ritmo fenomenal y la hoja de ruta del silicio no puede seguir el ritmo. Los desarrolladores de chips de silicio buscan rendimientos decrecientes e invierten cada vez más tiempo, esfuerzo y dinero en lograr mejoras marginales en el rendimiento.
La respuesta actual en la industria es aumentar el área de silicio, tener múltiples matrices de silicio dentro de un chip y utilizar un encapsulado sofisticado para resolver los desafíos que esto genera. Pero esto tiene un costo enorme, tanto en dólares como en energía consumida.
El alto costo monetario se debe al enorme gasto de capital que supone comprar los últimos y mejores aceleradores de IA, además de la mayor infraestructura necesaria para suministrar y enfriar esos dispositivos que consumen mucha energía; esto antes de considerar el mayor costo de la energía consumida.
La óptica es ideal para la IA, en particular porque el núcleo de la IA utiliza la multiplicación de vectores y matrices, que se resuelve de manera muy eficiente en luz. En los últimos años, había esperanzas de aplicar la fotónica integrada para el procesamiento de IA, sin embargo, la tecnología ahora se centra principalmente en aplicaciones de interconexión o conmutación, debido a las limitaciones en el uso de la fotónica integrada para la enorme escala de procesamiento matricial necesario para la IA moderna.
El uso de la óptica 3D (espacio libre) para el procesamiento permite superar estos desafíos: utiliza una fracción de la energía y ofrece un salto en el rendimiento. El uso de la óptica 3D significa que se pueden utilizar vectores muy amplios, lo que maximiza el rendimiento y la eficiencia energética. Los aceleradores de IA que utilizan la óptica 3D prometen ofrecer soluciones de alto rendimiento y bajo consumo a una fracción de los costos de capital y operativos en comparación con las soluciones de GPU actuales.
Con el uso cada vez mayor de la óptica en el centro de datos, la óptica 3D para el procesamiento de IA será inevitablemente el siguiente paso.