Guía Hardware
Black Friday Corsair

Electromigración: qué es y por qué podría estropear tu CPU

Actualizado a: 19 de enero de 2024

La electromigración es un fenómeno que ocurre en los átomos. Sucede cuando un flujo de corriente que pasa a través de un material hace que se rompa la estructura de los átomos y se muevan, dejando vacantes y depósitos, y causando estragos en algunos chips de alto rendimiento, como puede ser tu CPU, GPU, etc.

Es decir, puedes ver la electromigración como un río. El agua sería la corriente eléctrica, el cauce un conductor eléctrico, y los sedimentos que la corriente va arrancando de un lugar dejando huecos, los va depositando en otros lugares generando acumulaciones de material. Si esto le ocurre a una interconexión de un chip, puede llegar a producirse circuitos abiertos por las vacantes o cortocircuitos por los cúmulos.

¿Qué es la electromigración?

La electromigración (EM) es un fenómeno que ocurre en las líneas de metalización, como en las interconexiones que unen las distintas partes dentro de un chip. Cuando la corriente (flujo de electrones) pasa por el conductor, y con ayuda del calor generado, puede golpear a los átomos del metal y desplazarlos.

Si la electromigración pudiese mantenerse no sería dañina, es decir, cuando no hay divergencias, y la cantidad de material que entra y sale de la línea es igual Pero lo cierto es que esto produce que con el tiempo se arranquen átomos del metal del principio de la línea y se depositen al final, es decir, se producen pérdidas y acumulaciones Esto puede terminar causando un circuito abierto si la línea se corta por el principio o un cortocircuito con otra línea adyacente en el final donde se acumulan.

Debes saber también que cuando comienzan los pulsos eléctricos a arrastrar los átomos del material conductor y a generar vacantes, se puede recuperar esas vacantes sometiendo al conductor a un estrés opuesto. De esa forma, la corriente inversa circulará en el otro sentido (positivo negativo) y arrastrará los átomos de conductor hacia la vacante. Pero esto no siempre es posible en los circuitos.

Hay que decir, que incluso sin electromigración, una interconexión no es eterna. La vida útil será en función de la densidad de corriente RMS, según Joule.

Hay que decir también que la forma de onda de una tensión también tiene un impacto en las tasas de falla.

Ecuación de BLack

El tiempo de falla MTTF se puede calcular en la electromigración gracias a la Ecuación de Black:

Ecuación de Black –> MTTF = C·J-n e(Ea/kT)

En esta ecuación las letras son:

  • C es la constante basada en las propiedades del metal de la línea.
  • J es la densidad de corriente.
  • n es la constante entera de 1 a 2.
  • T es la temperatura en grados Kelvin.
  • K es la constante de Boltzmann.
  • Ea es la energía de activación.

Tipos de daños

Por tanto, tenemos que la electromigración puede generar dos tipos de daños:

  • Agotamiento de átomos (vacíos): reducción lenta de la conectividad, y finalmente fallo o circuito eléctrico abierto debido al corte de la línea.
  • Deposición de átomos (hillocks): depósitos de material conductor en otras zonas de la línea y cortocircuitos. Es decir, los átomos que se quitan de los vacíos van a parar a estos depósitos.

Factores que afectan a la EM

Para comprender mejor la electromigración o EM, hay que comprender qué factores afectan realmente a este fenómeno negativo. Y estos factores son:

  • Material de alambre: se sabe que el cobre puro utilizado para la metalización de los modernos chips es más resistente a la electromigración que el aluminio (empleado en los chips de hace décadas). Los conductores de cobre pueden soportar aproximadamente cinco veces más densidad de corriente que los cables de aluminio.
  • Temperatura:  en la ecuación de Black, que se utiliza para calcular el tiempo medio de falla de las líneas metálicas, la temperatura del conductor aparece en el exponente, es decir, afecta fuertemente al MTTF de la interconexión. La temperatura de la interconexión es principalmente el resultado de la temperatura del chip, el efecto de autocalentamiento por el flujo de corriente, el calor de las interconexiones o transistores próximos y la conductividad térmica de los materiales circundantes.
  • Tamaño del conductor: como muestra la ecuación de Black, además de la temperatura, es la densidad de corriente la que constituye el parámetro principal que afecta el MTTF de un conductor. Dado que la densidad de corriente se obtiene como la relación entre la corriente I y el área de la sección transversal A, y dado que la mayoría de las tecnologías de proceso asumen un grosor constante de las interconexiones impresas, es el ancho del cable el que ejerce una influencia directa en la densidad de corriente: cuanto más ancha sea, menor es la densidad de corriente y mayor es la resistencia a la electromigración.

Como sabes, el material y el tamaño del conductor es cuestión de fabricación del chip, pero la temperatura se verá afectada por otros parámetros. Por ejemplo, mientras mayor sea el voltaje y la frecuencia de reloj, más se calentará. Por eso, cuando se hace overclocking, los riesgos de electromigración son mayores.

Soluciones para la electromigración

disipador chip TDP

Una solución para la electromigración es garantizar que las líneas de conductor con grandes densidades de corriente potencial tengan un ancho adecuado para poder soportar estas corrientes.

Durante la fabricación del chip, debido a los efectos del pulido quimico-mecánico (CMP) para fabricar las interconexiones del chip, pueden reducir el grosor de estas líneas, y un cable más delgado no puede soportar tanta densidad de corriente como uno más ancho. Por eso hay que usar tablas de densidad de corriente para calcular los anchos compatibles con una EM dada.

Esto se marcará a la hora de diseñar el chip, tomando algunas restricciones para evitar la electromigración que ya existen predefinidas en el software EDA de diseño de chips, para facilitar las cosas al diseñador. Así se puede determinar el MTTF, es decir, el tiempo medio predefinido hasta que se produce un fallo.

Debes saber también que existen 4 tipos de restricciones EM para 4 tipos de corrientes equivalentes:

  1. Corriente absoluta
  2. Corriente media
  3. Corriente de pico
  4. Raíz cuadrada de la corriente media (RMS o Root Mean Squared) 

Para hacer las verificaciones durante el diseño del chip, los diseñadores definen la corriente equivalente de este tipo para cada pin del diseño digital, para que el motor de verificación de EM/R del software de diseño pueda trabajar. Y después se realizan las siguientes comprobaciones:

  • Se usa una tabla de densidad de corriente para el tipo de EM correspondiente proporcionada por el usuario para determinar los rangos de ancho adecuados para transportar la corriente para cada objeto de conexión de una red. Si el ancho real no se encuentra dentro de ningún rango de ancho compatible con EM, se envía un indicador al usuario o los resultados del enrutamiento se deben ajustar automáticamente. 
  • Utilizar restricciones de tolerancia de corriente de vía para el tipo de EM correspondiente suministrado por el usuario para determinar el número mínimo de cortes para transportar la corriente para cada vía de una red. Si el valor real es menor que el número mínimo de cortes que cumple con EM, se envía un aviso al usuario y los resultados de enrutamiento de las intercionexiones deben ajustarse automáticamente.

Electromigración y software de diseño

EDA

Muchos entornos EDA o de diseño de circuitos, tienen motores para poder verificar los casos de electromigración y generar las dimensiones de conductores adecuadas para que este fenómeno no ocurra. Además, los propios chips actuales también tienen sistemas para evitar esta EM, como el escalado de frecuencia dinámica, el throttling térmico, etc.

Por ejemplo, las herramientas de Synopsis son un claro ejemplo de software de diseño que permitirá al usuario/diseñador, actuar de forma adecuada para que su diseño final no tengan problemas de este tipo, o no al menos a corto plazo.

En el caso de Synopsis (place and routing, RTL, GDSII,…), como en otros casos, hay soluciones para el enrutamiento de las líneas de metal avanzado, modelado de energía dinámico, cálculo de los parámetros de EM y verificación del cumplimiento de fabricación, síntesis de árbol de la frecuencia de reloj, optimizaciones de la congestión, etc. Además, algunos de estos paquetes de herramientas también permiten analizar la electromigración a nivel de los transistores, para analizar la fiabilidad de las interconexiones de las primeras capas metálicas y calcular el envejecimiento del dispositivo.

Jaime Herrera

Jaime Herrera

Ingeniero Informático apasionado por el hardware y la tecnología. Llevo más de diez años dedicándome al análisis de componentes como procesadores, tarjetas gráficas y sistemas de almacenamiento. Mi objetivo es ofrecer información clara y precisa, combinando mi experiencia técnica con un enfoque práctico para ayudar a los lectores a entender mejor el mundo del hardware.

>
Guía Hardware
Logo