Guía Hardware

Loongson 3A6000: análisis de la arquitectura y benchmarks

Actualizado a: 16 de abril de 2024

Hace un tiempo publicamos un artículo sobre cómo se está moviendo China para no depender de la tecnología de EE.UU., creando sus propias GPUs y también sus propias CPUs. Recientemente también han mostrado que han conseguido módulos DDR5, lo cual es otro pasito más. Sin embargo, en este artículo vamos a centrarnos en una de las CPUs chinas que está dando más que hablar, es el Loongson 3A6000, que analizaremos a fondo y veremos el rendimiento que da comparado con los Intel y AMD.

Especificaciones técnicas del Loongson 3A6000

Lo primero que hay que comentar son las especificaciones técnicas del Loongson 3A6000, y compararlas con el 3A5000, la anterior generación de esta CPU china. Así comprenderemos a qué tipo de microprocesador nos enfrentamos y podremos interpretar mejor los resultados de los bancos de pruebas:


3A50003A6000
Nodo de fabricación14/12 nm SMIC14/12 nm SMIC
Frecuencia de reloj2.5 Ghz2.5 Ghz
Núcleos físicos48
SMT (núcleos lógicos)No (4 threads)Sí (8 threads)
Memoria caché L2256 KB256 KB
Memoria caché L316 MB16 MB
Memoria RAM soportadaDDR4 a 3200DDR4 3200
TDP35W50W
EmpaquetadoFCBGA-1211FCBGA-1190

Como se puede comprobar, pese a que muchos esperaban un salto enorme en muchos aspectos en el esperado Loongson 3A6000, lo cierto es que vemos cómo muchas cosas siguen siendo idénticas a la generación anterior, como la frecuencia de reloj, el tamaño de la memoria caché, el soporte de memoria RAM, o el proceso de fabricación. Sin embargo, la verdad es que hay un cambio significativo, como es el hecho se tener soporte SMT 2-way, lo que permite que cada núcleos físico se pueda desdoblar en dos núcleos lógicos y así procesar hasta 8 threads simultáneamente. Pero este no es el único secreto del incremento del rendimiento…

Arquitectura del Loongson 3A6000

Loongson Technology ha lanzado este año la versión más actualizada de su CPU para PC, es decir, los Loongson 3A6000, un microprocesador de 4 núcleos y 8 threads basado en su propia ISA denominada LoongArch, y una microarquitectura diseñada por ellos mismos para este repertorio de instrucciones.

Con este nuevo lanzamiento, China pretende no depender tanto de la tecnología de Estados Unidos, y quieren competir a los niveles de rendimiento IPC con el Intel Willow Cove y el AMD Zen 3, que puede parecer algo desactualizado, pero ten en cuenta que se trata de rendimientos bastante aceptables para la actualidad, de hecho muchos siguen usando estos procesadores a día de hoy y van bien…

El Loongson 3A6000 está impulsado con núcleos con microarquitectura Dragon para los núcleos denominados LA664, fabricados con proceso de fabricación de 14/12 nm en las fábricas chinas, y con velocidades de reloj que van desde los 2 Ghz hasta los 2.5 Ghz de tope, así como un TDP de 50W, lo que tampoco está nada mal.

Esto ha dado paso a que varios fabricantes de hardware con intereses en el mercado chino estén anunciando placas base y equipos basados en estos Loongson 3A6000. Además, para alimentar las noticias sobre esta CPU, ASUS China, el grupo Uncle Tony, ha realizado un overclocking a esta CPU llegando a 2.63 Ghz con una refrigeración por aire activa convencional, y en pruebas realizadas con nitrógeno líquido pudieron llegar a los 3 Ghz, aunque aseguran que aún hay margen para seguir subiendo la frecuencia de reloj.

Hay que decir que la ISA LoongArch ha sido diseñada por la propia Loongson Technology, y no es Arm, ni x86, sino que han creado su propia versión desde 2020, mejorando año a año con nuevas instrucciones, y con un total actual de unas 2000 instrucciones funcionando en el repertorio. No obstante, parece que esta ISA podría estar inspirada en MIPS64, que era la que Loongson usaba previamente.

La ISA LoongArch cuenta con unas instrucciones básicas que son obligatorias en todas las implementaciones o microarquitecturas, ya que así pueden ejecutar todo tipo de software. Sin embargo, también tienen varias extensiones opcionales, que sirven para poder mejorar el rendimiento con ciertas cargas de trabajo. Por ejemplo, nos encontramos con la extensión LBT (Loongson Binary Translation) para traducción binaria, la LVZ (Loongson VirtualiZation), la LSX (Loongson SIMD eXtension) que es un tipo de extensión vectorial, y la ASX (Advanced SIMD eXtension), otra extensión más de tipo SIMD para mejorar el rendimiento en ciertas tareas donde se necesita cálculo más intensivo.

Con esta ISA, no solo pretenden conseguir una CPU totalmente independiente de las tecnologías de Estados Unidos, también quieren competir con los mejores en el sector y estar disponibles para un gran número de software. No obstante, ésto último es algo más difícil, ya que los desarrolladores no están muy por la labor de compilar para esta arquitectura minoritaria, ya que está centrada en el mercado chino. Por tanto, se tienen que valer fundamentalmente de paquetes de código abierto que puedan compilar ellos mismos, de sistemas Linux, o de algún software chino de código cerrado creado expresamente. Esto sería un gran problema, pero lo cierto es que lo han solucionado. ¿Cómo? Pues bien, lo que han agregado es un traductor binario para que sea compatible con x86, de tal modo que incluso Windows y el software conocido compilado para esta arquitectura puede ejecutarse en estos sistemas. Otra cosa diferente es encontrar drivers para todos los elementos auxiliares…

Y no te lo pierdas, ya que los procesadores Loongson 3A6000, como los 3A5000, pueden ser compatibles también con software compilado para Arm, por lo que tienen una gran ventaja en cuanto a compatibilidad de binarios. Esto se hace también a través de un motor de traducción y extensiones de la ISA como en el caso de x86. Por tanto, tenemos que los Loongson 3A6000 son compatibles con los binarios compilados para LoongArch, los binarios compilados para x86 y los binarios compilados para Arm.

Por otro lado, la ISA de Loongson también está pensada para las cargas de trabajo del mundo actual, al ser bastante reciente frente a otras que son ya parte de la prehistoria, como x86, Arm y otras muchas. En este sentido se parece a RISC-V, mucho más fresca, y pese a heredar algunas reminiscencias de MIPS64, los chinos han modernizado su repertorio de instrucciones para mejorar en cargas actuales, mejorar la eficiencia energética, la virtualización, etc.

Es decir, tenemos que LoongArch es una evolución de LoongISA usada anteriormente en los 3A2000 de 2015, y que no era más que un superset de MIPS64 Release 2. A esta ISA actualmente de código abierto y tipo RISC, se le agregó extensiones como las 148 instrucciones LongEXT para propóstio general, 5 instrucciones LoongVZ para virtualización, 213 instrucciones LongBT para traducción binaria de x86 y ARM, 1014 instrucciones de LoongSIMD o LoongMMI de tipo SIMD de 128-bit, y las MSA (MIPS SIMD Architecture), DSP, y VZ de la MIPS64 Release 5.

Las microarquitecturas surgidas de esta ISA fueron vistas en los núcleos GS464E, que tenían una penalización del 5% del total del área del chip al tener que agregar ese motor de traducción de instrucciones x86. Pero la penalización en rendimiento era del 30%, y sin estas extensiones de traducción podría haber sido mucho más. Ten en cuenta que los núcleos para ejecutar software x86 no están trabajando con instrucciones nativas, sino que tienen que tomar las instrucciones x86 del binario y traducirlas al vuelo a las LoongISA…

Aprendidas estas lecciones, Loongson se puso manos a la obra para lanzar LoongArch en 2021, unos 6 años más tarde. Esta nueva ISA de la que he comentado aparecería por primera vez en el predecesor del Loongson 3A6000, es decir, el 3A5000. En este caso se incluye un set reducido de 32-bit LA32R, otro set estándar de 32-bit LA32S, pero sigue siendo una variante o fork de la MIPS64r6. Sin embargo, los chinos también se han fijado en lo mejor de RISC-V para nutrir esta LoongArch, por lo que tenemos un híbrido MIPS/RISC-V interesante…

Benchmarks: resultados del rendimiento del Loongson 3A6000

Como podemos ver en los resultados obtenidos en los benchmarks en los que se ha probado la nueva CPU Loongson 3A6000, vemos cómo con la frecuencia de reloj estándar a la que viene esta CPU, el procesador chino tiene un rendimiento similar al de un Intel Core i3-10100, es decir, un Intel Core i3 de 10ª Generación. Sin embargo, hay que decir que este Core i3 basado en la microarquitectura Comet Lake tiene una frecuencia superior, de 3.6 Ghz, así como un TDP superior de 65W. Por tanto, esto es un punto a favor del 3A6000 chino, que ofrece un rendimiento casi idéntico (-3%) con menor consumo y una menor frecuencia de reloj. En lo que sí están igualados es en núcleos y threads, por tanto, en ese aspecto es una batalla justa en esta prueba UnixBench.

Las pruebas realizadas en SPEC CPU 2006, con la frecuencia de reloj nominal, sin acelerar, también nos llevamos una sorpresa, ya que consigue un rendimiento casi igual al Intel Core i5-14600K, que es la última generación de Intel. Esto es algo más que destacable…

Pero… aquí llega otra grata sorpresa, y es que SPEC CPU 2006 solo está disponible de forma nativa para las arquitecturas ARM, Power ISA, RISC-V, SPARC y x86, y no para MIPS o para la propia LoongArch. Esto quiere decir que en estos aspectos se está usando binarios probablemente de x86, con la traducción, que implica una penalización de rendimiento considerable. Por tanto, en igualdad de condiciones con binarios nativos probablemente el Loongson 3A6000 estaría más a la par de los actuales procesadores de AMD e Intel.

¿Quién hay tras Loongson Technology?

Los procesadores comenzaron llamándose Godson, y se basaban en la ISA MIPS de 32-bit en un inicio, y destinados para pequeños ordenadores o dispositivos que necesitaban una CPU, dentro del mercado chino. Estos procesadores estaban desarrollados inicialmente por el Institute of Computing Technology (ICT) y el Chinese Academy of Sciences (CAS), y el arquitecto jefe fue Hu Weiwu.

CAS es la academia nacional de ciencias naturales y el principal órgano de asesoramiento para la ciencia y la tecnología de la República Popular China, algo así como el CSIC en España. Esta organización de investigación más grande del mundo, con 100 institutos de investigación (entre los que se encuentra también el ICT), 3 universidades, casi 70.000 empleados a tiempo completo y 79 mil estudiantes de posgrado.

El desarrollo de los Loongson se iniciaría en 2001, cuando se decidió crear una CPU de alto rendimiento y propósito general fabricada en China. Para ello se inyectó dinero para varios años de desarrollo, y con la idea de fabricar una CPU 100% china para 2025. Sin embargo, se han adelantado, ya que el Loogson 3A6000 ya está fabricado en China, al igual que su antecesor.

En 2010 se estableció una compañía separada como entidad para la comercialización de productos denominada Loongson Technology Corporation Limited, fundada por el pripio Hu Weiwu, el que también se transformaría en su CEO. Algo parecido a la iniciativa de la UE para crear un procesador europeo, donde intervienen multitud de entidades de diferentes países, pero se ha creado una compañía llamada SIPearl con base en Francia para la comercialización.

Pues bien, esta compañía con base en Zhongguancun, Beijing (China), se consolidó con capital público y privado, con la colaboración de la citada ICT y también con el diseñador de chips BLX IC Design Corporation, que es una spin-off de ICT fundada en 2002 como parte del Jiangsu Zhongyi Group.

Como Loongson era una fabless, y las demás instituciones implicadas también lo eran, tuvieron que buscarse un socio, una foundry que les fabricase los chips. Y para ello firmaron un acuerdo con la europea STMicroelectronics, ya que ésta tenía nodos de fabricación más avanzados que otras foundries chinas en aquel momento. Sin embargo, pronto cambiarían a SMIC cuando ésta superó a la europea.

Más información en la web oficial

¿Quién fabrica los Loongson?

Como he comentado anteriormente, los chips Loongson se fabricaban en STMicroelectronics, sin embargo, la foundry europea se ha estancado en los 22nm con transistores MOSFET y sustratos FD-SOI con wafers de 300 mm. Mientras que SMIC ha seguido más allá pese a las restricciones impuestas por el gobierno de Estados Unidos a China, para frear su desarrollo armamentístico, tecnológico y por motivos geopolíticos. De hecho, las foundries chinas tienen prohibido el acceso a equipos de fotolitografía de vanguardia como los europeos ASML, que son los líderes actuales, y también a equipos Tokyo Electron, Canon y Nikon japoneses, que son los competidores directos de ASML.

Pese a estas restricciones, que pretendían bloquear a SMIC en los 28 nm, lo cierto es que los chinos han sabido sortear los problemas y SMIC (Semiconductor Manufacturing International Corp) ha pido alcanzar capacidades de fabricación de hasta 7nm, y probablemente tengan nodos preparados para 5nm también. Pese a esto, Loongson 3A6000 se fabrica en 14/12 nm, como he comentado antes, que es un nodo mucho más maduro de SMIC. Sin embargo, SMIC se ha puesto las pilas por Huawei, ya que su filial HiSilicon, que diseña los chips Kirin para estos dispositivos, tras las sanciones de EEUU, han tenido que tirar de factorías nacionales.

El gobierno de Xi Jinping, invirtió unos 41.000 millones de dólares para lanzar la tecnología de SMIC, dando pasos importantes junto con Hua Hong Semiconductor y SMES (Semiconductor Manufacturing Electronics Shaoxing), etc. Así han podido sortear los bloqueos para la fabricación de chips avanzados. Aunque no estén al mismo nivel que Samsung y TSMC, la verdad es que le pisan los talones a Intel pese a todos estos impedimentos, lo que debería ser una preocupación para EEUU.

¿A qué equipos van destinados?

Para los que se pregunten en qué ordenadores se montan los Loongson, hay que decir que los serie 1A, 2A y 3A son los destinados a PCs, tanto sobremesas como portátiles. Mientras que los 1C, 2C y 3C son los que van destinados a servidores y HPC. También existen los B Series, que se han usado en generaciones anteriores tanto para PC como para servidores. Esa es la nomenclatura que siguen estos procesadores chinos.

Pues bien, los Godson-1, los primeros chips chinos basados en MIPS se usaron para electrónica de consumo, como PDAs, reproductores multimedia portátiles, etc. Estos chips se lanzaron entre 2001 y 2002, y eran de 32-bit, fabricados con tecnología CMOS de 0.18 micras y con frecuencias de 266 Mhz. Tenían un solo núcleo y con núcleos GS132 y GS232. También hubo derivados del GS232 denominados Loongson X, y que eran versiones RD, o chips endurecidos contra la radiación para usarlos en aplicaciones aeroespaciales o militares chinas.

Con la llegada de Godson-2, conocido más tarde como Loongson 2, y basados en MIPS de 64-bit, se usaron núcleos como los GS464, lanzados en CPUs y SoCs entre 2006 y 2009, con distintas versiones como las 2E (CPU), 2F (con northbridge integrado), 2G con bus HyperTransport integrando también el chipset y GPU, y los 2H, que eran SoCs más comletos. Estos procesadores sí que fueron usados en más dispositivos que los Godson-1, incluido algunos ordenadores baratos.

Después llegarían los Godson-3/Loogson 3, que comenzarían con la ISA Loongisa que era una extensión de la MIPS64, coom dijimos anteriormente, y con traducción para binarios x86, así como diseños multinúcleo para ser usados en ordenadores, servidores y sistemas HPC, como los clusters de alto rendimiento. Dentro de estos tenemos:

  • 1000 Series: siendo el primer procesador el Loongson 3A1000 Series usando cuatro núcleos GS464 para PC, después apareció el 3B1000 Series con 8 núcleos, mejoras de rendimiento y capacidad vectorial para alto rendimiento, y el 3C1000 para servidores y HPC con 16 núcleos. No obstante, el 3C fue suspendido en 2013 para centrarse en el diseño de las 2000 Series.
  • 1500 y 2000 Series: en 2015 llegarían las series 3A1500 y 3B2000 con núcleos GS464E mejorados. La microarquitectura podía mejorar sus prestaciones, siendo hasta 3 veces más rápidos que la generación anterior, y seguían basándos en la ISA LoongISA con nuevas extensiones. Mientras que el 3A1500 estaba destinado para embebidos, o aparatos de bajo consumo, los 3B2000 eran para servidores y PCs.
  • 3000 Series: en 2017 se lanzaron esta tercera generación y el objetivo era igualar a un Intel Atom J1900, usados en equipos baratos y de bajo rendimiento. El 3A3000 sería empleado para el satélite chino Beidou, para el sistema de geolocalización chino como alternativa al GPS americano.
  • 4000 Series: llegaron a finales de 2019, con una versión 3A4000 y 3B4000, el primero para bajo consumo y el segudo para ordenadores. Ambos basados en núcleos GS464EV con nueva microarquitectura mejorada.
  • 5000 Series: esta serie marcaría un antes y un después, ya que pasaban de usar MIPS puro y LongISA, a un repertorio propio LoongArch como comenté anteriormente. Los núcleos GS464V (más tarde conocidos com LA464) fabricados con nodos de 12 nm eran los encargados de dar vida a a los 3A5000 para PC con cuatro núcleos y 3C500L con 16 núcleos para servidores, que básicamente era un chiplet con cuatro 3A5000 en un mismo empaquetado. Aquí fue donde de verdad la marca china comenzó a hacerse eco en occidente, con medios como The Register o Phoronix probando estos procesadores y reportando resultados significativos, comparables a los Intel Core i3-8109U, los Core i5-750 o el Phytium FT-2000 basado en ARMv8. Además, en 2023, dos años más tarde del lanzamiento de esta serie, llegaría el 3D5000, un procesador especialmente diseñado para centros de datos y computación en la nube.
  • 6000 Series: en 2022 se anunciarían estos otros, pero no llegarían hasta mediados de este año al mercado. Ahora que ya conocemos a los Loongson 3A6000, basados en núcleos LA664, podemos decir que se cumplen los pronósticos de rendimiento single-core, comparándose con Intel Tiger Lake y AMD Zen 3.

Veremos qué nos depara la 7000 Series, pero la cosa promete. Además, hay que decir que los procesadores Loongson se han hecho bastante populares en el mercado chino frente a otras alternativas existentes. En 2021, los principales ordenadores usados por administraciones chinas y el gobierno usaban estos procesadores, representando un 80% de la cuota de mercado.

Desde 2006, empresas como Lemote, comenzaría a vender ordenadores llamados Longmeng (Dragon Dream) basados en Loongson a precios en yuanes equivalentes a unos 100€. Para el que no conozca esta compañía, decir que se trata de una empresa de informática propiedad del Grupo Jiangsu Menglan y el Instituto Chino de Tecnología Informática, y dedicada a crear tanto hardware como software.

Ese mismo año, una empresa llamada YellowSheepRiver también anunciaría un ordenador SFF o de pequeño factor de forma, basado en un chip Loongson. Este mini equipo se llamó Municator YSR-639.

En 2008, Lemote también lanzaría un portátil denominado Yeelong, que significa Portable Dragon en chino, y que usaba Debian GNU/Linux como sistema operativo. Y este mismo año, en Europa, una compañía holandesa llamada Tekmote Electronics también distribuiría este sistema por el viejo continente.

En 2010 ya se habían vendido muchos dispositivos y equipos informáticos con esta CPU. Y ese mismo año, Jiangsu, otra compañía china, tenía planeado comprar 1.5 millones de PCs basados en Loongson. Y así, poco a poco fueron haciéndose más populares entre las administraciones chinas y los equpos del gobierno, al no fiarse de CPUs extranejaras. También la población china fue adoptándolo cada vez más…

Sin embargo, hasta ahora hemos tratado casos de dispositivos embebidos y también de PCs, pero los Loongson también llegan a los servidores y supercomputadores como he comentado anteriormente. Por ejemplo, en 2007, China revelaría que tenía un supercomputador basado en Loongson en Hefei. Fue el primero con estos procesadores, y se denominó KD-50-I. Esta máquina podía conseguir un pico de rendimiento de 1 TFLOPS, o unos 350 GFLOPS medido con LINPACK, una cifra que puede parecer ridícula, pero que para esa fecha estaba bastante bien, teniendo en cuenta que no contaban con tecnología de Intel, AMD o IBM.

El equipo fue diseñado por Chen Guoliang, del departamento de tecnología de computación de la USCT (University of Science and Technology of China) y el ICT. Y así se transformaría en la primera supercomputadora hecha de microprocesadores chinos, con más de 336 Loongson-2F en nodos interconectados por una red Ethernet y con un coste que supuso unos 80.000€, bastante barato para un sistema HPC.

Como sabrás, en la actualidad, existen más supercomputadoras basadas en CPUs chinas, incluso algunas han entrado en la lista Top500. Es el caso de las máquinas de Sunway. De hecho, esta compañía tuvo un sistema MPP basado en Loongson llamado Sunway BLuelight, y también el supercomputador Dawning 6000 usó Loongson… Hay que decir que los Dawning son de la compañía Sugon, que oficialmente se llama Dawning Information Industry Company Limited, un fabricante de supercomputadoras que compite con gigantes chinos como Lenovo, y también con otros americanos como HPE, IBM, etc. Sugon fue otra de las empresas nacidas a partir de CAS. Como ves, «todo queda en familia»…

¿Se pueden comprar en Europa?

Para finalizar, debes saber que este chip estará disponible solo para el mercado chino. Por tanto, es poco probable encontrar un Loongson 3A6000 en Europa. Y si puedes cazar alguno desde España sería a través de vendedores chinos que lo envíen. De hecho, pocos medios occidentales han tenido acceso a estas CPUs para probar y realizar reviews.

En cuanto a la disponibilidad, estarían ya listos para usar, de hecho, si te asomas por sitios como Aliexpress encontrarás algunas placas base con este chip soldado, ya que es de tipo BGA y no se vende por separado. El precio de estas placas base es de unos 100€ en adelante, lo cual no es nada caro…

Jaime Herrera

Jaime Herrera

Ingeniero Informático apasionado por el hardware y la tecnología. Llevo más de diez años dedicándome al análisis de componentes como procesadores, tarjetas gráficas y sistemas de almacenamiento. Mi objetivo es ofrecer información clara y precisa, combinando mi experiencia técnica con un enfoque práctico para ayudar a los lectores a entender mejor el mundo del hardware.

>
Guía Hardware
Logo