tech

El chip de IA que China construyó para no necesitar a NVIDIA: Huawei Ascend 950PR ya tiene pedidos de ByteDance y Alibaba

tech · 7 min de lectura

El chip de IA que China construyó para no necesitar a NVIDIA: Huawei Ascend 950PR ya tiene pedidos de ByteDance y Alibaba

ByteDance y Alibaba van por 750,000 unidades del Huawei Ascend 950PR en 2026. A $6,900 dólares por tarjeta y con soporte para migrar código CUDA, China acaba de cambiar las reglas del cómputo de IA.

El chip de IA que China construyó para no necesitar a NVIDIA: Huawei Ascend 950PR ya tiene pedidos de ByteDance y Alibaba

Cuando Reuters reportó la semana pasada que ByteDance y Alibaba están lanzando pedidos masivos del nuevo chip de IA de Huawei, el mundo tech tardó como cinco minutos en enterarse y diez años en procesar lo que significa. Porque no estamos hablando de una empresa china haciendo un clon barato del H100. Estamos hablando de que China acaba de construir su propia infraestructura de cómputo de IA, de punta a punta, y el mercado le está respondiendo con billones de dólares en órdenes.

El Ascend 950PR no es el futuro. Es el presente. Y ya está cambiando todo.

Qué es el Ascend 950PR y por qué importa

Huawei presentó el Ascend 950PR en marzo de 2026 junto con su sistema Atlas 350, una caja con 8 tarjetas de este chip lista para inferencia de IA a escala. No es un chip para entrenar modelos como hace el H100: está diseñado específicamente para correr modelos ya entrenados, o sea, la parte que más escala necesita en producción.

Los números son serios:

SpecAscend 950PRNVIDIA H20
Cómputo FP41.56 PFLOPS~0.54 PFLOPS
Memoria HBM112 GB96 GB
Bandwidth de memoria1.4 TB/s4.0 TB/s
Interconexión2.0 TB/s~0.9 TB/s
Consumo~600W~400W

El sistema Atlas 350 completo (8 tarjetas) presume 2.8x el desempeño del H20 de NVIDIA en FP4. En velocidad de generación multimodal, hablan de un 60% más rápido que el H20. Y el precio por tarjeta es de unos $6,900 dólares en la versión estándar. Para comparar: una H100 SXM5 ronda los $25,000 a $40,000 dólares en mercado secundario.

Sí, es cuatro a seis veces más barata.

El pedo del software: cuando CUDA era la muralla

El problema de todos los chips “alternativos” a NVIDIA siempre ha sido el mismo: CUDA. El ecosistema de software de NVIDIA lleva 20 años acumulando librerías, frameworks y herramientas. Migrar millones de líneas de código de CUDA a otro paradigma era un proyecto de meses o años, lo que hacía que aunque el hardware fuera bueno, nadie quisiera moverse.

Huawei lo entendió y respondió con CANN Next, su nuevo stack de software que introduce un modelo de programación SIMT (Single Instruction Multiple Thread) que imita directamente las abstracciones de CUDA: thread blocks, warps, kernel launches. La propuesta de CANN Next es reducir el tiempo de migración de meses a semanas.

No es compatibilidad binaria total, así que no esperes meter tus binarios de CUDA y que corran mágicamente. Pero sí significa que un dev familiarizado con CUDA puede aprender el ecosistema Ascend sin empezar desde cero. Eso, combinado con el precio, es lo que convenció a ByteDance y Alibaba.

ByteDance, Alibaba y $5,600 millones de razones

Reuters confirmó el 27 de marzo que tanto ByteDance como Alibaba están planeando colocar pedidos del Ascend 950PR. La cifra que circula para ByteDance sola es de más de $5,600 millones de dólares en compras de hardware Ascend para 2026. Huawei tiene como objetivo producir 750,000 unidades del 950PR este año.

Para poner en contexto qué tan grande es eso: Huawei planea vender más chips de IA este año de lo que muchos gobiernos latinoamericanos tienen capacidad de procesar en toda su infraestructura pública combinada.

Las razones de estas empresas para apostar al Ascend son una mezcla de precio y geopolítica. Las sanciones de EE.UU. han cortado el acceso a las GPUs más avanzadas de NVIDIA para compañías chinas. En este contexto, ya hablamos de cómo DeepSeek V4 demostró que China puede entrenar modelos de 1 trillón de parámetros sin chips de NVIDIA: la historia se repite pero ahora con hardware propio para inferencia masiva.

Qué tan bueno es realmente vs NVIDIA

La neta: en entrenamiento de grandes modelos, el Ascend 950PR no compite contra el H100 SXM5 (que tiene ~1,979 TFLOPS en FP8 vs los ~1,000 TFLOPS del 950PR). El flagship de NVIDIA sigue siendo rey para entrenar desde cero.

Pero para inferencia, la historia cambia. Los datos de TrendForce y las pruebas internas de ByteDance apuntan a que el 950PR supera cómodamente al H20, que es el chip que NVIDIA puede vender en China bajo las restricciones actuales. Y el H20 es exactamente lo que estas empresas estarían usando de no existir el 950PR.

El chip también usa HBM propio de Huawei (HiBL 1.0), fabricado con tecnología doméstica, en un proceso SMIC N+3 de clase 5nm usando litografía DUV. No es TSMC 3nm, pero demuestra que China puede fabricar chips de IA competitivos sin depender de equipos EUV de ASML. Ya hemos visto cómo NVIDIA sigue apostando fuerte con chips como Vera Rubin en GTC 2026, pero la ventaja ya no es inalcanzable.

El roadmap que nadie debería ignorar

Lo que hace más interesante al Ascend 950PR no es lo que es hoy, sino lo que viene después:

  • Ascend 950DT (Q4 2026): para entrenamiento, con HiBL 2.0, 144 GB y 4 TB/s de bandwidth
  • Ascend 960 (2027): diseño chiplet, performance clase Blackwell
  • Ascend 970 (2028): apunta a rivalizar con la generación Rubin+ de NVIDIA
  • Atlas 950 SuperCluster: ya anunciado, con más de 520,000 chips y 524 EFLOPS de cómputo, 2.5x más grande que el Colossus de xAI

Huawei no está improvisando. Tiene una hoja de ruta de tres años que converge exactamente en el punto donde NVIDIA tiene sus chips más avanzados bloqueados por sanciones.

¿Y para LATAM?

Aquí viene el balde de agua fría para los que estaban emocionados: por ahora, el Ascend 950PR está enfocado 100% en el mercado chino y algunos mercados asiáticos como Corea del Sur. No hay anuncios de data centers en América Latina usando este chip.

Huawei Cloud sí tiene presencia fuerte en LATAM, con más de 2,100 partners locales y operaciones desde Brasil. Pero el 950PR para infraestructura regional es, por el momento, speculación. Lo que sí tiene implicaciones directas para México y LATAM es el cambio de poder que esto genera: si China puede construir su propia infraestructura de IA sin depender de EE.UU., el mapa de proveedores de servicios cloud de IA se diversifica, y eso eventualmente llega aquí.

Lo que sí nos toca directo ahora mismo es el precio que la demanda china está generando en todo el ecosistema de silicio global, como ya explicamos en RAMaggedon: la IA se está comiendo toda la RAM del mundo y tú vas a pagar la cuenta. Si 750,000 chips de IA salen de producción este año para China, eso tiene efectos en cadenas de suministro que llegan hasta los componentes de tu siguiente PC o servidor.

El chip que sí pasó el examen del mercado

La pregunta que rondaba al Ascend durante años era si alguien más allá del gobierno chino lo iba a comprar de verdad. Con ByteDance y Alibaba en la fila, la respuesta ya es clara.

No es que NVIDIA deba estar temblando hoy. Pero sí debe estar prestando atención mañana. Porque un chip que cuesta $6,900 dólares, es la raja en inferencia versus el único chip que te pueden vender bajo sanciones, y viene con un ecosistema de software cada vez más fácil de adoptar, es exactamente el tipo de propuesta que cambia industrias lentamente… hasta que lo hace de golpe.

¿Crees que Huawei puede realmente armarle competencia seria a NVIDIA en los próximos tres años, o las limitaciones de manufactura con DUV van a ser techo? Comenta, porque este tema va a dar mucho de qué hablar.

Fuentes

Comentarios

No te pierdas ningún post

Recibe lo nuevo de Al Chile Tech directo en tu correo. Sin spam.

También te puede interesar