Tachyum ha realizzato Prodigy T16128, processore pensato per svolgere qualsiasi tipo di carico di lavoro, dal general-purpose computing all'high-performance computing (HPC) e AI. Il chip, costituito da 128 core a 64 bit con una frequenza massima di 5,7GHz, 16 controller di memoria DDR5 (con una capacità massima di 8TB per socket) e 64 linee PCIe 5.0, viene definito dall'azienda come il primo "processore universale" al mondo, in grado di eseguire molteplici applicazioni di calcolo su un singolo dispositivo che necessita di 1/10 della potenza rispetto all'hardware tradizionale a 1/3 del costo.
Tachyum Prodigy T16128 supporta diversi tipi di dati, tra cui FP64, FP32, TF32, BF16, Int8, FP8 e TAI, ed offre prestazioni quattro volte superiori rispetto al più veloce Intel Xeon in commercio e il triplo di quelle di NVIDIA H100 in ambito HPC, il tutto con un'efficienza straordinaria. Questo incredibile risultato è stato possibile grazie alla scelta progettuale di aver costruito Prodigy con capacità di elaborazione matriciale e vettoriale sin dal principio. Ogni core è in grado di eseguire 2 unità vettoriali a 1024 bit, operazioni matriciali a 4096 bit e 4 istruzioni out-of-order per clock. Il chip include anche 128 MB di cache L2+L3 con funzionalità di correzione degli errori.
Tachyum Prodigy T16128 è stato costruito su un non precisato nodo a 5nm in un package FCLGA delle dimensioni di 64x84 mm. Per quanto riguarda la potenza bruta, Tachyum dichiara che il chip è capace di fornire 12 AI PetaFLOP e 90 TeraFLOP in carichi di lavoro HPC (per far un confronto, una singola NVIDIA A100 si ferma a 5 AI PetaFLOP). I file binari eseguibili possono essere stati scritti originariamente per x86, ARM, RISC-V e ISA.
Potrebbe trattarsi di una vera e propria svolta, soprattutto nel campo dei data center, visto che le aziende potrebbero non aver più bisogno di molteplici componenti per svolgere gli stessi compiti, aumentando l'efficienza e riducendo consumi e spazio. Tachyum Prodigy T16128 è il modello di punta della linea, con il T864 (64 core) e il T832 (32 core) che vanno a occupare la lascia media ed entry-level. La produzione inizierà nel 2023, quindi dovremo attendere il prossimo anno prima di vedere dei test completi effettuati da terze parti.