Lo scorso 25 gennaio quasi 45 GB di file di codice sorgente di Yandex, gigante tecnologico russo, sono stati pubblicati e diffusi in rete attraverso un torrent. I file, presumibilmente rubati da un ex dipendente, mostrano le basi delle numerose applicazioni e servizi di Yandex e i principali fattori di ranking del suo motore di ricerca. L'ingegnere informatico Arseniy Shestakov afferma di aver verificato che alcuni archivi contengono codice sorgente moderno, anche se Yandex ha dichiarato che non c'è stata alcuna violazione e che la fuga di informazioni proviene da un ex dipendente.
I file risalgono al febbraio 2022, quando la Russia ha iniziato un'invasione dell'Ucraina su vasta scala. Un ex dirigente di Yandex ha dichiarato che la fuga di notizie è stata motivata da fattori politici e che l'ex dipendente non ha cercato di vendere il codice ai concorrenti dell'azienda. Sebbene non sia chiaro se la pubblicazione del codice sorgente abbia implicazioni strutturali o di sicurezza, la fuga di 1.922 fattori di ranking nell'algoritmo di ricerca sta certamente attirando l'attenzione.
Il consulente SEO Martin MacDonald ha descritto l'hack su Twitter come "probabilmente la cosa più interessante che sia accaduta in ambito SEO negli ultimi anni". In aggiunta, il ricercatore Alex Buraks sostiene che "ci sono molte informazioni utili anche per il SEO di Google". Yandex valuta le pagine web in base a diversi criteri, tra cui età, traffico organico, codice ottimizzato, affidabilità del server, presenza su Wikipedia e di parole chiave nel URL, tra gli altri.
Circa 1.000 fattori di ranking hanno il tag "TG_DEPRECATED" e più di 200 sono elencati come "TG_UNUSED". Tuttavia, poiché il codice risale a febbraio 2022, è probabile che Yandex abbia cambiato diversi parametri da allora. In precedenza, il codice di Yandex era stato trapelato nel 2015, ma l'ex dipendente che aveva cercato di venderlo è stato condannato a una pena sospesa di due anni di carcere e i file non sono mai stati resi pubblici.