Risultati: prestazioni OpenCL
Intel ha abilitato OpenCL 1.1 sui processori Ivy Bridge con HD Graphics 4000 e 2500, dando agli sviluppatori un'opzione per sfruttare le execution unità del chip grafico integrato per carichi di lavoro general-purpose. Applicazioni desktop popolari come WinZip e Photoshop offrono miglioramenti prestazionali talvolta sostanziali sulle piattaforme in grado di parallelizzare con più precisione carichi di lavoro che in precedenza sarebbero stati gestiti da un numero inferiore di core. Con Haswell, la compatibilità è stato espansa a OpenCL 1.2.
Il nostro benchmark Photoshop CS6 è più efficace nel mostrare la differenza tra processori che non hanno il supporto OpenCL e quelli che lo hanno. Il Core i7-2700K affronta questo carico di lavoro usando i suoi quattro core con Hyper-Threading, mentre i modelli 3770K e 4770K coinvolgono la loro HD Graphics.
Il Core i7-4770K Haswell è leggermente più veloce del suo predecessore, principalmente per la combinazione di EU aggiuntivi, maggiore banda e IPC più elevato.
Abbiamo effettuato il test WinZip con e senza OpenCL abilitato su tutti i processori, e come potete chiaramente vedere non c'è così tanta differenziazione come c'era in Photoshop. La spiegazione di quanto avviene è abbastanza semplice. WinZip 17 è ben ottimizzato per i thread - decisamente di più della versione 16.5 - quindi i core della CPU sono sotto carico anche senza il supporto OpenCL.
Attivando OpenCL WinZip scarica compressione sulla GPU solo per file più grandi di 8 MB. Quindi, se la nostra cartella da 1.3 GB di file è piena di documenti, presentazioni PowerPoint, PDF e musica, l'accelerazione non aiuta molto.
Osserviamo piccoli miglioramenti prestazionali tra Core i7-4770K e 3770K, mentre il modello 2700K rallenta quando proviamo ad attivare OpenCL. La morale della storia? OpenCL è in grado di registrare benefici sinora solo con operazioni adatte al calcolo eterogeneo. Il benchmark Photoshop rappresenta un estremo dello spettro e il test WinZip l'altro capo.
LuxMark 2.0 quantifica l'incremento prestazionale da HD Graphics 4000 a 4600, ricordandoci allo stesso tempo che il Core i7 2700K, per quanto veloce sia, non aiuta con software OpenCL. Come nota a margine, l'A10-5800K ha registrato 225 mila sample al secondo, meno del Core i7-3770K.
Detto questo, OpenCL porta sempre a una vittoria prestazionale? Non necessariamente. Come abbiamo visto nel modulo GP Processing di Sandra 2013, i calcoli FP32 sono significativamente più rapidi sull'HD Graphics di Intel che sui core x86. Le prestazioni double devono però essere emulate su tutti e tre i processori e il Core i7-2700K mostra migliori risultati in questo caso. Emerge che i potenti core x86 di Intel emulano questi risultati più di quanto Ivy Bridge o Haswell possano fare affidandosi alla GPU.