In queste articolo trovate le informazioni relative alle migliori suite di benchmark per misurare le prestazioni dei componenti hardware. La prima delle due sezioni trattate è dedicata ai test che forniscono una sintesi delle prestazioni generali del sistema; la seconda parte tratta i benchmark dedicati in modo esclusivo a valutare le prestazioni della CPU.
Analisi generale del PC
Le prestazioni complessive di una piattaforma desktop o mobile sono il frutto di quelle dei singoli componenti che la compongono e di come questi interagiscono durante l’esecuzione di applicazioni ed elaborazioni. Per definire una scala di valutazione è necessario usare scenari di lavoro ben codificati, ripetibili e basati al tempo stesso su applicazioni reali e di uso comune.
Per i nostri test utilizziamo le suite BAPCo SYSmark25, UL Benchmarks Procyon, BAPCo Crossmark, UL Benchmarks PCMark 10 e SPECworkstation 3 del consorzio SPEC. Ognuna di queste simula scenari di utilizzo differenti. La suite BAPCo SYSmark25 è indirizzata alla produttività di fascia alta, alla creatività e alla finanza. La recente UL Benchmarks Procyon opera in modo simile su tre scenari e modelli di utilizzo tipici della produttività e della creatività a livello professionale. Entrambe queste due suite utilizzano applicazioni reali, installate dalla suite o a parte prima di eseguire i test. La suite BAPCo Crossmark e quella PCMark 10 estendono lo spettro di analisi verso un utilizzo prettamente consumer con test più rapidi e sintetici. La suite SPECworkstation, infine, valuta le prestazioni attraverso una raccolta di test di elaborazione pura e di visualizzazione grafica che sono basati su applicazioni workstation di classe industriale.
BAPCo SYSmark25
SYSmark25 è la versione più recente della complessa suite di benchmark targata BAPCo. Questa raccolta di test riproduce scenari d’uso reali per la produttività aziendale e d’ufficio, per la creazione e gestione di contenuti multimediali e per l’analisi finanziaria.
Il SYSmark25 installa applicazioni reali o parti essenziali di esse – Adobe Acrobat Pro DC, Lightroom Classic CC, Photoshop CC, Premiere Pro CC, Audacity, AutoIt, Corel WinZip 24.0 Enterprise, Google Chrome (v 81.0), Microsoft Excel 2019, Outlook 2019, PowerPoint 2019, Word 2019 – al fine di eseguire i test e misurare le prestazioni del sistema nel suo complesso. Il test prepara la piattaforma con impostazioni standard (profilo energetico del sistema, disattivazione delle connessioni di rete e di alcuni servizi di Windows) per evitare influenze sui risultati finali. Dopo un primo giro di condizionamento per verificare l’assenza di errori durante l’esecuzione viene eseguito il test vero e proprio. Il nuovo SYSmark25 utilizza tre set di applicazioni che riflettono gli scenari Productivity, Creativity e Responsiveness.
Il risultato finale è un indice sintetico di prestazione normalizzato rispetto al valore 1.000 ottenuto con una configurazione di riferimento così composta: processore Intel Core i5 8500T, 8 GB di memoria DDR4 su singolo modulo, GPU integrata Intel HD Graphics 630, disco SSD da 256 GB con interfaccia NVMe e sistema operativo Microsoft Windows 10 Pro (x64 19H2).
UL Benchmarks Procyon
UL Procyon permette di analizzare le prestazioni del sistema completo in quattro scenari d’uso: produttività d’ufficio, elaborazione fotografica, editing e produzione video e infine algoritmi di intelligenza artificiale (AI). Il test di produttività simula l’uso contemporaneo delle applicazioni di Microsoft Office. Il test con Word carica documenti, copia e incolla testo e immagini e inserisce nei documenti grafici immagini, PDF e così via. Il test Excel simula l’uso di fogli di calcolo con importazioni ed esportazioni di dati in formato CSV e PDF, calcolo di formule interne e l’uso di tabelle pivot. Il test PowerPoint inserisce all’interno del documento principale immagini, testo e animazioni prima di eseguire l’esportazione finale in formato PDF e video. Il test Outlook, infine, simula la creazione di mail, la ricerca nell’archivio, il salvataggio di allegati e il backup di elementi presenti nella casella di posta elettronica.
Il benchmark di Photo Editing utilizza Adobe Lightroom Classic e Photoshop con un flusso di lavoro tipo di un fotografo professionista. Il test importa file DNG (Digital Negative) in Lightroom Classic e applica diversi tipi di preset. Le immagini sono quindi aperte in Photoshop per l’applicazione di una serie di livelli di modifica. Il risultato è proporzionale al tempo impiegato per portare a termine l’elaborazione.
Il benchmark Video Editing utilizza Adobe Premiere Pro. Il test importa due progetti con timeline composte da diversi tipi di livelli di regolazione e di effetti, alcuni dei quali accelerati dalla GPU. Ciascun video è esportato in Full HD con codifica H.264 e in 4K UHD con codifica HEVC (H.265). Anche in questo caso il risultato è proporzionale al tempo impiegato per portare a termine le esportazioni.
BAPCo Crossmark
La suite CrossMark di BAPCo permette di misurare le prestazioni di una vasta gamma di piattaforme attraverso test di produttività e creazione di contenuti. Questo benchmark è molto più semplice e rapido del SYSmark25 ma è costruito in modo da fornire risultati con lo stesso peso di quelli elaborati dal suo fratello maggiore che è però limitato ai computer equipaggiati con sistemi operativi Microsoft Windows. Al fine di ottenere risultati validi, il sistema è configurato in modo standard, ma in modo meno invasivo rispetto al SYSmark25. I risultati sono comparabili anche con quelli ottenuti su piattaforme diverse da quella PC.
UL Benchmarks PCMark 10
La suite PCMark 10 offre quattro scenari di analisi e strumenti aggiuntivi per valutare l’autonomia e le prestazioni dei dischi interni o collegati al sistema. I tre profili di analisi principale e quelli che utilizziamo per i test sono definiti come Express, Standard ed Extended; a questi si aggiunge il profilo Applications che richiede l’installazione del pacchetto Microsoft Office per una simulazione più approfondita con questi applicativi. Il profilo Express esegue un benchmark rapido basato su operazioni d’ufficio basilari e piuttosto semplici. Il profilo Standard è focalizzato sul modello dell’ufficio moderno dove agli applicativi di produttività di base si affiancano esigenze ed elaborazioni evolute legate alla creazione di contenuti digitali. Il profilo Extended, infine, copre uno spettro ancora più ampio di necessità superando il confine classico delle attività di ufficio aggiungendo test di grafica 3D.
Gli indici di prestazione forniti dai test sono la media geometrica dei diversi punteggi ottenuti nei test parziali normalizzata rispetto ai diversi sistemi di riferimento utilizzati nei test parziali. La componente Storage della suite permette di valutare le prestazioni dei dischi attraverso quattro tipologie di test: Full system drive, Quick system drive, Data drive e Drive performance consistency. Il primo utilizza un ampio spettro di parametri di analisi per valutare le prestazioni di unità moderne come gli SSD, ma può essere utilizzato anche per valutare HDD classici utilizzati come dischi di sistema. Il test Quick è molto più breve e comporta anche un set di dati inferiore e adatto a valutare dischi di capacità ridotta. Il test Data è specifico per valutare tutte le tipologie di unità dedicati all’archiviazione dati sia interne sia esterne come dischi e chiavette USB. L’ultimo test è dedicato alla verifica della stabilità delle prestazioni nel tempo e può durare dalle 10 alle 20 ore; ne sconsigliamo l’uso – salvo casi specifici e da parte di utenti esperti – perché oltre al tempo necessario per la sua esecuzione può ridurre in modo sensibile la vita dell’unità sotto test.
SPECworkstation 3
La suite SPECworkstation è stata aggiornata di recente dal consorzio SPEC per riflettere il moderno ambiente di lavoro in ambiente professionale e industriale. La suite esegue elaborazioni e simulazioni distinte in diverse categorie: Media and Entertainment, Product Development, Life Sciences, Financial Services, Energy, General Operation e GPU Compute. Il numero e l’elevata complessità dei diversi test richiedono un tempo di analisi molto lungo (abbondantemente sopra l’ora).
L’elenco dei test eseguiti prevede Blender, Handbrake, LuxRender, Maya e 3ds Max per quanto riguarda la categoria Media and Entertainment. Rodina (CFD), WPCcfd, CalculiX, Catia, Creo, NX, Solidworks e Showcase appartengono alla categoria Product Development. Nel segmento Life Sciences troviamo LAMMPS, NAMD, Rodina e Medial. Per la categoria Financial Services sono utilizzati tre algoritmi di simulazione finanziaria quali Monte Carlo, Black-Scholes e Binomial options pricing model.
La categoria Energy è basata su applicazioni oil and gas e sfrutta elaborazioni FFTW, Convolution, SRMP, Kichhoff Migration, Poisson e un viewset del test grafico SPECviewperf 13. Nella categoria General Operation troviamo i test 7zip, Python, Octave e Storage. Completano la suite di test i benchmark LuxRender, Caffe e Folding@ Home per la categoria GPU Compute.
La suite fornisce una collezione di risultati suddivisi per categoria e di risultati specifici che indicano il livello di prestazioni valutato per la CPU, la GPU (con riferimento anche alle librerie OpenCL e Cuda) e il sistema di storage. Questo benchmark è indicato solo all’analisi di configurazioni destinate all’uso workstation sia a livello personale sia aziendale, mentre perde valore quando utilizzato su sistemi desktop di utilizzo consumer. I risultati non sono utilizzabili per ottenere un’indicazione del comportamento del sistema con con un modello d’uso di tipo consumer.
Analisi della CPU
Per valutare le prestazioni del processore di sistema è necessario isolare i carichi di lavoro escludendo l’intervento del processore grafico come acceleratore. Ancora oggi molti algoritmi di rendering e di calcolo si basano unicamente sui core di calcolo del processore e sono in grado di sfruttare la scalabilità delle architetture traendo vantaggio da tutti i core di calcolo presenti.
Maxon Cinebench R23
Il benchmark Cinebench R23, introdotto da Maxon a novembre del 2020 e basato sul motore di rendering dell’applicazione, è aggiornato per supportare sia i processori x86 sia quelli Apple Silicon. Il test esegue il rendering di un’immagine con qualità foto realistica e utilizza funzionalità che mettono a dura prova la potenza di calcolo della CPU: funzioni di riflessione, ambient occlusion, illuminazione e shader procedurali. Il benchmark utilizza al massimo la potenza di calcolo del processore impegnando tutti i core e i thread disponibili. Il test permette di eseguire il rendering della scena anche utilizzando un singolo thread e quindi la potenza di calcolo di un solo core di calcolo. Questo consente di ottenere informazioni utili per valutare l’efficienza e le prestazioni di un singolo core così come dell’architettura di calcolo nel suo complesso.
Corona 1.3
Il benchmark Corona 1.3 utilizza il motore di rendering dell’applicazione Corona Renderer 1.3. Questa è una vecchia versione del software Corona Renderer utilizzata per garantire il confronto con le misure di prestazioni raccolte sino a oggi. Il test genera una scena utilizzando la tecnica ray-tracing e il risultato fornito è un numero medio di raggi al secondo elaborati dal sistema. Il test è semplice e veloce e permette di ottenere un valore facilmente confrontabile con quelli raccolti nel corso degli anni su un vasto campione di processori.
Blender 3.0
Blender è uno strumento di rendering open source molto diffuso nel campo dell’animazione per progetti di piccole dimensioni così come per produzioni cinematografiche. Lo scorso dicembre è stata introdotta la nuova versione 3.0 che integra anche il motore di rendering Cycles X con supporto nativo anche all’accelerazione GPU. Per la misurazione delle prestazioni della CPU utilizziamo i precedenti test BMW_27 e Goosberry; a questo abbiamo affiancato anche il rendering dello splashscreen della versione 3.0. I risultati sono relativi ai secondi impiegati per completare il rendering della scena.
POV-Ray 3.8
POV-Ray è un altro software di rendering in grado di sfruttare tutti i thread di calcolo messi a disposizione dal sistema. Sebbene il suo sviluppo sia rimasto fermo per diverso tempo, il software è tornato al centro dell’attenzione con il rilascio dell’architettura Ryzen di AMD. La versione attuale integra ottimizzazioni per i processori sia AMD sia Intel e grazie al benchmark integrato è uno strumento pratico e veloce per ottenere un indice di prestazioni del processore.
Geekbench 5.4.3
Geekbench permette di valutare le prestazioni di CPU e GPU su sistemi Windows, macOS, Linux, Android e iOS. Il test CPU misura le prestazioni di un singolo core e di tutti i core disponibili con diversi carichi di lavoro che comprendono anche i più recenti algoritmi di calcolo per la realtà aumentata e il machine learning. I risultati sono calibrati rispetto al punteggio base (1.000) ottenuto da un processore Intel Core i3 8100. A risultato superiore corrispondono prestazioni superiori e a risultato doppio corrispondono prestazioni doppie. Geekbench integra anche un test computazionale che sfrutta la GPU presente nella piattaforma e le diverse API supportate. È possibile ottenere un indice di prestazioni sfruttando le API OpenCL, Cuda, Vulkan e Metal.
7-Zip Benchmark
7zip è un software di compressione open source. Il benchmark integrato permette di selezionare il numero di thread da utilizzare per l’elaborazione che comprende sia una fase di compressione sia una di decompressione dell’archivio generato. Il test esegue ad anello queste due fasi così da ottenere una stabilizzazione degli indici di prestazioni. Questi sono forniti sia disgregati sia come risultato combinato. Al pari di POV-Ray, Cinebench R20 e Geekbench, anche il test 7-Zip permette di rilevare in modo rapido e gratuito un indice di prestazione del sistema confrontabile con un ampio set di risultati pubblicati online.
Handbrake 1.4.2
Handbrake è un potente software open source per la conversione di file video in numerosi formati. Sono supportati i codec di codifica e decodifica H.265, H.264, Mpeg-4, Mpeg-2, VP8, VP9 e Theora. Per la nostra prova abbiamo utilizzato il filmato ReelRock 12 (potete acquistarlo dal sito Reel-Rock o attraverso altre piattaforme digitali). Il video sorgente è un Full HD (1920 x 1080) a 30 fps codificato in H.264 e della durata complessiva di 1 ora e 37 minuti e con dimensione complessiva di 3,85 GB. Per il nostro test abbiamo ricodificato l’intero film nei formati Discord 480p a 30 fps e YouTube 720p a 30 fps. Per la ricodifica nel formato Matroska 4K a 60 fps con codec HVEC abbiamo utilizzato solo il primo spezzone di 18 minuti. Come indice di prestazione riportiamo il numero di fotogrammi medio lavorato al secondo durante la transcodifica.
UL Benchmarks 3DMark
La suite 3DMark è progettata per misurare e analizzare le prestazioni in campo grafico di computer desktop e portatili, ma anche di smartphone e tablet grazie al supporto multipiattaforma. Uno degli aggiornamenti di quest’anno ha introdotto un test specifico per misurare le prestazioni del processore attraverso un carico di lavoro che viene scalato su un numero crescente di thread fino a saturare il numero di core. Il test fornisce così risultati relativi a 1, 2, 4, 16 e tutti core. Oltre a ciò raccogliamo la componente CPU relativa ai test Time Spy – disponibile solo con hardware di generazione recente – e Fire Strike nelle diverse varianti.
Borderlands 3
Borderlands 3 è uno dei titoli che utilizziamo per l’analisi delle prestazioni sia del processore sia della scheda grafica. Questo gioco compatibile con le librerie DirectX 12 dispone di un benchmark integrato che genera un log completo relativo ai tempi di generazione dei fotogrammi sia a livello di CPU sia di GPU. Questo permette di svincolare l’analisi delle prestazioni tra i due componenti hardware e valutare le prestazioni singole che concorrono al valore dei fotogrammi al secondo generati dal sistema. Per quanto riguarda i processori eseguiamo i test alle risoluzioni di 1.280 x 720, 2.560 x 1.440 e 3.840 x 2.160 pixel con impostazioni di qualità minime (Very Low); a questi affianchiamo un test a 1.920 x 1.080 pixel con impostazione di qualità massima (Badass).
Strange Brigade
Strange Brigade, al pari di Borderlands 3, è uno dei titoli videoludici che utilizziamo per l’analisi delle prestazioni sia del processore sia della scheda grafica. Questo gioco è compatibile con le librerie DirectX 12 e Vulkan e dispone di un benchmark integrato che genera un log completo relativo ai tempi di generazione dei fotogrammi sia a livello di CPU sia di GPU. Per quanto riguarda i test dei processori eseguiamo i benchmark alle risoluzioni di 1.280 x 720, 2.560 x 1.440 e 3.840 x 2.160 pixel con impostazioni di qualità minime (Low); a questi affianchiamo un test a 1.920 x 1.080 pixel con impostazione di qualità massima (Ultra).