NOTA: Questa risposta è stata scritta 8 anni fa. La programmazione parallela è diventata più rilevante da allora. Questo è probabilmente dovuto ai limiti intrinseci della velocità di clock e ai limiti della dimensione dei transistor che si avvicinano rapidamente.
Il tuo problema principale è il software non scritto per il multi-core.
Guardate l'eccellente articolo di Jeff Atwood su Choosing Dual core or Quad Core .
per la maggior parte del software, si raggiunge un punto di rendimenti decrescenti molto rapidamente dopo due core. In Quad-Core Desktops and Diminishing Returns , ho messo in dubbio quanto efficacemente il software di oggi possa davvero usare anche solo quattro core della CPU, e ancor meno gli inevitabili otto e sedici core della CPU che vedremo tra qualche anno.
Si risponde qui (evidenziazione copiata dall'articolo di Jeff),
Tuttavia, ci sono state alcune sorprese qui, come Excel 2007, e l'impostazione “operazioni concorrenti” di Lost Planet. È possibile che l'ingegneria del software alla fine progredisca fino al punto in cui la velocità di clock conta meno del parallelismo. O alla fine potrebbe essere irrilevante, se non dovessimo scegliere tra velocità di clock più elevate e più core della CPU. Ma nel frattempo, la velocità di clock vince la maggior parte delle volte. Più core della CPU non è automaticamente meglio. Gli utenti tipici staranno meglio con la CPU dual-core più veloce possibile che possono permettersi.
La questione del Front-Side Bus (questo termine mi ha sempre divertito). Con Nehalem le cose cambiano … come diceva ArsTechnica l'anno scorso.
La legge di Moore ha dato ai progettisti di processori l'imbarazzo della ricchezza di transistor, e da nessuna parte è più evidente che nel processore Nehalem di Intel a 45nm. Debuttando nelle varianti a 4 e 8 core nel corso di quest'anno, Nehalem racchiude una tonnellata di hardware in un singolo socket del processore. (I primi numeri mettono il conteggio dei transistor di un Nehalem quad-core a 781 milioni; nessun numero per il modello a 8-core è ancora apparso). Ma cercare di alimentare tutto quell'hardware con l'attuale architettura del bus frontside della piattaforma Intel sarebbe una follia. Così, altrettanto importante, Nehalem suona anche la tanto attesa campana a morto per l'architettura frontside bus di Intel, positivamente geriatrica.
Il cambiamento radicale nella situazione della larghezza di banda del sistema Intel che la nuova QuickPath Interconnect (QPI) rappresenta è forse il più grande fattore singolo che ha plasmato il design di Nehalem. Tra QuickPath e il controller di memoria integrato di Nehalem, un processore Nehalem avrà accesso a una quantità senza precedenti di larghezza di banda aggregata, specialmente nelle implementazioni a due e quattro socket.
AMD ha spostato il controller di memoria nel processore prima e ha usato Hypertransport.