Programmering

IBMs Power5-processor et andet kig værd

Hvis alle ting var lige, og IBM gjorde dets systemer så tilgængelige som Dell og Hewlett-Packard gør deres, kunne IBM Power5-processoren begrave Intels Itanium 2. Først introduceret sidste sommer, er Power5 en en-to-punch, en triumf for ingeniørarbejde fra et firma, der ikke kun udmærker sig inden for processordesign, men også inden for submicron-videnskaben inden for chipproduktion og emballering.

Power5 er selvfølgelig meget hurtig. Men det kan også ses som IBMs første seriøse forsøg på at imødekomme kundernes behov ud over hastighed. Power5 tilbyder forbedret energieffektivitet og fantastisk skalerbarhed, understøtter ikke-IBM-operativsystemer (inklusive Linux og Windows) og leverer partitionering og virtualisering uden sammenligning med den nuværende Intel-teknologi.

Power5 foregriber også en ny generation af 64-bit, PowerPC-baserede arbejdsstationer og servere fra IBMs mangeårige partner i Power, Apple Computer. Og IBM trak for nylig et uventet træk for en virksomhed, der var bygget på patenter, ved at offentliggøre Power-arkitekturen og -værktøjerne under en åben licens.

Der er så mange måder, hvorpå Power5s indflydelse når ud over IBMs primære base for velhælede kunder. Selvom IBM også sælger Itanium 2-, Opteron- og Xeon-servere, synes virksomheden tydeligt at have til hensigt at lægge Power5-systemer i hænderne på Linux- og Windows-administratorer. Om det giver mening vil være op til kunderne, men Power5's blotte tekniske muskler og Itanium-arkitekturens vaklende formuer kræver, at IBMs flagskibsprocessor tager en tur under vores mikroskop.

Magthemmeligheder

IBM har konsekvent tiltrukket de lyseste sind, den slags ingeniører, der fortjener monikeren "computerforsker." I 1980'erne kogte disse forskere en processorarkitektur, der blev bygget til ydeevne: IBM 801, den originale RISC-processor. 801-arven lever videre i IBM Power-serien af ​​processorklasser i virksomhedsklassen.

Den største forskel mellem en RISC-processor og en CISC-processor, såsom Intels x86, kan ses som en trækkamp mellem programmører og chipdesignere. CISC-processorer er designet til at gøre applikationsudvikleres liv lettere ved at reducere almindelige operationer til enkelt, langvarig udførelse af indfødte instruktioner, hvilket giver CISC et ry som et langsomt men venligt design. Sammenlignet med det lys er RISC hurtig og uvenlig. Hver af dens enkle instruktioner tjener et meget snævert formål, udføres hurtigt og paralleliserer usædvanligt godt. RISC kræver tålmodige, begavede programmører og omhyggeligt optimerede kompilatorer; RISCs succes vidner om en overflod af begge dele.

Den mest kendte Power5-attribut er dens integration af to diskrete RISC-kerner på en enkelt chip. Meddelelser fra AMD, Intel og Sun Microsystems om kommende multicore-processorer fokuserede på dette aspekt af Power5, men multicore var også et element i dets forgængere, Power4 og Power4 +. Ifølge IBM er Power5 fuldt kompatibel med Power4-eksekverbare filer. Underet ved multicore er, at det leverer rørdrømmen om mere hastighed på mindre plads uden en markant stigning i varmen. Men som du vil se, er multicore ikke blot SMP på en chip.

For det første deler Power5's kerner en meget hurtig niveau 2-cache. Hastigheden og mængden af ​​cache er en faktor i ydeevnen for alle mikroprocessorer. (Udviklingen af ​​x86 viser, at Intel er fuldstændig cache-besat.) Med enkle instruktioner, der flyver så hurtigt gennem en RISC CPU, bliver cacheens effektivitet til at reducere antallet af ture til RAM nøglen til hele designet.

Power5s niveau 2-cache udgør i alt lidt mindre end 2 MB. Med en delt cache er data hentet af den ene kerne straks tilgængelige for den anden, hvilket øger sandsynligheden for, at hentning af den næste programinstruktion eller datablok ikke kræver en tur til ydeevnedrabende RAM. Men den delte cache gør det også mere sandsynligt, at kernerne vil forsøge at få adgang til cachen på samme tid, hvilket de ikke kan gøre.

IBM implementerede et stopgap med cache-påstand, der splittede niveau 2-cachen i tre segmenter. Dette design tillader kvasi-samtidig adgang til cache, så længe begge kerner rammer forskellige cachesegmenter. IBM har en anden kreativ løsning på problemet med niveau 2-cache-konflikt: en tung 36MB ekstern niveau 3-cache. Hver kerne ejer udelukkende sit niveau 3-cache, så der er ingen mulighed for konflikt mellem kerner. Selvom niveau 3-cache ikke er næsten lige så hurtig som niveau 2, er niveau 3 meget hurtigere end hovedhukommelsen, og Power5s design gør forbindelsen mellem dens kerne og dens tilknyttede niveau 3-cache til et direkte link. Vi betragter IBMs omarbejdning af niveau 3-cache-design som en af ​​de bedste designgevinster i Power5.

En anden betydelig Power5-gevinst er dens hukommelsescontrollere på chip. Hver Power5-kerne har sin egen controller og er i stand til at styre en dedikeret blok af hovedhukommelse. Dette har en enorm indflydelse på den samlede ydeevne, som vi har set i sammenligning af f.eks. Hukommelseskapaciteten i Opteron og Xeon. Og i Power5s tilfælde passer designet til IBMs strategi om parallelisering på flere niveauer.

To er ikke nok

Power5 er ikke kun dual-core; det implementerer Power4s SMT-facilitet (Simultaneous Multi-Threading), som giver hver kerne muligheden for at udføre instruktioner fra to tråde samtidigt under visse betingelser. SMT svarer til Intels HTT (Hyper-Threading Technology), men med tydelige fordele, der gør "visse betingelser" bredere, og som dynamisk optimerer parallelisering ved at analysere og prioritere tråde for at gøre parallel udførelse mere effektiv - meget mere effektiv, tror vi. Selvom det er svært at isolere i test, bør Power5's implementering overgå det maksimale 30 procent boost, som Intel projekterer til HTT.

Power5 tilføjer to grundlæggende, men meget tiltrængte, trådprioriteringsordninger. Dynamic Resource Balancing forsøger at holde instruktionsstrømme flydende ved at analysere tråders opførsel og ved at sidelinjere kode, der kan bremse en SMT-stream. For eksempel kan instruktioner, der skal udføres i rækkefølge for at få et nøjagtigt resultat, låse tråden i processoren i et stykke tid. Power5 forsøger at forudsige dette og køre enklere instruktioner, indtil der er plads til at udføre sekvensen uden at tilstoppe SMT.

I en anden fantastisk designforøgelse giver Power5s justerbare trådprioritet operativsystemer, drivere og applikationer muligheden for at tildele et vilkårligt prioritetsniveau til hver tråd. Denne applikationsdefinerede trådprioritet er medtaget i Dynamic Resource Balancing-beregninger og bruges mere bredt til at bestemme, hvor længe en tråd forbliver aktiv i CPU'en. Det giver også operativsystemer en nem måde at kontrollere strømbesparelse på.

Hvis du har mange tråde med høj prioritet, kører kassen varmt. Men da operativsystemet slår trådprioriteterne ned, kører CPU'en flere tomgangscyklusser og kører derfor køligere. Hvis du slår alle trådprioriteter ned til deres laveste niveau, går CPU'en i en søvnlignende lavt strømtilstand. Det er den enkleste tilgang til strømstyring, vi kan forestille os.

Endelig bruger Power5, hvad det ved om de faciliteter, der er nødvendige for hver RISC-instruktion til i det væsentlige at slukke for dele af chippen, der ikke er nødvendige i det øjeblik. Dette sætter potentielt et nyt spin på Power's berygtede strøm- og varmeproblemer. Det virker bestemt enklere end OS-drevne strømstyringsordninger som dem, der er ansat af x86-processorer.

Du bemærker måske aldrig

Kun på teknologi er Power5 positioneret til at herske. Men utroligt, som det kan synes for de mange Itanium 2-skeptikere, der deler deres meninger med , har flertallet af observatører allerede kaldt Itanium 2 / Power5-konkurrencen til Intels fordel.

Det er en underlig vurdering, fordi IBM i dette tilfælde trækker en Intel på Intel. RISC ejer Unix-markedet, Unix ejer mellemstore til high-end-markedet, og Intel gør ikke RISC. Det er ude i kulden på disse indkøbsordrer på mange millioner dollar. Intel er effektivt låst ude, medmindre det kan overbevise købere om, at Itanium 2 forælder RISC. Vil Intel være i stand til at bryde ind? Vi tror, ​​det vil tage år for Itanium at skubbe RISC til side, og mens det bryder ind, vil Power og Sparc fortsætte med at udvikle sig.

Hvad gør det svært at ringe til, er at IBM vil have Intels marked så meget som Intel ønsker IBM's. IBM sælger Power5-servere for $ 5.000 med Linux forudinstalleret. Gå op igen og scan specifikationerne for at forstå, hvorfor en $ 5.000 Power5-server kan være rart at have rundt.

Analytikere, der ætser gravsten til Power, bemærker, at IBM's chipvirksomhed ikke tjener penge. Men dets systemforretning er, og nu er de to enheder én. Det er et smart træk: Lav chips til systemer, du sælger; bygge systemer omkring de chips, du laver. Det er også smart at frigive design og værktøjer til offentligheden. Enhver åben licenshaver er en potentiel produktionskunde, og intellektuel ejendomsret vil komme ind fra genier, der ikke er på IBMs lønningsliste.

Dette er gode strategier til at hygge sig med adgangsmarkedet. Hvis kun IBM ikke havde at gøre med kunder. Big Blue har aldrig været i stand til at bringe den lave ende af sit katalog det brandpolish og kundetillid, som Dell og HP nyder i spar. Det store arbejde, som IBMs ingeniører har udført, er styret af virksomhedens dårlige markedsføring. Hvis du ikke kører IBM-udstyr nu, ser du efter al sandsynlighed aldrig på en Power5-server uanset pris.

IBM har forsætligt tilsluttet Power5s succes til Linux på indgangsniveauet. Men det er svært at hente merværdi fra software, som offentligheden mener, at den kan downloade gratis, og Linux er et operativsystem, som købere ikke har tendens til at købe ny hardware til at køre. Med andre ord sælger Linux ikke Power5-indgangsservere. På $ 5.000 til $ 6.000 er IBMs billigste Power5-server ikke billig nok sammenlignet med en snavs billig Opteron- eller Xeon EM64T-server (Extended Memory 64 Technology), der kører Linux.

På den anden side sælger stort Unix jern sig selv, og kunderne køber altid mere af det, de allerede bruger. De køber, hvad deres løsningskonsulenter rådgiver. IBM overgår alle andre i sin evne til at fawn over større konti. Du kan ikke lukke en kunde løs fra IBM-hardware i mellemområdet og op. Så den overordnede besked på Power5 vil blive forvansket til pressen og offentligheden generelt, men dragterne i marken omgår IBM's markedsføring. I IBM-til-kunde-forhold kan du ikke slå IBM.

Power5 har næsten alt: hastighed, enkelhed, innovation, problemfri bagudkompatibilitet, et modent udviklingsværktøjssæt og opbakning fra en teknologisk gigant. Det er en uovertruffen teknisk præstation, skabt af hvad der kan være verdens smarteste ingeniører. Hvis IBMs markedsføring nogensinde stemmer overens med intelligens fra dets teknik, skal du passe på Intel.