V článku sa budem zaoberať výlučne procesormi určenými pre osobné počítače, architektúre x86, známej skôr ako platforma IBM-PC. Ostatné architektúry a platformy spomeniem len okrajovo. (bolo by to na dlhý samostatný článok) Mimo tejto dnes najpoužívanejšej, existujú ešte desiatky či už viac, alebo menej známych architektúr či typov mikroprocesorov, ktoré sa používajú na špecifické účely, napríklad v serveroch, výkonných pracovných staniciach, laboratóriách, rôznych prehrávačoch, moderných veľkoplošných obrazovkách a televíziách satelitných dekodéroch a podobne. Uvediem časti z ktorých sa skladá moderný procesor, na čo tieto časti slúžia, ako sa procesory delia, a postup pri výrobe procesora. Opakujem, je to len obšírnejší pohľad na tematiku procesorov, tak nech tu skúsenejší nehľadajú nejaké nove informécie.
IBM kompatibilný PC
Zloženie moderných procesorov
Dnešné moderné procesory sú veľmi zložité a komplexné elektronické súčiastky, ktoré však majú veľa spoločných znakov a vychádzajú z jediného historického návrhu procesoru – Intel 8086. Z tohto procesoru sú odvodené s istými modifikáciami všetky dnešné procesory architektúry x86 (procesory pre všetky stolné počítače) a aj keď to nie je najlepší návrh procesoru a existujú mnohé lepšie a oveľa výkonnejšie architektúry, dôvodom prečo je táto konštrukcia zachovaná je kompatibilita. Na terajších procesoroch je totiž možné spustiť všetky aplikácie určené pre x86 architektúru. Ak to nejde, tak len kvôli operačnému systému. Prejdime k jednotlivým častiam procesora.
Intel 8086
a, Jadro
Jadro – (core) interpretuje a vykonáva inštrukcie obsiahnuté v softvéri a vykonáva výpočty. Je zložený z ALU a RJ.
Schéma procesora.
• ALU
ALU – Aritmetic logic unit, je centrálna časť procesora ktorá vykonáva základné a logické operácie s celými číslami ako napríklad sčítanie, odčítanie, násobenie, delenie, logický posun, negáciu a ďalšie.
• RJ
RJ – Riadiaca jednotka, je to časť CPU, ktorá ovláda všetky operácie a činnosť procesora. Riadi aj komunikáciu CPU s jeho okolím (RAM, chipset atď.) a zabezpečuje rozdeľovanie úloh celému CPU.
• FPU
PFU – Floating-point unit, je časť procesora, ktorá vykonáva operácie s pohyblivou desatinnou čiarkou. Procesor bez FPU prakticky nevie spracovávať čísla s pohyblivou desatinnou čiarkou (iné ako celé čísla). Dá sa to emulovať a počítať aj pomocou ALU, ale je to zbytocne niekoľko sto krát pomalšie, a vyťažuje to CPU. Bez FPU by sme si nezahrali žiadnu 3D hru ;)
• Ďalšie časti
Jadro cpu má v závislosti od generácie, určenia a typu ešte ďalšie časti, ktoré sú špecifické pre danú rodinu CPU a nemusia byť prítomné v ostatných CPU.
b, Cache
Cache – nazývaná aj ako vyrovnávacia pamäť, je dočasná veľmi rýchla aj keď malá pamäť procesora, ktorá zabezpečuje neprerušený prísun dát na spracovanie CPU a slúži tiež ako odkladací priestor medzi jednotlivými operáciami CPU. Je tvorená veľmi rýchlym typom pamätí – SRAM, ktorý je ale náročný na výrobu a aj na počet tranzistorov procesora. Pre 1 bit informácie sa použije až šesť tranzistorov. Hlavným dôvodom existencie tejto pamäte je jej rýchlosť, keďže RAM počítača je pre potreby CPU priveľmi pomalá. Cache vyrovnáva časové rozdiely medzi spracovaním dát CPU a ich uložením či načítaním v RAM. Cache sa v moderných procesoroch skladá zo štyroch úrovní – levelov.
• L1 Cache
L1 (level 1)je najrýchlejšia a najmenšia časť cache. Tá sa ďalej delí na inštrukčnú a dátovú cache väčšinou v pomere 1:1 (napríklad 32 kB dátová časť a 32 kB inštrukčná časť). Od jej veľkosti veľmi závisí výkon CPU, pričom čím je väčšia, tým lepšie. Štandardne sa vyrábajú procesory s 32 kB až 128 kB L1 cache na jadro. Každé jadro procesora má vždy svoju vlastnú L1 cache. Je teda nezdieľaná.
• L2 Cache
L2 (level 2) je o niečo pomalšia ako L1, stále je ale veľmi rýchla. Táto úroveň cache sa už nedelí na dátovú a inštrukčnú, celá je dátová. Veľkosť tejto cache už nie je až tak kriticky dôležitá, ako L1, stále ale platí čím viac, tým lepšie. Typicky má veľkosť 256 kB až 3 MB na jadro. Väčšinou je nezdieľaná, ale existujú procesory so zdieľanou L2 cache.
• L3 Cache
L3 Cache sa nepoužíva v bežných procesoroch. Používa sa najmä v serverových a 4 a viacjadrových procesoroch (Intel Xeon, AMD Phenom a Opteron). V jednojadrových a dvojjadrových procesoroch nemajú takmer žiadny vplyv na výkon, keď sa L3 prejaví až vo veľmi náročných úlohách a špecifických prípadoch. V PC sa nepoužíva najmä pre cenu, keď vlastne nepotrebná cache zaberá veľa miesta v CPU, tým aj zvyšuje cenu procesoru. Veľkosť L3 sa pohybuje od 4 MB do 32 MB. Táto úroveň cache je spoločná pre všetky jadrá CPU.
• L4 Cache
V serveroch sa používa aj L4 cache, ale výroba procesora s veľkou L4 je cenovo aj technologicky náročná (väčšia náchylnosť na chyby vo väčšom kuse kremíku), a tak sú tieto procesory použité iba v špičkových serveroch, alebo superpočítačoch.
c, Radič operačnej pamäte
Radič operačnej pamäte integrovaný do CPU nie je bežný a je to vlastne integrovanie časti chipsetu kvôli zrýchleniu práce s RAM. Tento krok podstúpila firma AMD, spolu s prepracovaním komunikácie medzi časťami CPU, RAM a Chipsetom. Miesto FSB použila Hypertransport (HT), ktorý je rýchlejší. V budúcej generácii procesorov – Nehalem, integruje radič pamätí a použije rovnakú komunikáciu aj Intel. Keďže sa použil radič v CPU miesto v chipsete, tak sa nahradila komunikácia cez FSB (front side bus) CPU>Chipset>RAM>Chipset>CPU oveľa efektívnejšou a rýchlejšou komunikáciou cez HT CPU>RAM>CPU. Intel bude používať miesto HT svoju vlastnú zbernicu QuickPath (QP). Ide v podstate len o vylepšený HT.
d, GPU
Procesor môže obsahovať aj grafické jadro. Takéto procesory sa nepoužívajú v klasických PC, ale vo veľmi lacných počítačoch a špecializovaných zariadeniach. V súčasnosti je taký produkt OLPC notebook pre rozvojové krajiny s procesorom AMD Geode. V budúcnosti sa budú ale používať aj v lacných stolných PC s nízkym výkonom – projekt AMD Fusion a Intel Lincroft, určených najmä pre kancelárske použitie. Na trh prídu okolo roku 2009-2010.
Rozdelenie procesorov
Procesory sa delia podľa niekoľkých kritérií. Najvýznamnejšie popíšem.
a, Podľa šírky operanda
• 4 bitové • 8 bitové • 16 bitové • 32 bitové • 64 bitové
Šírka operanda určuje počet bitov s ktorými dokáže procesor vykonať jednu inštrukciu v jednom kroku. 4-16 bitové procesory sa už dnes v PC nepoužívajú, nahradili ich 32 a 64 bitové procesory. Pri prechode z 16 na 32 bitové procesory nastal veľký výkonový skok, rovnako ako predchádzajúce zdvojnásobovanie šírky operanda. Prechod z 32 na 64 bitové procesory však už nepriniesol tak dramatický nárast výkonu, a tak k presadeniu 64 bitových procesorov a aplikácií, ktoré by ich využívali prišlo v domácnostiach až teraz a to aj vďaka obmedzeniu alokácie systémových prostriedkov na 232 B= 4 GB (a aj vďaka MS a jeho slabej podpore 64 bitových OS a aplikácií). Do týchto prostriedkov sa započítava veľkosť grafickej pamäte a pamäte alokovanej všetkými zariadeniami. Po odčítaní tejto pamäte zostane pre RAM asi 3-3,5 GB, čo už dnes môže užívateľa obmedzovať, keďže sa dnes používajú bežne 2-4 GB RAM. Prechod k 128 bitovým CPU je teda zatiaľ v nedohľadne, keďže neprinesie takmer žiadny výkonový nárast a množstvo alokovateľnej pamäte pre 64 bitové systémy je 264 B= 16 EB (Exa Bajtov) čo je 17 179 869 184 GB pamäte. Toľko RAM sa za celú históriu počítačov ani nevyrobilo.
b, Podľa inštrukčnej sady
• CISC CISC – Complex instruction set computer, je architektúra, v ktorej sa každá inštrukcia vykonáva ako viacero operácií mikrokódu v jednom takte procesora. CISC procesory majú preto rozsiahlu sadu pomerne zložitých inštrukcií. Architektúra CISC je duálnou k architektúre RISC. Na tejto architektúre stoja dnešné x86 procesory.
• RISC RISC – Reduced instruction set computer, je architektúra procesorov s priamočiarym vykonávaním pomerne jednoduchých inštrukcií bez mikrokódu. Postupom času sa prišlo na to, že na vykonanie 80 % operácií je potrebných 20 % inštrukcií. Zvyšných 20 % operácií sa vykoná opakovaním inštrukcií. Zredukovanie inštrukcií na 20 % zjednodušilo návrh a konštrukciu procesorov ako aj programovanie pre ne. Navyše CISC procesory pri vykonávaní rozsiahlych inštrukcií boli pomalšie ako RISC procesory, čo viedlo k masovejšiemu rozšíreniu RISC procesorov. Základné znaky RISC procesorov: - väčšina inštrukcií má rovnakú dĺžku - väčšina inštrukcií sa vykonáva v jednom inštrukčnom cykle - procesor má sadu rovnocenných registrov - nad dátovou pamäťou nie je možné vykonávať zložitejšie operácie ako načítanie a uloženie
• ZISC ZISC - Zero Instruction Set Computer je technológia priemyselných čipov založená na „pattern matching“ technológii. ZISC nemajú žiadnu inštrukčnú sadu v klasickom slova zmysle. ZISC je technológia založená na umelých neurónových sietiach. Prvá generácia ZISC čipov obsahovala 36 nezávislých umelých neurónov. Každá z týchto buniek porovnáva vstupný vektor s podobným vektorom uloženým v pamäti. Ak sa vstupný vektor zhoduje s vektorom v pamäti, neurón excituje výstupný signál. (tejto časti som nerozumel ani ja, je to z wikipedie, tak sa ma nepýtajte. Zisk sa ale najviac podobá ľudskému mozgu..)
c, Podľa počtu jadier
• Jednojadrové
Sú to klasické procesory s jediným jadrom. Donedávna sa iné pre stolné PC ani nepoužívali.
• Viacjadrové
Procesor obsahuje viac ako jedno výpočtové jadro, obyčajne s vlastnými L1 aj L2. Existujú dva spôsoby, ako vyrobiť viacjadrový procesor. A to:
- spojením viacerých jadier samostatných procesorov pomocou zbernice (FSB, Hypertransport)
Výhody: ľahší návrh a výroba; menej odpadu pri výrobe; lacnejšie. Nevýhody: dvojnásobná spotreba a teplota; zahltenie zbernice pri komunikácii medzi jadrami; samostatné cache (ak jedno jadro potrebuje dáta z cache druhého jadra, musí ich skopírovať do vlastnej cache)
- navrhnúť a vyrobiť natívne viacjadrový procesor na jednom kuse kremíka
Výhody: spoločná L2 alebo L3 cache; menšie generované teplo a spotreba, vyšší výkon Nevýhody: menšia výťažnosť waferov; obyčajne vyššia cena.
Spojené viaceré procesory (Intel Quadcore)
Natívne viacjadrový procesor (AMD Quadcore)
d, Podľa spracovania inštrukcií
• Skalárne
Procesor vykonáva inštrukcie za sebou, jednu po druhej. Naraz môže pracovať len s jednou aplikáciou.
• Superskalárne
Inštrukcie sa delia na niekoľko operácii, ktoré sa vykonávajú v oddelených jednotkách procesora. Vďaka tejto technickej úprave môže takýto superskalárny procesor vykonať viac ako jednu inštrukciu za takt procesora. Bez superskalárnych procesorov by nemohli fungovať OS ako Windows, Linux a hocijaký iný OS pokročilejší ako DOS.
Výroba procesorov
a, Návrh procesoru
Na počiatku vzniku procesora je vždy dobre premyslený návrh, aby z neho podľa možností bolo možné ťažiť a odvodzovať ďalšie modely a generácie procesorov. V začiatkoch procesorovej éry sa čipy navrhovali ručne. Dnes je to nemysliteľné. Ručne navrhnúť čip s viac ako 500 miliónmi tranzistorov je nemožné, preto sa o to starajú profesionálne softvéry. Samotný návrh základu funkčnosti procesora však stále navrhuje človek. V tejto fáze vývoja sa ešte nevyrábajú prototypy, funkčnosť a pracovanie procesora sa overuje simuláciami, aby sa čo najviac ušetrilo pri vývoji procesora. Navyše pri simuláciách sa objavia aj skryté problémy a môžu sa ladiť ešte vo fáze vývoja. Keď je návrh hotový a otestovaný, prechádza sa na výrobu masiek procesora.
b, Masky procesora
Na výrobu procesorov sú potrebné fotolitografické masky, v priebehu návrhu a testovania procesora vzniká niekoľko revízií masiek, kým nie je proces fotolitografie úplne zvládnutý a bez chýb.
c, Wafer
Procesory sa vyrábajú na platniach zo super čistého kremíku. Takýmto platniam sa hovorí wafer. Wafer je odrezaný z extrémne čistého kremíkového valcového monokryštálu. V súčasnosti používané wafery majú priemer 20 alebo 30 cm. Na jeho povrchu sa nechá v kontrolovanom prostredí za pomoci extrémnej teploty a rôznych plynov narásť vrstva oxidu kremičitého. Táto vrstva je okom neviditeľná a na jej kvalitu, rovnomernosť a presnosť sú kladené veľmi vysoké nároky. Na túto vrstvu sa potom nanesie tenká vrstva fotorezista. Je to substrácia, ktorá mení svoje vlastnosti po vystavení UV žiareniu.
Wafer (rôzne veľkosti)
d, Fotolitografia a vrstvenie
Takto ošetrený wafer sa vloží do stroja, ktorý cez masky vyžaruje UV žiarenie na určitej vlnovej dĺžke – v súčasnosti 193 nm u ponornej litografie DUV. Toto UV žiarenie rozleptá vrstvu fotorezistu, ak nie je chránený maskou. Procesor má niekoľko vrstiev a pre každú sa použije vlastná maska. Po ožiarení UV, sa wafer očistí v rozpúšťadle, a očistí sa od všetkého fotorezistu. Po tomto kroku zostanú len požadované vzory, dalo by sa povedať cestičky na wafery zhodné s maskou. Na wafery sa vypestuje ďalšia vrstva oxidu kremičitého, nanesie sa vrstva polysilikónu - vodivého materiálu u MOS technológie, použije sa aj na prepojenie vrstiev procesora, nanesie sa znova fotorezist, presvieti sa wafer cez masku UV žiarením. Znova sa očistia nechránené časti fotorezistu a wafer sa prečistí. Nasleduje iónová implantácia, kedy sa vybraná časť budúceho čipu bombarduje nabitými atómami rôznych látok (iónmi), ktoré vytvoria elektricky vodivé cesty. Tieto kroky sa opakujú kým sa nevytvorí požadovaný počet vrstiev s požadovanými vzormi a tranzistormi.
Kroky pri výrobe tranzistora 1. Budúci tranzistor - oxid kremičitý pokrytý fotorezistom 2. Vrstva s polysilikónom 3. Iónová implantácia 4. Hotový tranzistor
e, Kontrolovanie a rezanie waferov
Po každej fáze výrobného procesu sa wafery opticky kontrolujú. Po dokončení vrstvenia a ďalších tajných procesoch – rôznych úpravách spadajúcich pod obchodné tajomstvo, sa môže wafer rozrezať diamantovou pílou na jednotlivé čipy. Wafer obyčajne obsahuje niekoľko stoviek jadier procesorov.
f, Testovanie a kompletizácia procesoru
Po rozrezaní je každý čip otestovaný a triedený podľa jeho kvality, schopnosti zvládať vysoké frekvencie a náročnosti na napájanie. Najlepšie kusy sú určené pre notebooky a ako prémiové vysoko taktované verzie procesorov. Keď sú už pretestované a vytriedené, nasleduje kompletizácia- umiestnenie čipu procesora na keramickú, alebo organickú doštičku. V súčasnosti sa používajú dva typy puzdier pre cpu. PGA a LGA. PGA má na doštičke procesora nožičky, LGA má len kontaktné plôšky a nožičky má základná doska. Procesor sa znova pretestuje a na jadro sa nasadí IHS – Integrated Head Spreader, čo je malý rozvádzač tepla, ktorý plní aj funkciu ochrany čipu pred mechanickým poškodením. Nakoniec sa ešte raz otestuje a zabalí spolu s chladičom a expeduje do veľkoskladov alebo OEM partnerom.
PGA - má nožičky
LGA - má len plôšky. Nožičky sú v sockete.
Procesor a IHS
Závěr
Snáď som týmto článkom objasnil základy konštrukcie procesorov, a trochu aj ich funkčnosť a procesorov. Procesorová problematika je ale omnoho rozsiahlejšia, toto sú len základy. Hlbšie vnorenie sa do problematiky by zabralo omnohoh viac času, priestoru a hlavne vôle, ktorú ťažko zbieram... Tak snáď nabudúce ;)
Všetky informácie boli čerpané z internetu (dodržiavame autorské zákony ;) ), Zdroje:
|