Benutzer:Dirk Huenniger/vorlagen
| Tendenzen |
|---|
Wir erwarten von der Halbleiterindustrie, dass unsere Computer leistungsfähiger werden. Welche Wege gibt es, um dieses Ziel zu erreichen?
Größere Verarbeitungsbreite
[Bearbeiten]Die Intel 8088 CPU konnte mit 8-Bit-Zahlen rechnen, der i8086 mit 16-Bit-Zahlen. Seit dem i80386 können die CPUs 32-Bit-Zahlen verarbeiten. Das bedeutet, dass Zahlen bis 4 294 967 296 (232) für die CPU zum „kleinen Einmaleins“ gehören und in einem einzigen Takt verarbeitet werden. Seit 2006 gibt es erste 64-Bit-CPUs, die hauptsächlich in Servern und Hochleistungs-PCs eingesetzt werden. Das bedeutet, dass Zahlen bis 18 446 744 073 709 551 616 (18 Trillionen) in einem einzigen Takt verarbeitet werden können.
Neue Materialien
[Bearbeiten]Zwischen der Steuerelektrode der Transistoren (dem „Gate“) und den Silizium-Elektroden befindet sich eine Isolationsschicht. Jahrzehntelang bestand sie aus Siliziumdioxid. Bei der 65 nm Strukturbreite war die Isolationsschicht nur noch 1,2 nm „dick“ (etwa 5 Atomlagen). Noch dünner war nicht möglich, die Schicht hätte zu viel „Leckstrom“ durchgelassen. Mit der Verwendung von Hafnium als Isoliermaterial konnten trotz dünnerer Isolierung die Leckstrom-Verluste auf ein Fünftel reduziert werden. Der Chip wurde weniger warm und die i3, i5 und i7 Prozessoren konnten in 45 nm Strukturbreite gefertigt werden.
Kleinere Strukturen
[Bearbeiten]Der Pentium III und die ersten Pentium 4 wurden in 0,13 Mikrometer-Struktur (130 Nanometer) hergestellt. Als Strukturbreite wird der halbe Abstand zweier Leiterbahnen bezeichnet. Kleinere Strukturen bringen drei Vorteile:
- Es passen mehr Transistoren auf die Chipfläche
- Kleinere Transistoren kommen mit einer kleineren Versorgungsspannung aus. Pro Transistor wird weniger Energie gebraucht.
- Die Schaltungen werden schneller, weil die Entfernungen zwischen den Transistoren kürzer werden (denn schneller als das Licht ist der Strom nicht).
- Nach Angaben von Intel senkt jede Verdopplung der Packungsdichte die Fertigungskosten um 30%.
Zum Vergleich: Die meisten Viruszellen haben einen Durchmesser von 20 bis 80 nm. Intel meint, wegen der 3D-Stapelung der Komponenten verliert die Angabe einer Strukturbreite an Bedeutung, zumal jeder Hersteller die Strukturbreite anders definiert.
| Jahr/Monat | 1980 | 1999-12 | 2001 | 2003-10 | 2005-12 | 2007-11 | 2009-03 | 2010 | 2014 | 2017 | 2019 | 2024 |
| Bezeichnung des Kerns | i8086 | Coppermine | Tualatin | Dothan | Presler | Penryn | Nehalem | Sandy Bridge | Broadwell | Cannon Lake | ||
| Strukturbreite (Nanometer) | 3000 | 180 | 130 | 90 | 65 | 45 | 32 | 32 | 14 | 10 | 7 | 2 |
- Beispiel
Wenn die Struktur von 65 auf 45 nm verkleinert wird, belegt jeder Transistor nur noch etwa die halbe Fläche (452 / 652 = 48%). Dadurch konnte Intel beim Dual-Core-Penryn den L2-Cache von 4 auf 6 MByte vergrößern und außerdem 47 neue SSE4-Befehle (Spezialbefehle für Multimedia) hinzufügen. Durch den geringeren Strombedarf konnte die Taktfrequenz auf mehr als 3 GHz gesteigert werden.
Im November 2010 hat Intel begonnen, Prozessoren mit 22 nm Strukturbreite herzustellen[1]. Im Vergleich zur 45 nm Technologie vervierfacht sich die Packungsdichte.
Mehr Transistoren
[Bearbeiten]In den vergangenen Jahrzehnten konnte die Zahl der Transistoren in der CPU durchschnittlich alle zwei Jahre verdoppelt werden. Der Intel Core i7 enthält 731 Millionen Transistoren. Im Jahr 2011 könnten etwa eine Milliarde Transistoren in ein CPU-Gehäuse passen. Was kann man mit so vielen Transistoren anfangen?
- Es soll neue Spezialfunktionen geben. In den vergangenen Jahren wurden den CPUs Spezialbefehle für Multimedia-Anwendungen (MMX und SSE) hinzugefügt. Gegenwärtig besteht ein hoher Bedarf an Spezialbefehlen für Kryptografie (Verschlüsselung).
- Der Cache-Speicher soll stark vergrößert werden.
- Vorhandene Funktionen können beschleunigt werden. Ein Beispiel: Bei der Addition können Überträge auftreten, die in die nächsthöhere Stelle eingerechnet werden müssen. Die CPU kann zwei 64-stellige Zahlen in einem ersten Schritt addieren und benötigt anschließend im ungünstigsten Fall weitere 63 Schritte, um die Überträge zu berücksichtigen. Wenn allerdings der Konstrukteur eine üppige Anzahl Transistoren zur Verfügung hat, lässt sich die Addition auf wenige Schritte reduzieren, sogar ein Ein-Schritt-Addierer wird möglich. Ein schnelles „Addierwerk“ ist deshalb so wichtig, weil sich die anderen Grundrechenarten auf die Addition zurückführen lassen.
- Spezielle Schaltungen könnten zukünftig noch weiter vorausschauend „erraten“, welche Daten aus dem Arbeitsspeicher benötigt werden könnten (Speculative Precomputation). Wenn der Speicherbus wenig beschäftigt ist, werden diese Daten auf Vorrat geholt.
Mehr Kerne
[Bearbeiten]Im Februar 2009 stellte Intel den ersten Xeon-Prozessor mit acht Kernen und 16 Threads vor. Er wird in 45-nm-Struktur gefertigt, 2010 soll die 32-nm-Version folgen. Es gibt neue Stromsparfunktionen. Je nach Auslastung kann für jeden Kern die Versorgungsspannung erhöht oder verringert werden. Zeitweilig unbenutzte Kerne können sogar komplett abgeschaltet werden, um Strom zu sparen und die Wärmeentwicklung zu verringern. [2]
Die neuesten CPUs von Intel der Serie „Core i9-13900“ haben acht „Performance“-Kerne, 16 „Efficient“-Kerne und einen „Thread Director“, der die Rechenarbeit auf die Kerne verteilt. Der Präfix „i9“ kennzeichnet CPUs mit mindestens 10 Kernen. AMD bietet Paroli mit der 16-Kern-CPU „Ryzen 9 5950X“ für 400 Euro. Besonders anspruchsvollere Kunden kaufen die AMD Ryzen Threadripper Pro 3995WX mit 64 Kernen für 3500 Euro (Nov. 2024).
Seit Ende 2023 verkauft Intel die neue Generation der „Core Ultra“ CPUs. Zusätzlich zu den Performance- und Effizienz-Kernen gibt es einen „Neuronalen“ Kern (Gaussian & Neural Accelerator), der typische Berechnungen der künstlichen Intelligenz beschleunigen soll. AMD hat in den Ryzen 7 8700G ebenfalls eine NPU (Neuronale Processor Unit) zur KI-Beschleunigung eingebaut. Die M4-CPU von Apple hat 16 Kerne „Neural Engine“.
Leider steigt die Leistung bei Universalprozessoren nicht so stark wie die Zahl der Prozessorkerne. Die Vorausschaulogik erkennt nicht genug unabhängige Programmteile (Threads), die auf die Kerne verteilt werden könnten, und es sind meist nur kleine Threads. Die Effektivität würde steigen, wenn die Programmierer zukünftig die parallelisierbaren Teile explizit markieren. Doch auch wenn sie das tun: Ein großer Teil vom Programmcode heutiger Programme ist vor vielen Jahren entstanden, als niemand an Parallelverarbeitung dachte.
Smartphone-CPUs arbeiten mit mehreren Kernen. Die hohe Rechenleistung leert den Akku schnell. NVIDIA hat den vier Kernen einen fünften „Stromspar-Kern“ hinzugefügt, der zum Einsatz kommt, wenn das Smartphone im Ruhezustand ist. Die anderen Kerne werden bei Bedarf geweckt. Die Galaxy-Modelle von Samsung ab dem S4 haben vier leistungsstarke Kerne plus vier Sparkerne. Andere Smartphones und Tablets schalten alle bis auf einen Kern ab und/oder reduzieren die Taktfrequenz, um Energie zu sparen.
Hot Spots beseitigen
[Bearbeiten]Hot Spots heißen die winzigen Stellen der CPU, wo die Temperatur besonders hoch ist, hervorgerufen durch hochbelastete Funktionseinheiten. Sie begrenzen die Taktfrequenz, denn je höher der Takt, desto mehr Wärme entsteht. Wenn man mehrere dieser heißlaufenden Funktionseinheiten auf dem Chip verteilen kann und sie abwechselnd benutzt, verteilt sich die Wärme und der Takt kann erhöht werden.
„Grüne“ CPUs
[Bearbeiten]Heutige Prozessoren schalten ungenutzte Funktionsgruppen ab und reduzieren den Stromverbrauch bei geringer Auslastung. Es gibt eine weitere Möglichkeit. Die gewaltige Rechenleistung heutiger CPUs wird nicht immer gebraucht. Bei vielen Servern wirkt es sich kaum auf die Gesamtleistung aus, wenn die CPU etwas langsamer ist. Wenn man eine 3-GHz-CPU mit einem Takt von 1,5 GHz betreibt, sinkt deren Leistungsbedarf auf die Hälfte.
Optische Datenleitungen
[Bearbeiten]Die intel Core i3/i5/i7/i9 CPUs werden imit immer kleineren Strukturen hergestellt[3]. Noch kleinere Strukturen als 2 Nanometer sind problematisch[4]. Wenn die Leitungen noch schmaler sind, wird der Elektronentransport zu langsam. Optische Datenleitungen wären der Ausweg: Die Informationen werden mit Lichtblitzen übertragen. Die Lichtblitze sollen mit Miniaturlasern erzeugt werden. Intel hat bereits Halbleiterlaser entwickelt[5], mit denen Übertragungsraten von 50 Gbit/s zwischen Prozessoren möglich sind. Für die Verwendung im Inneren der CPU sind die Laser noch viel zu groß.
Der vorliegende Text beschäftigt sich mit der Verwendung möglichst kompliziert und sinnfreier Vorlagen.
Wir Betrachjten eine Vorlage
Dies ist eine einfache jedoch sinnfreie Vorlage
Sie Expandiert zwei Paramter. Zu einen
unfug
und zum Anderen
nichts
ferner ist sie endlich
Sowie eine weitere Vorlage
Diese Vorlage ist kompliziert sie expandiert zwei Parameter
elf
und
zweiundzanwzig
Weiterhin inkduiert sie eine weitere Vorlage
Diese Vorlage expandiert lediglich einen Parameter nämlich
null
Ferner gibt es noch die möglichkeit vorlagen zu schachteln.
Dies ist eine einfache jedoch sinnfreie Vorlage
Sie Expandiert zwei Paramter. Zu einen
abDiese Vorlage hat einen Paramerte. Dieser wird expandietrt zu
rapam
weiterhin ist auch diese Vorlage endlichba
und zum Anderen
nichts
ferner ist sie endlich
- ↑ Intel beginnt mit 22-nm-Fertigung von Prozessoren http://ht4u.net/news/22702_intel_beginnt_mit_22-nm-fertigung_von_prozessoren/
- ↑ Die Zukunft der intel-Prozessoren http://www.intel.de
- ↑ 32 nm Technologie http://www.intel.com/cd/corporate/pressroom/emea/deu/archive/2008/410929.htm
- ↑ Herstellung von CPUs (Lithografie) http://www.techtower.de/pdf/techtower_mikroelektronik_Lithographie.pdf
- ↑ 50 Gbit/s Datenübertragung mit Halbleiter-Lasern http://www.storage-insider.de/themenbereiche/storage-hardware/forschung-und-wissenschaft/articles/276138/