Zum Inhalt springen

Einführung in die Theoretische Physik/ Druckversion

Aus Wikibooks
Einführung in die Theoretische Physik


Siegfried Petry
Wikibooks


Einleitung

[Bearbeiten]

Einführung in die Theoretische Physik, 1. Teil

[Bearbeiten]

   

Dies ist eine Einführung in die Theoretische Physik in mehreren einzelnen Wikibooks (Kinematik, Dynamik ...). Sie sollen Studienanfängern das Leben etwas erleichtern.

Theoretische Physik wird an Hochschulen gelehrt und ihr Studium setzt einige Kenntnisse voraus: Experimentalphysik und Analysis von Gymnasialniveau, Vektoralgebra, Vektoranalysis und einfachere Differentialgleichungen. In den Wikibooks zur Theoretischen Physik wird zwar einiges von dem genannten Stoff kurz wiederholt und es werden Erläuterungen zum leichteren Verständnis gegeben, aber dies kann und soll kein Ersatz für grundlegende Kenntnisse sein. Theoretische Physik kann nicht voraussetzungslos vermittelt werden.


Was ist Theoretische Physik?

[Bearbeiten]

Physik beginnt mit der sorgfältigen Beobachtung von physikalischen Vorgängen, wie sie entweder in der Natur auftreten oder im Experiment gezielt hervorgerufen werden.

Der Beobachtung solcher Vorgänge folgt ihre möglichst präzise Beschreibung. Dazu ein einfaches Beispiel: Bei fortgesetzter Abkühlung von Wasser gefriert es zu Eis. Bei diesem Vorgang kann eine nicht mehr triviale Entdeckung gemacht werden: Beim Gefrieren gibt das Wasser Wärme an seine Umgebung ab. Daraus ergibt sich die Frage: „Wie viel Wärme?“ Antwort: „Die Wärmemenge hängt von der Masse des gefrierenden Wassers ab.“ – Wie ist der Zusammenhang zwischen Masse und Wärmemenge? – „Die Wärmemenge ist der Masse proportional.“ Damit beginnt bereits die Mathematisierung der Physik: proportional ist nämlich ein mathematischer Begriff. Er bedeutet hier, dass der Quotient aus Wärmemenge und Masse immer denselben Wert hat. Als nächstes kann man einen neuen Begriff definieren: Der konstante Quotient aus Wärmemenge und Masse heißt spezifische Erstarrungswärme des Wassers. Daraus ergibt sich sofort die nächste Frage: „Haben alle Stoffe die gleiche spezifische Erstarrungswärme?“ – Beileibe nicht! – Weiter: „Wie kommt es, dass das Wasser Wärme – also Energie – abgibt und woher stammt sie?“ Und damit sind wir bei einer typischen Fragestellung der Theoretischen Physik, die uns schließlich zur kinetischen Wärmetheorie bringen wird.

Hier noch ein außerordentlich wichtiges historisches Beispiel:

Der dänische Astronom Tycho Brahe (1546-1601), der bedeutendste beobachtende Astronom vor der Erfindung des Fernrohrs, beobachtete über viele Jahre hinweg die Standorte der Planeten vor dem Hintergrund des Fixsternhimmels und führte penible Aufzeichnungen darüber. Aus der Datenfülle dieser Aufzeichnungen leitete Johannes Kepler (1571-1630) die nach ihm benannten Gesetze der Planetenbewegung ab, eine verbal-mathematische Beschreibung der Vorgänge. Diese Gesetze lauten:

  1. Die Planeten bewegen sich auf Ellipsen, in deren einem Brennpunkt die Sonne steht.
  2. Der Radiusvektor (Leitstrahl), also die Verbindungslinie zwischen Sonne und Planet, überstreicht in gleichen Zeiten gleiche Flächen.
  3. Die zweiten Potenzen der Umlaufzeiten der Planeten verhalten sich wie die dritten Potenzen der großen Halbachsen ihrer Bahnellipsen.

Das Herausdestillieren dieser Gesetze aus den Daten Tycho Brahes ist noch immer die bedeutendste Leistung der beschreibenden Physik.

Darüber hinaus fragte Kepler auch bereits nach dem physikalischen Grund dieser Bewegung und ihrer Gesetze. (Die Scholastiker des Mittelalters hatten noch angenommen, die Planeten würden von Engeln auf ihren Bahnen um die Erde (!) herumgeführt.) Er kam zu der Vermutung, dass zwischen Sonne und Planeten – wie überhaupt zwischen zwei Massen – eine anziehende Kraft wirken müsse.

Tycho Brahe war hier also der Beobachter, Johannes Kepler der Interpret und der erste Frager nach den physikalischen Gründen der Planetenbewegung.

Aus den Keplerschen Gesetzen leitete dann Isaac Newton (1643-1727) das Gravitationsgesetz ab: Zwischen zwei Massen wirkt eine anziehende Kraft, die proportional zum Produkt der beiden Massen und umgekehrt proportional zum Quadrat ihrer Entfernung ist. Isaac Newton war hier also der theoretische Physiker. Ein Triumph in diesem Kapitel der Theoretischen Physik war es, als 1846 der Astronom Johann Galle den Planeten Neptun entdecken konnte, nachdem Urbain Le Verrier aus Bahnstörungen des Planeten Uranus seine Position berechnet hatte.

Zum Wesen der Theoretischen Physik gehört auch, dass sie zuvor unbekannte (oder unerklärbare) Konsequenzen ihrer Ergebnisse ableitet, die wiederum an der Erfahrung überprüft werden können. Dazu ein beeindruckendes Beispiel: Albert Einstein gründete seine Allgemeine Relativitätstheorie auf die bekannte, aber unerklärte Tatsache, dass alle Körper im leeren Raum gleich schnell fallen, was bedeutet, dass schwere Masse und träge Masse eines Körpers proportional sind. Als Konsequenz ergab sich die zwar bekannte, aber nicht erklärbare "Perihelbewegung" des Merkur, dessen Bahnellipse um die Sonne rotiert.

Zuvor völlig unbekannt war (wenn man von Newtons Erkenntnissen über die Reflexion, Brechung, Beugung und die Farben des Lichts von 1704 und von einer Publikation Johann Georg Soldners "Zur Gravitations-Lichtablenkung am Sonnenrand" von 1801 absieht), die von Einstein aus der Allgemeinen Relativitätstheorie gefolgerte Krümmung von Lichtstrahlen, die nahe an der Sonne vorbeilaufen. Dieser Effekt wurde dann bei Sonnenfinsternissen tatsächlich beobachtet.

Zum Schluss noch ein letzter Hinweis auf die praktische Bedeutung der Theoretischen Physik: Die komplizierte moderne Technik ist ohne Theoretische Physik undenkbar. Es gibt eben nichts Praktischeres als eine gute Theorie.


Weiter zum Band 2: Kinematik

Kinematik

[Bearbeiten]
Wikibooks Dieses Buch wurde in den Wikibooks:Buchkatalog aufgenommen.

Einleitung

[Bearbeiten]

In der Kinematik geht es um grundlegende Vorgänge und Begriffe im Zusammenhang mit der Bewegung von Körpern: um Verschiebung, Geschwindigkeit, Beschleunigung, gleichförmige Bewegung, gleichmäßig beschleunigte Bewegung, um Bewegungen auf gekrümmten Bahnen – und natürlich um die mathematische Behandlung der entsprechenden physikalischen Vorgänge und Größen. Da es sich dabei meist um »gerichtete Größen«, also um Vektoren handelt, ist die Vektoranalysis [1] das angemessene mathematische Handwerkszeug dafür.

Die einfachste vektorielle Größe der Kinematik ist die »Verschiebung« Δs, die ein Körper während einer Zeitspanne Δt erfährt. Dass die Verschiebung ein Vektor ist, folgt daraus, dass sie den Gesetzen der Vektoraddition folgt. Erfährt nämlich ein Körper nacheinander oder gleichzeitig zwei Verschiebungen a und b, so ist die daraus resultierende Verschiebung gleich der Vektorsumme a + b der beiden einzelnen Verschiebungen.

Zwei gleichzeitige Bewegungen treten vor allem dann auf, wenn sich ein Körper relativ zu einem Bezugssystem bewegt und dieses Bezugssystem selbst sich relativ zu einem anderen Bezugssystem bewegt. Beispiel: Die Bewegung eines Reisenden in einem fahrenden Zug, der vom Bahndamm aus beobachtet wird.

Anmerkung zur Schreibweise: Im Text und in den Abbildungen werden Vektoren mit fett und kursiv gedruckten Buchstaben benannt. In den Formeln und Gleichungen, die mit TeX geschrieben wurden, sind Vektoren durch einen Pfeil über dem Formelzeichen gekennzeichnet.

 

Bahngeschwindigkeit und Bahnbeschleunigung

[Bearbeiten]

Bahngeschwindigkeit und Bahnbeschleunigung werden im Alltag (zum Beispiel bei Fahrzeugen) schlicht Geschwindigkeit bzw. Beschleunigung genannt. In der Physik jedoch sind Geschwindigkeit und Beschleunigung Vektoren, und so sind klare Begriffe und Unterscheidungen notwendig.

Legt ein Massenpunkt von einem Punkt P aus in der Zeit Δt die Strecke Δs zurück, so heißt der Quotient Δs / Δt seine mittlere Bahngeschwindigkeit vm im Zeitintervall Δt oder auf der Strecke Δs.




Man beachte, dass Δs hier nicht die Verschiebung, sondern die Bogenlänge, also die zurückgelegte Wegstrecke ist.

Von mittlerer Bahngeschwindigkeit sprechen wir darum, weil sich der Massenpunkt auf der betrachteten Strecke möglicherweise nicht gleichmäßig schnell bewegt hat.

Machen wir die Strecke Δs immer kleiner, so wird auch das Zeitintervall Δt immer kleiner. Für Δs gegen null (oder Δt gegen null, was auf dasselbe hinausläuft) nähert sich der Quotient Δst unbeschränkt einem Grenzwert, den wir die Bahngeschwindigkeit v des Massenpunktes im Punkt P nennen:



In der Analysis wird dieser Grenzwert auch mit ds/dt bezeichnet, also:


Nehmen wir weiter an, der Massenpunkt habe im Punkt P und zur Zeit t die Bahngeschwindigkeit v und zur Zeit t + Δt die Bahngeschwindigkeit v + Δv. Dann bezeichnen wir den Quotienten Δvt als die mittlere Bahnbeschleunigung am des Massenpunktes im Zeitintervall Δt:



Für Δt gegen null strebt dieser Quotient einem Grenzwert zu, der Bahnbeschleunigung a des Massenpunktes zur Zeit t heißt.



Für diesen Grenzwert wird auch folgende Abkürzung benutzt:



Ist der Weg s als analytische Funktion der Zeit t beschrieben, also s = s (t), so ist die Bahngeschwindigkeitsfunktion v (t) die erste Ableitung der Funktion s (t) nach der Zeit, die Bahnbeschleunigungsfunktion a (t) ihre zweite Ableitung. Ableitungen nach der Zeit können auch durch einen Punkt über dem Formelzeichen bezeichnet werden.



Umgekehrt können die Bahngeschwindigkeitsfunktion und die Wegfunktion durch Integration gefunden werden:



Die zu den unbestimmten Integralen gehörigen additiven Konstanten müssen aus den Anfangsbedingungen oder Randbedingungen bestimmt werden.

Beispiel: Beim freien Fall erfährt der Massenpunkt die konstante Beschleunigung g. Dann ist, wenn er zur Zeit t  =  0 die senkrecht nach oben oder unten gerichtete Bahngeschwindigkeit v0 und die Ortskoordinate s0 hat,


 

 

Geschwindigkeit und Beschleunigung

[Bearbeiten]

Geschwindigkeit

[Bearbeiten]

Wir betrachten nun einen Massenpunkt, der im Raum eine beliebige Kurve durchläuft. Zur Zeit t befinde er sich in P, zur Zeit t + Δt in Q. Der Ort des Punktes wird durch seinen Ortsvektor r beschrieben. Dieser ist eine Funktion von t und wird durch eine Vektorfunktion r(t) beschrieben.


Es sei



und



wobei i, j und k die Einheitsvektoren auf den Koordinatenachsen sind.

Die Verschiebung des Massenpunktes im betrachteten Zeitintervall ist dann



Der Quotient Δrt ist die mittlere (vektorielle) Geschwindigkeit vm des Massenpunkts im Zeitintervall Δt. Es ist



Dabei ist (siehe oben: Bahngeschwindigkeit und Bahnbeschleunigung) Δxt die mittlere Bahngeschwindigkeit des Massenpunktes parallel zur X-Achse, Δyt seine mittlere Bahngeschwindigkeit parallel zur Y-Achse und Δzt seine mittlere Bahngeschwindigkeit parallel zur Z-Achse im Intervall Δt.

Der »Grenzvektor«, dem der Bruch Δrt für Δt gegen 0 zustrebt, heißt Geschwindigkeit vP = v(t) des Massenpunktes in P oder zur Zeit t.



Die Vektorfunktion v(t) ist also die erste Ableitung der Ortsfunktion r(t) nach der Zeit.



Wie man sieht, sind die skalaren Komponenten des Vektors v(t) identisch mit den Bahngeschwindigkeiten parallel zu den Achsen:



Die Gerade durch P mit der Richtung des Vektors vP heißt Tangente der Bahnkurve in P.


 

Beschleunigung

[Bearbeiten]

Analog definieren wir nun die Vektorfunktion der Beschleunigung:



Die Vektorfunktion der Beschleunigung ergibt sich aus den skalaren Komponenten der Geschwindigkeitsfunktion und der Ortsfunktion wie folgt:




Wie zu erkennen, sind die skalaren Komponenten des Beschleunigungsvektors gleich der Bahnbeschleunigung in Richtung der jeweiligen Koordinatenachse.


Umgekehrt können durch Integration die entsprechenden Stammfunktionen gefunden werden.


Beispiel: Freier Fall mit Anfangsgeschwindigkeit v0 von einem Punkt mit dem Ortsvektor r0 aus (senkrechter oder schräger Wurf).

Wenn die +Z-Achse (Einheitsvektor k) senkrecht nach oben gerichtet ist, gilt




Während der Geschwindigkeitsvektor immer die Richtung der Bahntangente hat, kann der Beschleunigungsvektor beliebig gerichtet sein. Zu einer näheren Untersuchung ist es sinnvoll, die Beschleunigung in zwei Komponenten zu zerlegen, von denen die eine die Richtung der Bahntangente hat (»Tangentialbeschleunigung«) und die andere darauf senkrecht steht (»Normalbeschleunigung«).

Die Tangentialbeschleunigung verändert nur den Betrag der Geschwindigkeit (das ist die Bahngeschwindigkeit), die Normalbeschleunigung verändert nur die Richtung des Geschwindigkeitsvektors.


Für diese Zerlegung des Vektors der Beschleunigung führen wir die »Bogenlänge s« ein, das ist die Länge des Weges, den der betrachtete Massenpunkt auf der Bahnkurve zurückgelegt hat. Die Bogenlänge zählt von einem beliebig gewählten Nullpunkt aus, der hier ohnehin keine Rolle spielt, da wir nur das Differential ds der Bogenlänge brauchen. Außerdem führen wir den Tangenteneinheitsvektor t ein und machen einige Anleihen bei der Differentialgeometrie (Siehe dazu: Vektoranalysis: 3. Anwendungen auf die Differentialgeometrie) Der Tangenteneinheitsvektor t ist der Vektor



das heißt, er ist gleich dem Vektor v dividiert durch dessen Betrag v. Dieser Betrag aber ist gleich der Bahngeschwindigkeit und diese wiederum ist die Ableitung der Bogenlänge nach der Zeit. Also ist



Durch Differenzieren nach der Zeit ergibt sich daraus



Da die Länge des Tangenteneinheitsvektors t konstant (nämlich gleich 1) ist, steht der Ableitungsvektor dt/ds – wenn er nicht gleich null ist - auf t senkrecht.

Der Differentialgeometrie entnehmen wir, dass der Ableitungsvektor dt'/ds

  • die Richtung des Normaleneinheitsvektors n und
  • den Betrag k = 1/ρ hat.

Dabei ist k die Krümmung der Kurve im betrachteten Punkt und ρ ihr Krümmungsradius. Der Normaleneinheitsvektor n ist auf den (momentanen) Krümmungsmittelpunkt (also »nach innen«) hin gerichtet.

Folglich ist



Damit ergibt sich



Der Vektor a liegt also in der durch t und n aufgespannten Ebene, der so genannten Schmiegungsebene der Kurve im betrachteten Punkt.

Der Betrag der Tangentialbeschleunigung ist – wie zu erwarten war:



der Betrag der Normalbeschleunigung ist



Diese beiden Gleichungen sind so zu interpretieren: Die Beschleunigung des Massenpunktes erfolgt durch das Wirken einer Kraft. Die Richtung dieser Kraft bestimmt die Richtung der Beschleunigung. Die Tangentialkomponente der Beschleunigung verursacht eine Veränderung der Bahngeschwindigkeit, die Normalkomponente der Beschleunigung verursacht eine Krümmung der Bahnkurve. Der Krümmungsradius der Kurve im betrachteten Punkt ergibt sich aus der Normalbeschleunigung und der Geschwindigkeit zu:


 

Rotationsbewegungen

[Bearbeiten]

Ein Massenpunkt P bewege sich auf einer Kreisbahn. Wir legen die XY-Ebene in die Bahnebene und den Ursprung O des Koordinatensystems in den Mittelpunkt des Kreises.



Dann ist



Analog zur »Bahngeschwindigkeit« und zur »Bahnbeschleunigung« definieren wir die »Winkelgeschwindigkeit» ω



und die »Winkelbeschleunigung« α



Wenn für t = 0 auch φ = 0 und ω = 0 ist, dann ist



Gleichförmige Kreisbewegung

[Bearbeiten]

Eine Kreisbewegung mit konstanter Winkelgeschwindigkeit heißt gleichförmig. Dann ist



Die Gleichung des Ortsvektors ist dann



Daraus ergibt sich für die Geschwindigkeit



und



Außerdem ist das Skalarprodukt



Für die Beschleunigung ergibt sich



und daraus



Die Beschleunigung ist also auf O hin gerichtet (Zentripetalbeschleunigung), ihr Betrag ist konstant.

 

Gleichmäßig beschleunigte Kreisbewegung

[Bearbeiten]

Hier ist die Winkelbeschleunigung α konstant und folglich für ω(0) = 0


Wenn auch φ(0) = 0 ist, folgt daraus für den Drehwinkel



Dann folgt aus




und



oder



Daraus ersieht man, dass die (nach innen gerichtete) Radialkomponente der Beschleunigung



und ihre Tangentialkomponente



ist.


 

Die Winkelgeschwindigkeit als gerichtete Größe

[Bearbeiten]

Manchmal ist es nützlich, die Winkelgeschwindigkeit als gerichtete Größe aufzufassen und durch einen Vektor darzustellen, der in der Drehachse liegt und dessen Betrag gleich der Winkelgeschwindigkeit ω ist. Dazu führt man z. B. einen Einheitsvektor e von der Richtung der Drehachse ein und bezeichnet dann die Größe ω e als den »Vektor ω der Winkelgeschwindigkeit«. Dies ist – wie gesagt – manchmal recht nützlich; aber das darf uns nicht darüber hinwegtäuschen, dass die Winkelgeschwindigkeit kein Vektor ist. Ihr fehlt nämlich die wesentliche und unabdingbare Eigenschaft eines Vektors: sie kann nicht vektoriell addiert werden. Das heißt: Wenn ein Körper (z. B. die Erde) gleichzeitig zwei Rotationen mit der Winkelgeschwindigkeit ω1 bzw. ω2 um zwei verschiedene Drehachsen ausführt (im Beispiel: um die eigene Achse und um eine Achse, die durch die Sonne geht und auf der Ekliptik senkrecht steht), dann kann die resultierende Bewegung nicht durch die Vektorsumme der beiden Winkelgeschwindigkeiten beschrieben werden.

Nur wenn es um Berechnungen im Zusammenhang mit einer einzigen Drehbewegung oder um die Ermittlung der Geschwindigkeit eines Körpers geht, der gleichzeitig zwei Drehbewegungen ausführt (wobei dann die beiden Teilgeschwindigkeiten einzeln ermittelt werden müssen), ist die Einführung eines »Drehvektors« sinnvoll und nützlich.


 

Bewegungsgleichungen in einem Polarkoordinatensystem

[Bearbeiten]

Geschwindigkeit in Polarkoordinaten

[Bearbeiten]

Die Geschwindigkeit v eines Massenpunktes kann auf beliebig viele Arten in Komponenten zerlegt werden. Geläufig und wichtig ist vor allem die bisher benutzte Zerlegung in Komponenten in Richtung der Achsen eines kartesischen Koordinatensystems, also die Darstellung in der Form:



Alternativ werden wir nun die Darstellung einer in der XY-Ebene verlaufenden ebenen Bewegung in Polarkoordinaten betrachten.



Die Lage eines Punktes P kann nun beschrieben werden

  • durch seine kartesischen Koordinaten x, y und
  • durch seine Polarkoordinaten r, φ

Dabei gelten folgende Transformationsgleichungen:


und



Ein Massenpunkt bewege sich in der Zeit  Δt  von P1 nach P2. Wir zerlegen nun die Verschiebung P1 P2 in eine radiale und eine dazu senkrechte »transversale« Komponente




Analog zur Definition der mittleren Bahngeschwindigkeit definieren wir nun

die mittlere Radialgeschwindigkeit im Zeitintervall Δt



und die mittlere Transversalgeschwindigkeit im Zeitintervall Δt



Daraus ergeben sich die Definitionen für die (momentane) Radial- und Transversalgeschwindigkeit im Punkt P1:




Die Berechnung der Geschwindigkeiten aus diesen Gleichungen ist natürlich nur möglich, wenn die Funktion r = r (φ) - das ist die Gleichung der Bahnkurve – und φ = φ (t) oder r = r (t) – das ist die Beschreibung des zeitlichen Ablaufs der Bewegung – gegeben sind.

Den Zusammenhang zwischen den Geschwindigkeiten in kartesischen Koordinaten einerseits und in Polarkoordinaten andererseits findet man entweder graphisch oder durch Rechnung wie folgt durch Differenzieren der Gleichungen (B):



Mit



folgt daraus



und andererseits



Dieselben Ergebnisse gewinnt man auch aus der folgenden Graphik



Mit Hilfe der grau eingezeichneten Hilfslinien findet man



und



 

Beschleunigung in Polarkoordinaten

[Bearbeiten]

Die Verwendung eines Polarkoordinatensystems und die Zerlegung der betrachteten Größen (Geschwindigkeit, Beschleunigung) in radiale und transversale Komponenten hat zur Folge, dass diese Komponenten keine feste Richtung bezüglich des Koordinatensystems (hier speziell bezüglich der Polarachse) haben, sondern sich bei Bewegung des Punktes P in der Ebene drehen. Man kann dies auch so ausdrücken: das der Komponentenzerlegung zugrunde liegende Koordinatensystem rotiert für einen im kartesischen Koordinatensystem ruhenden Beobachter. Damit hängt es zusammen, dass man die radiale und transversale Beschleunigung nicht einfach durch die Ableitung der radialen bzw. transversalen Geschwindigkeit nach der Zeit finden kann. Wir müssen vielmehr so vorgehen: Ersetzt man in obiger Abbildung den Vektor v durch den Vektor a der Beschleunigung, so braucht man nur alle Buchstaben v durch a zu ersetzen und findet dann



Differenziert man ferner die Gleichungen



und



nochmals nach der Zeit, so erhält man




oder nach Ausklammern von cos φ und sin φ




Ein Vergleich dieser beiden Gleichungen mit den Gleichungen (A) - ein so genannter Koeffizientenvergleich – ergibt


 

Beispiele

[Bearbeiten]

1. Die gleichförmige Kreisbewegung (Mittelpunkt M, Radius R, Winkelgeschwindigkeit ω.)

Hier gilt mit (rM = Ortsvektor von M):





Für rM = 0 ist einfach a = -ω2 r

 

2. Die Planetenbewegung

Johannes Kepler (1571-1630) hatte aus den langjährigen sorgfältigen Planetenbeobachtungen Tycho Brahes (1546-1601) die drei nach ihm benannten Gesetze der Planetenbewegung abgeleitet. Diese lauten:

1. Die Planeten bewegen sich auf Ellipsen, in deren einem Brennpunkt die Sonne steht.
2. Der von diesem Brennpunkt aus auf einen Planeten gerichtete Ortsvektor (»Radiusvektor«) überstreicht in gleichen Zeiten gleiche Flächen (»Flächensatz«).
3. Die Quadrate der Umlaufszeiten der Planeten verhalten sich wie die 3. Potenzen der großen Halbachsen ihrer Bahnen.

Isaac Newton (1643-1727) benutzte bei der Aufstellung seines Gravitationsgesetzes (1666) die Keplerschen Gesetze und zeigte 1687, wie diese umgekehrt mit Hilfe der Differentialrechnung (damals »Fluxionsrechnung«) aus seinem Gravitationsgesetz abgeleitet werden können.

Hier soll als Anwendungsbeispiel gezeigt werden, wie sich das quadratische Abstandsgesetz der Gravitation aus dem ersten und zweiten Keplerschen Gesetz herleiten lässt.

Dazu machen wir zunächst eine Anleihe bei der Analytischen Geometrie: Legt man den Pol eines Polarkoordinatensystems in den linken Brennpunkt der Ellipse und richtet die Polarachse zum rechten Brennpunkt hin, dann lautet die Polargleichung der Ellipse:



wobei p und e zwei hier uninteressante Ellipsenparameter sind.


So anschaulich und einleuchtend das 2. Keplersche Gesetz formuliert ist, so ist es doch in dieser Form mathematisch nicht auszudrücken. Eine »moderne« und umsetzbare, dabei gleichwertige Form lautet: Die vom Ortsvektor des Planeten überstrichene Fläche ΔA ist der Zeit Δt proportional: ΔA = C Δt.

Für hinreichend kleine Werte Δφ ist:



Nach dem 2. Keplerschen Gesetz ist



Für Δt gegen null folgt daraus:



Dies ist die mathematische Form des 2. Keplerschen Gesetzes. Durch Differenzieren folgt daraus:



Der Term auf der linken Seite der zweiten Gleichung ist aber (siehe oben bei »In ebenen Polarkoordinaten«) nichts anderes als der Betrag aφ der transversalen Komponente der Beschleunigung.

Also: Bei der Planetenbewegung ist die Transversalbeschleunigung null; es gibt offenbar nur eine Radialbeschleunigung. Für die (skalare) Radialkomponente der Beschleunigung gilt (siehe wiederum a. a. O.):



Die Radialbeschleunigung der Planetenbewegung muss nun aus den Gleichungen berechnet werden, die wir aus dem ersten und dem zweiten Keplerschen Gesetz gewonnen haben. Da in der ersten Gleichung r als Funktion von φ und nicht von t auftritt, werden wir mit Hilfe der zweiten Gleichung die Ableitung nach t durch eine solche nach φ ersetzen:

Aus



und daraus



Nochmaliges Differenzieren der Gleichung (A) ergibt:



und zusammen mit den Gleichungen (A) und (B):



Dem Flächensatz entnehmen wir, dass



Damit ergibt sich schließlich:



Durch Differenzieren der Ellipsengleichung nach φ findet man dr/dφ und d2r/dφ2 und nach einer etwas mühsamen Rechnung schließlich:



wobei der Term in der Klammer gemäß der Ellipsengleichung den Wert – r hat.

Damit ergibt sich schließlich für die skalare Radialkomponente der Beschleunigung:



Die Radialbeschleunigung ist also dem Ortsvektor entgegengesetzt gerichtet, also auf die Sonne hin und ist dem Quadrat der Entfernung umgekehrt proportional.

Der Faktor C²/p hängt von den Parametern der Bahn des jeweiligen Planeten ab. Es ist zu erwarten, dass er bei jedem Planeten einen anderen Wert hat. Hier greifen wir nun auf das 3. Keplersche Gesetz zurück, das wir bisher noch nicht benutzt haben. Seine ursprüngliche Formulierung ("Die Quadrate der Umlaufszeiten T verhalten sich wie die 3. Potenzen der großen Halbachsen a.") lässt sich mathematisch als fortlaufende Proportion ausdrücken:



Stattdessen kann man auch schreiben:



oder



wobei K für alle Planeten des Systems denselben Wert hat, also eine für das ganze Sonnensystem gültige Konstante ist.


Wir beeinträchtigen die Allgemeingültigkeit des Ergebnisses nicht, vereinfachen aber die Rechnung erheblich, wenn wir nun einen Planeten betrachten, der sich auf einer Kreisbahn bewegt (selbst wenn dieser hypothetisch ist). Dann würde auch für ihn das obige Gesetz gelten und die große Halbachse a seiner Bahn wäre durch den Bahnradius R zu ersetzen. Dann lautet das 3. Keplersche Gesetz für diesen Planeten:



Mit T = (2πR)/v erhalten wir daraus R v2 = K. Bei einer Kreisbewegung ist ferner v2 = a R, womit sich schließlich ergibt



Das bedeutet verallgemeinert, dass die Radialbeschleunigung umgekehrt proportional zum Quadrat der Entfernung von der Sonne ist. Später wird sich zeigen, dass die Konstante K nur von der Gravitationskonstanten und der Sonnenmasse abhängt.

Dynamik

[Bearbeiten]
Wikibooks Dieses Buch wurde in den Wikibooks:Buchkatalog aufgenommen.

 


Einleitung

[Bearbeiten]

Der Gegenstand der Dynamik ist das Verhalten von Körpern unter der Einwirkung einer Kraft. Oft ist es einfacher, anstatt eines ausgedehnten Körpers einen »Massenpunkt« zu betrachten. Dieser ist eine Idealisierung, ähnlich wie die Gerade in der Geometrie. Man versteht darunter einen punktförmigen (oder doch verschwindend kleinen) Körper, der dennoch eine Masse besitzt. Dabei ist »Masse« zunächst nur ein anderes Wort für materielle Substanzmenge. Ein Körper, der Masse hat, besteht im Allgemeinen aus einer sehr großen Anzahl von Atomen. Die Masse des Körpers ist dann die Summe der Massen der Atome, aus denen er besteht.

Physikalisch betrachtet hat jede Masse zwei wesentliche (das heißt hier: ihr Wesen mit begründende) Eigenschaften: Sie ist schwer und sie ist träge. »Schwer sein« bedeutet, dass die Masse von anderen Massen angezogen wird (und ihrerseits andere Massen anzieht). »Träge sein« bedeutet, dass die Masse jedem Versuch, ihren Bewegungszustand zu ändern, einen Widerstand - eine Kraft - entgegensetzt. Diese Kraft heißt Trägheitskraft. Man kann sie spüren, wenn man mit dem Kopf an eine nur angelehnte und in ihren Angeln leicht bewegliche Tür stößt.

Bei der Beobachtung und Messung von Trägheitskräften muss man sorgfältig darauf achten, dass man andere Kräfte ausschaltet, die sich der Trägheitskraft überlagern. Diese sind vor allem Reibungskräfte und die Gewichtskraft des Körpers (kurz: sein Gewicht). Legt man einen Körper zur Kompensierung seines Gewichts auf eine Unterlage, bekommt man es sofort mit der Reibungskraft zu tun, es sei denn, man benutzt eine Luftkissenfahrbahn oder eine Magnetschwebebahn – aber selbst dann ist da immer noch der Luftwiderstand. Hängt man den Körper dagegen frei an einem Seil auf, so ist seine Gewichtskraft nur so lange ganz aufgehoben, wie er genau senkrecht hängt.

Aus diesen Beispielen erkennt man, dass es gar nicht so einfach ist, die Störungen auszuschalten. Daher ist es kein Wunder, dass die Naturphilosophen des Altertums und die des Mittelalters – die von Reibungskräften nichts wussten - glaubten, ein sich selbst überlassener Körper komme stets nach einiger Zeit zur Ruhe. Erst Kepler und Galilei haben diesen Irrtum durch das Studium der Bewegung von Himmelskörpern (Planeten, Monden) überwunden. Die grundlegenden Gesetze der Dynamik wurden dann von Newton formuliert.

 

Die Newtonschen Grundgesetze der Mechanik

[Bearbeiten]

Das Trägheitsgesetz

[Bearbeiten]

Ein jeder äußeren Einwirkung entzogener Körper verharrt in seinem Zustand der Ruhe oder der gleichförmig geradlinigen Bewegung. (1. Newtonsches Axiom)

In dieser Formulierung wird der Begriff »Kraft« absichtlich vermieden, da er ja noch nicht definiert ist.

(Im Original: »Erklärung 3. Die Materie besitzt das Vermögen zu widerstehen; deshalb verharrt jeder Körper, soweit es an ihm ist, in einem Zustande der Ruhe oder der gleichförmigen geradlinigen Bewegung. - Sir Isaac Newtons Mathematische Principien der Naturlehre, Berlin, 1872)

 

Kraft, Masse und Beschleunigung

[Bearbeiten]

Definition: Die Ursache der Änderung des Bewegungszustandes eines Körpers nennen wir »Kraft«.

(Im Original: Erklärung 4. Eine angebrachte Kraft ist das gegen einen Körper ausgeübte Bestreben, seinen Zustand zu ändern, entweder den der Ruhe oder den der gleichförmigen geradlinigen Bewegung. – A. a. O.)

Es hat sich gezeigt, dass das Phänomen, das Kraft genannt wird, auch noch andere Wirkungen haben kann: Eine Kraft kann einen Körper verformen (plastisch oder elastisch), sie kann Reibungswiderstand überwinden und sie kann einen Körper gegen die Wirkung seines Gewichts in der Schwebe halten oder mit konstanter Geschwindigkeit nach oben bewegen. Diese Wirkungen sind Gegenstand späterer Betrachtungen, sie sollten bis dahin jedoch nicht ganz aus dem Auge verloren werden.

Experimenteller Befund: Eine konstante Kraft (erkennbar etwa durch eine immer gleich stark gedehnte Schraubenfeder) erzeugt an ein und demselben Körper eine konstante Beschleunigung.

Experimenteller Befund: Die von einer konstanten Kraft erzeugte Beschleunigung hängt von einer Eigenschaft des Körpers ab, die wir seine »Masse« nennen. Die Masseneinheit 1 Kilogramm wird dargestellt durch den Internationalen Kilogrammprototyp. (Dies ist die Definition der Maßeinheit für die Masse. Neben dieser Definition der Einheit ist bei jeder physikalischen Größenart noch die Definition des Vielfachen nötig. Sie lautet in diesem Fall: Ein Körper, der durch die Vereinigung von zwei Massen mit je 1 kg entsteht, hat die Masse 2 kg usw. Damit sind wir im Prinzip in der Lage, Körper von beliebiger definierter Masse herzustellen, so genannte Massensätze.)

Mit Hilfe eines solchen Massensatzes kann man zeigen: Die Beschleunigung, die von derselben Kraft an Körpern unterschiedlicher Masse hervorgebracht wird, ist deren Masse umgekehrt proportional.

Die Masse eines Körpers erweist sich also als ein Maß für dessen Trägheit: Ein Körper doppelter Masse ist doppelt so träge und erfährt daher bei gleicher Krafteinwirkung nur die halbe Beschleunigung.


Damit können wir nun definieren: Die auf einen Körper wirkende Kraft ist gleich dem Produkt aus Masse und Beschleunigung:

F = m a

Diese Gleichung heißt noch immer 2. Newtonsches Axiom, obwohl sie inzwischen als Messvorschrift für Kräfte dient und obwohl Newton sie nie so formuliert hat.

Diese Definition ist natürlich nicht willkürlich, sie beruht vielmehr auf einem Naturgesetz, nämlich auf der umgekehrten Proportionalität von Masse und Beschleunigung bei konstanter Kraft, und dieses Gesetz findet sich auch in obiger Definition wieder.

Die Gleichung F = m a besagt auch, dass die Kraft ein Vektor von der Richtung der Beschleunigung ist. Logischer ist es allerdings zu sagen: »Die Beschleunigung hat die Richtung der Kraft«, denn die Kraft ist ja die Ursache der Beschleunigung.

Aus der Definitionsgleichung der Kraft (»Kraftgleichung«) ergibt sich auch ihre Maßeinheit kg m/s2. 1 kg m/s2 wird als 1 Newton (N) bezeichnet. 1 Newton ist jene Kraft, die erforderlich ist, einem Körper von der Masse 1 kg die Beschleunigung von 1 m/s2 zu erteilen.

Die »Kraftgleichung« kann in verschiedenen Formen geschrieben werden.

1. In Vektorform:



2. In Komponenten und kartesischen Koordinaten:



Dabei sind die zweiten Ableitungen der Ortskoordinaten nach der Zeit die Bahnbeschleunigungen in Richtung der Koordinatenachsen.


3. In ebenen Polarkoordinaten:




Die in eckigen Klammern stehenden Terme sind die Radialbeschleunigung bzw. die Transversalbeschleunigung. (Siehe dazu: Wikibook »Kinematik« unter »Beschleunigung«.)


4. In »natürlichen Koordinaten« (Begleitendes Dreikant) – (Hier ohne Beweis angeführt):




ρ ist der Krümmungsradius der Bahnkurve im betrachteten Punkt.

Bei bekannter Kraft und bekannter Masse können daraus durch Integration die entsprechenden Bewegungsgleichungen gewonnen werden.


Beispiel: Eine Rakete erfahre durch den Ausstoß von Materie nach hinten eine konstante Antriebskraft vom Betrag F. Die Masse der Rakete ohne Brennstoff sei mR, die Masse des Brennstoffs zur Zeit t = 0 sei mB. Die Geschwindigkeit des Massenverlustes durch Ausstoß der Verbrennungsgase sei k. Man berechne unter Vernachlässigung der Reibung die Bahngeschwindigkeit der Rakete als Funktion von t.

Aus a = F/m folgt mit m = mR + mB - k t:



und



Für t = 0 ergibt sich C = v(0), also:



Der Brennstoff ist verbraucht, wenn k t = mB. Dann hat die Rakete ihre Endgeschwindigkeit vE erreicht:



Benutzen wir (vorgreifend unter Hinweis auf den Impulssatz) noch, dass F = k vG ist, wobei vG die Ausströmgeschwindigkeit der Verbrennungsgase ist, dann erhalten wir:



Die Veränderung der Masse im Laufe der Zeit hat die Berechnung zwar etwas komplizierter, aber nicht prinzipiell unmöglich gemacht. Dies rührt daher, dass das »Kraftgesetz« eine Differentialgleichung ist, in der nur Momentanwerte auftreten: der Momentanwert der Kraft, der Momentanwert der Masse, der Momentanwert der Beschleunigung. Es ist daher keine grundsätzlich unüberwindliche Schwierigkeit, eine der drei Größen zu berechnen, wenn die beiden anderen zwar veränderlich, aber als Funktion der Zeit gegeben sind.


 

Das Gesetz von Wirkung und Gegenwirkung (actio = reactio)

[Bearbeiten]

Dies ist das 3. Newtonsche Axiom:

Übt ein Körper A auf einen Körper B die Kraft F aus, so übt B auf A die entgegengesetzte Kraft – F aus.

Wie man sich leicht überzeugen kann, ist es schlicht unmöglich, eine Kraft auszuüben, wenn keine Gegenkraft vorhanden ist, die »dagegenhält«. (Man nennt das auch offene Türen einrennen.) Dennoch gibt es da Probleme:

1. Tauziehen: Wenn beide Mannschaften nach Newton stets gleich stark am Tau ziehen, wieso kann es dann einen Sieger geben?

2. Newtons Esel: Newtons Esel hatte vom 3. Axiom seines Herrn erfahren und weigerte sich fortan, seinen Karren zu ziehen: »Was soll ich mich anstrengen und an dem Karren ziehen? Er zieht stets gleich stark dagegen – wie sollte ich ihn dann in Bewegung bringen können?« Newton soll – ganz unwissenschaftlich – den Esel mit einem Stock dazu gebracht haben, es dennoch zu versuchen. Wie wäre hier zu argumentieren?


 

 

Bewegungsgröße, Impuls und Kraftstoß

[Bearbeiten]

Aus F = m dv/dt folgt F dt = m dv und für m = konst.: F dt = d(m v).

Die Größe m v wurde von Newton »Bewegung« genannt.

(Im Original: Erklärung 2. Die Größe der Bewegung wird durch die Geschwindigkeit und die Größe der Materie vereint gemessen.

Die Bewegung des Ganzen ist die Summe der Bewegungen der einzelnen Teile. Daher ist sie eine doppelte in einem doppelt so großen Körper bei gleicher Geschwindigkeit und eine vierfache in einem doppelt so großen Körper bei doppelter Geschwindigkeit. – A. a. O.)

Später wurde m v – und das ist angemessener – als »Bewegungsgröße« bezeichnet. Noch später hat sich die Bezeichnung »Impuls« (Formelzeichen p) durchgesetzt, obwohl diese zunächst einer anderen Größe vorbehalten war, die nun namenlos wurde. Ich komme gleich darauf zurück.

Damit kann man nun – immer noch die Konstanz der Masse vorausgesetzt – schreiben:

F dt = dp

Stellen wir uns nun vor, dass auf den Körper (oder Massenpunkt) im Zeitintervall t1 bis t2 eine veränderliche Kraft F = F(t) einwirkt, so gilt:



Das Zeitintegral der Kraft, das früher Impuls genannt wurde, nenne ich Kraftstoß. Dann gilt: Die Impulsänderung des Körpers ist gleich dem auf ihn ausgeübten Kraftstoß.

Dieser Satz ist nicht zuletzt für die Berechnung von Stoßvorgängen interessant. Stoßen zwei Körper zusammen, so üben sie wegen »actio = reactio« jederzeit entgegengesetzt gleiche Kräfte und damit auch entgegengesetzt gleiche Kraftstöße auf einander aus. Folglich sind die Impulsänderungen, welche die beiden Körper dadurch erfahren, entgegengesetzt gleich. Die Summe ihrer Impulsänderungen ist null, und ihr Gesamtimpuls bleibt bei dem Stoß unverändert (»Impulserhaltungssatz«).

(Vorschau: Der Impulserhaltungssatz gehört zu den wichtigen Erhaltungssätzen der Physik. Seine besondere Bedeutung beruht darauf, dass er auch dann noch gilt, wenn der mechanische Energieerhaltungssatz nicht gilt, weil ein Teil der mechanischen Energie in Wärme umgesetzt wird. So können mit dem Impulserhaltungssatz z. B. auch nicht-elastische Stoßvorgänge berechnet werden.)

Ich möchte nun noch näher auf den Fall eingehen, dass sich die Masse des Körpers während der Einwirkung einer Kraft verändert. Hierzu wird meist etwas leichtfertig behauptet, es sei dann das Kraftgesetz F = m dv/dt zu ersetzen durch das Gesetz F = d(m v)/dt= dm/dt v + m dv/dt. – Wir wollen uns das etwas genauer ansehen.

Nehmen wir an, der Impuls eines Körper verändere sich unter der Einwirkung einer Kraft von p1 = m1 v1 nach p2 = m2 v2 = (m1 + Δm)(v1 + Δv) = m1 v1 + m1 Δv + Δm v1 + Δm Δv


Bei Vernachlässigung des letzten Summanden ergibt sich

Δp = p2 - p1 = m1 Δv + Δm v1

Das erste Glied der rechten Seite ist die Impulserhöhung durch die Zunahme der Geschwindigkeit, das zweite die Impulserhöhung durch die Massenzunahme, wobei deren Impulserhöhung so in die Bilanz eingeht, als sei die Masse Δm von 0 auf v1 beschleunigt worden. Das heißt aber: Die Gleichung gilt nur, wenn die Masse Δm entweder zuvor gar nicht vorhanden war (und z. B. durch relativistische Massenzunahme entstanden ist), oder aber – wenn die Masse von außen dem Körper hinzugefügt wurde – sie vorher die Geschwindigkeit 0 hatte. Dies ist z. B. dann der Fall, wenn ein Lastwagen oder ein Förderband mit Materie beladen wird, die senkrecht von oben herabfällt, während sich der Lkw bzw. das Förderband vorbeibewegt. Die Gleichung gilt dagegen nicht, wenn z. B. ein Raumfahrzeug im Weltraum Materieteilchen »aufsammelt«, die ihm mit einer Eigengeschwindigkeit entweder entgegenfliegen oder das Fahrzeug von hinten einholen.

Entsprechendes gilt, wenn der Körper Masse verliert, also Δm negativ ist.

Es ist also eine gewisse Vorsicht im Umgang mit dieser Gleichung geboten, selbst in der Relativitätstheorie, wo die hinzukommende Masse nicht nur auf die Geschwindigkeit der vorher schon vorhandenen beschleunigt werden muss, sondern wo darüber hinaus auch die der Masse entsprechende Energie E = Δm c2 aufgebracht werden muss. (Die Nichtbeachtung dieser Tatsache führte einst zu der absurden Vorstellung, ein schnell bewegter Körper habe in Bewegungsrichtung eine größere Masse [»longitudinale Masse«] als quer dazu [»transversale Masse«]).

 

Arbeit, Energie und Leistung

[Bearbeiten]

Arbeit

[Bearbeiten]

Wir müssen zunächst eine Anleihe bei der Experimentalphysik machen: Eine Kraft F wirke an einem bestimmten Punkt (»Angriffspunkt«) auf einen Körper ein. Wie wir oben gesehen haben, ist dies überhaupt nur möglich, wenn dort auf irgendeine Weise eine gleich große Gegenkraft – F entstehen kann. Wir haben es daher immer, wenn eine Kraft im Spiel ist, mit zwei Kräften zu tun.

Wird nun der Angriffspunkt der beiden Kräfte verschoben, dann gibt es zwei Möglichkeiten. Entweder die Verschiebung erfolgt in Richtung der Kraft F (oder in einem spitzen Winkel dazu), oder in entgegengesetzter Richtung (oder in einem stumpfen Winkel zur Kraft F). Den Fall, dass die Verschiebung senkrecht zu den beiden Kräften erfolgt, stellen wir zunächst zurück. Im ersten Fall (spitzer Winkel) können wir annehmen, dass die Kraft F die Ursache der Verschiebung ist; im zweiten Fall wird es die Kraft – F sein. Nehmen wir zunächst den ersten Fall. Bei genauer Betrachtung werden wir feststellen, dass da etwas Besonderes geschieht:

  • Entweder wird der Körper, an dem die Kraft angreift, beschleunigt,
  • oder er wird elastisch (d. h. reversibel) verformt,
  • oder er wird plastisch (d. h. irreversibel) verformt,
  • oder er wird (nach kurzer Beschleunigung) mit konstanter Geschwindigkeit bewegt,
  • oder er wird senkrecht (oder schräg) nach oben bewegt.


Frage: Was ist in den fünf verschiedenen Fällen die Gegenkraft, und wer oder was kommt für sie auf?


Allen diesen Fällen gemeinsam ist, dass sie nicht »von selbst« und gleichsam kostenlos ablaufen. In jedem Fall muss ein Etwas wirken, das Leibniz (1646-1716) eine »lebendige Kraft« genannt hat, die Körperkraft eines Lebewesens, die Kraft einer »Kraftmaschine« (besser: Arbeitsmaschine), oder die Kraft einer bewegten Substanz, z. B. Wasser oder Wind oder auch eines bewegten Festkörpers. Und in jedem Fall wird, wie wir heute sagen, im physikalischen Sinn eine »Arbeit verrichtet«, für die gleichsam als Gegenleistung irgendeine offensichtliche Veränderung eintritt, die nützlich oder unnütz oder auch schädlich sein kann, die aber in keinem Fall anders zu erreichen ist als eben durch Arbeitsaufwand.

Nach zahlreichen Versuchen und manchem Irrweg sind die Physiker schließlich übereingekommen, als Maß für die Größe der Arbeit das Produkt aus Kraft und Verschiebung anzusehen – solange Kraft und Verschiebung dieselbe Richtung haben und die Kraft konstant ist. Dann gilt also:


Arbeit W = Kraft F mal Verschiebung (oder Weg) s


Die SI-Einheit der Arbeit ist das Joule (J). 1 Joule = 1 Newtonmeter (Nm).


Hat die Kraft nicht dieselbe Richtung wie die Verschiebung, dann wirkt nur die Komponente der Kraft an der Arbeit mit, die in Richtung der Verschiebung liegt. Die senkrecht zur Verschiebung wirkende Kraftkomponente dagegen bringt keine der oben beschriebenen Veränderungen hervor, und daher wirkt sie ohne Arbeitsaufwand.


Es ist daher



Der Term auf der rechten Seite ist das Skalarprodukt der Vektoren F und s und somit ist



Wir betrachten nun den Fall, dass die Verschiebung längs einer gekrümmten Raumkurve erfolgt und sich zudem der Winkel α und der Betrag F der Kraft während der Verschiebung von A nach B ändern.



Wir zerlegen dann das Kurvenstück (den Bogen) in n gleiche Teile und ersetzen jedes Bogenstück Δsi (mit i = 1, 2, ... n) durch den Sekantenvektor Δri.



Dann gilt für die auf dem i-ten Bogenstück verrichtete Arbeit



wobei Fi der Kraftvektor ist, der in einem beliebigen Punkt des Bogenstücks Δsi wirkt. Für die gesamte Arbeit gilt dann



Die Näherung wird beliebig genau, wenn man die Anzahl n der Teilstücke entsprechend vergrößert, das heißt, es ist



wofür man abkürzend schreibt



Die Berechnung des Integrals setzt voraus, dass F als (integrierbare) Funktion von r gegeben ist: F = F(r). Ist F durch seine kartesischen Komponenten beschrieben, die wiederum Funktionen kartesischer Koordinaten sind, also in der Form



so schreibt man dr in der Form



und erhält für das Skalarprodukt F dr den Ausdruck



Das »Arbeitsintegral« lässt sich dann in drei skalare Integrale zerlegen:



Ist schließlich F als Funktion der Bogenlänge s der Kurve gegeben (wobei die Bogenlänge von einem beliebigen Punkt O aus gemessen wird), so erhält man mit dr = ds



Irritierend an diesem Integral ist, dass ds das Differential eines – abgesehen von Geraden - nicht existierenden Vektors s ist. Dennoch ist es in mancher Hinsicht nützlich.

 

Beschleunigungsarbeit

[Bearbeiten]

Auf einen Körper der Masse m wirke längs einer beliebigen (geradlinigen oder gekrümmten) Wegstrecke eine Kraft F ein, deren Betrag und Richtung sich beliebig verändern kann. Diese Kraft erzeugt am Körper eine Beschleunigung a, für deren momentanen Wert stets gilt:



Folglich ist die am Körper verrichtete Arbeit



und mit  








und speziell für v1 = 0 und v2 = v



Das bedeutet: Unabhängig vom zeitlichen Verlauf der Beschleunigung (und dem der Kraft) ist das Produkt



gleich der bei der Beschleunigung aufgewendeten Arbeit W.

Exkurs: Verformungsarbeit

[Bearbeiten]

Um die Voraussetzungen für einen wichtigen Gedankenversuch zu schaffen, soll hier die Verformungsarbeit untersucht werden.


Ein Körper werde unter der Wirkung einer Kraft (plastisch oder elastisch) verformt. Er reagiert darauf mit einer Gegenkraft. Im Fall der plastischen Verformung eines (amorphen) Körpers ist die Reaktionskraft der innere Reibungswiderstand. Die aufgewendete Arbeit wird dabei in Wärme umgesetzt. Der Vorgang kann nicht rückgängig gemacht werden; er ist irreversibel.

Bei der elastischen Verformung eines (kristallinen) Körpers reagiert die Kristallstruktur des Körpers auf die Verformung mit einer elastischen Gegenkraft. Beim Verschwinden der äußeren, verformenden Kraft machen die inneren Kräfte die Verformung rückgängig.

In beiden Fällen verrichtet die äußere Kraft die Arbeit


weil die Verformung in Richtung der Kraft erfolgt.

Bei der elastischen Verformung gilt unterhalb der »Elastizitätsgrenze« das HOOK-Gesetz: Der Betrag s der Verformung ist dem Betrag F der Kraft proportional:



Die Proportionalitätskonstante k heißt Richtgröße, bei Federn auch Federkonstante.

Im stationären Fall (d. h. wenn die Verformung zum Stillstand gekommen ist) sind äußere Kraft und elastische Gegenkraft gleich. Um die Verformung zu vergrößern, muss die angreifende Kraft ein wenig (beliebig wenig) größer sein als die elastische Gegenkraft. Der Überschuss dient dann zunächst der Beschleunigung der sich verformenden Teile des Körpers (z. B. der Schraubenfeder), bis sich ein neuer Gleichgewichtszustand einstellt. Verringert man die angreifende Kraft ein wenig, so wird ein kleiner Teil der Verformung rückgängig gemacht, bis wieder Gleichgewicht herrscht. Der Vorgang kann also (im Gegensatz zur plastischen Verformung) in beiden Richtungen ablaufen, er ist reversibel.

Für die verrichtete Verformungsarbeit gilt dann:



wobei se der Verformungsweg im Endzustand ist.



Energie

[Bearbeiten]

Wir machen nun folgenden Gedankenversuch Eine elastische Schraubenfeder mit der Federkonstanten k1 werde am linken Ende fixiert und dann von Hand um die Strecke 0 – x1 zusammengedrückt und in dieser Stellung arretiert. Dazu ist die Arbeit



aufzuwenden. Dann werde ein Körper der Masse m, der reibungsfrei auf der horizontalen Unterlage gelagert ist, vor die rechte Stirnfläche der Feder gebracht. Dann werde die Arretierung der Feder gelöst. (Die Masse der Feder wird im Folgenden vernachlässigt.)



Die Feder entspannt sich bis zum Punkt 0 und beschleunigt dabei den Körper. Dabei übt die Feder in jeder Phase auf den Körper eine Kraft von gleichem Betrag aus, wie sie selbst beim Zusammendrücken im gleichen Zustand erfahren hatte. Folglich verrichtet die Feder beim Entspannen an dem Körper eine Arbeit von gleichem Betrag wie die, welche beim Zusammendrücken von außen aufgewendet wurde. Die aufgewendete Arbeit wurde also gleichsam in der Feder gespeichert und kann beim Entspannen von der Feder wieder abgegeben werden.

Dies wird auch durch folgende Rechnung bestätigt. Für die Geschwindigkeitszunahme dv des Körpers in der Zeit dt in irgendeinem Punkt P(x) gilt:


wobei v = - dx/dt die Geschwindigkeit des Körpers in der jeweiligen Phase ist. (Das Minuszeichen berücksichtigt, dass v entgegengesetzt zur +X-Achse gerichtet ist.)

Aus obiger Gleichung folgt:


und



Das bedeutet: Der Körper wird auf eine Geschwindigkeit beschleunigt, die gerade so groß ist, dass die dazu benötigte Arbeit gleich der ursprünglich zum Spannen der Feder gebrauchte Arbeit ist. Die Feder hat also die in ihr gespeicherte Arbeit vollständig auf den Körper übertragen.

Im zweiten Teil des Versuchs trifft der Körper auf eine (entspannte) Feder mit der Federkonstanten k2. Er wird dann auf die Geschwindigkeit null gebremst, während seine Trägheitskraft die Feder um die Strecke 0 - x2 spannt.



Es gilt nun analog




und schließlich



Die Feder wird also gerade so weit gespannt, dass die dazu benötigte Arbeit gleich der Arbeit ist, die zum Beschleunigen des Körpers erforderlich war. Diese wiederum ist – wie oben gezeigt wurde – gleich der zum Spannen der Feder investierte Arbeit.

Zusammenfassung: Die ursprünglich zum Spannen der Feder aufgewendete Arbeit wird zunächst vollständig zum Beschleunigen des Körpers verwendet. Danach wird die Arbeit – wiederum unverändert – zum Spannen der zweiten Feder benutzt. Der Betrag der ursprünglich aufgewendeten Arbeit bleibt bei den beiden Umwandlungen unverändert. Der gesamte Vorgang kann umgekehrt und beliebig oft wiederholt werden. Die gespannte Feder und der bewegte Körper sind also fähig, ihrerseits Arbeit zu verrichten, und zwar in gleichem Ausmaß wie die zuvor an ihnen verrichtete Arbeit.

Die Fähigkeit der gespannten Feder und des bewegten Körpers, die an ihnen verrichtete Arbeit auf einen anderen Körper zu übertragen, heißt Arbeitsfähigkeit oder Energie. Insbesondere wird die Energie eines elastisch verformten Körpers als potentielle Energie bezeichnet, die Energie eines bewegten Körpers als kinetische Energie oder Bewegungsenergie. Die zu Beginn des Gedankenversuchs aufgewendete Arbeit wurde also erst in Arbeitsfähigkeit (potentielle Energie) der Feder, dann in kinetische Energie des Körpers umgesetzt. Durch eine genauere Untersuchung des Vorgangs lässt sich zeigen, dass während der Energieübertragung (wenn also die Feder erste teilweise entspannt und der Körper erst teilweise beschleunigt wurde) die Summe aus der momentanen potentiellen Energie der Feder und der momentanen kinetischen Energie des Körpers konstant ist. Für die Arbeit oder Energie gilt also eine Art von Erhaltungsgesetz, das zu den wichtigsten Gesetzen der Physik gehört.

Die Energie wird in den gleichen Einheiten gemessen wie die Arbeit.

 

Leistung

[Bearbeiten]

Definition: Wird in der Zeit Δt die Arbeit ΔW verrichtet, so ist die mittlere Leistung in dieser Zeitspanne:



Für Δt gegen null erhält man daraus die (momentane) Leistung P zu dem betrachteten Zeitpunkt:



 

Potentielle Energie, Potentialfelder

[Bearbeiten]

Bestimmte Kraftfelder (z. B. Gravitationsfelder und elektrostatische Felder) haben eine besondere Eigenschaft, die hier am Beispiel des Gravitationsfeldes dargestellt werden soll: In einem Gravitationsfeld erfährt eine Masse vom Gravitationszentrum eine anziehende Kraft. Um die Masse vom Zentrum weg zu bewegen (sie zu »heben«), muss Arbeit von außen aufgewendet werden (»Hubarbeit«). Dafür gewinnt die Masse »potentielle Energie« (Energie der Lage). Bewegt sich dagegen die Masse auf das Zentrum zu, so nimmt ihre potentielle Energie ab; dafür wird die Masse beschleunigt und gewinnt im »freien Fall« (d. h. ohne Luftwiderstand) in gleichem Maße kinetische Energie. Also:

In einem Potentialfeld ohne Reibungskräfte ist die Summe aus kinetischer und potentieller Energie eines Körpers konstant.

Bewegt man die Masse im Feld auf einer geschlossenen Kurve herum, so ist dazu insgesamt keine Arbeit aufzuwenden.

Bewegt man die Masse von einem Punkt P1 zu einem Punkt P2, so ist die aufzuwendende Arbeit W vom Weg unabhängig. Bewegt man dann den Körper auf irgendeinem Weg zum Ausgangspunkt zurück, so ist die auf dem Rückweg verrichtete Arbeit gleich –W und daher die gesamte Arbeit gleich null. Den beiden soeben beschriebenen Effekten liegt also dieselbe Eigenschaft des Feldes zugrunde.

Bewegt sich eine Masse aus dem Unendlichen zu einem bestimmten Punkt P im Feld, so wird dabei Energie frei; die von außen »aufzuwendende« Arbeit ist negativ. Die dabei frei werdende Energie ist ebenfalls vom Weg unabhängig, sie hängt jedoch von der Masse des Körpers ab, und zwar ist sie seiner Masse proportional. Dividiert man die (hier negative) Arbeit W durch die Masse m des Körpers, so ist das Ergebnis Φ eine Größe, die nur noch von der Lage des Punktes P abhängt. Diese Größe – die massebezogene Arbeit – heißt das Potential des Punktes P.

ΦP = W/m

Das Potential der Punkte eines Gravitationsfeldes ist negativ.

Aus der Definition des Potentials folgt: Ein Körper der Masse m hat in einem Punkt P mit dem Potential Φ gegenüber dem Unendlichen die potentielle Energie Epot = m Φ.

Die (Gravitations-)Feldstärke g ist die massebezogene Kraft, die das Feld auf eine Masse ausübt:

g = F/m

Wird die Masse durch eine von außen ausgeübte Kraft um die Strecke dr verschoben, so ist die dabei verrichtete Arbeit dW = - F dr = - m g dr und dΦ = dW/m = - g dr.

Der Zusammenhang zwischen Feldstärke und Potential wird im Rahmen des Wikibooks »Vektoranalysis« ausführlich behandelt. [2].  

 

Zentralkräfte und Flächensatz

[Bearbeiten]

Eine Zentralkraft ist eine Kraft, die stets auf denselben Punkt hin gerichtet ist. Macht man diesen Punkt zum Koordinatenursprung, dann ist die Zentralkraft F = f(x, y, z) r, wobei f stets einen negativen Wert hat.

Für Zentralkräfte kann man einen wichtigen Satz ableiten, der neben dem Energiesatz ein weiteres Integral des dynamischen Grundgesetzes darstellt (also eine Differentialgleichung erster statt zweiter Ordnung). Wir multiplizieren dazu das dynamische Grundgesetz vektoriell mit r:




Da r und F entgegengesetzt gerichtet (antiparallel) sind, ist ihr Vektorprodukt null. Folglich muss auch die rechte Seite der Gleichung null sein:



Das besagt lediglich, dass die Beschleunigung zum Radiusvektor parallel oder antiparallel ist. – Das Integral dieser Gleichung ist



wobei C irgendein konstanter Vektor ist.

Bestätigung durch Differenzieren:



wobei das erste Vektorprodukt null ist.


Das Vektorprodukt



hat eine anschauliche Bedeutung:

Der Betrag von r x dr ist die doppelte Fläche des Dreiecks, das vom Radiusvektor r in der Zeit dt überstrichen wird. Dividiert man diese Fläche durch dt, erhält man die auf die Zeit bezogene Fläche, das ist aber die so genannte Flächengeschwindigkeit. Die obige Gleichung besagt also, dass bei der Bewegung eines Körpers im Feld einer beliebigen Zentralkraft die Flächengeschwindigkeit konstant ist. Dies ist eine Verallgemeinerung des 2. Keplerschen Gesetzes.

Ferner: Das Vektorprodukt r x dr/dt ist ein Vektor, der auf r und dr und damit auf der Bahnkurve des Körpers senkrecht steht. Da dieser Vektor ein konstanter Vektor C ist, hat die Flächennormale von r und dr eine feste Richtung. Dies wiederum bedeutet, dass die Bahn eben ist.

Übrigens ist der Vektor m r x dr/dt nichts anderes als der hier offensichtlich konstante Drehimpuls des bewegten Körpers.


 

 

Gravitationsgesetz und Planetenbewegung

[Bearbeiten]

Natürlich ist der Weg auch umgekehrt gangbar: Man geht von einem – vermuteten oder experimentell begründeten - Gravitationsgesetz aus und leitet daraus das Verhalten von Himmelskörpern im Gravitationsfeld ab. Das Gravitationsgesetz lautet: Zwei schwere Massen m1 und m2 im Abstand r üben auf einander die anziehende Kraft


aus. Dabei ist f die Gravitationskonstante:

f = 6,672 59 N m2/kg2

Vektoriell geschrieben:



Wenn man von der Anziehung der Planeten untereinander absieht, sich ferner auf jeweils einen Planeten beschränkt und statt des gemeinsamen Schwerpunkts von Sonne und Planet den Mittelpunkt der Sonne als Drehzentrum und als Ursprung der Ortsvektoren r betrachtet, so gelten folgende Betrachtungen.

Zur Vereinfachung bezeichne ich die Sonnenmasse mit M und die Planetenmasse mit m. Die anziehende Kraft ist eine Zentralkraft, nämlich stets auf die Sonne gerichtet, und es gilt:



Die Feldstärke dieses Feldes ist:



Das Gravitationsfeld ist ein Potentialfeld mit der Potentialfunktion



(Zwischen Potentialfunktion und Feldstärkefunktion gilt die Beziehung grad Φ = - G, die zur Bestätigung der letzten Gleichung benutzt werden kann.)

Die Kraft F des Feldes erzeugt eine Beschleunigung a der Masse m, worauf diese mit der Trägheitskraft



reagiert. Diese Kraft wiederum ist der angreifenden Kraft F entgegengesetzt gerichtet.

In der soeben benutzten Bewegungsgleichung stellt m die träge Masse des Planeten dar, im Gravitationsgesetz dagegen ist m seine schwere Masse. Es ist keineswegs selbstverständlich, dass diese beiden Massen gleich (oder einander proportional) sind. Nachdem alle Versuche gescheitert waren, experimentell einen Unterschied zwischen träger und schwerer Masse nachzuweisen, hat man sich in der Physik daran gewöhnt, beide Massen als gleich zu betrachten, obwohl es keinen erkennbaren Grund dafür gab. Albert EINSTEIN hat die Gleichheit von schwerer und träger Masse zur Grundlage seiner Allgemeinen Relativitätstheorie gemacht. Die vielfältige experimentelle Bestätigung dieser Theorie bestätigt auch die Richtigkeit ihrer Voraussetzungen und auch damit die Gleichheit von schwerer und träger Masse.

Aus


folgt dann


oder


Die Lösung dieser vektoriellen Differentialgleichung 2. Ordnung wird einfacher, wenn wir auf die beiden uns bereits bekannten »Integrale« der Bewegungsgleichung zurückgreifen, auf den Energiesatz und den Flächensatz. Diese beiden Sätze sind nämlich Differentialgleichungen von lediglich 1. Ordnung. Der Energiesatz lautet:


Das bedeutet: Die Summe aus kinetischer und (negativer) potentieller Energie des Körpers ist konstant.

Der Flächensatz in Polarkoordinaten lautet (mit C = 2 A):



Um den zeitlichen Ablauf der Bewegung zu berechnen, muss man durch nochmalige Integration aus diesen beiden Gleichungen r und φ als Funktionen der Zeit bestimmen. Wenn wir uns aber darauf beschränken, die Gleichung der Bahnkurve herzuleiten, dann genügt es, aus den beiden Gleichungen die Zeit zu eliminieren.

Im Wikibook »Kinematik» (»Geschwindigkeit in ebenen Polarkoordinaten«) habe ich gezeigt, dass



woraus folgt:


Ferner ist


Damit ergibt sich aus dem Energiesatz:



Durch Trennung der Variablen r und φ erhält man:



Wir substituieren 1/r= u (dann wird – dr/r2 = du) und integrieren auf beiden Seiten:



Mit dem Integral nehmen wir nun folgende Umformungen vor:



woraus mit geeigneten Abkürzungen wird:




Damit ergibt sich



Beziehen wir π/2 in die Konstante bei φ mit ein, so erhalten wir




und schließlich



Dies ist die Gleichung eines Kegelschnitts in der Polarform, wobei der Pol des Koordinatensystems in einem der Brennpunkte liegt. Damit haben wir das 1. Keplersche Gesetz abgeleitet: Die Bahnen der Planeten (und die der Kometen) des Sonnensystems sind Kegelschnitte, in deren einem Brennpunkt die Sonne steht. Legt man die Polarachse so, dass sie zum nächstgelegenen Scheitel (also zum Perihel) zeigt, wird K = 0 und die Gleichung vereinfacht sich weiter zu:



Dabei ist

und



Der Kegelschnitt mit dieser Gleichung ist

eine Ellipse für ε < 1,

eine Parabel für ε = 1,

eine Hyperbel für ε > 1

Aus ε < 1 folgt:


oder


Die Bahnkurve ist also dann eine Ellipse, wenn die (konstante) Summe aus der kinetischen Energie des Körpers und seiner (negativen) potentiellen Energie negativ ist (siehe dazu den Energiesatz oben).

Die Bahnkurve ist eine Parabel, wenn diese Summe null ist und eine Hyperbel, wenn die Summe positiv ist.

Anders gesagt: Im Fall der Ellipse ist die Gesamtenergie des Körpers negativ, im Fall der Parabel null, im Fall der Hyperbel positiv.


 

Relativ zueinander bewegte Bezugssysteme

[Bearbeiten]

Inertialsysteme

[Bearbeiten]

Die ersten beiden Grundgesetze der Dynamik – das so genannte erste und zweite Newtonsche Axiom - gelten nur in einer besonderen Kategorie von Bezugssystemen, den so genannten Inertialsystemen.

Ein Inertialsystem ist ein Bezugssystem, das nicht beschleunigt ist und nicht rotiert. Für Newton war das Referenzsystem für Beschleunigungen und Rotationen der "absolute Raum". Nachdem sich herausgestellt hat, dass es diesen absoluten Raum so wenig gibt wie die absolute Zeit, benutzen wir als Referenzsystem die Gesamtheit der Massen des Weltalls. (Gäbe es diese nicht, wäre weder die Beschleunigung noch die Rotation eines Bezugssystems nachweisbar.)

Ein Inertialsystem ist daran erkennbar, dass drei freie Massenpunkte, die in drei nicht komplanare Richtungen geworfen werden, sich relativ zu ihm auf Geraden bewegen. (Zur Erinnerung: Freie Massenpunkte sind solche, auf die keine äußeren Kräfte einwirken. Nicht komplanare Vektoren liegen nicht in einer Ebene.)

Wegen der Allgegenwart der Schwerkraft auf der Erde ist es schwierig, freie Massenpunkte herzustellen. An der Gestalt der Bahnen, auf denen sich die drei Massenpunkte im Schwerefeld bewegen, kann man jedoch erkennen, ob sie sich ohne Schwerkraft geradlinig bewegen würden.

Alle anderen Bezugsysteme, die relativ zu einem Inertialsystem nicht beschleunigt sind und nicht rotieren, sind ebenfalls Inertialsysteme. Eine gleichförmige geradlinige Bewegung der anderen Bezugssysteme relativ zum ersten Inertialsystem ändert daran nichts.


 

Die GALILEI-Transformationen

[Bearbeiten]

Wir betrachten zwei relativ zueinander mit der Geschwindigkeit v bewegte Inertialsysteme, die aus zwei rechtwinkligen Koordinatensystemen und einer hinreichend großen Zahl von synchron gehenden Uhren bestehen. (Der gleichmäßige Ablauf der Zeit in den beiden Bezugssystemen ist eine Annahme, die bis 1905 als selbstverständlich galt, durch die Spezielle Relativitätstheorie Albert Einsteins jedoch als falsch entlarvt wurde. Für Relativgeschwindigkeiten v , die klein gegenüber der Lichtgeschwindigkeit c sind, kann man sie jedoch näherungsweise noch immer gelten lassen.)

Zur Vereinfachung nehmen wir (ohne Beschränkung der Allgemeingültigkeit) an, die Ursprünge der beiden Koordinatensystemen mögen zur Zeit t = 0 zusammenfallen. Dann lauten die so genannten GALILEI-Transformationen in Vektorform




Durch Differenzieren nach der Zeit ergibt sich daraus:



Wie man sieht, differieren die Geschwindigkeiten des Punktes P in den beiden Systemen um den konstanten Geschwindigkeitsvektor v (die so genannte Führungsgeschwindigkeit), während seine Beschleunigung in beiden Systemen dieselbe ist.

 

Gleichförmig linear beschleunigte Bezugssysteme

[Bearbeiten]

Wir betrachten nun ein Inertialsystem S und ein relativ dazu gleichförmig linear beschleunigtes System S'. Zur Vereinfachung treffen wir die üblichen Verabredungen: Die Beschleunigung des Systems S' beginne zur Zeit t = 0, wenn die Ursprünge der beiden Systeme zusammenfallen. Bei Bedarf kann man außerdem verabreden, dass die Achsen der beiden Systeme paarweise parallel sein sollen.



Dann lautet die Transformationsgleichung:



Durch zweimaliges Differenzieren nach der Zeit ergibt sich daraus nacheinander




Wie zu erwarten, ist nun auch die Beschleunigung des Punktes P in S' eine andere als in S, nämlich um die Beschleunigung des Systems S' kleiner.

Wenn der Punkt P ein Massenpunkt mit der Masse m ist, dann erfordert seine Beschleunigung im Inertialsystem S die Kraft



Für einen Beobachter im System S' aber verhält sich der Massenpunkt so, als ob die Kraft



auf ihn einwirkte, also eine um m a kleinere Kraft, obwohl auf den Massenpunkt nach wie vor nur die äußere (»eingeprägte«) Kraft F einwirkt.

Es lohnt sich, dieses Problem genau zu untersuchen. Bei irdischen Inertialsystemen ist die von außen wirkende (eingeprägte) Kraft praktisch immer die Gewichtskraft G, kurz: das Gewicht des Massenpunktes. Stellen wir uns nun vor, das System S' sei ein Abteil in einem Eisenbahnzug, das System S ein relativ zum Bahndamm ruhendes Inertialsystem. (Dabei werden – wie üblich – die Rotation der Erde um ihre Achse, ihre Rotation um die Sonne usw. vernachlässigt und angenommen, S sei unbeschleunigt.) Wir müssen nun zwei Fälle unterscheiden:

1. Der Massenpunkt sei im System S' frei – bis auf sein Gewicht, also ein frei fallender Massenpunkt. Wenn der Zug mit konstanter Geschwindigkeit (also unbeschleunigt) fährt, fällt der Massenpunkt in S' senkrecht nach unten. Wenn der Zug beschleunigt, bewegt sich der Massenpunkt auf einer nach hinten geneigten Geraden. Ein Beobachter in S' kann dies auf zweifache Weise interpretieren: Er kann annehmen, auf den Massenpunkt wirke eine zusätzliche, nach hinten gerichtete Kraft vom Betrag m a, die nur von einem horizontal nach hinten gerichteten Gravitationsfeld herrühren kann. Ein Beobachter in S weiß, dass diese Interpretation falsch ist und dass diese vermeintliche Kraft nicht existiert. (Darum spricht man hier oft von einer »Scheinkraft«.)

Der Beobachter in S' kann aber auch schließen, dass der beobachtete Effekt nicht von einer zusätzlichen Kraft herrührt, sondern von einer Beschleunigung seines Bezugssystems. Damit hätte er Recht. Es gibt jedoch für ihn im Inneren seines Bezugssystems (d. h. ohne einen Blick nach draußen) keine Möglichkeit, zwischen den beiden Alternativen zu unterscheiden. Für ihn ist ein beschleunigtes Bezugssystem gleichwertig mit einem nicht beschleunigten Bezugssystem in einem (zusätzlichen) Gravitationsfeld.

2. Der Massenpunkt sei auf irgend eine Weise mit dem System S' verbunden: er hänge z. B. an einem Faden von der Decke herab oder er liege in der rückseitigen Gepäckablage. Wenn der Zug nun beschleunigt, wird sich der Massenpunkt nach hinten bewegen (das »Pendel« hängt schief) bzw. sich nach hinten bewegen wollen (der Massenpunkt in der Gepäckablage drückt auf die Rückwand). In beiden Fällen übt das Bezugssystem auf den Massenpunkt eine beschleunigende Kraft aus, und der Massenpunkt reagiert mit einer Trägheitskraft dagegen. In diesem Fall sind beide Kräfte real und dem Betrag nach gleich m a.

Für den Beobachter in S' gibt es immer noch die beiden Möglichkeiten der Interpretation, und noch immer hat er keine Möglichkeit, im Inneren des Systems zwischen beiden zu unterscheiden.

Als nächstes nehmen wir an, beide Bezugssysteme befänden sich in einem senkrecht nach unten gerichteten Gravitationsfeld, dessen Feldstärke den Betrag g = G / ms habe, wobei G der Betrag der Gewichtskraft und ms die schwere Masse eines Massenpunktes ist. Das System S ruhe gegenüber der Erdoberfläche, ist also wieder ein Inertialsystem. Ein freier Massenpunkt erfährt dann in S eine nach abwärts gerichtete Beschleunigung vom Betrag a = G / mt, wobei mt die träge Masse des Massenpunktes ist. Da erfahrungsgemäß stets a = g ist, muss mt = ms sein, und wir können künftig einfach von der Masse m sprechen.

Wir betrachten nun drei Massenpunkte mi (i = 1, 2, 3), die zur Zeit t = 0 mit den Geschwindigkeiten vi vom Ursprung des Systems aus in drei nicht komplanare Richtungen geworfen werden. Ihre Bewegungsgleichungen im Systems S lauten dann:



Die Bahnkurven sind Wurfparabeln.

Das Bezugssystem S' dagegen falle frei nach unten, wobei es die Beschleunigung - g k erfährt. Die Transformationsgleichungen der drei Massenpunkte sind dann:



Im System S' bewegen sich die drei Massenpunkte also auf Geraden. Mit Hilfe einer Federwaage kann man zudem nachweisen, dass die Massenpunkte im System S' kräftefrei sind. Das frei fallende Bezugssystem S' erfüllt also die Kriterien eines Inertialsystems und ist für einen Beobachter im Inneren des Systems nicht von einem solchen zu unterscheiden. Also gilt:

Ein in einem Gravitationsfeld frei fallendes Bezugssystem ist einem im feldfreien Raum befindlichen Inertialsystem gleichwertig.

Auf ähnliche Weise kann man zeigen:

Ein im feldfreien Raum mit der Beschleunigung a beschleunigtes Bezugssystem ist gleichwertig mit einem Inertialsystem, das sich in einem Gravitationsfeld mit der Feldstärke - a befindet.

Diese Aussagen (und die dahinter stehende Annahme, dass die träge Masse eines Körpers gleich seiner schweren Masse ist) bilden die Grundlage der Allgemeinen Relativitätstheorie.

Gleichförmig rotierende Bezugssysteme

[Bearbeiten]

Wir betrachten nun ein Bezugssystem S' (i', j', k' ), das relativ zum Inertialsystem S(i, j, k) mit der konstanten Winkelgeschwindigkeit ω rotiert, wobei die Drehachse durch den gemeinsamen Ursprung der beiden Systeme gehen soll. Ihre Richtung ist durch den Vektor ω gegeben. Der Ortsvektor r eines Punktes P ist dann in beiden Systemen derselbe. Er habe in S die Komponenten x, y, z, in S' die Komponenten x', y', z' . Also ist



Die Geschwindigkeit des Punktes P im System S ist dann



Wenn wir die Geschwindigkeit des Punktes relativ zum Inertialsystem S aus seinen Koordinaten im Systems S' berechnen wollen, müssen wir berücksichtigen, dass sich auch die Einheitsvektoren des Systems S' relativ zu S bewegen, also Funktionen der Zeit sind. Folglich ist



Die ersten drei Summanden sind die Geschwindigkeit des Punktes P relativ zu S', die letzten drei Summanden sind die Geschwindigkeit eines in S' festen Punktes relativ zu S infolge der Bewegung des Systems S', also die so genannte Führungsgeschwindigkeit.

Für die Geschwindigkeit der Einheitsvektoren von S' gilt:



Beweis

Ein Ortsvektor r von konstanter Länge rotiere mit der Winkelgeschwindigkeit ω um eine Drehachse durch O.



Dann ist



wobei v die Bahngeschwindigkeit von P und t der Tangenteneinheitsvektor in P ist. Für v gilt


Der Tangenteneinheitsvektor t steht auf r und ω senkrecht. Daher ist



Damit ergibt sich schließlich



Somit gilt für die Führungsgeschwindigkeit



Mit




ergibt sich



Bezeichnen wir die Differentiation, bei der nur die Koordinaten des Vektors r nach der Zeit differenziert werden (also die Operation, welche die ersten drei Summanden hervorgebracht hat) mit



so kann man schreiben



Hier tritt in allen drei Termen derselbe Vektor r auf, der selbst völlig beliebig ist. Also gilt obige Gleichung auch für jeden beliebigen Vektor u, so dass wir hier eine allgemein gültige Rechenregel gewonnen haben:



Diese Rechenregel kann natürlich auch auf den Vektor dr/dt angewendet werden, wobei sie dann lautet



was wir gleich bei der Berechnung der 2. Ableitung benutzen werden. Dann erhalten wir mit



oder



schließlich



Der erste Term auf der rechten Seite ist die Relativbeschleunigung arel des Punktes P bezüglich des Inertialsystems S'. Der dritte Term ist die Führungsbeschleunigung a, d. h. die Beschleunigung, die ein im System S' fester Punkt relativ zu S hat. Dazu kommt nun ein dritter Term, der nur dann auftritt, wenn die Relativgeschwindigkeit des Punktes bezüglich S' nicht null und nicht parallel zur Drehachse ist. Dieser Term, das doppelte Vektorprodukt aus der Winkelgeschwindigkeit und der Relativgeschwindigkeit, heißt CORIOLIS-Beschleunigung aCor. Demnach ist die Gesamtbeschleunigung



Ist der Punkt P ein Massenpunkt mit der Masse m, dann lautet das Grundgesetz der Dynamik für ihn



und für einen Beobachter in S':



Zu der eingeprägten Kraft F (auf der Erde fast immer die Gewichtskraft) kommen noch zwei Kräfte hinzu. Für sie gilt das Gleiche wie das unter »Gleichförmig linear beschleunigte Bezugssysteme« über die zusätzliche Kraft Gesagte: Je nach den Bedingungen handelt es sich dabei um nicht real existierende Kräfte (»Scheinkräfte«) oder um Trägheitskräfte, die als Reaktion auf beschleunigende Kräfte auftreten. Der letzte Term ist die bekannte Zentrifugalkraft, der vorletzte Term die CORIOLIS-Kraft.

Schwingbewegungen

[Bearbeiten]
Wikibooks Dieses Buch wurde in den Wikibooks:Buchkatalog aufgenommen.


Einleitung

[Bearbeiten]

Eine Bewegung, deren Ablauf sich in gleicher oder sehr ähnlicher Form periodisch wiederholt, heißt Schwingbewegung (kurz auch: Schwingung). Bevor ich näher darauf eingehe, werfen wir einen Blick auf periodische mathematische Funktionen, die zur Beschreibung physikalischer Schwingungen dienen können.

Mathematischer Exkurs

[Bearbeiten]

Die einfachsten periodischen Funktionen sind sin φ und cos φ = sin (φ + π/2).

Lassen wir daneben auch komplexe Funktionen zu (was sich als sehr nützlich erweisen wird), so bietet sich als einfachste die Funktion z = eiφ an, wobei i die imaginäre Einheit ist, für die gilt: . Die Funktion z = eiφ wird definiert über die Vereinbarung, dass die bekannte Potenzreihe der Funktion ex auch für imaginäre Argumente gelten soll:

Daraus folgt

und


z = exp (iφ) ist demnach eine komplexe Zahl mit dem Realteil Re z = cos φ und dem Imaginärteil Im z = sin φ. z hat den Betrag 1 und das Argument φ und ist periodisch mit der Periodenlänge 2 π. In der Gaußschen Zahlenebene der komplexen Zahlen bewegt sich die Spitze des Zeigers z mit zunehmendem φ auf einem Kreis vom Radius 1 und kehrt für φ = 2 π an den Ausgangspunkt (φ = 0) zurück.

Die harmonische Schwingung

[Bearbeiten]

Betrachten wir nun einen Massenpunkt der Masse m, der z. B. durch Federn, Gummibänder oder sonst irgendwie in einem Ruhepunkt O elastisch fixiert ist. Elastisch bedeutet, dass die Fixierung nicht starr, sondern nachgiebig ist und dass bei Entfernung des Massenpunktes aus seiner Ruhelage Rückstellkräfte auftreten, deren Summe F auf O hin gerichtet ist und deren Betrag im einfachsten Fall proportional zur Auslenkung r ist. (r ist der von O ausgehende Ortsvektor des Massenpunktes.) Es sei also

wobei k ein Proportionalitätsfaktor ist, der auch Federkonstante genannt wird.

Die Rückstellkraft F bewirkt eine Beschleunigung a des Massenpunktes, für die das dynamische Grundgesetz gilt:



Durch Vergleich erhält man



Dies ist eine Differentialgleichung 2. Ordnung für die Vektorfunktion r(t). Sie besagt, dass die zweite Ableitung der gesuchten Funktion bis auf einen (positiven) Faktor k/m gleich der mit (-1) multiplizierten Stammfunktion ist.

In der Mathematik sind nur drei (eng miteinander verwandte) Funktionen mit dieser Eigenschaft bekannt, nämlich Sinus, Kosinus und die oben vorgestellte Exponentialfunktion. Wir versuchen daher die Gleichung mit dem Ansatz



zu lösen, wobei A ein konstanter Vektor und λ eine konstante reelle Zahl ist. (Über diese beiden Konstanten wird später verfügt.)

Dann ist



Einsetzen in die Differentialgleichung ergibt



Diese Bedingung (Bedingungsgleichung) kann durch geeignete Wahl der Konstanten λ erfüllt werden, was beweist, dass unser Ansatz richtig war. Das heißt: Nach geeigneter Bestimmung der Konstanten λ ist die gewählte Funktion eine Lösung der Differentialgleichung.

Der Vektor A kann durch Kürzen aus der Gleichung entfernt werden, was bedeutet, dass er für die Lösung der Gleichung irrelevant ist und daher beliebig gewählt werden kann. Nach Division durch m, A und die Exponentialfunktion (alle diese Größen sind ungleich null) erhält man die »charakteristische Gleichung«



mit den beiden Lösungen



Wir benutzen davon nur die positive Lösung. Bei der negativen Lösung rotiert der Zeiger z mit zunehmendem t rechts herum, was nichts prinzipiell Neues beiträgt. Es bleibt demnach die Lösung



Die Lösungsfunktion r(t) ist demnach ein komplexer Vektor, der aus dem Realteil Re r und dem Imaginärteil Im r besteht:



Wie man sich leicht überzeugen kann, erfüllen der Realteil und der Imaginärteil der Lösungsfunktion jeder für sich die gegebene Differentialgleichung. Die gefundene komplexe Lösungsfunktion ist also gleichwertig mit zwei verschiedenen reellen Lösungsfunktionen, nämlich mit



Da der Vektor A beliebig wählbar ist, kann er in der zweiten Lösung einen anderen Wert haben als in der ersten, also können wir für die zweite Lösung schreiben



Da jede der beiden Lösungen die Differentialgleichung erfüllt, gilt dies auch für ihre Summe. (Von dieser grundsätzlichen wichtigen Tatsache kann man sich durch Einsetzen in die Differentialgleichung überzeugen. Dabei erkennt man auch sofort ihren Grund.)

Eine allgemeinere (das heißt hier: umfassendere) Lösung der Differentialgleichung lautet also



Diese »allgemeinere« Lösung ist aber auch zugleich die allgemeine Lösung schlechthin, denn sie enthält genau zwei frei wählbare Konstanten, A und B. (Das entspricht dem Grundsatz, dass die allgemeine Lösung einer Differentialgleichung zweiter Ordnung zwei unabhängige Konstanten enthalten muss, entsprechend den zwei Integrationen, die zu ihrer Lösung im Prinzip nötig sind.)


Die Bedeutung der beiden Vektoren A und B findet man durch folgende Überlegung:

1. Setzt man t = 0, so findet man r (0) = A. Das heißt: A ist der Ortsvektor des Massenpunktes zur Zeit t = 0.

2. Bildet man dr/dt und setzt dann t = 0, so findet man: v (0) = B sqrt(k/m) und B = v(0) sqrt(m/k).

Damit ergibt sich die allgemeine Lösung in der Form:



Die Lösungsfunktion stellt eine „harmonische Schwingung“ dar.

A und B beschreiben die »Anfangsbedingungen« d. h. die frei wählbare Anfangssituation der Bewegung. Man kann nämlich den Massenpunkt zunächst beliebig aus seiner Ruhelage herausbewegen (Ortsvektor r(0) = A) und ihm zu irgendeinem Zeitpunkt, den man dann als Nullpunkt der Zeitskala nimmt, die Anfangsgeschwindigkeit v(0) erteilen.

Der Vektor r setzt sich also aus zwei Vektoren zusammen, welche die Richtung des Vektors r(0) bzw. v(0) haben, und deren Beträge eine Kosinus- bzw. eine Sinusfunktion der Zeit sind.



Diese beiden Vektoren bestimmen eine Ebene und in dieser Ebene bewegt sich der Massenpunkt. Die Bahnkurve ist also eine ebene Kurve. Dies war zu erwarten, da die Bewegung unter der Wirkung einer Zentralkraft erfolgt, die keine aus der Ebene hinausweisende Komponente hat.

Wir finden die Bahnkurve, indem wir Einheitsvektoren er und ev von der Richtung r(0) bzw. v(0) einführen. Die Koordinaten des Massenpunktes in diesem schiefwinkligen Koordinatensystem sind dann



woraus folgt



Dies ist die Gleichung einer Ellipse in schiefwinkligen Koordinaten, wenn die Koordinatenachsen die Richtungen konjugierter Durchmesser haben. Diese Voraussetzung ist hier erfüllt, da v(0) als Geschwindigkeitsvektor die Richtung der Kurventangente im Punkt mit dem Ortsvektor r(0) hat.

Die konjugierten Halbmesser der Ellipse sind r(0) und v(0) sqrt (m/k).

Hat v(0) die gleiche Richtung (d. parallel oder antiparallel) wie r(0), so ist die Schwingbewegung geradlinig.

Die Kreisfrequenz der Schwingung ist



ihre Frequenz ist


Gedämpfte harmonische lineare Schwingungen

[Bearbeiten]

Die bisher behandelte harmonische Schwingung ohne Reibung ist eine Idealisierung. In der Realität tritt bei jeder Bewegung ein Reibungswiderstand auf, und sei es nur der Luftwiderstand. Reibungsvorgänge sind sehr komplex und mathematisch nicht exakt beschreibbar. In Gasen und Flüssigkeiten ist der Reibungswiderstand erfahrungsgemäß bei kleinen Geschwindigkeiten annähernd der Geschwindigkeit proportional, bei großen Geschwindigkeiten wächst er etwa im Quadrat der Geschwindigkeit. Dagegen ist die Reibung fester Körper in weiten Grenzen von der Geschwindigkeit unabhängig.

Für die folgenden Untersuchungen nehmen wir an, dass die Reibungskraft der Geschwindigkeit proportional und der Bewegung entgegengesetzt gerichtet ist. Die auf den Massenpunkt wirkende Kraft ist dann insgesamt



wobei µ der Reibungskoeffizient ist.

Bei Beschränkung auf eine geradlinige Bewegung auf der X-Achse (oder parallel dazu) lautet die Differentialgleichung der Bewegung:



Zur Lösung verwenden wir denselben Ansatz wie oben, jedoch ohne den Faktor "i" im Exponenten, wodurch die Rechnung hier einfacher wird:



Die charakteristische Gleichung lautet dann:



Sie hat die Lösungen:



Für das Weitere kommt es darauf an, ob der Term unter der Wurzel positiv, negativ oder null ist. Dementsprechend sind drei verschiedene Fälle zu unterscheiden.


1. Fall: Die gedämpfte harmonische Schwingung

[Bearbeiten]

Für hinreichend kleine Reibung ist μ2 < 4 km; dann wird die Wurzel imaginär. Wie oben beachten wir die Lösung mit dem rechts herum rotierenden Zeiger nicht und gewinnen aus der anderen zwei unabhängige reelle Lösungen, deren Summe die allgemeine Lösung ist:



Es ist in jedem Fall möglich, zwei Größen C und δ so zu bestimmen, dass


ist.


Dann ist


und man sieht, dass es für jedes beliebige Wertepaar A, B genau ein Wertepaar δ, C gibt.

Nach Anwendung eines bekannten Additionstheorems kann die allgemeine Lösung so geschrieben werden:



Anmerkung: Eine gleichwertige Schreibweise der Lösung ist:


wobei

ist.


Wir werden von dieser Substitution später wiederholt Gebrauch machen. Für jene Fälle ist es nützlich, Folgendes festzuhalten:

Die Summe einer Sinus- und einer Kosinusfunktion mit gleichem Argument kann nach Belieben stets als eine phasenverschobene Sinus- oder Kosinusfunktion dargestellt werden. Die zweite Integrationskonstante ist dann der Phasenverschiebungswinkel δ


Es handelt sich bei der Lösung wieder um eine harmonische Schwingung, deren Amplitude jedoch exponentiell abnimmt.


Setzen wir – was ohne Beeinträchtigung der Allgemeingültigkeit möglich ist – den »Phasenverschiebungswinkel« (-δ) = 0, so hat die Schwingung die Anfangsamplitude C. Ihre Kreisfrequenz ist kleiner als die der ungedämpften Schwingung und nimmt für μ2 = 4 k m den Wert 0 an. Dann tritt der so genannte »aperiodische Grenzfall« ein, der als Nächstes behandelt wird.

2. Fall: Aperiodischer Grenzfall

[Bearbeiten]

Die charakteristische Gleichung hat in diesem Fall nur die Lösung λ = - µ/2m. Das ergibt für die Bewegungsgleichung die Lösung:



Diese Lösung hat jedoch nur eine Integrationskonstante und kann daher nicht die allgemeine Lösung sein. Aus der Theorie der Differentialgleichung ist jedoch bekannt, dass in diesem Fall auch eine Lösung ist, wovon man sich durch Einsetzen überzeugen kann. Die Allgemeine Lösung ist die Summe der beiden Lösungen und lautet:



Für t = 0 ergibt sich anfängliche Auslenkung x(0) = A. Eine Kurvendiskussion mit Bestimmung eventuell vorhandener Nullstellen (es gibt höchstens eine) sowie der Extremwerte und Wendepunkte (auch davon gibt höchstens je einen) ist zwar reizvoll, aber ein Glasperlenspiel, weil dieser Fall praktisch ja nicht vorkommt. Für diejenigen, die es trotzdem nicht lassen können, sei so viel verraten: Die Auslenkung kann zunächst noch zunehmen, irgendwann aber erreicht sie ein Maximum und geht danach asymptotisch gegen null (= Ruhelage). Es ist aber auch möglich (all das hängt von B ab), dass der Massenpunkt sich zunächst durch die Ruhelage hindurchbewegt, nach der anderen Seite ausschlägt und sich dann von dort der Ruhelage asymptotisch nähert.

 

3. Fall: Aperiodische Bewegung

[Bearbeiten]

Für µ2 > 4 k m ist der Term unter der Wurzel positiv und die charakteristische Gleichung hat zwei reelle Lösungen, die beide kleiner als null sind:



Diese beiden Lösungen bezeichnen wir mit und . Dann lautet die allgemeine Lösung



Dabei ist


    und    


Wie zu erkennen, ist



Die Kurve ist also die Summe der Kurven zweier abklingenden e-Funktionen, die sich asymptotisch der X-Achse nähern. Die Bedeutung von A und B findet man, indem man in der Lösungsfunktion und ihrer Ableitung t = 0 setzt.



Daraus folgt:


  und  


Zur Diskussion der möglichen Eigenschaften der Kurve:

  • Die Kurve hat für t = 0
    • eine horizontale Tangente, wenn
    • eine steigende Tangente, wenn
    • eine fallende Tangente, wenn
  • Im zweiten Fall (steigende Tangente) besitzt die Kurve an irgendeiner Stelle t > 0 eine horizontale Tangente.
  • Im dritten Fall (fallende Tangente) kann die Kurve an einer Stelle t > 0 eine Nullstelle (x = 0) besitzen.

Es können also auch hier die verschiedenen oben skizzierten Fälle eintreten.

 

Erzwungene Schwingungen

[Bearbeiten]

Ungedämpfte erzwungene Schwingungen

[Bearbeiten]

Bislang haben wir »freie Schwingungen« betrachtet, das sind Schwingbewegungen, bei denen – nachdem sie einmal angeregt wurden – der Massenpunkt nur noch unter dem Einfluss der elastischen Rückstellkraft steht.

Nun wollen wir annehmen, der Massenpunkt sei ständig einer äußeren Kraft ausgesetzt, deren Betrag sich – entsprechend einer Sinus- oder Kosinusfunktion - periodisch ändert. Dann spricht man von einer »erzwungenen Schwingung«.

Wir beschränken uns wieder auf eindimensionale (lineare) Schwingungen und nehmen an, dass auch die »Störungskraft« in Schwingungsrichtung wirkt. Die Differentialgleichung der erzwungenen Schwingung lautet dann:

Dies ist eine (wegen des Vorhandenseins von F(t)) »inhomogene« lineare Differentialgleichung 2. Ordnung. Nach einem Satz aus der Theorie der Differentialgleichungen erhält man die allgemeine Lösung der inhomogenen Gleichung, indem man zur allgemeinen Lösung der homogenen Gleichung (mit F(t) = 0) eine »partikuläre« (d. h. spezielle, nicht-allgemeine) Lösung der inhomogenen Gleichung addiert. Dieser Satz ist unmittelbar einleuchtend: Die allgemeine Lösung der homogenen Gleichung macht die linke Seite der Differentialgleichung zu null. Die partikuläre Lösung der inhomogenen Gleichung macht die linke Seite der Gleichung gleich F(t). Daher erfüllt die Summe der beiden Lösungen die inhomogene Gleichung. Da die Summe zwei frei wählbare Konstanten enthält (sie sind in der allgemeinen Lösung der homogenen Gleichung enthalten), ist sie die allgemeine Lösung der inhomogenen Gleichung.

Für die »Störfunktion« F(t) wählen wir die einfachste periodische Funktion: A cos ω t.

Da wir die allgemeine Lösung der homogenen Gleichung bereits kennen, brauchen wir jetzt nur noch eine partikuläre Lösung der inhomogenen Gleichung zu suchen.

Wir wählen für die Lösung den Ansatz



und erhalten die charakteristische Gleichung



und daraus:



wobei



die Kreisfrequenz der ungedämpften Schwingung ist.

Somit lautet die partikulare Lösung der inhomogenen Gleichung:



Wie man sieht, enthält die partikuläre Lösung keine frei wählbare Konstante.)

Interpretation: Der Massenpunkt schwingt mit der Kreisfrequenz der Störfunktion. Die Amplitude der erzwungenen Schwingung geht für ω gegen ω0 gegen unendlich. Wenn die Kreisfrequenz der von außen einwirkenden Kraft gleich der Eigenfrequenz des schwingenden Systems ist, spricht man von »Resonanz«. Das unbeschränkte Anwachsen der Amplitude bezeichnet man als »Resonanzkatastrophe«.

Zwar kann es in besonderen Fällen durch ungewöhnlich große Amplituden der Schwingung im Resonanzfall tatsächlich zu einer Katastrophe kommen, aber es kann in der Realität aus mehreren Gründen keine unendlich großen Amplituden geben:

  • Es gibt keine Bewegung ohne Reibung und damit ohne Dämpfung,
  • der schwingende Körper stößt bald an die von der Umgebung gesetzten Grenzen,
  • eine Schwingung mit unendlich großer Amplitude benötigte dazu eine unendlich große Energie, welche die Störkraft aufzubringen hätte. Dazu bräuchte sie eine unendlich lange Zeit. Zudem gibt es keinen unbegrenzten Energievorrat.


Nun addieren wir zu der partikulären Lösung noch die allgemeine Lösung der homogenen Differentialgleichung und erhalten so die allgemeine Lösung der inhomogenen Differentialgleichung:



Nun wählen wir möglichst einfache Anfangsbedingungen, aus denen dann die Konstanten C und D bestimmt werden: Es sei x(0) = 0 und v(0) = 0. Damit erhalten wir:



und damit



Wir wollen nun das Verhalten der Funktion in der Nähe des Resonanzpunktes näher betrachten. Dazu wenden wir folgendes Additionstheorem des Kosinus an:



Es sei nun eine kleine Zahl 2δ. Dann ist



Damit erhalten wir



Interpretation: Die Gleichung stellt eine Schwingung dar mit einer Kreisfrequenz, die gleich dem arithmetischen Mittel von ω und ω0 ist. Die Amplitude dieser Schwingung variiert mit der vergleichsweise kleinen Kreisfrequenz δ, die gleich der halben Differenz von ω0 und ω ist. (Falls diese Differenz negativ wird, kann man einfach sin (δ t) durch –sin (-δ t) ersetzen, wodurch das Argument der Sinusfunktion wieder positiv wird. Das Minuszeichen vor dem Sinus bedeutet dann lediglich einen Phasensprung von π.

Aus der Akustik ist eine solche Schwingung als »Schwebung« bekannt. Sie entsteht durch Überlagerung (Summation) zweier Sinusschwingungen von nahezu gleicher Frequenz.

Von hier ausgehend können wir das Verhalten der Funktion im Resonanzfall genauer untersuchen. Man kann es als Grenzfall einer Schwebung auffassen, bei der für ω = ω0 die Schwebungsfrequenz verschwindend klein geworden ist. Wir nehmen an, zur Zeit t = 0 sei x = 0 und v = 0, und es beginne die Störkraft mit der Frequenz ω0 zu wirken. Es ist dann



und erhalten durch Einsetzen in die Gleichung der Schwebung:



und mit



schließlich



Dies ist eine Sinusschwingung der Kreisfrequenz ω0, deren Amplitude proportional zu t wächst. Die Schwingung wird also unter der Wirkung der äußeren Kraft »aufgeschaukelt«, bis sie an die Grenzen des Systems stößt oder die Energiereserven der Kraft erschöpft sind.

 

Gedämpfte erzwungene Schwingungen

[Bearbeiten]

Die äußere Kraft F = A cos ω t wirke nun auf einen gedämpft schwingenden Massenpunkt ein. Die Bewegungsgleichung lautet dann:



und mit



wobei ω0 die Kreisfrequenz der ungedämpften freien Schwingung ist,



Wir benutzen wieder den schon oben gebrauchten Satz, dass die allgemeine Lösung der inhomogenen Differentialgleichung die Summe aus der allgemeinen Lösung der homogenen Gleichung und einer partikulären Lösung der inhomogenen Gleichung ist. Da die allgemeine Lösung der homogenen Gleichung eine exponentiell abklingende harmonische Schwingung ist, stellt sie den »Einschwingvorgang« des Systems dar, der nach einiger Zeit abgeklungen ist; die partikuläre Lösung dagegen beschreibt den stationären (dauerhaften) Schwingungsvorgang. Der Einschwingvorgang, also die gedämpfte freie Schwingung, wurde oben bereits abgehandelt. Jetzt interessiert uns der stationäre Vorgang.

Zur Auffindung der partikulären Lösung führen folgende Überlegungen: Da in der Gleichung neben der zweiten Ableitung auch die erste Ableitung auftritt, genügt nicht der einfache Kosinus-Ansatz, wie wir ihn früher schon einmal benutzt haben. Wir müssen vielmehr auch eine Sinusfunktion vorsehen:



Diese Summe können wir auch – wie ebenfalls früher schon geschehen – durch eine einzige, allerdings phasenverschobene Kosinusfunktion ersetzen:



Zum Auffinden von stationären Lösungen eignet sich das Zeigerdiagramm besonders gut. Daher ersetzen wir den eben genannten Ansatz durch



Konsequenterweise müssen wir dann auch die Störfunktion durch eine e-Funktion ausdrücken:



Damit ergibt sich:



und schließlich:



Wir stellen nun die komplexe Zahl auf der rechten Seite der Gleichung durch einen Zeiger in der Zahlenebene dar und vergleichen deren Real- und Imaginärteil mit den entsprechenden Werten auf der linken Seite der Gleichung:

Nach dem Pythagoras ist:



woraus folgt:



Ferner ist


Damit sind die Konstanten der partikulären Lösung und somit auch diese selbst gefunden. Der Massenpunkt schwingt – wie erwartet – im stationären Zustand mit der Frequenz der angreifenden Kraft. Die Phasendifferenz φ geht für kleine Kreisfrequenzen gegen null, erreicht für ω = ω0 den Wert π/2 und geht für weiter steigende Frequenzen gegen π.

Die Amplitude C wird niemals unendlich. Sie erreicht ihr Maximum, wenn der Nenner minimal wird, und das ist der Fall bei der Resonanzkreisfrequenz ωR, für die gilt:



Die Resonanzkreisfrequenz ist also etwas kleiner als ω0; bei geringer Reibung ist der Unterschied unbedeutend.

Von dieser »Amplitudenresonanz« ist die »Geschwindigkeitsresonanz« zu unterscheiden: Sie tritt ein, wenn die Energie des schwingenden Massenpunktes maximal ist, die vom Quadrat seiner Maximalgeschwindigkeit abhängt. Sie tritt ein bei ω = ωE = ω0.

Die Resonanzamplitude ist



Das Resonanzverhalten ist also umso deutlicher ausgeprägt, je geringer die Reibung ist. Die folgende Grafik zeigt die Amplitude in der Umgebung des Resonanzpunktes bei verschiedenen Werten μ.

 

 

Das mathematische Pendel

[Bearbeiten]

Darunter versteht man einen Massenpunkt (Masse m), der über einen masselosen Faden der Länge l irgendwo befestigt ist, sodass er frei herabhängt. (Dieses Ideal ist mit guter Annäherung realisierbar.)

Der Massenpunkt werde nun aus seiner Ruhelage, die senkrecht unter dem Aufhängepunkt liegt, entfernt und dann losgelassen. Er bewegt sich dann auf einem Kreisbogen, dessen Ebene senkrecht steht und durch den Aufhängepunkt geht. Er bewegt sich auch dann noch auf diesem Kreisbogen, wenn ihm beim Loslassen eine Anfangsgeschwindigkeit in Richtung der Kreistangente erteilt wird.

Durch die Art seiner Befestigung ist der Massenpunkt gezwungen, sich auf dem Kreisbogen (allgemeiner: auf einer Kugelfläche) zu bewegen. Der Massenpunkt unterliegt nun zwei Kräften: Seiner Gewichtskraft G = m g, und der Kraft, die der Faden auf ihn ausübt. Letztere ist immer in Richtung des Fadens auf den Aufhängepunkt hin gerichtet. Mit dieser Kraft hat es eine besondere Bewandtnis. Sie ist nur vorhanden, weil der Massenpunkt an dem Faden befestigt ist und mit einer Komponente seines Gewichts daran zieht. Eine gleichartige Kraft würde auch auftreten, wenn der Massenpunkt auf einer kreisbogenförmigen Schiene oder auf der Innenfläche einer Kugel gelagert wäre. Kräfte dieser Art, die den Massenpunkt in seiner Bewegungsfreiheit einschränken und ihn an einen bestimmten Ort oder in eine bestimmte Bahn zwingen, heißen Zwangskräfte.

Bei der Bewegung des Massenpunktes verrichtet die Zwangskraft keine Arbeit, weil sie immer senkrecht zur Bahn gerichtet ist.

Zerlegt man die Gewichtskraft G in eine Tangential- und eine Normalkomponente, so erhält man die Kraft F, welche den Massenpunkt beschleunigt, und die Kraft –Zstat, die am Faden zieht. Sie wird durch die Zwangskraft Zstat (statische Zwangskraft) kompensiert. (Dazu kommt die dynamische Zwangskraft Zdyn, auf die ich später zu sprechen komme.)

Nun ist:

Bogenlänge:
Bahngeschwindigkeit:
Bahnbeschleunigung:
In die Bewegungsgleichung (unter Berücksichtigung der Richtung von F) eingesetzt ergibt:

In der vorletzten Gleichung tritt die Masse m des Massenpunkts in zwei verschiedenen Bedeutungen auf: links als träge Masse mtr und rechts als schwere Masse mschw. Ich komme später auf dieses Problem zurück, bis dahin wird es ignoriert und die Masse m wird herausgekürzt.


Lösung in 1. Näherung

[Bearbeiten]

Für hinreichend kleine Winkel ist



Dann lautet die vereinfachte Bewegungsgleichung



und ist mit φ = x identisch mit der Differentialgleichung der harmonischen Schwingung.


Mit dem bekannten Ansatz



ergibt sich



wobei α der Amplitudenwinkel und δ der »Nullphasenwinkel« ist. Beide Größen sind frei wählbar. Daher ist die angegebene Lösung die allgemeine Lösung der vereinfachten Bewegungsgleichung.

Nehmen wir an, für t = 0 sei auch φ = 0, dann ist δ = 0. (Alternativ: Für t = 0 sei φ = α, dann ist δ = π/2.)


Lösung in 1. Näherung über den Energiesatz

[Bearbeiten]

Die kinetische Energie des pendelnden Massenpunktes ist



seine potentielle Energie ist



wobei die Höhe h vom tiefsten Punkt der Bahn nach oben gemessen wird.

Mit h = l(1 – cos φ) ergibt sich für die Summe der beiden Energien



Diese Gleichung ist das Integral der Bewegungsgleichung, wovon man sich durch Differenzieren nach der Zeit überzeugen kann. Sie ist nur von der 1. Ordnung, dafür aber vom 2. Grad und zudem inhomogen. Nach einer geschickten Umformung lässt sie sich dennoch näherungsweise einfach integrieren.

Die Bedeutung der Konstanten C ist leicht erkennbar: Sie ist einerseits gleich der maximalen kinetischen Energie des Massenpunktes, die dieser für φ = 0 annimmt, andererseits ist sie gleich der maximalen potentiellen Energie, welche die Masse annimmt, wenn ihre Geschwindigkeit null ist. Diesen Fall wollen wir betrachten.

Für dφ/dt = 0 hat die Masse die größte Auslenkung. Der dazu gehörige Amplitudenwinkel sei α. Dann ist



Wenn wir diesen Wert für C in die Energiegleichung einsetzen, erhalten wir



Für hinreichend kleine Amplitudenwinkel α ist



Damit ergibt sich


und durch Integration



Wir interessieren uns nun noch für die dynamische Komponente der Zwangskraft. Durch den Faden ist der Massenpunkt gezwungen, sich auf einer Kreisbahn zu bewegen. Dazu ist eine Radialbeschleunigung erforderlich, auf die der Massenpunkt mit einer Trägheitskraft reagiert. Die Ursache der Radialbeschleunigung ist die dynamische Zwangskraft (Zentripetalkraft). Sie ist



Nach der oben stehenden Energiegleichung ist



und somit



Zusammen mit der statischen Zwangskraft Zstat = m g cos φ ergibt sich die gesamte Zwangskraft



Wie man sieht, kann die Zwangskraft Z null und sogar negativ werden, allerdings nur für α > π/2. (Zur Begründung: Die Kosinuskurve fällt im betrachteten Bereich monoton, und es ist stets φ kleiner/gleich α.) Wenn Z negativ wird, übt der Massenpunkt keinen Zug auf den Faden aus, sondern einen Druck, den der Faden nicht aufnehmen kann: Der Massenpunkt „stürzt ab“, bevor er den Amplitudenwinkel erreichen kann.


Lösung in 2. Näherung

[Bearbeiten]

Ersetzt man in der Bewegungsgleichung


sin φ durch den verbesserten Näherungswert φφ3/6, den man dadurch erhält, dass man in der Reihe für sin φ auch das zweite Glied berücksichtigt, so erhält man die Bewegungsgleichung einer »anharmonischen Schwingung«:



Da auch jetzt nur ungerade Potenzen von φ auftreten, bleibt die Rückstellkraft symmetrisch, d. h. sie wirkt auf beiden Seiten der Ruhelage gleich stark. Ein weiteres Merkmal ist, dass sie mit zunehmender Auslenkung jetzt langsamer als proportional zu φ wächst. Die Lösung der so verbesserten Näherungsgleichung ist ebenfalls nur näherungsweise möglich. Wir verzichten jedoch auf diese „Näherung einer Näherung“, zumal die ursprüngliche (exakte) Bewegungsgleichung auch exakt gelöst werden kann.


Die exakte Lösung

[Bearbeiten]

Die exakte Lösung der Bewegungsgleichung



führt auf ein elliptisches Integral, dessen Werte von Legendre 1816 berechnet und tabelliert wurden. Daraus kann auch die Schwingungsdauer T des mathematischen Pendels in Abhängigkeit vom Amplitudenwinkel α ermittelt werden. So ergibt sich:



Die Abweichung des exakten Wertes vom oben ermittelten Näherungswert



beträgt für α = 1° weniger als 2·10-5 s, für α = 5° weniger als 5·10-4 s.


Die historische Bedeutung des mathematischen Pendels

[Bearbeiten]

Die Bedeutung des mathematischen Pendels beruht zum einen darauf, dass mit seiner Hilfe die Erdbeschleunigung g sehr genau ermittelt werden kann. (Durch Beobachtung einer großen Zahl von Schwingungen (z. B. 1000) kann die Schwingungsdauer sehr genau bestimmt werden.) Zum anderen glaubte man, mit mathematischen Pendeln die Gleichheit von schwerer und träger Masse verifizieren zu können. Wenn nämlich das Verhältnis mtr / mschw nicht für alle Körper dasselbe wäre, würde die Schwingungsdauer eines mathematischen Pendels im allgemeinen vom Material der Pendelkugel abhängen. Dies war der Grund für die Pendelversuche, die schon Newton und später mit verbesserten Mitteln F. W. Bessel (1784-1846) durchführten. Nach unserem heutigen Wissen allerdings mussten diese Versuche schon darum scheitern, weil ja alle Atome aus denselben Bausteinen bestehen. Der negative Ausgang der Versuche taugte daher nicht als Indiz. Anders war es mit den Versuchen, die L. Eötvös (1848-1919) mit von ihm entwickelten hochempfindlichen Drehwaagen vornahm, und die ergaben, dass der relative Unterschied von schwerer und träger Masse sicher kleiner als 1 × 10-7 ist.

Ein derart hohes Maß an Übereinstimmung kann natürlich kein Zufall sein. In der klassischen Physik wurde die Identität beider Massen einfach als experimentelle Tatsache hingenommen. Da eine Erklärung nicht möglich war, verschwand bezeichnenderweise im Laufe der Zeit das Bewusstsein dafür, dass hier überhaupt ein Problem vorlag, mehr und mehr. Erst Albert Einstein hat in seiner Allgemeinen Relativitätstheorie (1913) wieder an dieses Problem angeknüpft. Wenn es innerhalb eines Bezugssystems grundsätzlich nicht möglich ist, zwischen Trägheitskraft und Schwerkraft zu unterscheiden, dann ist es – so Einstein - auch grundsätzlich nicht möglich, zwischen träger und schwerer Masse zu unterscheiden.

 


Unfreier Massenpunkt auf horizontaler Kreisbahn

[Bearbeiten]

Der Massenpunkt eines mathematischen Pendels werde zunächst aus seiner Ruhelage herausgebracht (Auslenkungswinkel α) und ihm dann ein Anstoß derart erteilt, dass er sich auf einer horizontalen Kreisbahn bewegt. Seine Bahngeschwindigkeit sei v.

Die Zwangskraft Z muss mit ihrer Vertikalkomponente die Gewichtskraft G kompensieren und mit ihrer Horizontalkomponente die benötigte Zentripetalkraft Fz aufbringen. Es gelten nun folgende Beziehungen:


woraus schließlich folgt:




und



Wird das Gleichgewicht der Kräfte z. B., dadurch gestört, dass die Bahngeschwindigkeit etwas abnimmt, dann tritt eine Selbstregulation ein: Bei zunächst unveränderter Auslenkung wird die Zentripetalkraft kleiner und mit ihr die Gegenkraft zum Gewicht. Dadurch bewegt der Massenpunkt sich ein wenig nach unten, wodurch die Auslenkung kleiner wird und sich ein neuer Gleichgewichtszustand einstellt.

Amplitudenmodulierte Schwingungen, Schwebungen

[Bearbeiten]

Die Amplitude der Schwingung



werde mit einer Kosinusschwingung



„moduliert“ (siehe Abbildung), wobei ω0 ≫ ω1 sei.



Die Amplitude der modulierten Schwingung ist dann



und die resultierende Schwingung kann wie folgt beschrieben werden:



Durch Ausmultiplizieren und Anwendung eines bekannten Additionstheorems ergibt sich daraus:



Das bedeutet: Die amplitudenmodulierte Schwingung ist gleichwertig mit drei Schwingungen von konstanter Amplitude mit den Kreisfrequenzen ω0, (ω0 - ω1) und (ω0 + ω1). Die folgende Abbildung zeigt das Frequenzspektrum:



Der Quotient B/A heißt Modulationsgrad m. Er ist im Allgemeinen kleiner als 1.

Ein im Grunde ähnliches Phänomen ist die Überlagerung (Summation) zweier Kosinus-Schwingungen nahezu gleicher Frequenz ω1 und ω2. Wir betrachten zunächst den Fall gleicher Amplituden:



Durch Anwendung eines Additionstheorems findet man dafür:



Diese Funktion stellt eine Kosinuskurve mit einer Kreisfrequenz, die gleich dem arithmetischen Mittel der beiden ursprünglichen Kreisfrequenzen ist. Die Amplitude dieser Kurve ist



und schwillt also mit der Kreisfrequenz ω1 - ω2 an und ab. (Zu einer Periode der Kosinuskurve gehören zwei Extremwerte.) In der Akustik wird ein solcher Vorgang als Schwebung bezeichnet.



In vielen Büchern sind die Schwebungen insofern falsch gezeichnet, als der Phasensprung beim Nulldurchgang der Amplitude nicht berücksichtigt wird.

Richtig gezeichnete Schwebungskurven findet man z. B. unter [3].

Haben die beiden überlagernden Schwingungen nicht gleiche Amplituden, so entsteht eine »unreine Schwebung« mit der Gleichung:



Ist zum Beispiel A > B, so kann man dann schreiben:



und dann weiter ähnlich wie oben:



Der erste Term ist eine Schwingung mit konstanter Amplitude, der zweite Term eine „reine Schwebung“ mit einer etwas höheren Frequenz.

Mechanik realer Körper

[Bearbeiten]
Wikibooks Dieses Buch wurde in den Wikibooks:Buchkatalog aufgenommen.


Der Massenmittelpunkt und seine Bewegungsgleichung

[Bearbeiten]

Nun wird die Mechanik realistischer: Wir wenden die an idealen Massenpunkten gewonnenen Ergebnisse auf reale Körper an.

Die Atome – und im Allgemeinen auch die Moleküle – aus denen reale Körper aufgebaut sind, kommen unserem Ideal des Massenpunktes außerordentlich und völlig hinreichend nahe. Daher können wir reale Körper als Systeme zahlreicher Massenpunkte auffassen. Die im Folgenden hergeleiteten Sätze über Systeme von Massenpunkten gelten folglich für reale Körper. Dies müssen nicht unbedingt Festkörper oder gar starre Körper sein; die hier abzuleitenden Sätze gelten ganz allgemein für jedes irgendwie klar definierte System von Massenpunkten: für die Flüssigkeit oder das Gas in einem Behälter (einschließlich oder ausschließlich des Behälters), für eine in einem Raumfahrzeug frei schwebende Kugel aus Wasser, für eine Gaswolke im Weltall, ja sogar für eine Galaxie aus Fixsternen, die wegen der riesigen Entfernung uns als Punkte erscheinen.

Als Erstes treffen wir eine wichtige Unterscheidung: Kräfte, die zwischen zwei Massenpunkten des Systems wirken, heißen innere Kräfte. Dagegen heißen Kräfte, die ihren Ursprung außerhalb des Systems haben, äußere Kräfte.

Wir betrachten nun ein System von beliebig vielen Massenpunkten. Auf einen von ihnen (den k-ten Massenpunkt) wirke eine Anzahl äußerer Kräfte, die wir durch ihre Resultante Fk ersetzen. Ferner wirke vom ersten Massenpunkt her auf ihn die (innere) Kraft F1k ein, vom zweiten Massenpunkt die Kraft F2k, allgemein vom i-ten Massenpunkt die Kraft Fik. Dann lautet die Bewegungsgleichung für den k-ten Massenpunkt


Denken wir uns die Bewegungsgleichungen sämtlicher Massenpunkte des Systems addiert, so erhalten wir



Nun gibt es aber nach Newtons 3. Axiom (actio = reactio) zu jeder inneren Kraft eine gleich große, entgegengesetzt gerichtete: Wenn der i-te Massenpunkt auf den k-ten Massenpunkt die Kraft F ik ausübt, dann übt der k-te Massenpunkt auf den i-ten Massenpunkt die Kraft Fki = – Fik aus. Alle inneren Kräfte treten daher in entgegengesetzt gleichen Paaren auf. Daher ist die doppelte Summe auf der rechten Seite der Gleichung gleich null. Also ist



Die folgende Abbildung zeigt ein System von Massenpunkten mit ihren Ortsvektoren, die von einem beliebig gewählten Nullpunkt O ausgehen:


Die Summe der Massen aller Massenpunkte sei M. Wir bestimmen nun einen Punkt S mit dem Ortsvektor rS so, dass



Den so definierten Punkt S nennen wir den Massenmittelpunkt oder Schwerpunkt des Systems. Durch Aufspaltung der Vektorgleichung (2) in die Komponenten findet man für die Koordinaten des Schwerpunkts:





Die Koordinaten des Schwerpunkts sind die Mittelwerte der mit ihren Massen gewichteten Koordinaten der Massenpunkte des Systems. Um den Schwerpunkt zweier Massenpunkte m1 und m2 zu ermitteln, legen wir den Nullpunkt der Ortsvektoren bequemerweise in m1:

Dann ist definitionsgemäß




Der Schwerpunkt liegt also auf der Strecke m1 m2 und teilt sie im Verhältnis m2: m1.


Differenzieren wir die Gleichung (2) zweimal nach der Zeit und setzen das Ergebnis in Gleichung (1) ein, so erhalten wir die wichtige Gleichung


Diese Gleichung entspricht genau der Newtonschen Bewegungsgleichung für einen Körper der Masse M, an dem die Kraft FR angreift. Das bedeutet:

Der Massenmittelpunkt eines Systems bewegt sich so, als ob sich in ihm die gesamte Masse des Systems befände und an ihm die Summe (Resultante) aller äußeren Kräfte angriffe.

(Aus dieser Eigenschaft des Massenmittelpunktes erklärt sich auch sein Name "Schwerpunkt": Im Schwerefeld der Erde verhält sich der Schwerpunkt eines Körpers so, als wirke auf ihn die Summe der Gewichtskräfte der einzelnen Massenpunkte, also das Gesamtgewicht des Systems ein.)

Falls keine äußeren Kräfte einwirken, bleibt der Massenmittelpunkt in Ruhe oder bewegt sich gleichförmig geradlinig.


Beispiel: Zwei Massenpunkte m1 und m2 sind durch eine Schraubenfeder, die sowohl gedehnt wie gestaucht werden kann, miteinander verbunden und befinden sich in der Entfernung a voneinander im Gleichgewicht. Wird die Entfernung um eine kleine Strecke x verändert, treten Rückstellkräfte auf, die der Strecke x proportional sind. Wie lauten die Schwingungsgleichungen der beiden Massenpunkte?

Wir nehmen an, dass die Änderung der Entfernung entweder durch innere Kräfte oder durch zwei entgegengesetzt gleiche äußere Kräfte geschieht, sodass der Schwerpunkt S in Ruhe bleibt. Dann bleibt er auch bei der nachfolgenden Schwingbewegung in Ruhe, und es ist zweckmäßig, ihn zum Ursprung des Koordinatensystems zu machen. Die Koordinaten der beiden Massenpunkte seien x1 und x2, in der Ruhelage x1 (0) und x2 (0).

Aus der Definition des Schwerpunkts folgt wegen xS = 0, dass stets



Ferner ist


und daher


Damit lautet die Bewegungsgleichung für m1:


Eliminiert man mittels Gleichung (B1) x2, so erhält man


Setzt man

so wird daraus



Dies ist eine gewöhnliche Schwingungsgleichung mit einem konstanten Glied auf der rechten Seite. Ein partikuläres Integral findet man mit dem Ansatz x1(0) = konst.

Durch Einsetzen in die Differentialgleichung ergibt sich



Die allgemeine Lösung lautet dann


Die Bewegungsgleichung für m2 findet man am einfachsten durch Anwendung von Gleichung (B1):



Die beiden Massenpunkte schwingen also im Gegentakt um ihre Ruhelage; ihre Amplituden verhalten sich umgekehrt wie die Massen. Die Kreisfrequenz ist gleich der eines einfachen harmonischen Oszillators mit der Masse μ, welche die »reduzierte Masse« genannt wird.

Der Impulssatz

[Bearbeiten]

Den Impuls p eines Massenpunktes haben wir definiert als das Produkt aus seiner Masse m und seiner Geschwindigkeit v:

Impuls p = m V

Durch diese Definition als skalares Vielfaches eines Vektors ist der Impuls selbst ein Vektor.

Den Impuls eines Systems von Massenpunkten definieren wir entsprechend:


Haben alle Massenpunkte des Systems dieselbe Geschwindigkeit, vereinfacht sich die Gleichung zu:



Nach Gleichung (1) ist



Wenn alle mk konstant sind, kann diese Gleichung einfach zwischen zwei beliebigen Grenzen t1 und t2 integriert werden:




Auf die linke Seite der Gleichung wenden wir den Satz an, dass das Integral über eine Summe gleich der Summe der Integrale über die einzelnen Summanden ist.

Auf der rechten Seite der Gleichung steht die Änderung des Impulses des Systems im Zeitintervall von t1 bis t2. Also gilt:


Auf der linken Seite steht nun die Summe aller "Kraftstöße", die in der Zeit von t1 bis t2 auf die Massenpunkte des Systems einwirken. Also gilt:

Die Summe aller Kraftstöße, die in einem Zeitintervall auf die Massenpunkte eines Systems einwirken, ist gleich der Änderung des Impulses des Systems in diesem Zeitintervall.

Wirkt auf ein System keine äußeren Kraftstöße ein, bleibt der Impuls des Systems konstant. (Satz von der Erhaltung des Impulses.)

 

Das Drehmoment

[Bearbeiten]

Wir betrachten zunächst einen Massenpunkt mk in einem kartesischen Koordinatensystem, auf den eine Kraft Fk wirkt.


Stellen wir uns zunächst einmal (und nur vorübergehend) die X-Achse als Drehachse vor, mit der der Massenpunkt m (hier einmal alles ohne Indices k geschrieben) starr verbunden ist. Der Abstand des Massenpunktes von der Drehachse ist

ryz = ry + rz

Für die Drehwirkung bezüglich der X-Achse zählt nur die auf ryz senkrechte Komponente von F, nämlich

Fyz = Fy + Fz

und zwar derart, dass auf ry nur Fz wirkt und auf rz nur Fy, die jeweils senkrecht aufeinander stehen. Die Drehwirkung setzt sich also zusammen aus den Produkten

ry Fz (in Richtung der X-Achse gesehen rechtsdrehend) und
rz Fy (in Richtung der X-Achse gesehen linksdrehend)

Die gesamte Drehwirkung oder der Betrag des Drehmoments der Kraft bezüglich der X-Achse ist daher

Mx = ry Fz - rz Fy

Entsprechend findet man die Drehmomente der Kraft bezüglich der beiden anderen Achsen:

My = rz Fxrx Fz

und

Mz = rx Fyry Fx

Wir können uns nun vorstellen, dass der Massenpunkt um alle drei Achsen drehbar wäre, etwa durch eine kardanische Aufhängung mit dem Zentrum in O. Dann führen wir drei Vektoren ein, welche die Richtungen der Koordinatenachsen haben:

Mx = (ry Fz - rz Fy) i
My = (rz Fxrx Fz) j
Mz = (rx Fyry Fx) k

Die Summe dieser drei Vektoren ist der Vektor


Wir erkennen in diesem Vektor das Vektorprodukt der beiden Vektoren r und F:

MO = r x F

Führen wir ein anderes Koordinatensystem mit demselben Ursprung O ein, so bleiben r und F davon unberührt. Der Vektor MO bleibt also bei einer Drehung des Koordinatensystems um O unverändert. Wir bezeichnen ihn als das Drehmoment der in m angreifenden Kraft bezüglich des Punktes O. Er gibt hinsichtlich einer Drehung um O die Richtung der durch O gehenden Drehachse und den Betrag des Drehmoments an, das F auf m ausübt. Sein Betrag ist gleich r F sin α , wobei α der von r und F eingeschlossene Winkel ist. Das Drehmoment ist daher gleich dem Produkt aus dem Hebelarm bezüglich O und der dazu senkrechten Kraftkomponente.

Dieses Ergebnis übertragen wir nun wieder auf ein System von Massenpunkten und bezeichnen die Summe aller auf die Massenpunkte des Systems ausgeübten Drehmomente als das auf das System bezüglich O ausgeübte Drehmoment:


 

Der Drehimpuls

[Bearbeiten]

Analog zum Impuls p = m v eines Massenpunktes wird – zunächst anscheinend etwas willkürlich – der Drehimpuls eines Massenpunktes bezüglich einer Drehachse (in der Abbildung: O) definiert als ein Vektor, dessen Betrag gleich dem Produkt aus dem Trägheitsmoment J = m r 2 des Massenpunktes (bezüglich O) und dem Betrag ω seiner Winkelgeschwindigkeit:

L = J ω = m r 2 ω

Der Grund für diese Definition ist ihre Zweckmäßigkeit. Außerdem ergibt sich eine schöne Analogie: In der Impulsgleichung tritt anstelle des Impulses der Drehimpuls, anstelle der Masse das Trägheitsmoment und anstelle der Geschwindigkeit die Winkelgeschwindigkeit. (Daneben gibt es noch weitere Analogien.)

Als Richtung des Vektors L wählen wir die Richtung des Vektors ω und somit die Richtung der Drehachse. Somit wird:

L = J ω = m r 2 ω

Zerlegen wir die Geschwindigkeit v in eine Radialkomponente vrad und in eine Tangentialkomponente vtan, so ist

ω = v tan / r



Die Tangentialkomponente der Geschwindigkeit ergibt sich als die Projektion des Vektors v auf die zu r senkrechte Richtung:


Wegen


und da der Vektor der Winkelgeschwindigkeit dieselbe Richtung hat wie das obige Vektorprodukt, ist


Damit ergibt sich für den Drehimpuls L schließlich:


Wir übertragen das Ergebnis auf ein System von Massenpunkten, indem wir verabreden:

Unter dem Drehimpuls eines Systems von Massenpunkten bezüglich O verstehen wir den Summenvektor


 



 

Drehmoment und Drehimpuls

[Bearbeiten]

Um den Zusammenhang zwischen diesen beiden Größen zu ermitteln, bilden wir die Ableitung der Impulsgleichung nach t: Aus

folgt so:


da das erste der beiden Vektorprodukte null ist. Nach der Bewegungsgleichung (siehe die erste Gleichung auf S. 1) ist


wobei Fk die Resultierende aller Kräfte ist, die von außen auf mk einwirken, während der zweite Term die Summe aller auf mk einwirkenden inneren Kräfte ist.

Oben eingesetzt ergibt das:



Die erste Summe ist die Resultierende MO der Drehmomente der äußeren Kräfte, die zweite Summe ist die Resultierende der Drehmomente der inneren Kräfte. Es lässt sich zeigen, dass diese Summe null wird, wenn die Kräfte zwischen zwei Massenpunkten die Richtung der Verbindungsgeraden der Massenpunkte haben, also Zentralkräfte sind, was jedoch stets der Fall ist. Dann ist Fki = - Fik, und die Summe der Drehmomente auf ein beliebiges Paar von Massenpunkten ist



Dieses Vektorprodukt ist aber null, wenn Fik die Richtung von (rk - ri), nämlich die Richtung der Verbindungsgeraden hat. Es bleibt dann


was bedeutet:

Die Änderungsgeschwindigkeit des Drehimpulses eines Systems ist gleich dem von außen wirkenden Drehmoment.

Durch Integration zwischen den Grenzen t1 und t2 folgt:


Das bedeutet: Die Änderung des Drehimpulses eines Systems in einem Zeitintervall ist gleich dem auf das System in diesem Intervall ausgeübten »Drehmomentstoß« (das ist das Zeitintegral des Drehmoments).

Ferner:

Wirkt auf das System kein äußeres Drehmoment, so bleibt sein Drehimpuls konstant. (Satz von der Erhaltung des Drehimpulses.)

 

 

Die Energie eines Systems von Massenpunkten

[Bearbeiten]

Wir gehen wieder von der Bewegungsgleichung eines einzelnen Massenpunktes aus:


Durch skalare Multiplikation mit drk/dt und Summation über alle Massenpunkte des Systems ergibt sich (zusammen mit einer identischen Umformung der linken Seite):


Wir multiplizieren die Gleichung mit dt und integrieren sie dann zwischen den Grenzen t1 und t2:





und mit




Auf der linken Seite der Gleichung steht die Änderung der kinetischen Energie des Systems, rechts die Summe der Arbeit der äußeren und der der inneren Kräfte im betrachteten Zeitintervall. Die aufgewendeten Arbeiten führen also zu einer gleich großen Veränderung der kinetischen Energie des Systems. (Dies ist ein spezieller Fall des Satzes von der Erhaltung der Energie.)


Mit der kinetischen Energie kann man nun folgende Umformung vornehmen: Wir führen ein weiteres Koordinatensystem ein, dessen Ursprung O' im Schwerpunkt liegt. Dieser habe im ersten Koordinatensystem den Ortsvektor r*. Der Ortsvektor des Massenpunktes mk im neuen System sei r' k. Dann ist


und


und damit



Nach der Definition des Schwerpunkts ist



wobei (r*)' die Koordinate des Schwerpunkts im zweiten (dem "gestrichenen") System ist. Diese ist hier gleich null, und damit wird auch der zweite Term auf der rechten Seite null. Damit wird:



Das bedeutet: Die kinetische Energie des Systems ist gleich der Summe aus der kinetischen Energie der im Schwerpunkt vereint gedachten Masse des Systems und der kinetischen Energie, welche die Massenpunkte des Systems infolge ihrer Bewegung relativ zum Schwerpunkt haben.


Wir wollen nun von den inneren Kräften annehmen, dass zu ihnen ein Potentialfeld gehört. (Die Kräfte seien also – wie man auch sagt – konservative Kräfte.) Das Potential der Kraft Fik auf mk ist eine Funktion der Entfernung dik und damit eine Funktion der Koordinaten der beiden Punkte (und natürlich eine Funktion der Masse mi), also:


(Lies: Φik ist gleich Φik von dik ist gleich Φik von ...)

Mit Hilfe einer Anleihe aus der Vektoranalysis ergibt sich daraus die Kraft, die von der Masse mi auf die Masse mk ausgeübt wird:



Analog ergibt sich die von der Masse mk auf die Masse mi ausgeübte Kraft:



Nehmen wir nun an, mit den beiden Massen werden verschwinden kleine Verschiebungen drk bzw. dri vorgenommen. Die dabei zu verrichtende Arbeit ist



Der Ausdruck in der Klammer ist das vollständige Differential der Funktion Φik mit ihren sechs Variablen, also ist



Wir können nun in Gleichung (A) im ganz rechts stehenden Term das Produkt Fik drk durch das Differential –dΦik ersetzen. Bei der Summierung müssen wir jedoch beachten, dass –dΦik schon zwei der Summanden enthält, weshalb bei der Summierung jeder Summand doppelt vorkommt. Dies muss durch einen Faktor ½ berücksichtigt werden:



Das über diese Doppelsumme zu bildende Integral ist in einem Potentialfeld vom Weg unabhängig und hat den Wert



Wenn wir nun zusätzlich annehmen, dass auch zu den äußeren Kräften ein Potentialfeld gehört, dann wird auch das erste Integral vom Weg unabhängig und kann so geschrieben werden:



Dann nimmt Gleichung (A) folgende Form an:



Die Summe aus der kinetischen Energie, der äußeren potentiellen Energie und der inneren potentiellen Energie eines Systems von Massenpunkten ist also konstant, wenn sowohl die äußeren wie die inneren Kräfte ein Potentialfeld besitzen (konservative Kräfte sind). Dies ist eine erweiterte Form des Satzes von der Erhaltung der Energie.

Mechanik starrer Körper

[Bearbeiten]
Wikibooks Dieses Buch wurde in den Wikibooks:Buchkatalog aufgenommen.


Die Kinematik starrer Körper

[Bearbeiten]

Was ist ein starrer Körper?

[Bearbeiten]

Ein starrer Körper ist ein System von Massenpunkten, deren Entfernungen voneinander konstant sind. Wir sehen also ab von Deformationen des Körpers und von Schwingungen der Massenpunkte (Atome, Moleküle), wie sie bei realen Körpern stets vorhanden sind. Der "starre Körper" ist also auch wieder eine der so nützlichen Abstraktionen und Idealisierungen der theoretischen Physik.

Die Verschiebung eines starren Körpers

[Bearbeiten]

Die einzig mögliche Veränderung eines starren Körpers ist demnach die Veränderung seiner Lage relativ zu anderen Körpern, z. B. relativ zu einem Bezugssystem, das von einem Beobachter als ruhend betrachtet wird. Eine solche Lageänderung heißt »Verschiebung«. Sie kann auf drei verschiedene Arten geschehen:

1. Die Translation. Dies ist eine Verschiebung aller Massenpunkte des Körpers um denselben Vektor . Der Ortsvektor eines beliebigen Punktes geht dabei über in , wobei gilt:

2. Die Rotation um eine Gerade . Dabei bewegen sich alle Massenpunkte, soweit sie nicht auf der Geraden liegen, auf Kreisbögen, deren Mittelpunkte auf liegen. Die Gerade heißt Rotationsachse.

3. Die Rotation um einen Punkt . Dabei bewegen sich alle (übrigen) Punkte des Körpers auf konzentrischen Kugelflächen um das Rotationszentrum . Wie später gezeigt wird, kann eine Rotation um einen Punkt stets auf eine Rotation um eine durch diesen Punkt gehende Achse zurückgeführt werden.


 

Die Anzahl der Freiheitsgrade eines starren Körpers

[Bearbeiten]

Die Anzahl der Freiheitsgrade eines Körpers gibt an, wie viele voneinander unabhängige Bewegungen der Körper ausführen kann. Ein Eisenbahnzug hat – da er an seine Schienen gebunden ist - nur einen Freiheitsgrad (vorwärts und rückwärts zählen zusammen nur als eine Bewegungsmöglichkeit). Formal ist dies daran erkennbar, dass die Position des Zuges durch eine einzige Koordinate beschrieben werden kann, wie sie sich z. B. auf den Kilometertafeln findet. Ein Auto auf der Erdoberfläche hat drei Freiheitsgrade: Sein Ort kann durch seine geografische Länge und Breite beschrieben werden, die Richtung seiner Längsachse z. B. durch den Winkel zur Nordrichtung. Die beiden anderen Winkel – die Ausrichtung des Fahrzeugs um die Längsachse und um die horizontale Querachse – dienen der Anpassung an Abweichungen des Geländes von der horizontalen Ebene und sind durch den Ort und die Richtung der Längsachse bestimmt. Sie sind daher keine Freiheitsgrade.

Ein kunstflugtaugliches Flugzeug hat sechs Freiheitsgrade der Bewegung.

Der Anschauung kann man entnehmen, dass ein freier Körper wie ein Flugzeug drei Freiheitsgrade der Translation besitzt: er kann sich nämlich frei in drei räumlichen Dimensionen (Länge, Breite, Höhe) bewegen. Dazu kommen drei Freiheitsgrade der Rotation: er kann um drei räumliche Drehachsen rotieren. Folglich besitzt der freie Körper sechs Freiheitsgrade der Bewegung.

Formal kann dieses Ergebnis so bestätigt werden: Stellen wir uns vor, der Körper führe ein räumliches Koordinatensystem mit sich, das mit ihm fest verbunden ist. Die Lage des starren Körpers bezüglich eines im Raum (des Beobachters) ruhenden Koordinatensystems ist dann eindeutig bestimmt, wenn die (drei) Ortskoordinaten des Ursprungs des »körperfesten Systems« und seine räumliche Orientierung bekannt sind. Diese wird charakterisiert durch die drei mal drei Richtungskosinus seiner Einheitsvektoren (i', j', k' ). Diese neun Größen unterliegen aber sechs Bedingungen: Die Summe der Quadrate der Richtungskosinus eines jeden Vektors muss 1 sein, und zudem müssen die Einheitsvektoren paarweise aufeinander senkrecht stehen. Von den neuen Größen sind also nur drei unabhängig. Dies entspricht den drei Freiheitsgraden der Rotation.

Die Zahl der Freiheitsgrade wird eingeschränkt, wenn der Körper nicht völlig frei beweglich ist. Ist z. B. einer seiner Punkte festgelegt, so kann man in diesen den Ursprung des körperfesten Systems legen. Damit fallen die drei Freiheitsgrade der Translation weg. Wird ein weiterer Punkt festgehalten, so kann der Körper nur noch um die Verbindungsgerade der beiden Punkte rotieren, und seine Lage ist durch eine einzige Koordinate, nämlich den Drehwinkel, festgelegt. Er besitzt also nur noch einen Freiheitsgrad der Bewegung. Legt man nun noch einen dritten Punkt des Körpers fest, so verliert er auch den letzten Freiheitsgrad (sofern die drei Punke nicht auf einer Geraden liegen).

Nach dem folgenden Exkurs über die eulerschen Winkel werden wir einige Bewegungen untersuchen, die bei verschiedenen Einschränkungen der Freiheit eines starren Körpers möglich sind.


 

Die eulerschen Winkel

[Bearbeiten]

Anstatt 9 Richtungskosinus einzuführen, die durch 6 Bedingungen eingeschränkt sind, ist es häufig günstiger, von Anfang an nur drei unabhängige Veränderliche einzuführen. Dazu eignen sich die eulerschen Winkel, , und (phi, psi und theta). Diese haben folgende Bedeutung: ist der Winkel zwischen der Z' -Achse des körperfesten Systems und der Z-Achse des raumfesten Systems. Die XY-Ebene (grau) schneidet die X'Y' -Ebene (grün) in einer Geraden, die Knotenlinie genannt wird und auf der der Einheitsvektor n liegt. Senkrecht zu n legen wir in der X'Y' -Ebene eine Gerade, auf welcher der Einheitsvektor m' liegt.



Der Winkel ist der Winkel zwischen der Knotenlinie und der X-Achse und wird »Knotenlänge« genannt (analog zur geografischen Länge). Sein Gegenstück in der X'Y' -Ebene, nämlich der Winkel zwischen der Knotenlinie und der X' -Achse ist der Winkel φ.

Sind die eulerschen Winkel gegeben, kann man das Koordinatensystem i', j', k' zeichnen: Zuerst wird mit dem Winkel die Knotenlinien in die XY-Ebene gezeichnet. Durch diese Gerade wird dann eine Ebene gelegt, die mit der XY-Ebene den Winkel bildet; dies ist die X'Y' -Ebene. Das Lot auf dieser Ebene in O ist die Z' -Achse. Die X' -Achse ist in der X'Y' -Ebene dann durch den Winkel bestimmt.

Die Einheitsvektoren des körperfesten Systems seien




Dann gelten die folgenden Umrechnungbeziehungen:


 


 



Mit Hilfe dieser Beziehungen lassen sich die Verschiebungskomponenten und die Geschwindigkeitskomponenten bezüglich der X-, Y- und Z-Achse sowie die Rotationsgeschwindigkeiten um diese Achsen aus den entsprechenden Größen des körperfesten Systems berechnen.

Zur Veranschaulichung eignet sich recht gut die Erde und ihre Bewegung im Sonnensystem. Als invariable XY-Ebene bietet sich die Ekliptik an, also die Ebene der Erdbahn, in der auch die Sonne liegt. Die Richtung der X-Achse kann z. B. durch irgendeinen in der Ekliptik gelegenen Fixstern vorgegeben werden. Die Y-Achse steht auf der X-Achse senkrecht, die Z-Achse auf der Ekliptik. Der Nullpunkt beider Koordinatensysteme sei der Erdmittelpunkt. Die X'Y' -Ebene ist die Äquatorialebene, wobei die X' -Achse z. B. durch den Nullmeridian (den Meridian von Greenwich) gehen soll. Die Z' -Achse ist die Rotationsachse der Erde.


Bliebe die Richtung der Erdachse unverändert und rotierte die Erde lediglich um die Z' -Achse, dann änderte sich nur der Winkel φ zwischen Knotenlinie und X' -Achse. Tatsächlich aber rotiert die Erdachse in etwa 26 000 Jahren einmal um die Z-Achse. Die Erdachse führt also eine sogenannte Präzessionsbewegung aus und somit ändert sich auch der Winkel ψ. Schließlich schwankt aber auch der Winkel zwischen Z' - und Z-Achse ein wenig: die Erdachse führt eine Nutationsbewegung (Nickbewegung) aus.


 

Ebene Bewegung eines starren Körpers

[Bearbeiten]

Ein Beispiel für die ebene Bewegung eines starren Körpers ist ein Buch, das auf einer Tischplatte bewegt wird. Dabei bewegen sich alle Punkte des Körpers (des Buches) parallel zu einer Ebene (zur Tischplatte). Alle Punkte des Körpers, die auf demselben Lot zur Ebene liegen, bewegen sich dabei auf kongruenten Bahnen. Daher genügt es, den Körper auf eine einzige Ebene – hier eine Seite des Buches – zu reduzieren und lediglich die Bewegung einer Ebene auf einer anderen, festen Ebene zu betrachten.

Diese Bewegung hat drei Freiheitsgrade: Wir können die beiden Koordinaten irgendeines Punktes der beweglichen Ebene beliebig wählen und dann die Ebene noch um diesen Punkt drehen.

Zunächst will ich zeigen, dass man jede beliebige ebene Verschiebung eines Körpers aus einer Position (1) in eine Position (2) als das Ergebnis einer Drehung um einen Punkt auffassen kann. Dabei wird von den Zwischenstadien der Verschiebung völlig abgesehen und es werden nur die Anfangs- und die Endposition betrachtet. Dabei genügt es, zwei in der Bewegungsebene gelegene Punkte A und B des Körpers herauszugreifen, denn durch die Lage dieser beiden Punkte ist auch die Position aller übrigen Punkte des Körpers festgelegt. Durch die betrachtete Verschiebung seien die beiden Punkte A und B auf einem beliebigen Weg in die Position A' bzw. B' bewegt worden. Konstruiert man die Mittelsenkrechten der Strecken AA' und BB' und schneidet sie miteinander, so erhält man das gesuchte Rotationszentrum P. Während der Drehung wird das Dreiecks PAB in das kongruente Dreieck PA'B' übergeführt und gleichzeitig alle anderen Punkte des Körpers aus ihrer ursprünglichen Lage in eine neue Position gebracht. Da das Drehzentrum für alle Punkte dasselbe ist, würde man denselben Punkt P auch mit zwei beliebigen anderen Punkten (statt A und B) finden.

(Zum vollständigen Beweis muss gezeigt werden, dass dieselbe Drehung, welche die Strecke PA in die Strecke PA' überführt, auch die Strecke PB in die Strecke PB' überführt. Dazu muss bewiesen werden, dass der Winkel APA' gleich dem Winkel BPB' ist. Wegen der Kongruenz der Dreiecke APB und A'PB' sind die Winkel APB und A'PB' gleich. Ich nenne sie α. Nun ist aber Winkel APA' = α + Winkel BPA' und Winkel BPB' ebenfalls gleich α + Winkel BPA'. Also sind die beiden fraglichen Winkel gleich. – Einfacher ist folgende Argumentation, die später auch noch in einem anderen Zusammenhang benutzt werden kann: Da wir es hier mit einem starren Körper zu tun haben, ist auch das Dreieck ABP ein starres Gebilde. Daher können sich bei einer Rotation um P die beiden Radien PA und PB immer nur um gleiche Winkel drehen.)

Wenn wir nun die Zwischenstadien der Bewegung nicht ignorieren, sondern die Bahnkurven der Punkte A und B exakt verfolgen wollen, so können wir zunächst einige Zwischenstadien der Bewegung betrachten:


Für je zwei benachbarte Lagen der Strecke AB können wir - wie oben - ein temporäres Drehzentrum konstruieren und so die gesamte Ortsveränderung durch eine Anzahl von Drehungen um ein jeweils anderes temporäres Drehzentrum ("temporärer Pol") annähern.


Verbindet man die benachbarten temporären Drehzentren miteinander, entsteht ein Polygonzug. Es lohnt sich, diesen Vorgang in seinen Phasen in einem Modell zu realisieren. Dazu befestigt man ein Blatt Papier (die feste Ebene) auf einer geeigneten Unterlage (Korkbrett, Weichfaserplatte, Styroportafel ...). Ein zweites Blatt Papier (das transparent sein sollte) stellt die bewegte Ebene (den bewegten Körper) dar, auf der zwei Punkte A und B und ihre Verbindungsgerade markiert werden. Anstatt nun aber die einzelnen Phasen der Verschiebung dieser Ebene vorzugeben und dann Mittelsenkrechten über mehreren kleinen Teilstrecken zu errichten und diese paarweise miteinander zu schneiden (was mühsam und ungenau wäre), ist es weitaus bequemer, das Pferd von hinten aufzuzäumen und sich den Polygonzug von temporären Zentren beliebig vorzugeben. Dann wird das transparente Papier auf die feste Ebene gelegt. Mit einer Stecknadel sticht man zunächst in den Punkten A und B durch die beiden Papiere hindurch und markiert so deren Ausgangslage auf der festen Ebene. Dann sticht man im ersten Drehzentrum P1 durch beide Ebenen und dreht die das obere Papier um einen beliebigen Winkel (etwa 20° bis 30°), wobei die Stecknadel die Drehachse bildet. Dann sticht man die Nadel durch das zweite Drehzentrum und dreht wiederum die obere Ebene um einen beliebigen Winkel usw. Nach der letzten Drehung markiert man durch Durchstechen die Lage der Punkte Πi auf der festen Ebene und ebenso Endlage der Punkte A und B, die mit A' und B' bezeichnet sind. Dadurch erhält man auf der festen Ebene eine Figur, die etwa so aussieht:

Diese Abbildung lässt sich auch als "Ausschneidebogen" zur Demonstration verwenden. Dazu schneidet man den linken Teil am blauen Polygonzug entlang aus. Dann legt man die Punkte Π6 und P6 wieder aufeinander und dreht den ausgeschnittenen linken Teil um Π6, bis Π5 auf P5 zu liegen kommt usw. So kann man den ganzen Vorgang rückwärts verfolgen, bis man am Anfang angekommen ist. Von dort kann man den ursprünglichen Ablauf nachvollziehen. Man kann also die wirkliche Bewegung der Ebene (oder des Körpers) annähern, indem man das körperfeste (blaue) Polygon um das raumfeste (rote) Polygon "kantet".

Wenn wir nun die Anzahl der betrachteten Bewegungspasen unbegrenzt wachsen lassen, so nähert sich der Bewegungsablauf unbeschränkt dem tatsächlichen Vorgang und die beiden Polygone werden zu glatten Kurven, von denen die blaue auf der roten abrollt. So ergibt sich folgender Satz:

Jede beliebige Bewegung eines starren Körpers in einer Ebene kann dadurch erzeugt werden, dass eine bestimmte, im Körper feste Kurve auf einer bestimmten, im Raume festen Kurve abrollt. Die erste Kurve heißt Gangpolkurve oder Körperzentrode, die zweite Rastpolkurve oder Raumzentrode.

Handelt es sich um die ebene Bewegung eines Körpers, so können wir in den Punkten der Rast– und Gangpolkurve Lote auf der festen Ebene errichten. Diese bilden je eine gerade Zylinderfläche, die Gangpolfläche (blau) und die Rastpolfläche (rot), die aufeinander abrollen.

 

 

Bewegung eines starren Körpers um einen festen Punkt

[Bearbeiten]

Eine solche Bewegung heißt auch sphärische Bewegung, weil sich dabei alle Punkte des Körpers auf Kugelschalen ("Sphären") bewegen, deren Mittelpunkt der feste Punkt O ist.

Wir betrachten wieder zwei Punkte A und B des starren Körpers. Durch eine beliebige Bewegung um den festen Punkt O mögen die beiden Punkte in die Endlage A' und B' überführt werden. Wenn wir wieder von dem tatsächlichen Verlauf der Bewegung absehen und nur die Ausgangs- und die Endlage betrachten, so kann der gleiche Effekt stets durch eine Rotation um eine durch den festen Punkt gehende Achse erzielt werden. Es gilt also der Satz: Eine beliebige Bewegung eines starren Körpers um einen festen Punkt ist äquivalent (d. h. hinsichtlich des Ergebnisses gleichwertig) einer Rotation um eine bestimmte, durch diesen Punkt gehende Achse (Eulersches Theorem).

Der Beweis verläuft analog zu dem für die ebene Bewegung.

Die beiden Dreicke OAA' und OBB' sind gleichschenklig. Wir errichten die mittelsenkrechte Ebene e auf AA' und f auf BB'. Jeder Punkt der Ebene e ist von A und A' gleich weit entfernt, und jeder Punkt der Ebene f ist von B und A'B' gleich weit entfernt. Beide Ebenen gehen durch O und schneiden einander in einer Geraden OC. Alle Punkte dieser Geraden haben die Eigenschaften der Punkte beider Ebenen gemeinsam: sie sind sowohl von A und A' als auch von B und B' gleich weit entfernt. Außerdem ist der Winkel AOC gleich dem Winkel A’OC und der Winkel BOC gleich dem Winkel B'OC.

Jede durch O gehende und in der Ebene e liegende Gerade kann als Drehachse dienen, um A in A' überzuführen. Dasselbe gilt für jede in der Ebene f liegende und durch O gehende Gerade bezüglich der Punkte B und B'. Da die Gerade OC zusammen mit der Strecke AB als starrer Körper aufgefasst werden kann, führt eine Drehung um OC, welche A in A' überführt, auch B in B' über.

Analog zu unserem Vorgehen bei der ebenen Bewegung betrachten wir nun mehrere Zwischenstadien der tatsächlichen Bewegung und nähern jede der Bewegungsphasen durch eine Rotation um einen bestimmte Achse an, die wie oben gefunden werden kann. Die verschiedenen Achsen und die von ihnen bestimmten Ebenen bilden dann einerseits eine im Raum feste Pyramidenfläche (Rastpolpyramide) mit der Spitze in O und andererseits eine im Körper feste (und somit im Raum bewegliche) Pyramidenfläche, die Gangpolpyramide. Beide Pyramiden rollen über die Kanten aneinander ab.

Wenn die Anzahl der betrachteten Bewegungsphasen unbeschränkt zunimmt, gehen die beiden Pyramidenflächen in Kegelflächen über, die aufeinander abrollen und deren Mantellinien die (raumfesten und körperfesten) momentanen Drehachsen sind.

Im Hinblick auf die später zu behandelnde Kreiselbewegung ist insbesondere der Fall interessant, in dem die beiden Kegelflächen kreisförmig sind. Dabei sind zwei Fälle zu unterscheiden: Der Gangpolkegel (blau) kann auf dem Rastpolkegel (rot) außen oder innen abrollen. Dies zeigt die folgenden Abbildung.

 


 

Die allgemeinste Bewegung eines starren Körpers

[Bearbeiten]

Die allgemeinste Bewegung eines Körpers ist eine Bewegung, die keinen Einschränkungen unterliegt. Ein solcher frei beweglicher Körper hat sechs Freiheitsgrade, drei Freiheitsgrade der Translation und drei der Rotation. Seine Lage ist festgelegt durch Angabe von drei seiner Punkte. Die Anfangslage dieser Punkte sei A, B, C, ihre Endlage sei A', B', C'.

Es kann gezeigt werden, dass jede solche Bewegung äquivalent einer Schraubenbewegung ist. Das heißt: Zu jeder Bewegung eines starren Körpers lässt sich eine Schraubenlinie angeben, welche (ohne Berücksichtigung der Zwischenpositionen) die Punkte A, B, C in die Punkte A', B', C' überführt (Theorem von Chasles).

Auch hier kann der tatsächliche Bewegungsablauf durch eine Anzahl n von einzelnen Schraubenbewegungen angenähert werden. Für n gegen unendlich ergibt sich eine kontinuierliche Folge von unendlich vielen, verschwindend kleinen Schraubenbewegungen, welche den tatsächlichen Bewegungsablauf exakt wiedergibt. Eine solche Bewegungsfolge heißt Schrotung.

 

 

 

Kräftesysteme, die an einem starren Körper angreifen

[Bearbeiten]

Ein einzelner Massenpunkt erfährt keine Beschleunigung, wenn die Resultierende aller an ihm angreifenden Kräfte null ist. Man sagt dann, die angreifenden Kräfte seien im Gleichgewicht (oder auch – weniger präzise – der Massenpunkt sei im Gleichgewicht).Analog gilt für ein System von Massenpunkten, dass sein Schwerpunkt keine Beschleunigung erfährt, wenn die Resultierende aller Kräfte, die an dem Punktsystem angreifen, null ist. Es sei Fi die Resultierende aller Kräfte, die am i-ten Massenpunkten angreifen. Dann lautet die Bedingung für die Kräftefreiheit seines Schwerpunkts also:

Das bedeutet jedoch nicht unbedingt, dass dann auch alle Massenpunkte des Systems unbeschleunigt sind, denn es könnte ja noch Rotationsbeschleunigungen um den (unbeschleunigten) Schwerpunkt geben. Die notwendige und hinreichende Bedingung für das Fehlen von Rotationsbeschleunigungen ist, dass die Summe aller an dem System angreifenden Drehmomente null ist:



Beweis: Wie ich im Wikibuch "Mechanik realer Körper" im Kapitel "Drehimpuls und Drehmoment" gezeigt habe, ist ganz allgemein bei einem System von Massenpunkten



Das bedeutet: Die Änderungsgeschwindigkeit dLO/dt des Drehimpulses LO des Systems ist gleich der Summe der auf das System einwirkenden Drehmomente. Wenn das Drehmoment MO null ist, ist auch die Summe der Änderungen der Drehimpulse im Zeitelement dt gleich null. Das damals betrachtete System bestand allerdings aus unabhängigen Massenpunkten. In einem solchen System ist es denkbar, dass verschiedene Massenpunkte positive bzw. negative Drehimpulsänderungen erfahren, die einander kompensieren können. Da wir aber nun ein starres System von Massenpunkten betrachten, müssen eventuelle Änderungen des Drehimpulses der einzelnen Massenpunkte stets dasselbe Vorzeichen haben. Ihre Summe kann daher nur dann null sein, wenn sie alle einzeln null sind. Also finden für MO gleich 0 im System keine Rotationsbeschleunigungen statt.

Folglich gilt: Notwendige und hinreichende Bedingung für das Fehlen von Translations- und Rotationsbeschleunigung bei einem starren Körpers ist, dass sowohl die Resultiere F der Kräfte als auch die Resultierende M der Drehmomente, die an dem Körper angreifen, null ist:



Für die Wirkung des an einem starren Körper angreifenden Kräftesystems kommt es also nur auf die beiden Resultierenden F und M an. Dies gilt – wie später gezeigt werden wird – nicht nur für den (statischen) Fall, dass keine Beschleunigungen stattfinden. Auch in den Gleichungen der Dynamik treten nur diese beiden Summenvektoren auf, sodass man sagen kann: Alle Systeme von Kräften, die in den Resultierenden F und M übereinstimmen, sind in ihrer Wirkung gleichwertig (äquivalent).

In diesem Zusammenhang begegnet uns ein weiterer Typ von Vektoren: Im Gegensatz zu den freien Vektoren (sie sind beliebig verschiebbar) und den gebundenen Vektoren (sie sind an einen Punkt gebunden; z. B. Feldvektoren und Ortsvektoren), dürfen Kraftvektoren nur in ihrer Wirkungslinie verschoben werden, da sich bei einer Parallelverschiebung außerhalb ihrer Wirkungslinie das von ihnen ausgeübte Drehmoment ändert. Solche Vektoren heißen linienflüchtig.

Dass Kraftvektoren nur in ihrer Wirkungslinie verschoben werden dürfen, hat Konsequenzen für die graphische Addition paralleler und antiparalleler Kräfte.

1. Fall: Parallele Kräfte F1 und F2 Um die Resultierende der beiden Kräfte und ihre Wirkungslinie zu finden, verschieben wir zunächst eine der beiden Kräfte (hier F1) in ihrer Wirkungslinie, sodass die Verbindungslinie der Angriffspunkte der beiden Kräfte auf ihren Wirkungslinien senkrecht steht. Dann addieren wir zu beiden Kräften eine Hilfskraft Fx bzw. – Fx. Da sowohl die Summe wie das Drehmoment der beiden Kräfte null ist, ändert ihr Hinzufügen nichts an dem gegebenen Kräftesystem. Nun werden die beiden resultierenden Kräfte (grün) ermittelt und beide in ihren Wirkungslinien bis zum Schnitt verschoben. Durch Addition ergibt sich die resultierende Kraft FR. Sie ist parallel zu F1 und F2. Ihr Betrag ist gleich der Summe F1 + F2. Die Resultierende kann nach Belieben in ihrer Wirkungslinie verschoben werden. Geschieht das so, wie in der Abbildung gezeigt, erkennt man, dass ihre Abstände von den beiden Teilkräften nach dem Hebelgesetz berechnet werden können.


2. Fall: Antiparallele Kräfte


Die größere der beiden Kräfte (hier F2) wird in zwei Teilkräfte - F1 und F3 zerlegt. F1 und - F1 bilden zusammen ein Kräftepaar (das sind zwei entgegengesetzt gleiche Kräfte, die nicht am selben Punkt angreifen). Also gilt:

Antiparallele Kräfte sind äquivalent einer Einzelkraft und einem Kräftepaar.

Ist F2 = – F1, so ist die Einzelkraft null. Dies ist ein einfaches Beispiel dafür, dass zwar F = O, aber M' ungleich null sein kann.

Das Drehmoment des Kräftepaares ist


Das Drehmoment eines Kräftepaares ist also von der Lage des Bezugspunktes O unabhängig.

Im Allgemeinen jedoch hängt der Betrag eines Drehmoments vom Bezugspunkt O ab, da sich bei einer Verlagerung des Bezugspunktes die "Kraftarme" ändern und sogar beliebig groß werden können. Das Drehmoment ist jedoch immer dann vom Bezugspunkt unabhängig, wenn die Resultierende F der Kräfte null ist.

Beweis: Verschiebt man den Bezugspunkt O um den Vektor s nach O' und bezeichnet die neuen Ortsvektoren mit r' , so ist


Für F = 0 verschwindet der letzte Term und es bleibt übrig



Wie oben gesagt wurde, kommt es bei einem Kräftesystem, das an einem starren Körper angreift, nur auf die Resultierenden F und M an. Die Resultierende F ist eine einzelne Kraft, und das resultierende Moment M kann durch ein geeignetes Kräftepaar aufgebracht werden. Also gilt:

Jedes an einem starren Körper angreifende Kräftesystem kann ersetzt werden durch eine Einzelkraft und ein Kräftepaar.


 

 

Rotation um eine feste Achse

[Bearbeiten]

Wenn ein starrer Körper in zwei Punkten O und O' fixiert wird, ist seine Freiheit auf die Rotation um die Achse OO' eingeschränkt. Er hat nur noch einen Freiheitsgrad, und seine Lage ist durch den Drehwinkel φ eindeutig beschrieben.

Von den an ihm angreifenden Drehmomenten wirken lediglich ihre in der Drehachse liegenden Komponenten; die übrigen Komponenten werden durch Zwangskräfte in den Lagern kompensiert.

Wir legen nun den Ursprung des Koordinatensystems in den Punkt O und die Z-Achse in die Drehachse.


Die Gleichung für die Änderung des Gesamt-Drehimpulses des Körpers vereinfacht sich daher auf die Berücksichtigung der Z-Komponenten des Drehimpulses und der Resultierenden der (auf den Punkt O bezogenen) Drehmomente:



Für den Drehimpuls L gilt:



und mit




wobei ωk der Vektor der Winkelgeschwindigkeit ist.

Für ein zweifaches Vektorprodukt gilt:



Also ist



und



Die Z-Komponente von L ist gleich der Z-Komponente der rechten Seite der Gleichung:


und schließlich



Die Größe


heißt Trägheitsmoment des Körpers bezüglich der Z-Achse und wird aus einem erst später erkennbaren Grund Jzz genannt.


Damit ergibt sich die (einzige) Bewegungsgleichung des Körpers:



Ein Vergleich mit der Bewegungsgleichung der eindimensionalen Translationsbewegung


zeigt die formale Identität der beiden Gleichungen, wobei einander entsprechen:

Trägheitsmoment Jzz --- Masse m

Winkelbeschleunigung d2φ/dt2 --- Bahnbeschleunigung d2x /dt2

Axiale Komponente des Drehmoments --- Bahnkomponente der Kraft

Die kinetische Energie des rotierenden Körpers ist



in völliger Analogie zur kinetischen Energie der Translationsbewegung



 

Das Trägheitsmoment starrer Körper

[Bearbeiten]

Das Trägheitsmoment eines homogenen Körpers

[Bearbeiten]

Aus der Definition des Trägheitsmoments folgt für einen homogenen Körper (das ist ein Körper mit kontinuierlicher Massenverteilung und konstanter Dichte ρ)



wobei r jetzt den Abstand des Massen- bzw. Volumenelements von der Drehachse bedeutet.

 


Der Satz von Steiner

[Bearbeiten]

Kennt man das Trägheitsmoment eines Körpers bezüglich einer durch den Schwerpunkt gehenden Achse, so lässt sich ohne neuerliche Integration sein Trägheitsmoment bezüglich jeder dazu parallelen Achse berechnen (und umgekehrt).


Ein Körper rotiere um eine durch A gehende, auf der Zeichenebene senkrecht stehende Achse. S sei eine dazu parallele, durch den Schwerpunkt des Körpers gehende Achse im Abstand s. Der Körper sei mit der Drehachse A starr verbunden. Dann dreht er sich, während er einmal um A rotiert, gleichzeitig genau einmal um seine Schwerpunktachse. Sein Trägheitsmoment bezüglich der Schwerpunktachse sei JS, sein Trägheitsmoment bezüglich der Achse A sei JA. Die Winkelgeschwindigkeit der beiden Rotationen sei ω.

Wir betrachten nun die kinetische Energie des rotierenden Körpers. Sie setzt sich einerseits zusammen aus der Rotationsenergie bezüglich der Schwerpunktachse und der kinetischen Energie der Kreisbewegung um A:



Andererseits ergibt sich die kinetische Energie aus dem Trägheitsmoment bezüglich der Achse A zu



Durch Vergleich erhält man




 

Das Trägheitsellipsoid

[Bearbeiten]

Für eine beliebige Drehachse A durch einen Punkt O, deren Richtung durch den Einheitsvektor a beschrieben wird, stellen wir folgende Überlegungen an: Den Punkt O machen wir zum Ausgangspunkt der Ortsvektoren ri. Die Richtungskosinus des Vektors a seien cos α, cos β, cos γ. Das Trägheitsmoment des betrachteten Körpers bezüglich der Achse ist dann



Das Trägheitsmoment ist demnach eine quadratische Funktion der Richtungskosinus der Achse. Die Koeffizienten dieser Funktion sind zum einen die Trägheitsmomente des Körpers bezüglich der Koordinatenachsen:





zum anderen die folgenden Größen, welche Deviationsmomente genannt werden:


Damit lautet die obige Gleichung



Ich werde nun statt der Richtungskosinus der Achse die Koordinaten eines auf der Achse gelegenen Punktes P(x, y, z) mit dem Ortsvektor r einführen. Dann ist:


und

wobei r 2 = x 2 + y 2 + z 2 ist.

Die Gleichung vereinfacht sich erheblich, wenn wir P so wählen, dass r 2 = 1/J ist. Sie lautet dann:



Dies ist die Gleichung einer Fläche zweiter Ordnung, also eines Ellipsoids, eines Paraboloids oder eines Hyperboloids, das wegen der oben getroffenen Verabredung folgende Eigenschaft hat: Der Abstand r eines jeden Punktes P der Fläche vom Punkt O ist gleich dem Kehrwert aus der Wurzel des Trägheitsmoments J, das der betrachtete Körper bezüglich der Achse OP hat. Da das Trägheitsmoment eines realen Körpers niemals null sein kann, wird r niemals unendlich. Folglich muss die Fläche ein Ellipsoid sein (in Spezialfällen ein Rotationsellipsoid oder eine Kugel).

Das Ellipsoid ist durch die sechs Koeffizienten seiner Gleichung eindeutig bestimmt. Bei Kenntnis dieser Größen kann man den Abstand r eines jeden Punktes P der Fläche von O berechnen, woraus sich dann das Trägheitsmoment des betrachteten Körpers bezüglich der Achse OP ergibt: J = 1/r2. Das Ellipsoid heißt daher Trägheitsellipsoid des Körpers für den Punkt O.

Aus der Analytischen Geometrie ist bekannt, dass es für jede Fläche 2. Ordnung ein ausgezeichnetes Koordinatensystem ('X', Y', Z') gibt (und zwar das Koordinatensystem, dessen Achsen in Richtung der Hauptachsen des Ellipsoids liegen), in welchem die Flächengleichung eine besonders einfache Form annimmt, nämlich die Form

JI x' 2 + JII y' 2 + JIII z' 2 = 1

wobei JI, JII und JIII' zunächst irgendwelche Koeffizienten sind. In unserem Fall heißen diese drei Größen die Hauptträgheitsmomente des Körpers (bezüglich O). Sind die Achsen der Hauptträgheitsmomente und deren Beträge bekannt, so kann daraus das Trägheitsmoment des Körpers für jede beliebige Achse durch O ermittelt werden. Ist O zugleich der Schwerpunkt S des Körpers, so kann man aus den Hauptträgheitsmomenten zunächst das Trägheitsmoment für jede andere Achse durch S berechnen und daraus nach dem Satz von Steiner das Trägheitsmoment für jede dazu parallele Achse.

Ein Vergleich der beiden Gleichungen des Trägheitsellipsoids zeigt, dass beim Übergang auf die Hauptträgheitsachsen Folgendes geschieht:


 

Trägheitsmoment und Rotationsenergie

[Bearbeiten]

Für die Rotationsenergie des Körpers gilt

wobei ω der Betrag der Winkelgeschwindigkeit und a der Einheitsvektor in der Drehachse ist.

In dem Koordinatensystem, dessen Achsen mit den Hauptträgheitsachsen des Körpers zusammenfallen, ist


wobei



und somit


ist.

 

Beispiel: Es soll das Trägheitsellipsoid für den Mittelpunkt eines Würfels untersucht werden.

Vorüberlegungen: Die Hauptachsen eines Ellipsoids haben einige besondere Eigenschaften:

1. Die Hauptachsen (und damit auch die von ihnen aufgespannten Ebenen) stehen aufeinander senkrecht.

2. Die Hauptachsen und ihre Ebenen sind Symmetrieachsen bzw. –ebenen für das Ellipsoid.

3. Die auf den Hauptachsen gelegenen Punkte des Ellipsoids haben vom Mittelpunkt extreme Abstände: diese sind entweder größer oder kleiner als die Abstände der Nachbarpunkte vom Mittelpunkt.

4. Die Eigenschaften 2. und 3. sind hinreichende Bedingungen dafür, dass drei aufeinander senkrechte Achsen Hauptachsen sind.

Betrachten wir nun ein Koordinatensystem mit dem Ursprung im Mittelpunkt des Würfels, dessen Achsen parallel zu den Kanten des Würfels sind. Die Symmetrie des Würfels bezüglich dieser Achsen überträgt sich natürlich auch auf sein Trägheitsellipsoid. Folglich (gemäß 4.) sind die Koordinatenachsen Hauptachsen des Würfels. Aus der Symmetrie folgt weiter, dass die Hauptachsen gleich lang sein müssen, also ist das Trägheitsellipsoid eine Kugel. Daraus folgt, dass das Trägheitsmoment des Würfels für jede Achse durch den Mittelpunkt gleich ist. Für das Trägheitsmoment bezüglich der Z-Achse gilt dann:


a = Kantenlänge, M = Masse des Würfels.

Dieses Ergebnis gilt z. B. auch für die Raumdiagonale des Würfels, für welche die analytische Berechnung des Trägheitsmoments schwieriger wäre.


 

Trägheitsmoment einer regelmäßigen Pyramide

[Bearbeiten]

Die Berechnung des Trägheitsmomentes einer regelmäßigen geraden Pyramide ist mit einer gewissen Schwierigkeit verbunden. Sie besteht darin, die richtigen Integrationsgrenzen zur Bestimmung der Masseverteilung zu finden. Um diese zu meistern, empfielt es sich, nicht über das Volumen der gesamten Pyramide zu integrieren, sondern nur über ein Teilstück. Denn jede n-seitige Pyramide lässt sich in n Pyramidenstücke zerlegen, ähnlich der Aufteilung eines Kuchens in Kuchenstücke (siehe Skizze). Berechnet man das Trägheitsmoment eines solchen Stückes und multipliziert es dann mit der Seitenzahl der Pyramide, erhält man so das Trägheitsmoment der gesamten Pyramide.Dieses Vorgehen soll im Folgenden allgemein für eine n-seitige Pyramide demonstriert werden. Die daraus resultierende Formel eignet sich zur Berechnung des Trägheitsmomentes jeder regelmäßigen geraden Pyramide.


Vorgehen bei der Herleitung:

1. Festlegung der Volumen-Integrationsgrenzen des Pyramidenstücks

2. Berechnung des Trägheitsmoments in Abhängigkeit von der Dichte

3. Umrechnung in das Trägheitsmoment in Abhängigkeit von der Masse



Legende:

Die Skizze zeigt eine fünfseitige regelmäßige gerade Pyramide als ein Beispiel für eine n-seitige regelmäßige gerade Pyramide. Das für die Integration wichtige Teilstück ist rot hervorgehoben.

r...Radius des Umkreises um die Pyramidengrundfläche

n...Anzahl der Pyramidenseiten (in dieser Skizze fünf)

h...Höhe der Pyramide

α...Winkel zwischen den beiden Schenkeln der Dreiecks-Grundfläche des Pyramidenstücks


Wichtige Beziehungen:

α = 2π/n

d = r sinα

r = e + f












1. Die Integrationsgrenzen des Pyramidenstücks:

Damit die Integrationsgrenzen möglichst einfach werden, wird die Pyramide, bzw. das Pyramidenstück auf die Spitze gestellt, so dass (entgegen der Skizze) die Spitze im Koordinatenursprung liegt. Die Integrationsgrenzen in z-Richtung ergeben sich dann von selbst:

.

In y-Richtung beginnt die Integration immer von der x-Achse aus, also bei y=0. Die zweite Integrationsgrenze stellt eine von der Höhe z, bzw. von abhängige "Verkürzung" der Länge dar:

.

Die erste Integrationsgrenze in x-Richtung ist eine von y, bzw. von abhängige "Verkürzung" von , also . Die zweite Grenze besteht aus zwei Komponenten: eine von z, bzw. abhängige "Verkürzung" von : , verringert um eine von y, bzw. abhängige "Verkürzung" von f: . Es gilt: . Damit ist . Und die Integrationsgrenzen in x-Richtung lauten:

.



2. Berechnung des Trägheitsmoments in Abhängigkeit von der Dichte :

Die allgemeine Formel zur Berechnung eines Trägheitsmomentes kann in folgender Form angegeben werden:

In diese Formel werden nun die oben gefundenen Integrationsgrenzen für das Pyramidenstück eingesetzt, multipliziert mit der Anzahl der Pyramidenstücke n ergibt sich die Integralformel für das Trägheitsmoment der Pyramide in Abhängigkeit von der Dichte:

Nun wird das Dreifach-Integral ausgerechnet. Man beginnt mit der Integration von nach und setzt dort dann die Integrationsgrenzen in x-Richtung ein:

Als nächstes wird nach integriert, dann die entsprechenden Integrationsgenzen eingesetzt und ausgeklammert; im zweiten Schritt wird der Term zusammengefasst:

Zuletzt wird noch nach integriert, die verbleibenden Integrationsgenzen eingesetzt und zusammengefasst. Somit ergibt sich für das Trägheitsmoment der Pyramide:

(1)



3. Das Trägheitsmoment der Pyramide in Abhängigkeit von der Masse :

Die bisher erhaltene Formel gibt das Trägheitsmoment einer n-seitigen Pyramide in Abhängigkeit von der Dichte an. Benötigt wird aber in der Regel das Trägheitsmoment in Abhängigkeit von der Masse . Wir erhalten diese über die Beziehung . Zur Berechnung von dienen wieder die bereits verwendeten Integrationsgrenzen für ein Pyramidenstück:

Nach dreimaliger Integration und Einsetzung der Integrationsgrenzen erhalten wir:

Nun kann in (1) durch ersetzt werden:

Diese Gleichung zusammengefasst ergibt das Trägheitsmoment einer n-seitigen regelmäßigen geraden Pyramide:

.

 

Trägheitsmoment eines regelmäßigen Prismas

[Bearbeiten]

Beim regelmäßigen Prisma ist das Vorgehen analog zur Pyramide. Nur die Integrationsgrenzen sind entsprechend einfacher:

In z-Richtung:, in y-Richtung:und in x-Richtung: .

Da das Prisma in jeder Höhe den gleichen Querschnitt hat, sind die Integrale nicht mehr von der Höhe abhängig und so fallen alle von z abhängigen "Verkürzungen" weg. In die Formel

werden wieder die Integrationsgrenzen eingesetzt, dann über alle Richtungen integriert. Das Trägheitsmoment wird dann noch durch

(das Volumen eines n-seitigen Prismas) geteilt. So lautet das Trägheitsmoment eines n-seitigen regelmäßigen geraden Prismas:

.



Beispiele für die Trägheitsmomente von Pyramiden und Prismen:

Seitenzahl Trägheitsmoment Pyramide Trägheitsmoment Prisma
3
4
5
6
8
10
12

(Quelle: Mathematica 5.1)

 


Bewegung eines starren Körpers um einen festen Punkt

[Bearbeiten]

Zusammenhang zwischen Trägheitsmoment, Drehimpuls und Winkelgeschwindigkeit

[Bearbeiten]

Wir nehmen nun an, der betrachtete Körper sei lediglich in einem Punkt O fixiert. Dann wird im Allgemeinen seine Drehachse im Raum nicht stillstehen, sondern sich um O drehen.

Zur Untersuchung des Drehimpulses des Körpers greife ich noch einmal auf eine Betrachtung am Anfang des Kapitels "Rotation um eine feste Achse" zurück. Wenn der Körper nicht mehr um k, sondern um eine beliebige Achse mit dem Einheitsvektor a rotiert, dann gilt:



Die Zerlegung in Komponenten ergibt:



oder



wobei ωx die X-Komponente des Vektors ω der Winkelgeschwindigkeit bedeutet, usw.

Entsprechend findet man:




Legt man nun die Achsen des Koordinatensystems in die Hauptachsen des Trägheitsellipsoids, so wird (siehe im vorangegangenen Kapitel)

Jxx = JI ,

Jyy=JII ,

Jzz=JIII ,

während alle übrigen Koeffizienten gleich null werden. Somit ergibt sich:





Wie man erkennt, hat der Drehimpulsvektor im Allgemeinen nicht die gleiche Richtung wie der Vektor der Winkelgeschwindigkeit. Diese Feststellung ist natürlich unabhängig davon, auf welches Koordinatensystem die Vektoren bezogen sind. Nur für JI = JII =JIII (also wenn das Trägheitsellipsoid ein Kreis ist) sind Drehimpuls und Winkelgeschwindigkeit gleichgerichtet.

Das ( X',Y',Z' )-Koordinatensystem liegt als Achsenkreuz des Trägheitsellipsoids im Körper fest und ändert daher bei der Rotation des Körpers seine Richtung im Raum. Alle bisher abgeleiteten allgemeinen Gesetze, wie z. B. der Satz von der Erhaltung des Drehimpulses beim Fehlen äußerer Kräfte, gelten aber für ein raumfestes Koordinatensystem. Diese Tatsache ist grundsätzlich zu beachten. So würde z. B. ein mit dem Körper rotierender Beobachter den raumfesten Vektor des Drehimpulses L als bewegt wahrnehmen.

 

Kreisel

[Bearbeiten]

Ein Kreisel ist ein (im Allgemeinen) schnell rotierender starrer Körper. Am einfachsten zu behandeln ist ein Kreisel mit drei gleichen Trägheitsmomenten. Ein solcher heißt Kugelkreisel, auch wenn er nicht die Gestalt einer Kugel hat. Technische Kreisel sind im Allgemeinen Rotationskörper, bei denen nur zwei Hauptträgheitsmomente gleich sind; ihr Trägheitsellipsoid ist ein Rotationsellipsoid.

Kreisel mit drei verschiedenen Hauptträgheitsmomenten sind mathematisch sehr schwer zu behandeln; sie kommen in der technischen Mechanik kaum vor, spielen aber als Modelle in der Molekularphysik eine Rolle. Ich beschränke mich hier auf die Betrachtung rotationssymmetrischer Kreisel.

Wir legen die k' -Achse des körperfesten Koordinatensystems in die Symmetrieachse des Kreisels, die Figurenachse genannt wird. Sie ist auch die Figurenachse des rotationssymmetrischen Trägheitsellipsoids. Es gibt dann ein Trägheitsmoment J bezüglich der Figurenachse und ein Trägheitsmoment Js bezüglich jeder zur Figurenachse senkrechten Achse. Es ist nun:


da wegen der Symmetrie des Körpers die beiden Integrale in der Mitte der Zeile gleich sind. Ferner ist

Wir setzen nun


Dann ist


und wegen


ist


und folglich



Ich stelle nun den Vektor ω der Winkelgeschwindigkeit und den Vektor L des Drehimpulses im körperfesten Koordinatensystem dar und fasse die zu k' senkrechten Komponenten von ω zu einem Vektor ωs zusammen. (Aus technischen Gründen muss ich für den Vektor der Winkelgeschwindigkeit eine doppelte Schreibweise anwenden: Im Text wird der Vektor - wie üblich - fett und kursiv geschrieben, in den Formeln durch einen Pfeil über dem ω gekennzeichnet.)




Berechnet man aus der oberen Gleichung ω und setzt das Ergebnis in die untere Gleichung ein, so erhält man



Beim rotationssymmetrischen Kreisel liegen also der Vektor ω der Winkelgeschwindigkeit, der des Drehimpulses L und der Vektor k der Figurenachse in einer Ebene.


Die folgende Abbildung macht dieses Ergebnis anschaulich:


 

Der kräftefreie symmetrische Kreisel

[Bearbeiten]

Bei einem Kreisel, auf den kein Drehmoment einwirkt, bleibt der Drehimpuls L konstant. Die Differentiation der letzten Gleichung des vorangegangenen Abschnitts nach der Zeit ergibt daher wegen dL/dt = 0 :



Nun ist aber bei der Rotation eines Ortsvektors r sein Geschwindigkeitsvektor v:


Dies gilt auch für den Einheitsvektor k' , den man ja als den Ortsvektor eines Punktes auf der Z' -Achse im Abstand 1 von O auffassen kann. Folglich ist:

Daraus folgt, dass

und daher

ist. Folglich ist


Multipliziert man diese Gleichung skalar mit k' , so erhält man


Wegen


und mit


ergibt sich schließlich


was bedeutet, dass ωz' = konst.

Multipliziert man Gleichung (A) skalar mit ω und berücksichtigt, dass dωz' / dt = 0 ist, so ergibt sich


Das bedeutet, dass auch der Betrag ω des Vektors ω konstant ist.

Wenden wir diese Ergebnisse auf die letzte Abbildung an, so erkennen wir, dass die Form des blauen Vektordreiecks unveränderlich ist. Auch der Winkel zwischen dem konstante Vektor L und dem Vektor k' muss konstant sein. Die einzige Möglichkeit einer Veränderung besteht folglich darin, dass sich die Ebene der Vektoren im Raum dreht. Die Drehachse muss dabei die unveränderliche Richtung von L sein. Die Bewegung des kräftefreien symmetrischen Kreisels kann also nur darin bestehen, dass der Vektor ω der momentanen Drehachse einen Kegel um die raumfeste Drehmomentachse L beschreibt und der Kreisel selbst um ω rotiert. Diese Bewegung wird Nutation genannt.

Nun kann aber jede Bewegung eines starren Körpers (siehe das gleichnamige Kapitel) durch das Abrollen des Gangpolkegels auf dem Rastpolkegel dargestellt werden. Die (momentan) gemeinsame Mantellinie der beiden Kegel liegt dabei auf dem Vektor der Winkelgeschwindigkeit. Die Figurenachse k' des Kreisels beschreibt dabei einen Kegel, dessen Achse auf dem Vektor L liegt.

 

Der Kreisel unter der Wirkung eines äußeren Drehmoments

[Bearbeiten]

Um zu erforschen, wie sich ein frei beweglicher Kreisel unter der Wirkung eines äußeren Drehmoments verhält, denken wir uns den Kreisel K in einem Gehäuse G reibungsfrei gelagert, das durch eine kardanische Aufhängung in allen Richtungen gedreht werden kann. (Von einer Translationsbewegung des Gehäuses und damit auch des Kreisels können wir absehen, da sich dadurch nichts Neues ergibt.) Der Schwerpunkt des Kreisels falle mit dem Zentrum der kardanischen Aufhängung zusammen. Die Kreiselachse sei die k-Achse.

Der Kreisel werde durch Drehmoment parallel zur Drehachse auf die gewünschte Drehzahl gebracht. Wenn das Drehmoment zu wirken aufhört, bleibt seine Winkelgeschwindigkeit ωz k konstant.

Nun soll sich das Gehäuse mit der Winkelgeschwindigkeit Ω drehen, und wir fragen nach dem Drehmoment, das erforderlich ist, um diese Drehung hervorzubringen. Wir zerlegen dazu Ω in seine Komponenten:

Ω = Ωx i + Ωy j + Ωz k

Diese Winkelgeschwindigkeit überlagert sich – so sollte man meinen – additiv der Winkelgeschwindigkeit des Kreisels, da die beiden Drehachsen durch den Kreiselmittelpunkt gehen. Nun ist aber zu beachten, dass wegen der reibungsfreien Lagerung des Kreisels die Z-Komponente von Ω sich nicht auf den Kreisel überträgt und daher ωz konstant bleibt. Wir müssen daher bei der Addition die Z-Komponente von Ω weglassen und dürfen nur die auf k senkrechte Komponente Ωs berücksichtigen: Die neue Winkelgeschwindigkeit des Kreisels ist daher:

ω = Ωs + ωzk

Ich wende jetzt die im Kapitel "Kreisel" hergeleitete Gleichung auf unser Problem an (man ersetze dabei k' durch k) und löse sie zunächst nach L auf:



und mit (siehe oben)


(letzteres wegen ωz = Konst.) folgt daraus


Mit


ergeben sich daraus die beiden wichtigen Formen der Grundgleichung:


Auffällig ist, dass das erforderliche Drehmoment nicht nur von dΩs/dt, sondern auch von Ωs abhängt und auch dann nicht null ist, wenn Ωs konstant ist. In diesem Fall ist



Der Vektor M steht also auf Ω und k senkrecht und ist in der Abbildung nach hinten gerichtet. Wenn sich das Gehäuse dreht, dreht sich auch der Vektor M, und zwar in einer horizontalen Ebene. Ein solches Drehmoment lässt sich am einfachsten dadurch erzeugen, dass man irgendwo am Gehäuse eine Masse m mit dem Hebelarm a anbringt, deren Gewichtskraft G das Gehäuse im richtigen Sinn zu drehen sucht. Das Ergebnis ist dann nicht etwa ein Kippen des Gehäuses, sondern eine gleichmäßige Rotation. Diese Erscheinung heißt Präzession. Sie ist sehr viel wichtiger als die oben beschriebene Nutation. Die Winkelgeschwindigkeit Ω der Präzession ergibt sich wie folgt:


Der Betrag des Drehmoments ist


woraus sich die Winkelgeschwindigkeit ergibt:


Mechanik flüssiger und gasförmiger Körper

[Bearbeiten]
Wikibooks Dieses Buch wurde in den Wikibooks:Buchkatalog aufgenommen.


Gleichgewichtszustände flüssiger und gasförmiger Körper

[Bearbeiten]

Auch Flüssigkeiten und Gase können in der Mechanik als homogene Kontinua angesehen und behandelt werden. Allerdings ist zur Erklärung ihres unterschiedlichen Verhaltens (auch im Vergleich mit Festkörpern) das Wissen um ihren Aufbau aus einzelnen, diskreten Atomen oder Molekülen wichtig. Da die Moleküle in Flüssigkeiten und Gasen nicht (elastisch) an einen festen Ort gebunden, sondern frei beweglich sind, setzen diese Körper einer Veränderung ihrer Form keinen Widerstand entgegen und passen ihre Gestalt der Form ihres Gefäßes an. Dass Flüssigkeiten fast nicht kompressibel sind, lässt darauf schließen, dass ihre Moleküle nahezu dicht gepackt sind. Dass sie andererseits aber eine hautähnliche Oberfläche mit einer Oberflächenspannung bilden und nicht – wie Gase – jeden ihnen gebotenen Raum einnehmen, zeigt, dass zwischen den Molekülen noch beträchtliche anziehende Kräfte wirken. Gase dagegen sind leicht komprimierbar und expandieren andererseits in jeden ihnen gebotenen Raum und üben auf die Gefäßwände einen Druck aus. Die erste Eigenschaft erklärt sich daraus, dass die Abstände der Moleküle ein Vielfaches ihrer Abmessungen betragen und zwischen ihnen keine abstoßenden Kräfte wirken. Die unbegrenzte Expansion und der Druck auf die Wände (auch auf die Oberfläche eines im Inneren befindlichen Körpers) rühren her von der beträchtlichen Geschwindigkeit, mit der sich die Gasmoleküle bewegen und auf die Wände stoßen.

Auch im Innern einer Flüssigkeit herrscht ein bestimmter Druck, wobei (in einem Gravitationsfeld) der durch das Gewicht der jeweils darüber befindlichen Flüssigkeit ausgeübte Druck (hydrostatischer Druck) eine besondere Rolle spielt. Die gleiche Ursache hat in Gasen der – naturgemäß viel kleinere – aerostatische Druck.

Wenn wir im Folgenden sehr kleine Volumenelemente betrachten, so sollen deren Abmessungen noch immer sehr groß sein gegen die Abmessungen und Abstände der Moleküle, denn nur dann ist es möglich, von einem definierten Druck zu sprechen. (Wenn diese Bedingung nicht erfüllt ist, werden pro Sekunde nur noch sehr wenige Moleküle – oder auch einmal gar keine – auf die Oberfläche treffen, und dann kann man nicht mehr von einem bestimmten Druck sprechen.)

Wenn wir von Reibungskräften zunächst absehen, wirkt auf jedes Oberflächenelement eines Volumenelements ein Druck, der auf der Fläche stets senkrecht steht, weil von außen keine tangentialen Kräfte ausgeübt werden.

Im Allgemeinen herrscht im Innern einer Flüssigkeit und eines Gases (im Folgenden "Medium" genannt) ein von Ort zu Ort variierender Druck, der sich außerdem mit der Zeit verändern kann. Wir betrachten zunächst eine Momentaufnahme eines Volumenelements ΔV, sodass zeitliche Veränderungen keine Rolle spielen. Das Volumenelement sei ein Quader (seine Kanten parallel zu den Koordinatenachsen) mit den Seiten Δx, Δy und Δz. An der linken Seitenfläche sei der mittlere Druck gleich p1, an der rechten Seitenfläche gleich p2. Die von diesen Drucken ausgeübten Kräfte seien Δ F1 und Δ F2


Unter der Voraussetzung, dass die Druckverteilung wenigstens in der Umgebung des betrachteten Punktes P durch eine Funktion p(r) dargestellt werden kann, die stetig ist und stetige partielle Ableitungen besitzt, gelten folgende Überlegungen: Es ist


wobei die partielle Ableitung an der Stelle P zu bilden ist.

Die Druckkräfte auf die betrachteten Seitenflächen sind dann



Analog findet man:


Die Gesamtkraft auf das Volumenelement ist dann


und damit gilt für die "volumenbezogene Kraft" in P:


Dividiert man die Gleichung durch die Dichte ρ des Mediums, so erhält man die "massebezogene Kraft" in P:


Die beiden "bezogenen Kräfte" sind also, wie zu erwarten, der Richtung von grad p, also der Richtung des stärksten Anstiegs von p, entgegengesetzt gerichtet.

Bei Anwendung der letzten Gleichung ist zu berücksichtigen, dass die Dichte ρ = ρ(p, T) eine Funktion der Temperatur und (bei Gasen) des Drucks ist.

Die nächste Frage ist: Was richten diese "bezogenen Kräfte" aus? Anders ausgedrückt: Nach dem Newtonschen Axiom "actio = reactio" muss es eine entgegengesetzt gleich große "bezogene Kraft" geben, die der ersten bezogenen Kraft das Gleichgewicht hält. Welche ist das?

Im statischen Zustand, d. h. wenn das Medium sich nicht bewegt, können die Kräfte nur vom Gewicht des Mediums herrühren. In diesem Fall ist das Gewicht des Mediums die Ursache des Druckanstiegs mit zunehmender Tiefe. Wenn sich das Medium bewegt (dynamischer Zustand), können die Gegenkräfte außerdem von Trägheitskräften (bei Beschleunigung des Mediums) stammen. Bezeichnen wir das Gewicht des Volumenelements mit dG und seine Trägheitskraft mit dT, so gilt

dG+ dT= – dF

und

dG / dV + dT / dV = grad p

sowie

dG/dm + dT/dm = (1/ρ) grad p

und mit

dG = dm g und dT = - dm d2r/dt2

schließlich:

g – d2r/dt2 = (1/ρ) grad p   (1)


Das Minuszeichen bei der Trägheitskraft rührt daher, dass sie der Beschleunigung entgegengesetzt gerichtet ist.

g ist der Vektor der Erdbeschleunigung.

Bei Kenntnis der Größen auf der linken Seite kann grad p berechnet werden.


Drei einfache Beispiele

[Bearbeiten]

1. Hydrostatischer Druck in einer Flüssigkeit


Hier gilt:



Durch Vergleich findet man:


Der Druck p hängt also nur von z ab; d. h. die horizontalen Ebenen sind Flächen gleichen Drucks (Isobaren).

Also ist


Durch Integration zwischen den Grenzen 0 und z ergibt sich:


 

2. Aerostatischer Druck (Barometrische Höhenformel)


Hier ist


(Das Gewicht ist nach unten gerichtet.) Also ist:


Bei konstanter Temperatur gilt das Boyle-Mariottesche Gesetz


Durch Integration zwischen den Grenzen 0 und z ergibt sich:


 

3. Oberfläche einer rotierenden Flüssigkeit

Wegen der Rotationssymmetrie genügt eine zweidimensionale Betrachtung:


und


Aus (1) folgt:


Daraus folgt:


und


Wir suchen nun die Flächen gleichen Drucks, wozu auch die Oberfläche gehört. Für p = konst. =K2 ergibt sich:


Legen wir den Ursprung des Koordinatensystems in den tiefsten Punkt dieser Parabel, so wird K = 0 und



 

Die hydrodynamischen Grundgleichungen

[Bearbeiten]

Ich greife auf die Gleichung (1) im vorigen Kapitel zurück und schreibe sie in folgender Form:


Sie heißt hydrodynamische Grundgleichung.

Nun betrachten wir ein in seinem Inneren bewegtes, also strömendes Medium. Der Ort P(x, y, z) eines Volumen– oder Massenelements ist dann eine Funktion der Zeit:



Seine Geschwindigkeit v = dr/dt und deren skalare Komponenten vx, vy, vz sind ebenfalls Funktionen des Ortes und damit auch indirekt Funktionen der Zeit:



Falls die Strömung nicht stationär ist, also sich auch am selben Ort im Laufe der Zeit verändert, sind die Geschwindigkeitskomponenten außerdem auch (unmittelbare) Funktionen der Zeit:



Dasselbe gilt dann auch für die Komponenten der Beschleunigung


Diese wollen wir jetzt näher untersuchen.

Die vollständigen Differentiale der skalaren Komponenten der Geschwindigkeit sind dann:




Division durch dt ergibt:


Damit lauten die "Eulerschen Gleichungen der Hydrodynamik" in Koordinatenform:



Dies sind drei Gleichungen für die skalaren Komponenten ax, ay, az des Beschleunigungsvektors a. Der erste Summand jeder Gleichung gibt die (zeitabhängige) Beschleunigung an, die das Element auch dann erfährt, wenn sich sein Ort nicht ändert ("lokale Beschleunigung"), die übrigen Summanden geben die Beschleunigung an, die das Element infolge seiner Ortsveränderung erfährt, weil am neuen Ort das Element im Allgemeinen auch dann eine andere Geschwindigkeit hat, wenn die Strömung stationär ist. Diese Beschleunigung heißen "konvektiv".

Die rechten Seiten sind die entsprechenden Komponenten des Vektors



Es liegt daher nahe, diese drei skalaren Gleichungen durch eine einzige Vektorgleichung zu ersetzen.

Bezeichnen wir den Vektor der lokalen Beschleunigung mit alok, den Vektor der konvektiven Beschleunigung mit akon, so ist


und



Damit können wir schreiben:



Wir wollen noch eine weitere Umformung vornehmen. Es ist




sodass wir schreiben können



Wir treffen nun folgende Verabredung:

Es bedeute "grad" so viel wie



Dies ist der so genannte Nabla-Operator, ein symbolischer Vektor mit den skalaren Komponenten



Dieser "partielle Differentialoperator" wird dann auf die danach stehende Funktion angewendet.

Wenn wir diesen symbolischen Vektor skalar mit dem Vektor v multiplizieren, erhalten wir



Dieses Skalarprodukt multiplizieren wir nun mit dem Vektor v:



Das Ergebnis ist genau der Vektor akon:



Damit lautet die Eulersche Gleichung in Vektorform:



Der Vektor g kann als negativer Gradient des Gravitationspotentials Φ dargestellt werden:



Damit wird



Diese hydrodynamische Grundgleichung wird ergänzt durch eine zweite Gleichung, die sich mit der Massenänderung eines Volumenelements befasst.

Die Masse eines beliebigen Volumens V des Mediums ist


und die Änderungsgeschwindigkeit der Masse ist



Die Dichte ρ des Mediums kann sich, falls es sich um ein Gas handelt, nur dadurch ändern, dass in das Volumen V, das als konstant betrachtet wird, Materie einströmt oder daraus ausströmt. Die Änderungsgeschwindigkeit bei ausströmender Materie ist



wobei v der Geschwindigkeitsvektor und dA der nach außen gerichtete Normalenvektor eines Flächenelements ist. A ist die das Volumen V einschließende Fläche.

Unter Berücksichtigung des Vorzeichens ist dann



Nach dem Gaußschen Integralsatz ist



Bei Anwendung auf ein einzelnes Volumenelement dV folgt daraus:



und für eine inkompressible Flüssigkeit (mit ρ = konst.) insbesondere



In Komponentenschreibweise:



Nach den Regeln der Vektoranalysis ist



Dabei bedeutet der Index c, dass der indizierte Vektor bei der Differentialoperation als konstant zu behandeln ist.


Für w = v folgt daraus



und



In die hydrodynamische Grundgleichung eingesetzt ergibt



Diese Gleichung wird erheblich vereinfacht und wesentlich leichter integrierbar, wenn im ganzen Raum rot v = 0 ist (wirbelfreie Strömung).


 

Wirbelfreie stationäre Strömungen

[Bearbeiten]

Stromlinien und Bahnlinien

[Bearbeiten]

Stromlinien sind (gedachte) Linien in einer Strömung, deren Tangenten die Richtung der Geschwindigkeit der strömenden Teilchen im jeweils betrachteten Punkt haben.

Die Bahnlinie eines Teilchens dagegen ist die Kurve, die das Teilchen im Laufe der Zeit durchläuft.

Bei einer stationären Strömung sind die Stromlinien zeitunabhängig; die Bahnlinien und die Stromlinien fallen zusammen.

Bei nicht stationären Strömungen verändern sich die Stromlinien im Laufe der Zeit ständig. Daher sind Stromlinienbilder dann nur Momentaufnahmen und haben keine den Augenblick überdauernde Bedeutung. Auch die Bahnlinien ändern sich im Laufe der Zeit, aber immerhin gelten sie für jeweils ein bestimmtes Teilchen für die Zeit seiner Bewegung im Strömungsfeld.


 


Die Bernoullische Gleichung

[Bearbeiten]

Wir betrachten die zuletzt abgeleitet Gleichung und setzen für g wieder – grad Φ:


Wir multiplizieren die Gleichung mit dr und integrieren zwischen zwei Punkten P0 und P des Strömunmgsfeldes:


Nehmen wir die Integration längs einer Stromlinie vor, dann ist auf dem ganzen Weg


Für inkompressible Flüssigkeiten (mit ρ = konst.) folgt daraus die

Bernoullische Gleichung:


Die Summe


hat also in allen Punkten einer Stromlinie denselben Wert.


Die Bernoullische Gleichung gilt (entlang einer Stromlinie) für jede Art von Strömungen, für wirbelfreie und nicht wirbelfreie. Der Wert der Konstanten ist dabei im Allgemeinen von Stromlinie zu Stromlinie verschieden. Ist die Strömung wirbelfrei, d. h. ist im ganzen Strömungsgebiet rot v = 0, so liefert die Integration auch dann immer denselben Wert, wenn nicht längs einer Stromlinie integriert wird. Das heißt: Die oben genannte Summe ist bei Wirbelfreiheit im ganzen Strömungsgebiet konstant.

Der Umkehrschluss von der Konstanz der Summe auf die Wirbelfreiheit des Gebiets ist nicht unbedingt zulässig, da v parallel zu rot v und daher das Vektorprodukt null sein könnte, obwohl rot v nicht null ist. Wohl aber kann geschlossen werden: Stammt die Strömung aus einem wirbelfreien Gebiet, in dem die oben genannte Summe für alle Stromlinien denselben Wert hat, dann bleibt die Strömung im ganzen Raum wirbelfrei.

Die Bernoullische Gleichung erlaubt zwei anschauliche Interpretationen:

1. Aus


folgt mit dem Gravitationspotential Φ = g z


Alle drei Summanden haben die Dimension "Länge":

  • v2 / 2 g ist die Höhe, die ein Körper (hier ein Flüssigkeitsteilchen frei durchfallen muss, damit er die Geschwindigkeit v erlangt ("Geschwindigkeitshöhe"),
  • p / ρ g ist die Höhe einer Flüssigkeitssäule, die an ihrem Fuß den hydrostatischen Druck p erzeugt ("Druckhöhe"), und
  • z ist die "Ortshöhe" des betrachteten Flüssigkeitsteilchens.

Damit gilt für inkompressible Flüssigkeiten im Erdfeld: Die Summe aus Geschwindigkeitshöhe, Druckhöhe und Ortshöhe ist konstant.


2.In der Form



geschrieben, kann die Bernoullische Gleichung auch so interpretiert werden:


ρ v2 /2 ist die volumenbezogene kinetische Energie in der Flüssigkeit,

ρ Φ + p ist die volumenbezogene potentielle Energie, die teils vom Druck, teils von äußeren Kräften herrührt.

In dieser Form drückt die Bernoullische Gleichung also den Energieerhaltungssatz aus.

 


Berechnung von wirbelfreien (Potential-)Strömungen

[Bearbeiten]

Wenn in einem Strömungsgebiet überall rot v = 0 ist, lässt sich v als Gradient einer skalaren Größe U darstellen, welche Geschwindigkeitspotential heißt.


Damit lautet die Kontinuitätsgleichung für inkompressible Flüssigkeiten:



Dabei steht Δ hier für den


 

Wie oben gezeigt wurde, lautet die hydrodynamische Grundgleichung für stationäre, wirbelfreie Strömungen


Jede Funktion U, welche der Differentialgleichung ΔU = 0 genügt, kann also das Geschwindigkeitspotential einer wirbelfreien Strömung darstellen. Unter all diesen Funktionen muss diejenige gefunden werden, welche den jeweiligen physikalischen Gegebenheiten entspricht. Danach kann durch Gradientenbildung das Geschwindigkeitsfeld bestimmt werden. Zur Berechnung der Druckverteilung wird die hydrodynamische Grundgleichung benutzt.


Die kugelsymmetrische Strömung

[Bearbeiten]

Die einfachste (nicht-triviale) räumliche Potentialströmung ist eine kugelsymmetrische Strömung, bei der U nur von r abhängt:


Dann ist:




So ergibt sich:


Mit


erhält man schließlich


Wie man durch Ableiten und Einsetzen bestätigen kann, ist


eine Lösung (und zwar die allgemeine Lösung) dieser Differentialgleichung.

Durch Gradientenbildung erhält man daraus


wobei r0 der Einheitsvektor in der Richtung von r ist.

Die Strömung verläuft also – je nach Vorzeichen von a – radial von O nach außen (für a < 0) oder nach innen auf O hin (für a > 0). Im ersten Fall befindet sich in O eine Quelle, im zweiten Fall eine Senke. Die Ergiebigkeit ("Schüttung") dV/dt der Quelle bestimmt die Konstante a: Die Ergiebigkeit ist nämlich gleich der zeitbezogenen Flüssigkeitsmenge, die durch die Oberfläche rgendeiner Kugel um O nach außen strömt, und diese ist


woraus folgt



Die Konstante b ist für die Strömung belanglos, da sie bei der Gradientenbildung wegfällt. Sie hat aber Einfluss auf das Potential der Strömung. Wenn man dieses –wie üblich – so normiert, dass es im Unendlichen null wird, ist b = 0.

Interessant ist auch die vollkommene Analogie zum elektrischen Feld einer Punktladung.


Zerreißen eines Flüssigkeitsfadens

[Bearbeiten]

Wenn z. B. aus einem Wasserhahn ein Flüssigkeitsfaden austritt und eine Strecke herabfällt, wird er wegen der zunehmenden Geschwindigkeit zunächst dünner und zerreißt schließlich in einzelne Tropfen. Wir wollen diesen Vorgang genauer betrachten. Dazu schreibe ich die Bernoullische Gleichung zunächst so:


Für eine ruhende Flüssigkeit lautet die Gleichung:

Der Index "stat" bedeutet, dass es sich jetzt um den hydrostatischen Druck handelt.

Aus den beiden Gleichungen folgt:


Das bedeutet: Der hydrodynamische Druck p ist um ρ v2/2 kleiner, als der hydrostatische Druck an derselben Stelle wäre, wenn sich die Flüssigkeit nicht bewegen würde, und nimmt mit zunehmender Geschwindigkeit ab. Da Flüssigkeiten keinen Zug aushalten können, ohne zu zerreißen, darf der hydrostatische Druck nicht kleiner als 0 werden, wenn die Flüssigkeit nicht zerreißen soll. Der höchste zulässige Wert für die Geschwindigkeit ist also



Das Theorem von Torricelli

[Bearbeiten]

Gegeben sei ein Gefäß, das bis zur Höhe h mit einer Flüssigkeit der Dichte ρ angefüllt ist. Im Boden des Gefäßes befindet sich ein Loch, dessen Querschnitt sehr klein ist gegenüber der Oberfläche der Flüssigkeit im Gefäß. Gesucht ist die Geschwindigkeit, mit der die Flüssigkeit ausströmt.


Da an der Oberfläche der Flüssigkeit überall derselbe Druck p0 (der Atmosphärendruck) herrscht, die Flüssigkeitsteilchen an der Oberfläche alle dieselbe Geschwindigkeit v (praktisch gleich 0) haben und sie außerdem in derselben Höhe h liegen, hat für alle Punkte der Oberfläche die Summe


denselben Wert, nämlich

Außerdem ist das Gebiet der Oberfläche wirbelfrei. Da die Summe längs einer Stromlinie ihren Wert behält, muss rot v überall null sein. Wir können also die Bernoullische Gleichung anwenden.

In der Ebene der Öffnung unten ist die Geschwindigkeit v, der Druck ebenfalls p0 und das Potential 0. Also ist


woraus folgt


Das Ergebnis entspricht dem Energiesatz: Wenn unten das Volumen ΔV austritt, verschwindet an der Oberfläche eine gleiche Menge. Die Flüssigkeitsteilchen, die unten austreten, haben dieselbe Geschwindigkeit, als wenn sie die Höhe h frei durchfallen hätten. Für die oben verschwindende potentielle Energie tritt unten der gleiche Betrag an kinetischer Energie auf.


Prinzip der Wasserstrahlpumpe

[Bearbeiten]

Wir betrachten ein sich in der Mitte verengendes Rohr, das wirbelfrei von einer Flüssigkeit durchströmt wird.

Das Gravitationspotential sei für die drei Querschnitte A0, A1 und A2 gleich oder (bei senkrechter Anordnung) annähernd gleich. Die Anwendung der Bernoullischen Gleichung auf die Querschnitte A0 und A2 ergibt:


Da die Flüssigkeit nicht kompressibel ist, gilt:


womit man schließlich erhält


Wenn A2 >> A0 ist, dann ist (erst recht) p2 >> p0.

Wenn die Flüssigkeit in die freie Atmosphäre ausströmt, ist p2 gleich dem Atmosphärendruck, und daher p0 sehr viel kleiner als dieser. Daher: Bohrt man die Röhre an der engsten Stelle an, so saugt die vorbeiströmende Flüssigkeit dort Luft an.




 


Zweidimensionale stationäre Strömungen

[Bearbeiten]

Zweidimensionale stationäre Strömungen inkompressibler Flüssigkeiten stehen in einem interessanten Zusammenhang mit den Funktionen einer komplexen Veränderlichen, die in der Funktionentheorie behandelt werden. Dieser Zusammenhang soll zunächst dargestellt werden.

Unter einer Funktion w(z) einer komplexen Variablen z = x + iy versteht man eine Funktion der beiden Variablen x und y, in der diese nur in der Verbindung (x + iy) vorkommen.

Die partiellen Ableitungen der Funktion w nach x und y sind dann




Durch Eliminieren von w' ergibt sich daraus:



Die Werte, welche die Funktion w annimmt, sind selbst wieder eine komplexe Zahl, die wir in einen Realteil und einen Imaginärteil zerlegen können. Dies kann man so schreiben:



Die Gleichung (A) kann dann wie folgt geschrieben werden:



woraus folgt



Diese beiden Bedingungen gelten für den Realteil und den Imaginärteil einer jeden Funktion w(z) einer komplexen Veränderlichen.

Differenziert man (B1) partiell nach y und (B2) partiell nach x, so erhält man



Nach dem Satz von SCHWARZ ist



und daher



Auf analoge Weise findet man



Diese beiden Gleichungen besagen, dass sowohl φ(x, y) als auch ψ(x, y) die Funktion des Geschwindigkeitspotentials einer zweidimensionalen Strömung sein kann.

Multipliziert man (B1) und (B2) mit einander, so erhält man



Das bedeutet: Die Kurven φ = konst. und ψ = konst. stehen in jedem Punkt, den sie gemeinsam haben, aufeinander senkrecht (sie sind »Orthogonaltrajektorien«). Jede der beiden Kurvenscharen kann als die Schar der Stromlinien der betreffenden Strömung aufgefasst werden; die jeweils andere ist dann die Schar der Äquipotentiallinien (oder Niveaulinien) des Geschwindigkeitspotentials.

Zusammenfassung: Sowohl der reelle wie der imaginäre Bestandteil einer beliebigen Funktion einer komplexen Veränderlichen kann als Funktion des Geschwindigkeitspotentials einer zweidimensionalen stationären Flüssigkeitsströmung angesehen werden. Betrachten wir die Kurven φ = konst. als die Niveaulinien des Potentials, so sind die Kurven ψ = konst. die Stromlinien, und umgekehrt. Man erhält also mit jeder Funktion einer komplexen Veränderlichen gleich zwei mögliche Strömungsfelder.

Nun gibt es in der Realität keine ebenen Strömungen, aber es gibt Strömungen, die in Ebenen, die zu einander parallel sind, völlig gleich verlaufen, wo also die Geschwindigkeit v' und das Potential φ zum Beispiel nur Funktionen von x und y sind.


 

Beispiele

[Bearbeiten]

1. Ebene Quell- und Zirkulationsströmung

Es sei


Setzen wir


so ist


also


und


Aus ψ = konst. folgt dann y= c x, und aus φ = konst. folgt r = konst.


Wir erhalten also einerseits eine Schar von Geraden durch den Ursprung O, andererseits eine Schar von konzentrischen Kreisen um O. Betrachten wir die Geraden als Stromlinien, so erhalten wir das ebene Gegenstück zu der früher betrachteten Kugelströmung. Die Kreise sind dann die Niveaulinien des Geschwindigkeitspotentials.

Wir können aber auch die Kreise als Stromlinien betrachten. Wenn wir den Nullpunkt durch einen kleinen Kreis um ihn herum ausschließen, ist das ganze übrige Gebiet wirbelfrei. Die Flüssigkeitsteilchen bewegen sich allerdings im Kreis herum und das Linienintegral der Geschwindigkeit über einen solchen Kreis oder über eine andere geschlossene Linie um O ist nicht null. Eine solche "Zirkulationsströmung" findet sich zum Beispiel bei den magnetischen Feldlinien eines sehr langen Leiters.


1. Fall: Betrachten wir φ = a ln r als Funktion des Geschwindigkeitspotentials. Dann ist:


Im Punkt O befindet sich eine Quelle oder Senke. Ihre (Flächen-)Ergiebigkeit ist


2. Fall: Betrachten wir ψ = = arctan y/x als Funktion des Geschwindigkeitspotentials, dann ist


Der Geschwindigkeitsvektor steht also auf dem Radiusvektor senkrecht; sein Betrag ist

Das Linienintegral über v ds längs einer beliebigen geschlossenen Kurve, die den Punkt O umschließt, hat den Wert


 

2. Ebene Parallelströmung

Wir betrachten nun die sehr einfache Funktion

w(z)= z = x + i y.

Hier ist

φ = x und ψ = y.

Die Kurven φ = konst. haben die Gleichung x = konst., und

die Kurven ψ = konst. haben die Gleichung y = konst.

Wir haben also, je nach Interpretation, eine Parallelströmung parallel zur X-Achse oder parallel zur Y-Achse. Die Niveaulinien sind dann die jeweils andere Kurvenschar.

 

3. Umströmter Kreiszylinder

Wir betrachten die Funktion w(z) = A z + B/z (A und B positive Konstanten) oder


Es ist also


Wir wollen nun φ = konst. als die Gleichung der Niveaulinien betrachten und ψ = konst. als die Gleichung der Stromlinien. Wegen v = grad φ ist dann


Für

geht offensichtlich


das heißt, dort besteht eine Parallelströmung parallel zur X-Achse.

Betrachten wir nun die Stromlinie mit Ψ = 0. Deren Gleichung ist


Diese Gleichung wird erfüllt durch die Funktionen


Die erste Lösung ist die X-Achse, die zweite der Kreis um O mit dem Radius sqrt (B/A). In den Kreis dringen keine Stromlinien ein, denn sowie Ψ auch nur ein wenig von null abweicht, verläuft die dazu gehörige Stromlinie außerhalb des Kreises. Und dort, wo die X-Achse auf den Kreis trifft, ist die Strömungsgeschwindigkeit null. Wir können daher den Kreis durch einen Festkörper ersetzen, ohne dass sich am Strömungsverlauf etwas ändert. Wir haben somit einen ebenen Schnitt durch eine räumliche, ursprünglich parallele Strömung vor uns, in die senkrecht zu den Stromlinien ein Kreiszylinder eingebracht wurde.


 

Wirbel- und Zirkulationsströmungen

[Bearbeiten]

Definition Zirkulation

[Bearbeiten]

Unter der Zirkulation Γ eines Feldvektors v längs einer geschlossenen Kurve C versteht man das Linienintegral über diesen Vektor längs der Kurve:



Nach dem Stokesschen Satz besteht zwischen der Zirkulation und der Rotation eines (beliebigen) Vektors folgender Zusammenhang:



Dabei ist A irgendeine beliebige Fläche, deren Umrandung die Kurve C ist. (Die Fläche A muss jedoch "einfach zusammenhängend" sein, d. h. sie darf nur eine einzige Umrandung haben. Es darf also im Innern kein Flächenstück herausgeschnitten worden sein.) Das Integral über rot v df heißt Wirbelstärke.

 

Der Thomsonsche Satz von der Erhaltung der Zirkulation

[Bearbeiten]

Da die Stromlinien in einer Strömung einander nicht überschneiden, bleiben Flüssigkeitsteilchen, die zu irgendeinem Zeitpunkt t0 benachbart sind, ständig benachbart, solange die Flüssigkeit nicht zerreißt.

Wir betrachten nun eine geschlossenen Kurve C0 in einer Strömung, die zur Zeit t0 aus lauter benachbarten Teilchen gebildet wird, eine so genannte materielle Kurve. Zu irgendeiner Zeit t bilden diese Teilchen noch immer eine geschlossene Kurve C, die allerdings eine völlig andere Gestalt als C0 haben kann.


Der Thomsonsche Satz von der Erhaltung der Zirkulation besagt nun, dass


wenn die äußeren Kräfte (das sind i. A: die Gravitationskräfte) ein Potential besitzen.

 

Die Helmholtzschen Wirbelsätze

[Bearbeiten]

Wir betrachten nun das Feld des Vektors V = rot v, wobei v der Geschwindigkeitsvektor einer Flüssigkeitsströmung ist. Die Feldlinien des Vektors V = rot v sind dann die Kurven, deren Tangenten in jedem Punkt die Richtung von rot v haben, also die Richtung der Drehachsen der Flüssigkeitsteilchen.

Diese Feldlinien nennen wir Wirbellinien.

Da nach einem Satz der Vektoranalysis stets div rot v = 0 ist, gibt es in der Flüssigkeit keine Quellen oder Senken der Wirbellinien, also Stellen, in denen Wirbellinien beginnen oder enden. Die Wirbellinien sind also entweder geschlossene Linien oder sie beginnen oder enden bei einer begrenzten Flüssigkeit an den Grenzflächen.

Eine schlauchartige Fläche, deren Oberfläche von Wirbellinien gebildet wird, heißt Wirbelröhre. Eine Wirbelröhre von so geringem Querschnitt, dass auf ihm rot v als konstant angesehen werden kann, heißt Wirbelfaden. Die Wirbelstärke eines Wirbelfadens ist dann einfach das Produkt aus seinem Querschnitt q und dem Betrag von rot v.

Die Wirbelstärke eines Wirbelfadens und einer Wirbelröhre ist längs des ganzen Fadens bzw. der Röhre konstant.

Beweis: Da im Innern der Wirbelröhre keine Wirbellinien entstehen oder enden können, auch keine Wirbellinien die Seitenflächen durchdringen oder dort enden, bleibt die Anzahl der Wirbellinien in einer Röhre unverändert.

Außerdem gelten: folgende Sätze:

Eine Wirbelröhre besteht immer aus denselben Flüssigkeitsteilchen.

In einer reibungslosen Flüssigkeit sind die Wirbelstärken der Wirbelröhren auch zeitlich konstant.


Das Biot-Savartsche Gesetz der Hydrodynamik

[Bearbeiten]

Der durch den Stokeschen Satz ausgedrückte Zusammenhang zwischen v' und rot v ist nicht nur ein quantitativer, sondern ein kausaler: Eine Wirbelröhre e r z e u g t um sich herum ein Strömungsfeld, dessen Zirkulation gleich der Wirbelstärke der Wirbelröhre ist. Ist der Vektor rot v als Funktion des Ortes gegeben, so lässt sich im Prinzip daraus das Strömungsfeld berechnen.

Der einfachste Fall ist das Feld eines einzelnen Wirbelfadens der Wirbelstärke Γ. Hier gilt (wegen rot v = konstant längs des Querschnitts q):


Das Problem ist völlig analog der Berechnung des magnetischen Feldes eines dünnen Leiters, in dem ein Strom I fließt. Hier lautet die entsprechende Gleichung:


Für das magnetische Feld aber ist die Lösung bekannt:



woraus geschlossen werden kann, dass der Beitrag dH eines einzelnen Leiterelements ds zur Feldstärke



beträgt. Entsprechend gilt dann



und


 


Schallwellen in Flüssigkeiten und Gasen

[Bearbeiten]

Bei der Ausbreitung von Schallwellen in Flüssigkeiten und Gasen sind die auftretenden Teilchengeschwindigkeiten und Dichteänderungen so klein, dass alle Produkte dieser Größen vernachlässigt werden können. (Dies gilt nicht für die Ausbreitung von Schockwellen, wie sie z. B. bei Explosionen entstehen. Sie bedürfen einer eigenen Behandlung.) So kann in der Eulerschen Gleichung von dem Term (v grad)v abgesehen werden. Auch die Wirkung äußerer Kräfte (Schwerkraft) kann vernachlässigt werden. Damit vereinfacht sich die Eulersche Gleichung zu:



Ferner benötigen wir die Kontinuitätsgleichung:



Nun fehlt uns noch eine Beziehung zwischen p und ρ. Hier bietet sich zunächst wieder das für konstante Temperatur gültige Boyle-Mariottesche Gesetz an, das jedoch zu falschen Ergebnissen führt, so z. B. zu einer Schallgeschwindigkeit in Luft bei 0 °C von ca. 280 m/s. Erst Laplace hat erkannt, dass wegen der Schnelligkeit der Druckschwankungen im Medium kein Temperaturausgleich stattfinden kann und der Vorgang nicht als isotherm, sondern als adiabatisch angesehen werden muss. Das einschlägige Gesetz lautet dann:



Dabei bedeuten:

κ = cp / cv,

cp = spezifische Wärmekapazität bei konstantem Druck,

cV = spezifische Wärmekapazität bei konstantem Volumen


Wir setzen nun

wobei 1+σ = 1+σ(x,y,z,t) die relative Abweichung der Dichte vom Durchschnittswert ist. Damit wird



und



Daraus folgt



und mit




In die vereinfachte hydrodynamische Grundgleichung (1) eingesetzt:



Aus Gleichung (2) wird mit den entsprechenden Vernachlässigungen



Zur Eliminierung von v wird diese Gleichung nochmals nach t differenziert:



und von Gleichung (3) die Divergenz gebildet (zeitliche und örtliche Ableitungen dürfen vertauscht werden):



Folglich ist



Dies ist eine Differentialgleichung für σ, welches (siehe oben) angibt, um wie viel die relative Abweichung der Dichte vom Mittelwert von 1 differiert. Eine Lösung dieser Differentialgleichung ist eine sich um O mit der Phasengeschwindigkeit



ausbreitende Kugelwelle. Dieses Ergebnis erhält man am einfachsten, indem man sich auf eine lineare Welle beschränkt und ansetzt:

mit ω = 2 π / T, λ = v T, T Schwingungsdauer.


Die mittlere Dichte ist temperaturabhängig:



wobei ρ0 = Dichte bei 0°C, θ = Temperatur /°C, γ = 1/273 .

Damit ergibt sich:



Da die Dichte dem Druck proportional ist, ist die Schallgeschwindigkeit vom Druck unabhängig.


 


Hydrodynamik zäher Flüssigkeiten

[Bearbeiten]

Einfache lineare Laminarströmung, das Hagen-Poisseuillesche Gesetz

[Bearbeiten]

Von einer Laminarströmung spricht man, wenn sich die Flüssigkeit in Schichten mit verschiedener Geschwindigkeit unterteilen lässt, die aneinander vorbeigleiten. Infolge der inneren Reibung sucht die schneller fließende Schicht die angrenzende langsamere mitzunehmen und zu beschleunigen. Umgekehrt wirkt die langsamere Schicht auf die schnellere verzögernd, wobei wieder "actio gleich reactio" ist. Für diese Kräfte hat schon Newton eine Annahme gemacht, die sich als richtig erwiesen hat: Jede der beiden Kräfte ist proportional der Größe der Berührungsfläche A und proportional dem Geschwindigkeitsgefälle senkrecht zur Strömungsrichtung.

Im einfachsten Fall (lineare Laminarströmung) verläuft die Strömung geradlinig, z. B. parallel der X-Achse. Nimmt die Geschwindigkeit v in Richtung der positiven Z-Achse zu, so ist der Betrag der (Tangential-) Kraft zwischen zwei benachbarten Schichten



Der Proportionalitätsfaktor η heißt Zähigkeits- oder Viskositätskoeffizient der Flüssigkeit.

Wir betrachten nun die in Richtung der positiven X-Achse gerichtete laminare Strömung in einem kreiszylindrischen Rohr.


Als Volumenelement nehmen wir einen Hohlzylinder mit den Radien r und r + dr. Die nach innen benachbarte Schicht hat eine größere Geschwindigkeit und übt daher eine Kraft in Richtung der +X-Achse aus:



Durch das Minuszeichen wird berücksichtigt, dass dv/dr negativ ist , weil die Geschwindigkeit mit zunehmendem r abnimmt.

Die außen angrenzende Schicht dagegen ist langsamer und wirkt auf das betrachtete Volumenelement hemmend. Die von ihm ausgeübte Kraft ist



wobei berücksichtigt wurde, dass sich auf der Strecke dr auch das Geschwindigkeitsgefälle geändert hat. Es ist F2 < 0 und dem Betrag nach größer als F1.

Herrscht an einem Ende des Rohres der Druck p1, am anderen Ende (d. h. am Ausfluss) der Druck p0, so ist die Summe der an dem Hohlzylinder angreifenden Druckkräfte unter Berücksichtigung ihrer Richtung 2π r dr (p1p0). Im stationären Zustand dient diese Kraft nur dazu, die resultierende Reibungskraft F1 + F2 zu kompensieren. Unter Berücksichtigung des Vorzeichens ist also:



und unter Vernachlässigung von Größen höherer Ordnung



Diese Gleichung kann leicht integriert werden:



Nochmals integriert:



Bestimmung der Integrationskonstanten:

1. Für r = 0 (d. h. in der Achse) muss v endlich bleiben, also muss C = 0 sein.

2. Für r = a (d. h. an der Rohrwand) muss v = 0 sein, da die Flüssigkeit erfahrungsgemäß an der Wand haftet. Daraus folgt:



und somit



Die Stärke des Stromes durch das betrachtete Volumenelement ist



Die Integration über den Querschnitt des Rohres ergibt



Dies ist das Hagen-Poisseuillesche Gesetz mit der in der Physik selten auftretenden 4. Potenz, die bedeutet, dass unter sonst gleichen Bedingungen eine Verdoppelung des Rohrdurchmessers zur 16-fachen Durchflussmenge führt.


Erwähnenswert ist noch das parabolische Geschwindigkeitsprofil im Rohr:

Elektrostatik

[Bearbeiten]
Wikibooks Dieses Buch wurde in den Wikibooks:Buchkatalog aufgenommen.

Elektrische Ladungen

[Bearbeiten]

In den Atomen aller chemischen Elemente gibt es »Elementarteilchen«, nämlich Protonen und Elektronen, die anziehende oder abstoßende Kräfte aufeinander ausüben. Diese Kräfte werden als »elektrostatische Kräfte«; bezeichnet. Ihre Ursache ist eine besondere Eigenschaft der Protonen und Elektronen, die man »elektrische Ladung« nennt. Es gibt genau zwei Arten von elektrischer Ladung, die man positiv und negativ genannt hat, weil sie einander teilweise oder ganz kompensieren können. Ganz willkürlich und – wie sich später herausgestellt hat – nicht besonders glücklich wurde die Protonenladung als positiv, die Elektronenladung als negativ bezeichnet. Beide Ladungen sind – vom Vorzeichen abgesehen – gleich groß und können einander zu null kompensieren. Da es die kleinsten Ladungen sind, die in der Natur vorkommen, heißen sie Elementarladungen.

Wie man schon mit sehr einfachen Experimenten zeigen kann, stoßen Ladungen gleichen Vorzeichens einander ab, während Ladungen entgegengesetzten Vorzeichens einander anziehen.

Die so genannte Erzeugung größerer elektrischer Ladungsmengen beruht in Wirklichkeit nicht auf Neuschöpfung elektrischer Ladungen, sondern auf einer Trennung der positiven und der negativen Ladungen, die in der Materie ja immer in gleicher Menge auftreten. Diese Trennung kann z. B. durch intensive Berührung zweier verschiedenartiger Körper geschehen (so genannte Reibungselektrizität) – die älteste und einfachste Form der Ladungstrennung.

Die SI-Einheit der elektrischen Ladung (oder Elektrizitätsmenge) ist das Coulomb (C). 1 Coulomb = 1 Amperesekunde (As).

Reibt man einen Stab aus Glas oder Kunststoff mit einem Stück Stoff, so fließen Elektronen entweder vom Stab auf den Stoff oder umgekehrt. (Die positiv geladenen Protonen befinden sich in den Atomkernen und können diese nicht verlassen.) Je nachdem hat der Stab dann ein Defizit oder einen Überschuss an negativen elektrischen Ladungen und ist dann positiv oder negativ »geladen«. Durch Berührung des Stabes mit einer isoliert aufgehängten Metallkugel kann diese dann ebenfalls positiv oder negativ aufgeladen werden. Wegen der gegenseitigen Abstoßung befindet sich das Defizit bzw. der Überschuss an Elektronen unmittelbar an der Oberfläche der Kugel, und zwar wegen der Symmetrie der Kugel gleichmäßig verteilt. (Bei einem anderen, weniger regelmäßig geformten Körper wäre die Verteilung ungleichmäßig, aber auch dann befänden sich die Ladungen nur an der Oberfläche. Man kann daher für diese Versuche auch metallische oder dünn metallisierte Hohlkörper benutzen.) Nähert man zwei derart geladene Kugeln einander an, so wird die Gleichmäßigkeit der Ladungsverteilung durch die Kräfte zwischen den Ladungen sofort zerstört. Es ist dann schwer, den Abstand der beiden »Kugelladungen« richtig zu bestimmen. Zu diesem Zweck müsste man die Kugeln möglichst klein machen, aber das wiederum schränkt die Größe der Ladungen ein, weil bei größerer Ladungsdichte eine »Sprühentladung« einsetzt (»Sankt-Elms-Feuer«). Daher hatte COULOMB bei seinen Bemühungen, das Gesetz für die Kraft zwischen zwei Ladungen zu bestimmen, große Schwierigkeiten.


 

Das COULOMB-Gesetz

[Bearbeiten]

So wurde denn das Grundgesetz der Elektrostatik 1785 von COULOMB eher erraten und behauptet als experimentell bestätigt. Es besagt, dass die Kraft zwischen zwei elektrischen »Punktladungen« (eigentlich: Ladungen auf hinreichend kleinen kugelförmigen Körpern) Q1 und Q2 proportional dem Produkt der beiden Ladungen und umgekehrt proportional dem Quadrat ihres Abstandes r ist. (Als Abstand gilt angenähert der Abstand der Kugelmittelpunkte.)

Das COULOMB-Gesetz entspricht somit formal genau dem Gravitationsgesetz.

Die Kraft hat die Richtung der Verbindungsgeraden der beiden Ladungen, ist also eine »Zentralkraft«. Legt man die Ladung Q1 in den Ursprung O des Koordinatensystems und bezeichnet den Ortsvektor von Q2 mit r, so kann man das COULOMB-Gesetz als Vektorgleichung wie folgt schreiben. (Dabei ist F2 die Kraft auf Q2.)


Für die Kraft F1 gilt wegen »actio = reactio« :

F1 = – F2

Ist das Produkt Q1Q2 negativ (d. h. ist genau eine der beiden Ladungen negativ), ist F2 auf Q1 hin gerichtet.

(Anmerkung zur Schreibweise: Im Text werden Vektoren kursiv und fett dargestellt, in den mit TeX geschriebenen Formeln und Gleichungen durch einen Pfeil über dem Formelzeichen.)

 

Die elektrische Feldstärke

[Bearbeiten]

Der elektrischen Feldtheorie liegt die Vorstellung zugrunde, dass jede elektrische Ladung den Raum in ihrer Umgebung verändert, indem sie ein »elektrisches Feld« um sich herum aufbaut. Worin die Veränderung des Raumes dabei besteht, ist noch immer ein Geheimnis. Wir können lediglich sagen: Ein elektrisches Feld ist ein Raum, in dem eine elektrische Ladung eine Kraft erfährt. Das Feld wird beschrieben durch den Vektor E der elektrischen Feldstärke.

Definition: Die elektrische Feldstärke E in einem Punkt des Raumes ist der Quotient aus der Kraft F, die eine »Probeladung« q in diesem Punkt erfährt und dieser Ladung:


Für q > 0 haben E und F dieselbe Richtung, für q < 0 die entgegengesetzte.


Aus dem COULOMB-Gesetz ergibt sich mit Q1 = Q und Q2 = q  für die Feldstärke einer »Punktladung« Q:



Aus historischen Gründen wird der Proportionalitätsfaktor k in der Form



geschrieben.

Die Konstante ε0 = 8,85419 10-12 A s / V m heißt elektrische Feldkonstante.

Die Einheit der elektrischen Feldstärke ist das Newton/Coulomb = Volt/Meter.

Im COULOMB-Gesetz und in der Gleichung für die Feldstärke einer Kugelladung taucht der Radius R der Kugel, auf der die Ladung gleichmäßig verteilt ist, nicht auf. Er hat also keinen Einfluss auf das Feld, außer dass dieses an der Oberfläche der Kugel, also im Abstand R vom Mittelpunkt, beginnt oder endet. Man kann theoretisch(!) den Radius der Kugel beliebig klein machen und so zum Ergebnis kommen:

Außerhalb einer Kugel, auf der eine Ladung Q gleichmäßig verteilt ist, verhält sich das Feld so, als ob die gesamte Ladung im Mittelpunkt vereinigt wäre.

Daher können »Punktladungen«, die es ja nicht gibt, durch »Kugelladungen« ersetzt werden.


Das oben beschriebene Gesetz für die Feldstärke gilt nur für den Raum außerhalb der Kugel, welche die Ladung trägt. Im Innern der Kugel ist der Raum feldfrei.

Begründung: Betrachten wir zunächst eine massive geladene Metallkugel. Wäre im Inneren ein elektrisches Feld vorhanden, dann würde dort auf die freien Elektronen des Metalls je eine Kraft ausgeübt und die Elektronen bewegt. Dies würde Wärme erzeugen, für deren Energie es keine Quelle gäbe. (Widerspruch zum Energiesatz.) Also ordnen sich die Elektronen so an, dass im Inneren kein Feld vorhanden ist. Dann kann man aber auch das Innere der Kugel aushöhlen, ohne dass sich an der Ladungsverteilung etwas ändern würde. Folglich existiert im Inneren auch dann kein Feld, wenn die Kugel hohl ist.

Es gibt aber auch noch einen anderen Beweis, der dann auch dazu dienen kann, das COULOMB-Gesetz zu verifizieren. Betrachten wir einen beliebigen Punkt P im Inneren der Hohlkugel. Drei eng beisammen liegende Gerade durch diesen Punkt bilden zusammen mit zwei Teilen der Kugelfläche zwei schlanke Tetraeder.




Man denke sich nun die Grundflächen der beiden Tetraeder auf einen Punkt hin schrumpfend. Dann wirken in P praktisch zwei elektrische Kräfte und zwei elektrische Felder in entgegengesetzter Richtung. Die Ladungen auf den beiden Flächen verhalten sich dabei stets wie a2 / b2, die Quadrate der Abstände der Ladungen zu P (= Höhen der Tetraeder) ebenfalls. Folglich sind die Kräfte und die Feldstärken in P entgegengesetzt gleich. Denkt man sich die ganze Kugel derart in ähnliche Tetraeder zerlegt, so erkennt man, dass die gesamte Feldstärke in P gleich null sein muss.


Elektrische Felder können durch Feldlinien anschaulich gemacht werden. Das sind Linien, deren Tangenten in jedem Punkt die Richtung der Kraft haben, die eine positive Ladung dort erfahren würde. So sind die Feldlinien einer positiven Punktladung radial nach außen gerichtet, die Feldlinien einer negativen Ladung radial nach innen. Die elektrischen Feldlinien gehen also von positiven Ladungen (»Quellen«) aus und enden in negativen Ladungen (»Senken«).

Wie man am Feld einer Punktladung erkennen kann, ist die Flächendichte der Feldlinien proportional der Feldstärke.

Die Darstellung des elektrischen Feldes durch Feldlinien ist zwar recht anschaulich und einprägsam, hat aber einen gravierenden Mangel: Einerseits muss man annehmen, dass durch jeden Punkt eines Feldes eine Feldlinie geht. Die Flächendichte der Feldlinien wäre dann unendlich. Andererseits aber laufen die Feldlinien einer Kugelladung nach außen immer weiter auseinander, und ihre Flächendichte nimmt ab. Dieser Widerspruch bleibt unauflösbar. Darum wird für strenge Untersuchungen das Feldlinienkonzept durch eine andere Betrachtungsweise ergänzt, die im Folgenden vorgestellt wird.

 

Fluss und Flussdichte des elektrischen Feldvektors E

[Bearbeiten]

Betrachten wir zunächst ein homogenes Feld. Hier ist der Feldvektor E unabhängig vom Ort. In einem solchen Feld liege ein ebenes Flächenstück vom Größenwert ΔA, das auf dem Feldvektor senkrecht steht. Sein Flächenvektor ΔA sei also parallel zum Feldvektor E. Dann bezeichnet man das Produkt aus dem Größenwert E der Feldstärke und dem Größenwert ΔA der Fläche als den elektrischen Fluss Ψ des Feldvektors durch die Fläche:



Eine nützliche Analogie dazu ist der Fluss v ΔA einer Flüssigkeits- oder Gas-Strömung mit dem Geschwindigkeitsvektor v durch ein Flächenstück. Die Dimension dieses Flusses ist Volumen/Zeit. Die Dimension des elektrischen Flusses ist Feldstärke mal Fläche.

Der auf die (senkrecht zum Feld stehende) Fläche bezogene Fluss, also der Quotient ΔΨ / ΔA heißt »Flussdichte« des Feldvektors. Er ist in unserem Fall nichts anderes als der Betrag der Feldstärke.




Bildet der Feldvektor E mit dem Flächenvektor ΔA den Winkel α, so ist



Der Term auf der rechten Seite ist das Skalarprodukt der Vektoren E und ΔA, also ist



Für α = 90° ist ΔΨ = 0, für 90° < α < 270° ist ΔΨ < 0.


Im inhomogenen Feld gilt für ein hinreichend kleines Flächenstück



wobei Em die Feldstärke in der Mitte des Flächenstücks ist.

Für eine beliebig große Fläche A ergibt sich daraus nach Zerlegung der Fläche in hinreichen kleine Teile:



Für alle ΔA gegen 0 wird daraus




Wir untersuchen nun den Fluss des Feldes einer Kugelladung Q. Als Fläche A benutzen wir eine mit der Ladung konzentrische Kugelfläche vom Radius r. Der Feldvektor E steht überall auf dieser Fläche senkrecht. Außerdem ist sein Betrag dort konstant:



Weil die Vektoren E und dA parallel sind, ist ihr Skalarprodukt gleich dem Produkt ihrer Beträge. Somit wird:



Der Ring im Integralzeichen bedeutet, dass sich die Integration über eine geschlossene Linie, über eine geschlossene Fläche (Hüllfläche) oder über ein durch eine Hüllfläche umschlossenes Volumen erstreckt. (Die letzten beiden Integraltypen werden in der deutschen Literatur meist als Doppel- bzw. Dreifachintegrale dargestellt, was mit TeX nicht möglich ist.)


Der von der Ladung Q ausgehende Fluss des Feldvektors E ist also gleich Q0. Dieses Ergebnis ist von der Gestalt der »Hüllfläche« unabhängig und gilt für jede die Ladung umschließende geschlossene Fläche. Dies wird spätestens dann erkennbar, wenn man sich um die Ladung zwei (blaue) Kugeln gelegt denkt, von denen eine ganz innerhalb der (schwarzen) Hüllfläche liegt und die andere diese ganz umschließt. Der Fluss durch die beiden blauen Kugeln ist gleich groß. Also muss er in gleicher Größe auch durch alle Flächen gehen, die dazwischen liegen. Dies gilt selbst dann, wenn die unregelmäßige Fläche in einzelnen Bereichen nach innen gekrümmt ist. (Man bedenke, dass die Flächennormale in einem Teil der Fläche mit dem Feldstärkevektor einen stumpfen Winkel bildet und das Skalarprodukt negativ ist. – Siehe Abbildung.)



 

Das elektrische Feld mehrerer Kugelladungen

[Bearbeiten]

Wie Messungen zeigen, erfährt eine Ladung q im Feld zweier Kugelladungen Q1 und Q2 eine Kraft F, die so groß ist wie die Vektorsumme der beiden Kräfte F1 und F2, welche die beiden Ladungen Q1 und Q2 je einzeln auf die Ladung q ausüben.




Durch Division mit q folgt daraus


Bei der Überlagerung der beiden Felder addieren sich die Feldstärken vektoriell.


Für den Fluss ΨA des Gesamtfeldes durch eine Fläche A ergibt sich daraus:




Die Flüsse der beiden Feldvektoren summieren sich also skalar.


Schließt man die beiden felderzeugenden Ladungen Q1 und Q2 durch eine gemeinsame Hüllfläche ein, so gilt für den Fluss durch diese Fläche:



Also gilt: Der Fluss des Feldvektors E durch eine Hüllfläche ist gleich der Summe der umschlossenen Ladungen dividiert durch ε0.


Die gefundenen Gesetze für die Feldstärke und für den Fluss des elektrischen Feldvektors durch eine Hüllfläche lassen sich nun für beliebig viele Ladungen verallgemeinern:



 

Kontinuierliche Ladungsverteilung

[Bearbeiten]

In einem Raumstück sei eine elektrische Ladung kontinuierlich – wenn auch nicht unbedingt gleichmäßig – verteilt. Man spricht dann von einer »Raumladung«. (Da elektrische Ladungen aus einzelnen Protonen und Elektronen bestehen, ist eine kontinuierliche Ladungsverteilung streng genommen nicht möglich: die Ladung ist »körnig«. Da aber die »Körner« und ihre Abstände sehr klein sind, kann man fast immer eine kontinuierliche Ladungsverteilung annehmen.)

Befindet sich in einem Teil des Raumes mit dem Volumen ΔV die Ladung ΔQ, so ist die mittlere Raumladungsdichte in diesem Teil



Für ΔV gegen null ergibt sich daraus die Raumladungsdichte im Punkt P, auf den hin ΔV geschrumpft ist:



Kennt man in dem betrachteten Raumstück mit dem Volumen V die Raumladungsdichte als Funktion des Ortes, so findet man die in V befindliche Ladung:



Betrachten wir nun eine das Raumstück umfassende Hüllfläche H. Der durch diese Hüllfläche tretende Fluss des Feldvektors E ist



Andererseits ist



also



Dieses Ergebnis entspricht dem Integralsatz von GAUSS:



Er besagt Folgendes: Ist der Fluss eines Feldvektors durch eine Hüllfläche ungleich null, dann gibt es in dem von der Hüllfläche umschlossenen Raumstück einen Überschuss entweder an Quellen oder Senken des Feldvektors (hier: positive oder negative Ladungen). Der Fluss durch die Hüllfläche ist gleich der Summe der Ergiebigkeiten aller in der Hüllfläche liegenden Quellen und Senken. Bei kontinuierlicher Verteilung der Quellen und Senken im Raum wird die »Ergiebigkeitsdichte« oder »Quelldichte« durch die Divergenz ausgedrückt. (Siehe dazu Wikibook Vektoranalysis: Teil III)


Der Vergleich der beiden oben stehenden Gleichungen ergibt:


Die »Quelldichte« des Feldvektors E bei kontinuierlicher Ladungsverteilung ist also gleich ρ / ε0.

 

Beispiel:

Gegeben sei eine kugelförmige »Raumladungswolke« vom Radius R mit der konstanten Raumladungsdichte ρ und ein beliebiger Punkt im Abstand r vom Mittelpunkt M.




Erste Betrachtungsweise:

Auf Grund unserer bisher erworbenen Kenntnisse können wir sagen:

1. Liegt P außerhalb der Kugel (r > R), so verhält sich das Feld in P so, also ob die gesamte Ladung in M vereinigt wäre. Es ist also



2. Liegt P innerhalb der Kugel (r < R), so gilt:

a) Die Ladung in der Kugelschale mit den Radien r und R, auf deren Innenfläche P liegt, erzeugt in P kein Feld.

b) Die Ladung der Kugel mit dem Radius r, auf deren Oberfläche der Punkt P liegt, erzeugt in P dasselbe Feld, wie wenn die ganze Ladung dieser Kugel im M vereinigt wäre. Also ist



Zweite Betrachtungsweise:


1. Liegt P außerhalb der Kugel, so ist der Fluss des Feldvektors E durch eine kugelförmige Hüllfläche durch P:



woraus folgt



2. Liegt P innerhalb der Kugel, dann ist der Fluss durch eine kugelförmige Hüllfläche durch P:



woraus folgt



Als Vektoren geschrieben sind



Wir berechnen noch für beide Feldvektoren die Divergenz.



Es ist





und analog




Daraus folgt



Also ist



Ferner ist






Diese Resultate entsprechen genau unseren Erwartungen.


 

Das elektrostatische Potential

[Bearbeiten]

Im elektrostatischen Feld (das ist das Feld unbewegter Ladungen) gelten folgende Gesetze:

1. Es gibt im elektrostatischen Feld auch bei beliebiger Ladungsverteilung keine geschlossenen Feldlinien.

Beweis: Gäbe es im Feld eine geschlossene Feldlinie, so könnte eine elektrische Ladung unter der Wirkung der elektrischen Kraft beliebig oft darauf umhergeführt und dabei Arbeit gewonnen werden, ohne dass dafür an einer anderen Stelle Arbeit aufgewendet werden müsste. Dies wäre ein Verstoß gegen den Energieerhaltungssatz.

2. Die Arbeit W, die aufzuwenden ist, wenn in einem elektrostatischen Feld eine Ladung q von einem Punkt P1 zu einem anderen Punkt P2 bewegt wird, ist vom Weg unabhängig.

Beweis: Wenn dies nicht so wäre, so könnte man mit einer Ladung q einen geschlossenen Umlauf P1 – P2 – P1 machen und dabei durch geschickte Wahl der Wege Arbeit gewinnen.

Die Arbeit, die bei Bewegung einer Ladung q in einem elektrischen Feld aufzuwenden ist, beträgt



Berechnet man das Arbeitsintegral über einen geschlossenen Weg, so ist W = 0 und daher



3. Da der Wert des Arbeitsintegrals vom Weg zwischen P1 und P2 unabhängig ist, ist auch die Arbeit W, die aufzuwenden ist, um eine Ladung q aus dem Unendlichen (d. h. aus sehr großer Entfernung) zu einem Punkt P zu bringen, vom Weg unabhängig. Diese Arbeit hängt also nur von q und von der Lage des Punktes P ab. Sie ist proportional zu q, weil die Kraft auf die Ladung an jeder Stelle proportional zu q ist. Der Quotient W/q hängt dann nur noch von der Lage des Punktes P ab, ist also allein eine Funktion des Ortes und wird das Potential φ des Punktes P genannt.



Durch diese Definition ist das Potential im Unendlichen gleich null; im Feld einer positiven Ladung ist es positiv, im Feld einer negativen Ladung negativ.

Die SI-Einheit des Potentials ist das Volt (V). 1 V = 1 Nm/As.

Aus der Definition des Potentials folgt:

Um eine Ladung q von einem Punkt mit dem Potential φ1 zu einem Punkt mit dem Potential φ2 zu bringen, ist die Arbeit



aufzuwenden.

 


Das Potential des Feldes einer Kugelladung

[Bearbeiten]

Es soll nun das Potential eines Punktes P im Abstand r von einer Kugelladung Q berechnet werden. Dazu berechnen wir zunächst die Arbeit W, die nötig ist, um eine Ladung q aus dem Unendlichen nach P zu bringen. Da diese Arbeit vom Weg unabhängig ist, machen wir es uns bequem und bewegen die Ladung aus dem Unendlichen radial auf Q zu. Dann hat die aufzuwendende Kraft stets dieselbe Richtung wie der Weg und es wird daher:



Da r und s entgegengesetzt gerichtet sind, ist ds = - dr und daher



Folglich ist



Das Potential des Feldes hat also das gleiche Vorzeichen wie die felderzeugende Ladung.

Da im Innern einer geladenen Kugelfläche die Feldstärke null ist, ist das Potential konstant: zum Bewegen einer Ladung ist keine Kraft und daher auch keine Arbeit erforderlich.


Feldstärke und Potential einer geladenen Kugelfläche


Wir berechnen nun noch den Gradienten des Potentials in diesem Feld. Es ist



Die partiellen Ableitungen von φ nach x, y und z werden nach der Kettenregel berechnet.



Die partielle Ableitung findet man am bequemsten so:



So erhält man



und folglich



und daher



Diese wichtige Beziehung gilt in jedem beliebigen Potentialfeld. (Siehe unten: Potential und Feldstärke in einem beliebigen Feld.)


Das Potential des Feldes mehrerer Kugelladungen

[Bearbeiten]

Wie oben schon erklärt, addieren sich die Feldstärken diskreter Kugelladungen vektoriell:



Bewegt man in einem solchen Feld eine Probeladung aus sehr großer (unendlicher) Entfernung zu einem Punkt P, so muss dabei die Kraft F = -q E aufgewendet werden. Die Arbeit ist daher



Das elektrostatische Potential des Punkts P ist dann



Die n Summanden sind aber nichts anderes als die von den einzelnen Ladungen in P erzeugten Potentiale. Also ist



Das Gesamtpotential ist die Summe der Potentiale der einzelnen Felder.

 

 


Das Potential im Feld einer kugelförmigen Raumladung

[Bearbeiten]

Die Feldstärke dieses Feldes wurde schon im Beispiel des Kapitels 5.1 Kontinuierliche Ladungsverteilung berechnet.

Im Außenraum verhält sich das Feld wie das einer Kugel- oder Punktladung. Dort ist



Für das Potential gilt dann entsprechend



An der Oberfläche der kugelförmigen Raumladung ist dann mit r = R



Im Innenraum (r < R) kommt zu diesem Potential noch die ladungsbezogene Arbeit hinzu, die auf dem Weg vom Abstand R bis r aufzubringen ist. Es ist also



wobei (siehe Kapitel 5.1)



ist. Damit ergibt sich weiter



und schließlich



Feldstärke und Potential einer kugelförmigen Raumladung


 

Potential und Feldstärke in einem beliebigen Feld

[Bearbeiten]

Das Differential dW der Arbeit, das aufzuwenden ist, um die Ladung q in einem Punkt mit der Feldstärke E um die gerichtete Strecke ds zu bewegen, ist



und das Differential dφ des Potentials im Fußpunkt des Vektors ds ist



Das vollständige Differential dU einer skalaren Ortsfunktion U(x, y, z) ist



Die rechts stehende Summe kann dargestellt werden als das Skalarprodukt zweier Vektoren:



Der erste Faktor ist der Vektor grad U, der zweite Faktor ist der Vektor ds. Folglich ist



(Zur Erinnerung: Der Vektor grad U einer skalaren Ortsfunktion U hat die Richtung des maximalen Anstiegs der Funktion U im jeweils betrachteten Punkt P; sein Betrag ist gleich dem Größenwert dieses maximalen Anstiegs. Der Vektor grad U steht auf der Tangentenebene der Fläche U = konst. in P senkrecht.)

Wendet man dieses Ergebnis auf das Potential φ an, erhält man



Durch Vergleich mit Gleichung (A) ergibt sich



Die Feldstärke eines jeden Potentialfeldes (das ist ein Feld, in dem jeder Punkt ein definiertes Potential hat) ist also der Gradient des Potentials des Feldes.

Wegen



ist



wobei (Nabla) der HAMILTON- Differentialoperator und der LAPLACE-Differentialoperator ist.


Es ist



Die POISSON-Differentialgleichung ist die Differentialgleichung des elektrostatischen Potentials φ.

Im ladungsfreien Raum ist überall



Befinden sich insbesondere in einem Raumstück mehrere Kugelladungen, so summieren sich in jedem Punkt deren Potentiale wie Skalare, ihre Feldstärken dagegen wie Vektoren. (Hier zeigt sich die erhebliche Vereinfachung durch die Einführung des Potentials.)




Bei kontinuierlicher Ladungsverteilung (Raumladung mit der Raumladungsdichte ρ oder Flächenladung mit der Flächenladungsdichte σ) ist


 

Aus der mit dem Energiesatz begründeten Aussage, dass das Linienintegral der elektrischen Feldstärke über eine geschlossene Linie gleich null ist,



folgt mit dem Integralsatz von STOKES (siehe Wikibook Vektoranalysis: Teil IV), dass im ganzen Feld



ist: Das elektrostatische Feld ist wirbelfrei. Die Wirbelfreiheit wiederum erweist sich (siehe a. a. O.) als die mathematische Voraussetzung dafür, dass ein Vektorfeld ein Potentialfeld besitzt. (Das bedeutet, dass jedem Punkt des Feldes eindeutig ein Potential zugeordnet werden kann.)



 

Spezielle elektrostatische Potentialfelder

[Bearbeiten]

Elektrischer Dipol

[Bearbeiten]

Ein elektrischer Dipol besteht aus zwei entgegengesetzt gleichen Ladungen Q und –Q im Abstand l. Das Produkt Q l heißt Dipolmoment m. Es ist ein Vektor von der Richtung des Vektors l.



Das Potential in P ist die Summe der einzelnen Potentiale:



Für r >> l ist



Dann ist annähernd:



Das Dipolpotential nimmt also mit 1/r2 ab und hängt außerdem vom Winkel zwischen l und r ab. Es ist auf der Mittelsenkrechten des Dipols überall null und hat bei konstantem r in der Dipolachse den größten Betrag. Auf der Seite der positiven Ladung ist es positiv, auf der anderen negativ. Das Feld ist nicht mehr kugelsymmetrisch (radialsymmetrisch), sondern lediglich rotationssymmetrisch.

 

 

Elektrische Doppelschicht

[Bearbeiten]

Eine elektrische Doppelschicht ist eine Fläche, die mit Dipolen belegt ist, deren Achsen überall die Richtung der Flächennormalen n haben. Die Flächendichte des Dipolmoments sei m*= dm/dA. Dann ist das Potential in P:



Ist die Schicht homogen, d. h. ist m* = konst., dann ist



Der räumliche Winkel dΩ, unter dem das Flächenelement dA von P aus erscheint, ist definiert als die Fläche, die der von P aus nach dem Rand von dA sich erstreckende Körper aus der Einheitskugel um P ausschneidet:


Der Betrag von dΩ ist daher gleich dem Integranden des obigen Integrals. Durch Integration ergibt sich also:


Unmittelbar vor einer ausgedehnten ebenen Doppelschicht ist Ω = 2 π und daher φ = m*/2 ε0, unmittelbar dahinter ist φ = –m*/2 ε0 Es findet also auf einer möglicherweise sehr kurzen Strecke ein beträchtlicher Potentialsprung statt.

 

 

Kugelkondensator

[Bearbeiten]

Gegeben sind zwei konzentrische, leitende Kugelflächen mit den Radien a und b. Auf die innere Kugelfläche wird (mittels einer isolierten Durchführung durch die äußere Fläche) die Ladung Q gebracht. Die äußere Kugelfläche wird mit der Erde verbunden (»geerdet«) und nimmt so deren Potential an, das wir gleich null setzen.

Für den Raum zwischen den beiden Kugelflächen finden wir mit Hilfe des Hüllenintegrals und der von der Ladung Q ausgehendem Fluss für den Betrag der Feldstärke wieder



Das Potential finden wir durch folgende Überlegung: Wegen der Radialsymmetrie des Feldes ist



und



Für r = b muss φ = φb = 0 sein. Daraus folgt


und



Das Potential der inneren Kugel ergibt sich mit r = a zu



Die Potentialdifferenz φa – φb = φa zwischen den beiden Flächen des »Kugelkondensators« heißt elektrische Spannung U des Kondensators. Sie wird wie das Potential in Volt (V = N m/A s) gemessen und ist der Ladung Q proportional. Die spannungsbezogene Ladung Q/U ist ein Maß für das elektrische Fassungsvermögen des Kondensators und wird Kapazität C des Kondensators genannt und in A s / V = Farad (F) gemessen.

Für den Kugelkondensator gilt:


Für b gegen unendlich erhält man daraus die Kapazität einer freistehenden Kugel vom Radius a:



Farad ist eine sehr große Einheit. Beispiel: Die Kapazität der Erdkugel beträgt 0,7 mF.

 

Influenzladungen

[Bearbeiten]

Es lohnt sich, den Kugelkondensator noch etwas genauer zu betrachten.

Außerhalb der äußeren Kugel ist überall E = 0, und daher muss die von einer im Außenraum befindlichen geschlossenen Hülle umfasste Ladung ebenfalls null sein. Wie ist das möglich?

Ferner: Die von der inneren Ladung Q ausgehenden Feldlinien müssen – da der Außenraum feldfrei ist – auf der äußeren Kugel enden. Als Senken der Feldlinien kommen aber nur negative Ladungen in Frage. Also muss auf der Innenfläche der äußeren Kugel die Ladung –Q gleichmäßig verteilt sein. Dann ist auch die von der geschlossenen Hülle insgesamt umfasste Ladung gleich null.


Es fragt sich nun: Wo kommt diese Ladung her? Hier treffen wir auf das Phänomen der »Influenzladungen« oder »influenzierten Ladungen«. Die negative Ladung wurde von der positiven Ladung aus der Erde angezogen. Diese Influenzladung kann mit geeigneten Mitteln nachgewiesen werden, wenn man zuvor die Verbindung der äußeren Kugel mit der Erde trennt und so der influenzierten Ladung den Rückzug abschneidet. Verbindet man dann die beiden Kugeln miteinander, erweisen sie sich als ungeladen.

Wenn man die innere Kugel auflädt, ohne dass die äußere zuvor geerdet wurde, geschieht etwas ganz anderes: Auf der äußeren Kugel findet durch Influenz eine Ladungstrennung statt. Auf ihrer Innenfläche erscheint die Ladung –Q, auf der Außenfläche die Ladung Q. Das hat zur Folge, dass nun auch im Außenraum ein elektrisches Feld entsteht, und zwar von gleicher Art, als wenn die Ladung Q im Mittelpunkt vereinigt wäre.


 

Punktladung über einer unendlich ausgedehnten leitenden Ebene

[Bearbeiten]

Auf der Z-Achse befinde sich im Punkt z = a eine Punktladung Q. Die XY-Ebene sei eine leitende Ebene, der wir das Potential 0 zuschreiben. Da die XY-Ebene eine Äquipotentialfläche ist, stehen die Feldlinien auf ihr senkrecht.


Im Raum oberhalb der leitenden Ebene gilt für jede die Ladung Q umschließende Fläche:



Für z gegen null muss auch φ gegen null gehen.


Letzteres gilt auch für den Raum unterhalb der Ebene. Außerdem hat dort jedes Hüllenintegral den Wert null. Folglich muss dort überall E = 0 und daher φ = konst., also ebenfalls null sein.

Da die Feldlinien alle auf der leitenden Ebene enden, muss es dort negative Influenzladungen mit nach außen abnehmender Ladungsdichte geben.

Stellen wir uns nun vor, es würde symmetrisch zu Q auf der negativen Z-Achse eine Ladung –Q angebracht. Es entstünde dann im unteren Raum ein spiegelsymmetrisches Feld, allerdings mit Feldlinien, die auf die Ladung –Q zu laufen. In der XY-Ebene würden durch Influenz positive Ladungen erzeugt, die sich mit den negativen Influenzladungen kompensieren würden. Die leitende Ebene könnte also entfernt werden, ohne dass sich am Feld etwas ändern würde. Übrig bliebe ein elektrischer Dipol mit dem Dipolmoment m* = 2 a Q in Richtung der +Z-Achse. Dieses Feld ist uns aber bereits bekannt und wir können für jeden Punkt das Potential und die Feldstärke berechnen:




Für den Betrag der Feldstärke in der XY-Ebene, die senkrecht nach unten gerichtet ist, gilt insbesondere:


Aus dieser Feldstärke finden wir die Ladungsdichte σ der Influenzladung auf der XY-Ebene , indem wir ein Flächenelement der Ebene durch eine quaderförmige Fläche von der Grundfläche dA und verschwindend kleiner Höhe einhüllen:



Das Hüllenintegral besteht dann nur aus zwei Anteilen. An der Oberseite ist die Feldstärke gleich E0, an der Unterseite null. Folglich ist




wobei dq die Ladung des Flächenelements dA und σ die Flächenladungsdichte ist.

Daraus folgt:



Durch Integration über die ganze Ebene findet man, dass die influenzierte Ladung gleich –Q ist, entsprechend der Tatsache, dass die influenzierte Ladung die Senke des von Q erzeugten Feldes ist.

 

Isolatoren (Dielektrika) im elektrischen Feld

[Bearbeiten]

Definition Plattenkondensator

[Bearbeiten]

Ein Plattenkondensator besteht aus zwei parallelen ebenen Metallplatten in geringem Abstand zu einander. Im Folgenden soll die Plattenfläche A mindestens einige Quadratdezimeter betragen und der Plattenabstand d nicht größer als einige Millimeter sein. Dann kann man von den Störungen am Rand des Kondensators absehen und das Feld als insgesamt homogen betrachten. Für den Betrag E0 der Feldstärke des Kondensators im Vakuum (und praktisch auch in Luft) findet man mit dem Hüllenintegral über eine der Kondensatorplatten:



Im Allgemeinen wird eine der beiden Platten des Kondensators geerdet und hat dann das Potential null. Die andere Platte kann man z. B. mit einem geriebenen Glas- oder Hartgummistab aufladen und ihr Potential φ (identisch mit ihrer Spannung U, da die andere Platte geerdet ist) mit einem Elektrometer messen. (Wird auf die Platte die Ladung Q aufgebracht, so influenziert diese Ladung auf der anderen Platte die Ladung –Q. Dies ergibt sich auch mit dem Hüllenintegral über diese Platte und mit der bekannten Feldstärke.) Wegen der Homogenität des Feldes (E0 = konst.) ist:



 

Dielektrikum im elektrischen Feld

[Bearbeiten]

Füllt man nun den Raum zwischen den Platten mit einem Dielektrikum (einem Isolator), so sinkt die Spannung U und damit auch die Feldstärke E0 drastisch auf einen Bruchteil des ursprünglichen Wertes, obwohl die Ladung des Kondensators offensichtlich unverändert geblieben ist. (Entfernt man das Dielektrikum wieder, stellen sich die ursprünglichen Werte wieder ein.) Es gilt nun für die neue Feldstärke E:



Der Nenner εr ist vom Material des Dielektrikums abhängig und heißt relative Permittivität, Permittivitätszahl oder (veraltend) relative Dielektrizitätskonstante des Materials.

Die Abnahme der Feldstärke erklärt sich dadurch, dass das Dielektrikum durch das elektrische Feld »polarisiert« worden ist, d. h. dass seine Endflächen – ähnlich wie bei der Influenz, jedoch in verringertem Maß – nun elektrische Ladungen tragen.

Für die Herkunft dieser Ladungen kann es zwei Ursachen geben: 1. Falls die Moleküle des Dielektrikums elektrische Dipole sind, die normalerweise regellos angeordnet sind, werden diese nun im Feld graduell ausgerichtet. 2. Wenn die Moleküle keine Dipole sind, kommt es im Feld zu einer (sehr geringen) Verformung der Elektronenhüllen und damit zu einer Ladungsverschiebung. – In beiden Fällen ist die Wirkung dieselbe: Im Inneren des Dielektrikums ist die Verteilung der positiven und negativen Ladungen noch immer gleichmäßig. An den Endflächen überwiegen jedoch nun auf der einen Seite die positiven Ladungen, auf der anderen Seite die negativen. Es entsteht also jeweils eine Flächenladung.

Das von diesen Ladungen erzeugte Feld wirkt dem angelegten Feld entgegen, was zu einer Herabsetzung der Feldstärke führt.

Polarisation des Dielektrikums und Verminderung der Feldstärke


Die Ladungsdichte der Polarisationsladung sei σ = P. Dann ist der Betrag der Polarisationsfeldstärke Epol = P/ε0 und der Betrag der neuen Feldstärke


Der dazu gehörige Vektor P heißt Polarisation des Dielektrikums:



 

Das Brechungsgesetz für elektrische Feldlinien

[Bearbeiten]

An der Trennungsfläche zweier verschiedener Dielektrika mit εr = ε1 bzw. ε2 werden die elektrischen Feldlinien gebrochen, wenn sie nicht gerade senkrecht zur Trennungsfläche verlaufen. Der Grund dafür ist, dass sich die Tangentialkomponenten der Feldstärken an der Grenzschicht anders verhalten als die Normalkomponenten. Für die Normalkomponenten gilt:



Dagegen gilt für die Tangentialkomponenten:



Begründung: Erfahrungsgemäß sind elektrostatische Felder auch in Dielektrika wirbelfrei. So muss das Linienintegral über die Feldstärke entlang der Trennfläche null sein (siehe Abbildung). Daraus folgt die Gleichheit der Tangentialkomponenten.



Für die beiden Winkel gilt daher:


 

Die Energie des elektrischen Feldes

[Bearbeiten]

Potential eines Systems von Punktladungen

[Bearbeiten]

Wir gehen aus von dem Potentialfeld einer Punktladung. Für das Potential φ in einem Punkt P im Abstand r von der Ladung Q gilt:


Wir denken uns nun sukzessive ein System von Punktladungen Q1, Q2,Q3 usw. zusammengebaut.


Das Potential am Ort von Q2, das von Q1 erzeugt wird, ist


Um Q2 aus dem Unendlichen an ihren Ort zu bringen, ist die Arbeit W2 nötig:


Q1 und Q2 erzeugen am Ort der Ladung Q3 zusammen das Potential



Um Q3 aus dem Unendlichen an ihren Ort zu bringen, ist die Arbeit W3 nötig:


Dies ist die Arbeit, die nötig ist, um die jeweilige Anordnung der vorgegebenen, also bereits als vorhanden angenommenen Punktladungen herzustellen. Nicht berücksichtigt sind dabei jedoch die Arbeiten, die nötig sind, um Q1 an ihrem Ort und alle übrigen Ladungen im Unendlichen aus einzelnen Elementarladungen zusammenzusetzen. Wenn wir den Begriff »Punktladungen« wörtlich nähmen, wäre dazu jeweils eine unendlich große Arbeit nötig. Nun gibt es aber in der Realität keine Punktladungen, weshalb wir entweder kugelförmige Raumladungen oder kugelschalenförmige Flächenladungen entsprechender Größe benutzen müssen. Deshalb ist unsere nächste Aufgabe, die Energie zu berechnen, die zur Herstellung einer solchen Ladung erforderlich ist.

 

Die Energie einer geladenen Kugel

[Bearbeiten]

Das Potential einer geladenen Kugel vom Radius R ist



Um nun die zusätzliche Ladung dQ auf die Kugel zu bringen, braucht man die Arbeit



Um die Kugel vom ursprünglich ungeladenen Zustand (Q = 0) in den Endzustand (Q = QE) zu bringen, braucht man die Arbeit



Dieses Ergebnis entspricht der Tatsache, dass das mittlere Potential der Kugel während des Ladevorgangs gleich dem halben Endpotential ist.

 

Wo befindet sich die elektrische Energie eines geladenen Körpers?

[Bearbeiten]

Auf diese Frage gab es in der Physik lange Zeit zwei gegensätzliche Antworten. Nach der so genannten Nahewirkungstheorie (auf die hier nicht näher eingegangen werden soll) sollte sich die Energie auf dem geladenen Körper und gleichsam in den Ladungen befinden. Nach der Fernwirkungstheorie, die sich schließlich aus zwingenden Gründen durchgesetzt hat, befindet sich die Energie im elektrischen Feld, das den geladenen Körper umgibt. Dabei ist zu erwarten, dass die Energiedichte dW/dV eine Funktion der Feldstärke ist. Um diesen Zusammenhang zu klären, betrachten wir das homogene Feld eines Plattenkondensators mit der Plattenfläche A, dem Plattenabstand d und der Ladung Q. Der Betrag seiner Feldstärke ist dann



und der Potentialunterschied seiner Platten



Seinen Energieinhalt W findet man durch eine Integration wie oben:



Daraus ergibt sich die Energiedichte des Feldes:



Analog findet man für einen mit Dielektrikum gefüllten Kondensator:



Diese wichtige Beziehung gilt jedoch nicht nur für das homogene Feld eines Plattenkondensators, sondern ganz allgemein. In hinreichend kleinen Bereichen kann man nämlich jedes Feld als homogen betrachten und es durch einen Plattenkondensator erzeugt denken.

Wir wenden diese Beziehung nun auf das radialsymmetrische Feld einer geladenen Kugel an und überprüfen die Übereinstimmung mit dem oben gefundenen Wert für deren Energie.

Wir zerlegen das Feld in konzentrische Kugelschalen der Fläche 4πr2 und der Dicke dr, berechnen aus der Energiedichte deren Energiegehalt und integrieren über das Volumen des gesamten Feldes, d. h. von r = R bis r gleich unendlich.




was mit dem oben gefundenen Wert übereinstimmt.


Zum Schluss noch eine etwas vertrackte Aufgabe:

Man kann die Energiedichte des elektrischen Feldes auch mittels einer Kugelladung finden, indem man zunächst die Arbeit berechnet, die nötig ist, um die Ladung Q auf eine Kugel vom Radius R zu bringen, sodann die Arbeit, die man braucht, um die gleiche Ladung auf eine Kugel vom Radius R – dR zu bringen. Die Differenz der beiden Arbeiten muss gleich der Energie sein, die in dem hinzugekommenen Volumen steckt. Auf diese Weise findet man das richtige Ergebnis.

Dann denken wir uns nun die Kugelladung Q aus einer großen Zahl sehr kleiner Ladungen q zusammengesetzt. Jede dieser Ladungen befindet sich in dem elektrischen Feld, das von der Ladung Q an der Oberfläche der Kugel erzeugt wird und erfährt eine entsprechende Kraft. Verschiebt man jede der kleinen Ladungen um die Strecke dR nach innen, so braucht man dazu eine bestimmte Arbeit und erhält dafür ein größeres Feld mit einer entsprechend höheren Energie. Die Durchführung der Rechnung liefert für die Energiedichte genau das Doppelte des richtigen Wertes. Wo liegt der Fehler?


Und noch eine Anmerkung:

Vielleicht hat jemand hier die "Verschiebungsdichte D " vermisst. Nun, ich habe bemerkt, dass sie im Rahmen der Elektrostatik überhaupt nicht benötigt wird. Ich werde sie erst dann einführen, wenn sie gebraucht wird.

Der elektrische Strom – Eigenschaften und Wirkungen: Teil I: Grundlagen

[Bearbeiten]

Einleitung

[Bearbeiten]

Wir betrachten zwei beliebige isolierte Körper, die auf unterschiedliche Potentiale (oder Spannungen gegen Erde) φ1 und φ2 aufgeladen wurden. Es sei φ1 > φ2, wobei auch negative Potentiale zugelassen sind. (Ein negatives Potential entsteht dadurch, dass der Körper einen Überschuss an negativen Ladungen hat.)

Verbindet man anschließend die beiden Körper durch einen Leiter, z. B. durch einen Metalldraht, dann fließen elektrische Ladungen von einem Körper zum anderen, und zwar so lange, bis beide Körper dasselbe Potential haben. Das ist die Konsequenz des Satzes der Elektrostatik, dass ein leitender Körper überall dasselbe Potential hat. (Durch die leitende Verbindung ist aus den ursprünglich zwei Körpern ein einziger geworden.)

Dabei stellt man sich vor, dass von dem ersten Körper, der wegen seines höheren Potentials einen größeren Überschuss an positiven Ladungen hat als der zweite, positive Ladungen auf den zweiten fließen.

In unserem Beispiel klingt der elektrische Strom vom ersten auf den zweiten Körper sehr schnell ab, und es herrscht wieder "Elektrostatik".

Merke:

Wenn ein elektrischer Strom fließt, bewegen sich Ladungsträger. Es gibt positive und negative Ladungsträger.
Positiv sind Metall-Ionen in Lösungen. Negativ sind Säure-Rest-Ionen oder freie Elektronen.

Es gibt aber Anordnungen, die einen elektrischen Potentialunterschied über längere Zeit aufrecht erhalten können, auch wenn ständig Ladungen abfließen, z. B. die Monozellen, die für elektrische und elektronische Geräte benutzt werden. Sie bewirken, dass auch in einem leitenden Körper ein Potentialgefälle (und somit ein elektrisches Feld) anhaltend bestehen kann und ständig ein elektrischer Strom fließt.

Die Stromrichtung

[Bearbeiten]

In welche Richtung fließt der Ausgleichsstrom? Es scheint ganz klar, dass die positiven Ladungen vom stärker positiv geladenen Körper zum weniger aufgeladenen Körper fließen. Als Beispiel betrachtete man den Transport von Kupfer-Ionen in einem Elektrolyten.

Die Richtung, in die Kupfer-Ionen (Metall-Ionen) in einem Elektrolyten transportiert werden, wurde als (technische) Stromrichtung definiert.

Nun bewegen sich in einem Elektrolyt nicht nur positiv geladene Metall-Ionen, sondern auch negativ geladene Säure-Rest-Ionen in die Gegenrichtung. Daher hätte man auch die Bewegung der Säure-Rest-Ionen als technische Stromrichtung definieren können.

In Elektrolyten bewegen sich die Metallionen von „plus“ nach „minus“ und gleichzeitig die Säurerest-Ionen von „minus“ nach „plus“. Deshalb muss man die Festlegung der (technischen) Stromrichtung als willkürlich bezeichnen.

In metallischen Leitern stehen als Ladungsträger ausschließlich Elektronen zur Verfügung: Die Restatome stecken in einem Atomgitter fest und sind unbeweglich. Dadurch verläuft die Fließrichtung der Ladungsträger (der Elektronen) vom negativen zum positiven Potenzial.

So haben wir also künftig in Metallen die reale Stromrichtung (die der Elektronen) von der physikalisch-technischen Stromrichtung zu unterscheiden, die leider genau umgekehrt verläuft. In einem Stromkreis aus einer Batterie und einer Glühlampe bedeutet dies, dass vom negativen Pol der Batterie über die Glühlampe negativ geladene Elektronen zum positiven Pol der Batterie fließen – entgegen der technischen Stromrichtung. Die Zuordnung des positiven und negativen Vorzeichens ist also unglücklich erfolgt, lässt sich aber nicht mehr ändern.

In Schaltplänen wird die (technische) Stromrichtung durch einen Richtungspfeil gekennzeichnet. Der Richtungspfeil wird direkt auf den stromdurchflossenen Leiter (oder parallel dazu in geringem Abstand) gezeichnet. Neben dem Richtungspfeil wird die Größe des Stroms angegeben.

Beispiel:

Ia = 0,3 A
Ib = – 0,3 A (Das heißt, die Stromrichtung ist entgegengesetzt zur Richtung des Richtungspfeils.)
Beachte
Ein „Überschuss an positiven Ladungen“ ist gleichbedeutend mit einem „Mangel an negativen Ladungen“.
Ein „größerer Überschuss an positiven Ladungen“ kann gleichbedeutend sein mit einem „geringeren Überschuss an negativen Ladungen“.

Elektrischer Strom fließt in folgenden Fällen:

  • Zwischen zwei unterschiedlich geladenen Körpern fließt ein Ausgleichsstrom, wenn man sie mit einem Leiter verbindet.
  • Durch Umwandlung chemischer Energie kann ein Stromfluss entstehen.
  • Ein veränderliches Magnetfeld kann durch Induktion einen Strom erzeugen.

Alle elektrischen Ströme haben vier wichtige Eigenschaften:

1. Sie sind mit dem Transport von Materie verbunden. In metallischen Leitern werden Elektronen bewegt, in elektrolytischen Leitern positive und negative Ionen.

2. Die Ladungsträger bewegen sich langsam, aber die Wirkung des Stromes pflanzt sich fast mit Lichtgeschwindigkeit fort.

3. Der Strom erzeugt um sich herum ein Magnetfeld.

4. Sie sind mit der Erzeugung von Wärme verbunden, die sich in einer Erwärmung des Leiters zeigt. Bei diesem Vorgang wird zunächst die „elektrische Energie“ der Stromquelle in kinetische Energie der Ladungsträger umgesetzt. Die Ladungsträger bewegen sich durch den Leiter und stoßen dabei mit den Atomen oder Molekülen des Leiters zusammen, was eine Temperaturerhöhung bedeutet. (Dieser Vorgang wird kurz als „Reibung“ bezeichnet.)

Definition Stromstärke und Stromdichte

[Bearbeiten]

Fließt in der Zeit Δt durch einen Leiterquerschnitt senkrecht zur Strömungsrichtung der Ladungsträger die Ladungsmenge ΔQ, so ist die mittlere Stromstärke im Zeitintervall Δt.



und die (momentane) Stromstärke zu Beginn des Zeitintervalls:



Für die Richtung des Stromes (»technische Stromrichtung«) gilt die Verabredung: Der elektrische Strom fließt von den Punkten höheren Potentials zu den Punkten niedrigeren Potentials, bei einer Spannungsquelle also vom Pluspol zum Minuspol. Damit hat der Strom dieselbe Richtung wie das elektrische Feld.

Die Stromdichte j an einer Stelle des Leiters ist



wobei ΔI die Stromstärke in dem senkrecht zur Stromrichtung liegenden Flächenstück ΔA ist.

Der Vektor j der Stromdichte hat nach Vereinbarung die Richtung des elektrischen Feldvektors. Die Stromstärke durch den Querschnitt A ist dann



Ein Strom mit zeitlich konstanter Stromstärke heißt stationärer Strom oder Gleichstrom. Für ihn gilt



Bei einem stationären Strom ist die Stromstärke in jedem zur Stromrichtung senkrechten Leiterquerschnitt dieselbe. Wäre das nicht so, dann müsste es an den Stellen, an denen sich die Stromstärke ändert, zu Ladungsanhäufungen und damit zu sehr starken Potentialänderungen kommen.

Die Vektoren der Stromdichte bilden ein Vektorfeld, dessen Feldlinien ohne Anfang und ohne Ende, also in sich geschlossen sind. Folglich ist das Feld der Stromdichte ein quellenfreies Feld:



Die so genannten Stromquellen (auch »Spannungsquellen« genannt) sind daher nicht etwa »Quellen« elektrischer Ladungen, sondern eher »Ladungspumpen«, in denen das Potential stetig (wie in Generatoren) oder sprunghaft (wie in Monozellen) verändert wird.

Das ohmsche Gesetz

[Bearbeiten]

Als Nächstes steht die Frage an, wie der Strom in einem Leiter vom Potentialunterschied (oder der elektrischen Spannung) zwischen den Enden des Leiters abhängt. Diese Frage kann nur experimentell beantwortet werden, obwohl man immerhin Folgendes vorhersagen kann: Mit dem Potentialunterschied steigt proportional die Feldstärke im Leiter und damit die Kraft auf die Ladungsträger, also auf die Elektronen. Das Experiment bestätigt die naheliegende Vermutung, dass die Stromstärke I der Spannung U proportional ist, allerdings nur bei konstanter Temperatur. Da der Strom selbst zu einer Erwärmung des Leiters führt, ist die Proportionalität oft stark gestört. Also:



Dies ist das ohmsche Gesetz.

Der Quotient U / I ist ein Maß für den (Reibungs-)Widerstand R, den der Leiter dem Strom entgegensetzt und heißt daher ohmscher Widerstand des Leiters. Der ohmsche Widerstand hängt von der Temperatur ab.

Definition:



Hier besteht nun eine beträchtliche Begriffsverwirrung, zu der auch namhafte Lehrbücher beigetragen haben und noch immer beitragen: Diese Gleichung ist die »Definitionsgleichung des ohmschen Widerstandes« und nicht das »ohmsche Gesetz«. (Auch die daraus hergeleiteten Umkehrungen U = R × I und I = U / R sind Umkehrungen der Definitionsgleichung und nicht solche des ohmschen Gesetzes.)

Für einen homogenen Leiter der Länge l mit konstantem Querschnitt A gilt:


Dabei ist ρ = ρ(T) der spezifische elektrische Widerstand des Leitermaterials. Der Kehrwert von ρ heißt spezifischer elektrischer Leitwert σ. Damit kann man schreiben



woraus folgt



Dies ist eine der elektrischen Feldtheorie (Nahewirkungstheorie) angemessene (weil »punktuelle«) Formulierung des ohmschen Gesetzes.

 

Der Energieumsatz des elektrischen Stroms – joulesche Wärme

[Bearbeiten]

Fließt in einem Leiter die elektrische Ladung Q von einem Punkt A mit dem Potential φ1 zu einem Punkt B mit dem Potential φ2, so wird dabei die elektrische Energie



in Wärme (so genannte »joulesche Wärme«) umgesetzt.

Dazu muss für

Q > 0:     φ1 > φ2,
Q < 0:     φ1 < φ2

sein.

Die mit dem Energieumsatz verbundene Leistung P bei konstanter Spannung U ist


Um auch hier einen der Feldtheorie entsprechenden Ausdruck zu erhalten, betrachten wir ein quaderförmiges Volumenelement dV, von dem vier Kanten (Länge dl ) in Stromrichtung liegen. Die dazu senkrechten Stirnflächen dA sind dann Äquipotentialflächen des elektrischen Feldes im Leiter. Dann ist die Potentialdifferenz (elektrische Spannung) zwischen den Stirnflächen dU = E dl. Die Stromstärke ist dI = j dA und daher dP = dU dI = E dl j dA = E j dV.

Damit erhalten wir die

Leistungsdichte des Energieumsatzes


Dieses Ergebnis ist unabhängig von der räumlichen Orientierung des betrachteten Volumenelements dV und gilt ganz allgemein.

 

Die magnetische Wirkung des elektrischen Stroms

[Bearbeiten]

Einleitung

[Bearbeiten]

Jeder elektrische Strom erzeugt um sich ein magnetisches Feld, und niemand weiß, wie er das macht. Das charakteristische Merkmal eines magnetischen Feldes ist, dass »Magnetpole« darin eine Kraft erfahren. Da Magnetpole aber nur paarweise als Dipole auftreten, ist es oft zweckmäßiger, das Drehmoment zu beobachten, das im Feld auf einen magnetischen Dipol wirkt.

Ähnlich wie ein elektrisches Feld kann ein magnetisches Feld durch Feldlinien beschrieben werden.

Es liegt nahe, die magnetische Feldstärke analog zur elektrischen Feldstärke zu definieren

  • als die auf die Polstärke eines Magneten bezogene Kraft des Feldes,
  • oder als das auf das magnetische Dipolmoment eines Dipols bezogene Drehmoment.

Das setzt jedoch voraus, dass wir Polstärken bzw. Dipolmomente messen können. Darauf wollen wir uns aber nicht einlassen und wählen daher einen ganz anderen Weg.

Wir begnügen uns zunächst mit einer relativen Messung magnetischer Feldstärken, das heißt, es genügt uns (zunächst), das Verhältnis zweier Feldstärken zu messen. Dazu reicht aber auch ein Magnetpol bzw. ein magnetischer Dipol unbekannter Stärke. Die Einzelheiten solcher Messungen sind Sache der Experimentalphysik und schon seit über 150 Jahren hinreichend bekannt.

Mit Hilfe entsprechender Methoden hat man herausgefunden, dass der Betrag H der magnetischen Feldstärke bei jedem beliebigen Leiter proportional der Stromstärke I und im Falle des langen geraden Leiters umgekehrt proportional zum Abstand r vom Leiter ist. Für die Richtung der Feldlinien hat man verabredet, dass sie in Stromrichtung gesehen rechts herum laufen.

 

Definition der Einheit der magnetischen Feldstärke

[Bearbeiten]

Für das Feld eines langen, geraden Drahtes gilt also:



Berechnen wir nun das Linienintegral von H ds über einen zum Leiter konzentrischen Kreis K mit Radius r, so finden wir, da H stets parallel zu ds ist,


Das Linienintegral hat also für alle konzentrischen Kreise denselben Wert und dieser hängt nur von I ab.

Wie man sieht, hängt die Größe k (dem Zahlenwert und der Einheit nach) von der Maßeinheit der magnetischen Feldstärke ab, die benutzt wird.

Verabreden wir nun, die Einheit der magnetischen Feldstärke so festzulegen, dass die Konstante k = 1/2π ist, dann wird


und



Damit haben wir über die Einheit der magnetischen Feldstärke verfügt und nun gilt:

1. Die Einheit der magnetischen Feldstärke ist 1 Ampere/Meter (A/m)

2. Die Feldstärke 1 A/m ist die Stärke des Feldes eines unendlich langen geraden Drahtes im Abstand r = (1/2π) Meter, wenn die Stromstärke im Draht 1 Ampere beträgt.

 


Das magnetische Durchflutungsgesetz

[Bearbeiten]

Wir wollen nun das oben genannte Linienintegral über eine beliebige geschlossene Kurve bilden, die entweder einen Leiterquerschnitt in sich enthält (a) oder aber nicht (b).

a) Geschlossene Linie enthält Leiterquerschnitt
b) Geschlossene Linie enthält Leiterquerschnitt nicht

Vor der Berechnung des Linienintegrals zerlegen wir das Wegelement ds in eine Komponente in Richtung r (Radialkomponente), und eine Komponente senkrecht dazu (Normalkomponente).

Kurventeil, Linienelement und Feldstärke (in Stromrichtung gesehen)


Da die Feldstärke auf r senkrecht steht, leistet die Radialkomponente des Wegelements keinen Beitrag zum Linienintegral und es gilt

mit dsnormal = r dφ:



Enthält die Kurve einen Leiterquerschnitt, dann läuft das Linienintegral von 0 bis 2π, anderenfalls von 0 über einen positiven oder negativen Wert zurück zu 0. Folglich ist:



Anmerkung: Die Kurve muss nicht eben sein.

Umfängt die Kurve mehrere Leiter mit den Stromstärken I1, I2, usw. dann gilt:



Nach dem Stokesschen Integralsatz ist


wobei A eine ganz beliebig geformte Fläche ist, die von der Kurve K umrandet wird.

Folglich gilt:



wobei I der durch die Fläche A fließende Strom ist.


Bei Anwendung auf ein einzelnes Flächenelement dA, durch das der Strom dI fließt, folgt daraus:



Fließt durch die Fläche A kein Strom, so ist



Da die Fläche A beliebig geformt sein kann und daher der Normalenvektor dA überall beliebig gerichtet sein kann, kann diese Gleichung nur erfüllt sein, wenn überall rot H = 0 ist. Also:


Im Innern eines stromdurchflossenen Leiters ist rot H = j, außerhalb ist überall rot H = 0.

 

Das Biot-Savart-Gesetz

[Bearbeiten]

Herleitung

[Bearbeiten]

Zur Berechnung des magnetischen Feldes anders geformter Leiter genügen unsere bisherigen Kenntnisse noch nicht. Wir brauchen vielmehr eine Aussage darüber, welchen Beitrag der in einem einzelnen Leiterelement dl fließende Strom I zum Magnetfeld des Leiters in einem beliebigen Punkt P leistet. Dieses Gesetz kann nicht experimentell durch Beobachtungen und Messungen gewonnen werden, denn es ist unmöglich, ein einzelnes Leiterelement aus dem Zusammenhang des ganzen Leiters herauszutrennen. Außerdem leistet ein verschwindend kleines Leiterelement auch nur einen verschwindend kleinen Beitrag, der gar nicht messbar ist. Es bleibt uns also nichts anderes übrig, als das gesuchte Gesetz zu erraten und es dann an bekannten Erscheinungen zu überprüfen und es entsprechend anzupassen. (In der Mathematik nennt man das: »einen Ansatz machen«.) Als bekannte Erscheinung nehmen wir das Magnetfeld eines langen geraden Drahtes.



Wir wollen einmal folgende, zwar plausible, aber natürlich nicht gesicherte Annahmen machen:

  • der Vektor dH stehe auf dem Dreieck P A dl senkrecht,
  • der Betrag dH sei proportional 1/r 2 (das quadratische Abstandsgesetz)
  • die Abhängigkeit vom Winkel α muss durch eine Funktion beschreibbar sein, deren Verlauf symmetrisch zu α = 90° ist. Ferner muss (aus Symmetriegründen) dH verschwinden, wenn α gleich 0° oder 180° ist. Dafür bietet sich die Funktion sin α an.
  • Der Betrag dH muss proportional zu dl und proportional zur Stromstärke I im Leiter sein.

Demnach müsste gelten:


wobei k ein noch zu bestimmender Proportionalitätsfaktor ist.


Drückt man die Variablen l (das von A aus gemessen wird) und r durch α und R aus, erhält man


und daraus



Ein Vergleich mit der oben gewonnenen Formel für das Feld eines unendlich langen, geraden Leiters,


ergibt


und damit


In Vektorschreibweise:



Dabei ist r von P nach dl gerichtet und der Vektor dl hat dabei dieselbe Richtung wie der Strom I.


Der Ansatz hat also zu einem Ergebnis geführt, das mit beobachteten Gesetzen übereinstimmt. Es musste lediglich dem konstanten Faktor noch der richtige Wert zugeordnet werden.

Als Anwendungsbeispiel soll zunächst die magnetische Feldstärke in der Achse eines kreisförmigen Leiters vom Radius R berechnet werden.

 

Feld eines kreisförmigen Leiters

[Bearbeiten]


Wir berechnen die Feldstärkeanteile zweier diametral gegenüber gelegener Leiterelemente dl1 und dl2. Für diese gilt


Wie zu erkennen, kompensieren die Radialkomponenten einander, dagegen summieren sich die Axialkomponenten zum axialen Feldstärkeanteil


Da dieser Anteil bereits aus zwei Teilen besteht, wird zur Berechnung der gesamten Feldstärke nur über den halben Kreisumfang integriert:


Insbesondere folgt daraus für die Mitte der Stromschleife mit a = 0:



Feld einer Zylinderspule

[Bearbeiten]

Als Nächstes berechnen wir die Feldstärke in der Mitte einer Zylinderspule, die aus zahlreichen kreisförmigen Leiterschleifen besteht.

Die Windungsdichte n /l der Spule sei N. Auf die Strecke zwischen x und (x + dx) treffen dann N dx Windungen, in denen insgesamt der Strom I N dx fließt. Der Feldstärkeanteil dieses Spulenelements, das einer kreisförmigen Leiterschleife entspricht, beträgt dann



und die Gesamtfeldstärke ist



wenn die Länge der Spule 2l ist und x von der Spulenmitte aus zählt.

Das Integral hat den Wert



Für l gegen unendlich wird daraus 2/R2 und somit



Bei einer unendlich langen Spule ist überall auf der Achse »die Mitte« der Spule, also gilt dieses Ergebnis überall – jedenfalls auf der Achse. Für eine reale Spule endlicher Länge gilt dieses Ergebnis annähernd in der Nähe der Mitte, falls die Länge der Spule sehr groß ist gegenüber ihrem Radius. Am Ende einer solchen Spule ist die Feldstärke gerade noch halb so groß wie in der Mitte, da ja hier eine Hälfte der Spule und damit auch ihr Anteil an der Feldstärke fehlt.



 

Das Vektorpotential des magnetischen Feldes

[Bearbeiten]

Die Grundgleichung des durch einen elektrischen Strom erzeugten Magnetfeldes lautet


mit der Zusatzbedingung



Der Versuch, ein magnetisches Feld mittels der Gleichung (1) unter Berücksichtigung von (2) aus j herzuleiten, gelingt auf einem raffinierten Umweg durch Einführung eines neuen, noch unbekannten Vektors A, von dem gelten soll:


Zunächst ist festzustellen, dass dieser Ansatz die Nebenbedingung (2) erfüllt, da die Divergenz eines Wirbelfeldes (hier: div rot A) stets null, das heißt das Feld quellenfrei ist.

Sollte es gelingen, einen Vektor A zu finden, der die Gleichung (1) erfüllt, so kann H einfach durch Berechnung von rot A, also durch Differentialoperationen, gefunden werden.

Aus der Gleichung (1) ergibt sich zunächst


Nach einem Gesetz der Vektoranalysis ist


wobei Δ der LAPLACE-Operator ist (siehe unten). Demnach muss sein


Diese Gleichung vereinfachte sich erheblich, wenn der gesuchte Vektor A zusätzlich die Bedingung div A = 0 erfüllte, also ebenfalls quellenfrei wäre.

Nun kann dies ohne Beeinträchtigung der Allgemeingültigkeit immer angenommen werden. Denn aus jedem beliebigen Vektor V0 kann ein quellenfreier Vektor V gewonnen werden, indem man zu V0 einen geeigneten Vektor grad ψ addiert:


Anschaulich gesprochen läuft dies darauf hinaus, einen Vektor zu finden, der einerseits dieselben Quellen wie V0 hat, nur mit entgegengesetzten Vorzeichen, und der andererseits wirbelfrei ist und daher bei der Summenbildung an rot V0 nichts ändert. Die zweite Bedingung wird dadurch erfüllt, dass wir den gesuchten Vektor als Gradientenvektor angesetzt haben. Nun müssen wir noch zeigen, dass sich stets eine skalare Ortsfunktion ψ finden lässt, welche die erste Bedingung erfüllt. Aus (4) folgt


und weiter



oder


oder



Sicher lässt sich stets eine skalare Ortsfunktion ψ angeben, welche dieser Differentialgleichung genügt, sodass unsere Forderung, der Vektor A sei quellenfrei, stets erfüllbar ist.

Dann erhalten wir aus (3) die vereinfachte Gleichung



Der LAPLACE-Operator Δ ist das Symbol für die Differentialoperation



Dieser Operator ist uns von der Elektrostatik her bekannt; jetzt allerdings wird er auf einen Vektor angewendet. Das ergibt:



(Verwechslungen zwischen dem Einheitsvektor j und dem Vektor j der Stromdichte auf der rechten Seite können sicher als ausgeschlossen gelten.)

Für die einzelnen Komponenten gilt dann:



Diese drei skalaren Gleichungen entsprechen – jede für sich – genau der aus der Elektrostatik bekannten Poissonschen Gleichung für das Potential des elektrischen Feldes. Daher werden die obigen Gleichungen als die Potentialgleichungen des magnetischen Feldes bezeichnet. Dementsprechend heißt der Vektor A das Vektorpotential des magnetischen Feldes.

Die Lösungen der drei skalaren Potentialgleichungen sind aus der Elektrostatik bekannt. Sie lauten:



Fasst man diese drei Gleichungen wieder zu einer Vektorgleichung zusammen, so ergibt sich die Gleichung des Vektorpotentials:



Hieraus kann sofort das Feld eines geraden Leiters berechnet werden. In ihm hat der Vektor j die Richtung der Leiterachse. Legen wir die Linienelemente ds in diese Achse, so wird, wenn q der Leiterquerschnitt ist,


und



Die nun zur Ermittlung von H folgende Berechnung der Rotation ist von der Integration über die Länge des Leiters unabhängig. Daher können Rotationsbildung und Integration in der Reihenfolge vertauscht werden:



Dabei ist r0 der Einheitsvektor in der Richtung vom Leiterelement ds zum Aufpunkt (= betrachteter Punkt) hin.

Diese Gleichung kann so interpretiert werden, dass jedes Leiterelement zum Feld den Beitrag



liefert. Dies ist aber genau das Biot-Savart-Gesetz.


Der elektrische Strom – Eigenschaften und Wirkungen: Teil II: Kräfte im Magnetfeld

[Bearbeiten]

Kraft auf Strom im Magnetfeld

[Bearbeiten]

Es ist zu erwarten, dass ein stromdurchflossener Leiter in einem Magnetfeld eine Kraft erfährt, da er ja selbst von einem Magnetfeld umgeben ist und die beiden Felder im Allgemeinen aufeinander einwirken.

Der experimentelle Befund ist, dass ein geradliniger Leiter in einem Magnetfeld eine Kraft erfährt, die

  • proportional der Stromstärke I,
  • proportional der Leiterlänge l,
  • proportional dem Größenwert H der Feldstärke und
  • proportional dem Sinus des Winkels α zwischen Leiter und Feldlinien ist. (Dies kann so gedeutet werden, dass nur die Komponente des Stromes zählt, die auf der Feldstärke senkrecht steht.)

Also ist



und vektoriell geschrieben



Der Wert des Faktors k ergibt sich aus der Definition der Einheit der elektrischen Stromstärke:

"Ein Ampere ist die Stärke eines elektrischen Stromes, der durch zwei geradlinige, unendlich lange parallele Leiter mit einem Abstand von einem Meter fließt und der zwischen den Leitern je Meter Länge eine Kraft von 2·10-7 N hervorruft."

Berücksichtigt man, dass die magnetische Feldstärke am Ort jedes Leiters 1 A / (2π m) beträgt, so ergibt sich aus Gleichung (1):



Diese Größe heißt magnetische Feldkonstante μ0.

Damit ergibt sich


Da die Kraft des Magnetfeldes nicht primär auf den Leiter, sondern auf die bewegten Ladungen in ihm einwirkt, soll jetzt die Kraft auf eine einzelne Ladung berechnet werden.

Der Größenwert der Kraft auf das Leiterstück ist nach Gleichung (1)



wobei α der Winkel zwischen Stromrichtung und Feldrichtung ist.

Die Stromstärke I ergibt sich aus der Ladungsdichte ρ, dem Leiterquerschnitt A und der Geschwindigkeit v der Ladungen zu



(Begründung: Es ist I = dQ / dt. In der Zeit dt fließen alle diejenigen Ladungen durch irgend einen Leiterquerschnitt, die sich auf der Strecke ds = v d t vor diesem Leiterquerschnitt befinden. Das ist die Ladung dQ = ρ dV = ρ A ds = ρ A v dt. Damit wird I = dQ / dt = ρ A v.)


Also ist



Nun ist aber ρ A l die in dem Leiterstück befindliche Ladung Q. Damit ergibt sich



Dies ist also die Kraft, die eine mit der Geschwindigkeit v im Magnetfeld H bewegte Ladung Q erfährt.

Insbesondere erfährt ein Elektron (Ladung –e), das sich mit der Geschwindigkeit v senkrecht zur Feldrichtung bewegt, die Kraft



 

Die elektromagnetische Induktion

[Bearbeiten]

Ursachen der Induktion

[Bearbeiten]

Wird ein Leiter in einem magnetischen Feld so bewegt, dass er Feldlinien schneidet, wird in ihm eine elektrische Spannung »induziert«. Die Spannung ist am größten, wenn die Bewegung des Leiters senkrecht zu den Feldlinien und senkrecht zu seiner Achse erfolgt.



Erklärung: Die im Leiter befindlichen elektrischen Ladungen erfahren wegen ihrer Bewegung im Feld eine Kraft. Die positiven Ladungen (Protonen) können sich nicht bewegen, aber die Elektronen werden durch die Kraft ein Stück verschoben (in der Abbildung nach rechts), und so entsteht an den Leiterenden eine negative bzw. positive Flächenladung. Diese erzeugt im Leiter ein elektrisches Feld, das auf die Elektronen eine Kraft ausübt. Es stellt sich sehr schnell ein Gleichgewicht ein, wobei die Kraft des elektrischen Feldes so groß ist wie die Kraft des Magnetfeldes:

e E = μ0 e v H

Durch das elektrische Feld entsteht zwischen den Leiterenden ein Potentialunterschied Δ φ, der gleichbedeutend ist mit einer elektrischen Spannung U = E l (l = Leiterlänge). Aus der obigen Gleichung ergibt sich dafür

U = μ0 v H l

Die vektorielle Beschreibung der induzierten Feldstärke (welche in der Abbildung in Leiterrichtung schräg von links nach rechts gerichtet ist) lautet:



Derselbe Effekt tritt auf, wenn der Leiter ruht und das Magnetfeld (das zum Beispiel von einem Hufeisenmagneten erzeugt wird) sich bewegt. Es kommt also auch hier nur auf die Relativgeschwindigkeit zwischen Leiter und Magnetfeld an. Das bedeutet, dass auch Induktionsvorgänge keine Möglichkeit bieten, die »absolute Geschwindigkeit« eines Bezugssystems, d. h. seine Geschwindigkeit relativ zum »absoluten Raum«, zu bestimmen.

Es gibt auch Induktionsvorgänge ohne Bewegung, zum Beispiel wenn das Magnetfeld durch einen Strom in einer Spule erzeugt wird und die Stromstärke verändert wird. Für solche Fälle brauchen wir eine allgemeinere Formulierung des Induktionsgesetzes. Diese lautet:

1. In einer Leiterschleife wird eine elektrische Spannung induziert, wenn sich der »magnetische Fluss« Φ durch die Fläche der Schleife ändert. Der magnetische Fluss ist der Fluss des Vektors μ0H:



2. Die induzierte Spannung (identisch mit dem Linienintegral der induzierten Feldstärke über die Leiterschleife S) ist gleich der negativen Änderungsgeschwindigkeit des magnetischen Flusses durch die Fläche A der Leiterschleife:



Nach dem Stokesschen Satz ist




und daher



Wenden wir die Gleichung auf ein beliebiges Flächenelement an, so ergibt sich



Nach der Maxwellschen Theorie ist die induzierte Feldstärke von der Existenz eines Leiters unabhängig und daher gilt diese Gleichung für jeden Punkt des Raumes.

 

 

Selbstinduktion und Induktivität

[Bearbeiten]

Eine Leiterschleife, in der ein elektrischer Strom fließt, wird von ihrem eigenen Magnetfeld durchdrungen. Ändert sich die Stromstärke, so ändert sich auch die Feldstärke und damit der magnetische Fluss durch die Leiterschleife, und damit wird in der Leiterschleife eine Spannung induziert.

Die quantitative Betrachtung wird besonders einfach bei einer schlanken Ringspule (Toroidspule).

Die Spule sei eng gewickelt, habe n Windungen und werde vom Strom I durchflossen. Ihr Querschnitt sei A. Ihr Magnetfeld hat kreisförmige Feldlinien und ist praktisch homogen. Die rot gezeichnete Linie umschlingt dann n Stromfäden und daher ist



und



Der magnetische Fluss Φ durch jede Windung der Spule ist



Ändert sich der Strom in der Spule, wird in ihr die Spannung U induziert, für die gilt:



Der nur von den Eigenschaften der Spule abhängige Faktor heißt die Induktivität L der Spule:



Natürlich gilt diese spezielle Formel nur für eine Toroidspule.

Allgemein gilt jedoch die Definitionsgleichung der Induktivität:



Das Minuszeichen, das bei dieser Gleichung auch weggelassen werden kann, wenn es nur auf den Betrag ankommt, wird so interpretiert, dass die induzierte Spannung der Stromstärkeänderung entgegen wirkt (Lenz'sche Regel). Ich komme später darauf zurück.

Die Einheit der Induktivität ist das Henry. 1 Henry = 1 V s/A. Eine Spule hat die Induktivität 1 Henry, wenn bei einer Stromstärkeänderungsgeschwindigkeit von 1 A/s in ihr die Spannung von 1 Volt induziert wird.


Da einerseits


und andererseits



ist, ergibt sich



 

 

Gegenseitige Induktion, gegenseitige Induktivität

[Bearbeiten]

Wenn zwei Spulen so angeordnet sind, dass der magnetische Fluss der Spule 1 wenigstens teilweise auch die Spule 2 durchdringt, so wird eine Änderung der Stromstärke I1 in der Spule 1 auch in der Spule 2 eine Spannung U1,2 induzieren, die der Änderungsgeschwindigkeit dI1/dt der Stromstärke I1 proportional ist:

U1,2= L1,2 dI1/dt

Der Faktor L1,2 heißt gegenseitige Induktivität der Spule 1 bezüglich der Spule 2.

L1,2 = U1,2/(dI1/dt)

Analog ist die gegenseitige Induktivität der Spule 2 bezüglich der Spule 1:

L2,1 = U2,1/(dI2/dt)

Sind die Spulen so angeordnet, dass der gesamte magnetische Fluss der Spule 1 sämtliche Windungen der Spule 2 durchsetzt und umgekehrt, dann spricht man von einer vollständigen Kopplung der beiden Spulen. Vollständige Kopplung ist nur realisierbar, indem die beiden Spulen auf einem Toroid ineinander gewickelt werden (abwechselnd immer eine Windung der Spule 1 und eine der Spule 2) oder einen (streuungslosen) gemeinsamen Eisenkern haben. Bei vollständiger Kopplung ist



woraus folgt:



Analog findet man:



Für eine doppelte Toroidspule gilt:



woraus sich nach einer einfachen Rechnung ergibt:


 

 


Die Energiedichte des magnetischen Feldes

[Bearbeiten]

Der Aufbau eines Magnetfeldes erfordert Energie. Dies äußert sich darin, dass beim Einschalten des Stromes dieser verzögert auf seinen endgültigen Wert (der durch den Ohmschen Widerstand des Stromkreises bestimmt ist) anwächst. Die unmittelbare Ursache dieser Verzögerung ist die durch Selbstinduktion induzierte Spannung Uind, die der angelegten Spannung entgegen wirkt. Zum Transport der Ladung dq gegen diese Spannung ist die Arbeit dW = Uind dq = Uind I dt = L dI / dt I dt = L I dI erforderlich. Integration zwischen den Grenzen 0 und I liefert:


Diese Energie findet sich im magnetischen Feld wieder. Zur Berechnung der Energiedichte w = dW/dV ist das praktisch homogene Feld einer großen schlanken Toroidspule besonders gut geeignet. Für sie findet man


und mit 2 πR A = V = Volumen des Feldes



Da man jedes beliebige Feld in hinreichend kleinen Bereichen als homogen betrachten kann, gilt auch dieses Ergebnis ganz allgemein.

Der elektrische Strom – Eigenschaften und Wirkungen: Teil III: Elektrische Stromkreise

[Bearbeiten]

Elektrische Stromkreise

[Bearbeiten]

Zählpfeile

[Bearbeiten]

Zur Berechnung elektrischer Stromkreise hat sich die Einführung von Zählpfeilen bewährt, die an einem einfachen Beispiel erläutert werden sollen:

Links ist eine Gleichspannungsquelle (Quellenspannung U0), rechts ein Bauteil (»Widerstand«), das (nur) einen Ohmschen Widerstand R besitzt, etwa ein dünner langer Draht. Der Ohmsche Widerstand der Leitungen und der »innere Widerstand« der Spannungsquelle seien vernachlässigbar klein. (Sollte dies einmal nicht der Fall sein, müssen sie durch »Ersatzschaltglieder« berücksichtigt werden.) Das gleiche soll für die Induktivität und die Kapazität der Leitungen gelten.

Die Zählpfeile zeigen nicht unbedingt in Richtung des tatsächlichen Stromflusses bzw. Spannungsabfalls, sondern definieren die Richtung, in der die Größen Strom bzw. Spannung positiv gewertet werden. Ergibt eine Berechnung z. B. einen negativen Wert für den Strom, heißt das, dass der Strom entgegen der Zählpfeilrichtung fließt - der Zählpfeil ist dennoch gültig.

Bei positiven Werten der Spannung gilt:

Die Spannungszählpfeile weisen in Richtung abnehmenden Potentials, also von Plus nach Minus. UR ist die vom Strom I zur Überwindung des Widerstandes »verbrauchte« Spannung, für die gilt UR = I · R.

Bei positiven Werten des Stroms gilt:

Der Stromzählpfeil zeigt die technische Stromrichtung an, weist also im äußeren Teil des Stromkreises ebenfalls von Plus nach Minus, innerhalb der Spannungsquelle jedoch von Minus nach Plus.

Bei positiver Leistung P = U · I gilt:

Wo Strom- und Spannungszählpfeil dieselbe Richtung haben, wird Energie freigesetzt (hier in Form von Wärme), wo sie entgegengesetzte Richtung haben, wird dem Stromkreis Energie zugeführt.

Macht man in beliebiger Richtung einen geschlossenen Umlauf im Stromkreis, so ist die Summe aller durchlaufenen Spannungen (Potentialdifferenzen) unter Berücksichtigung ihrer Richtung (auch in komplizierteren Stromkreisen) gleich Null (2. Kirchhoffsches Gesetz). Hier also ist

UR - U0 = 0

Dieser Umlauf stellt eine geschlossene Kurve in einem Potentialfeld dar. Aus dieser Gleichung und aus der Tatsache, dass (z. B. bei Stromverzweigungen) die Summe aller Teilströme konstant und gleich der Stromstärke im unverzweigten Teil des Kreises ist, können die bekannten Gesetze für den Gesamtwiderstand von parallel- und hintereinandergeschalteten Widerständen berechnet werden.

   

Gleichspannungskreise

[Bearbeiten]

Schaltelemente

[Bearbeiten]

Es gibt drei Typen von »Schaltelementen«:

  • Ohmsche Widerstände (kurz: »Widerstände); Formelzeichen R,
  • Spulen mit Selbstinduktion (»Induktivitäten«); Formelzeichen L,
  • Kondensatoren (»Kapazitäten«); Formelzeichen C.

Da der Ohmsche Widerstand eines Schaltkreises (unter Normalbedingungen) niemals gleich Null ist (weil anderenfalls unendlich große Stromstärken aufträten), müssen wir im Folgenden immer einen Ohmschen Widerstand im Kreis annehmen, der mindestens gleich der Summe der Leitungswiderstände und des inneren Widerstandes der Spannungsquelle ist. Insbesondere haben Spulen immer einen kaum zu vernachlässigenden Ohmschen Widerstand. Daher werden wir in den folgenden Fällen immer einen Ohmschen Widerstand im Stromkreis vorsehen, der die genannten anderen Widerstände (mit) vertritt.

Induktivität im Gleichspannungskreis

[Bearbeiten]

Zur Vereinfachung und Vermeidung von Verwirrung wird vereinbart, dass der Zählpfeil für UL dieselbe Richtung wie der Zählpfeil für I hat und das unselige Minuszeichen in der Gleichung UL = - L dI/dt weggelassen wird. Bei zunehmender Stromstärke ist dI/dt positiv und die induzierte Spannung hat (wie die Spannung am ohmschen Widerstand) oben den Pluspol. Sie wirkt damit der Quellenspannung und dem Anwachsen der Stromstärke entgegen. Anders gesagt: An der Spule wird, genau wie am Widerstand, ein Teil der angelegten Spannung verbraucht, nur ist dieser proportional zu dI/dt und nicht proportional zu I. Es gilt nun wieder

und mit UR = I · R und UL = L dI/dt


Die allgemeine Lösung dieser inhomogenen Differentialgleichung ist (wie schon früher gezeigt) die Summe aus der allgemeinen Lösung der homogenen Gleichung und einer partikulären Lösung der inhomogenen Gleichung und lautet:



Die Konstante k wird wie folgt aus den Anfangsbedingungen bestimmt: Der Vorgang beginne zur Zeit t = 0 (Einschaltzeitpunkt) mit der Stromstärke 0. Daraus ergibt sich:



und somit ist



Die Stromstärke nähert sich also asymptotisch von unten dem Wert



und zwar umso langsamer, je kleiner R/L ist.

Für die Spannungen UR und UL gilt:



Wie zu erkennen, ist tatsächlich stets



Zur Zeit t = 0 ist wegen I(0) = 0 auch UR(0) = 0 und daher UL(0) = L dI/dt = U0

und somit



Die Steigung der Kurve I = I(t) ist also von R unabhängig.

Für R = 0 wird die Funktion I = I(t) unbestimmt, nämlich gleich 0/0. Um sie zu bestimmen, gehen wir so vor: Für R = 0 ist stets (d. h. für alle Werte t) UL = U0. Die Gleichung (A) gilt dann für alle Werte von t, und durch Integration ergibt sich:



Der Strom steigt also linear an.

Für R gegen 0 nähert sich die Kurve I = I(t) mehr und mehr dieser Geraden.



Besonders interessant ist die vom Strom an der Spule aufgebrachte Arbeit WL. Wir berechnen sie für den Fall R = 0; das Ergebnis ist dann leicht zu verallgemeinern. Die Leistung des Stromes ist



Daraus ergibt sich die im Intervall 0 bis t aufgewendete Arbeit:



Dieses Ergebnis stimmt mit einem früher auf einem anderen Weg ermittelten überein und kann so interpretiert werden:

Fließt in einer Spule mit der Induktivität L der Strom I, so ist die Energie des Magnetfeldes der Spule



Diese Energie ist im Magnetfeld (konservativ) gespeichert und kann in andere Energieformen umgesetzt werden. Bei dem nachfolgend behandelten Ausschaltvorgang wird sie im Widerstand R in Wärme umgewandelt.

Für den Ausschaltvorgang (beim Abschalten der Spannungsquelle und gleichzeitigem Kurzschließen der Spule über R) findet man analog:



wobei IA die Stromstärke im Moment des Ausschaltens ist.


 

Kapazität im Gleichspannungskreis

[Bearbeiten]


Auch hier haben die Zählpfeile für I und UC dieselbe Richtung: die obere Kondensatorplatte wird durch den Strom positiv, die untere negativ aufgeladen.

Es gilt nun

,     Q = Ladung des Kondensators


und somit



Differenzieren nach t liefert mit dQ/dt = I:



Der Ansatz



führt zu



und zu



War der Kondensator beim Einschalten (t = 0) leer, also Q(0) = 0, dann ist



und somit



Die Spannung des Kondensators kann am einfachsten berechnet werden aus



Wird der Kondensator (bei abgeschalteter Spannungsquelle) über den Widerstand R entladen, nachdem er die Spannung UA angenommen hatte, ist



Die beim Transport der Ladung dQ gegen die Spannung UC des Kondensators verrichtete Arbeit ist


wobei Q die momentane Ladung des Kondensators ist.

Zum Aufbringen der Ladung Q benötigt man die Arbeit



 


Strom- und Spannungsverlauf beim Ein- und Ausschalten


Wie man sieht, sind die Kurven für Strom und Spannung bei Induktivität und Kapazität »über Kreuz« austauschbar.


Einschaltvorgang
Ausschaltvorgang

 

 

Induktivität und Kapazität im Gleichspannungskreis

[Bearbeiten]

Hier ist



Durch Differenzieren nach der Zeit ergibt sich:



Diese Differentialgelichung (in der übrigens U0 gar nicht mehr auftritt) entspricht genau der Differentialgleichung der gedämpften harmonischen Schwingung (siehe Wikibook "Schwingbewegungen" unter "Gedämpfte harmonische Schwingungen")



wobei m die Masse des schwingenden Körpers, μ der Reibungskoeffizient und k die Federkonstante ist.

Dabei entsprechen einander

  • Auslenkung x und Stromstärke I,
  • Masse m und Induktivität L,
  • Reibungskoeffizient μ und Ohmscher Widerstand R,
  • Federkonstante k und Kehrwert 1/C der Kapazität.

Somit sind alle Ergebnisse von dort analog übertragbar.

Der Ansatz



führt zu der charakteristischen Gleichung



mit den beiden Lösungen



die beide negativ sind.

Je nachdem die Diskriminante (der Term unter der Wurzel) größer, kleiner oder gleich null ist, ergeben sich unterschiedliche Lösungen.


1. Fall:


Die beiden Lösungen bezeichnen wir mit –α und –β, wobei 0 < α < β ist.

Die allgemeine Lösung ist dann



Aus der Anfangsbedingung I(0) = 0 ergibt sich sofort B = - A. Eine zweite Gleichung für A und B gewinnen wir aus der Betrachtung von



Wenn der Kondensator anfangs die Ladung 0 hat, ist UC(0) = 0. Ferner ist UR(0) = I(0) R = 0. Somit muss



sein. Also ist



und somit



Diese Differenz zweier abklingender e-Funktionen hat – wie man leicht nachweisen kann - für t = tM ein Maximum und für t = tW einen Wendepunkt. Dabei ist




2. Fall:


Die Lösung der Differentialgleichung ist dann



wobei mit den Anfangsbedingungen wie oben A = 0 und B = U0 / L wird.

Also ist



Der Verlauf dieser Funktion unterscheidet sich nicht wesentlich von dem oben wiedergegebenen. Das Maximum liegt bei tM = 1/β, der Wendepunkt bei tW = 2 tM.


3. Fall:


Die Wurzel wird dann imaginär und die Lösungen sind periodische Funktionen. Beim Ein- und Ausschalten der Spannungsquelle (letzteres wieder bei geschlossenem Stromkreis) nähern sich die Spannung und die Ladung des Kondensators in Form von abklingenden Schwingungen dem jeweiligen Endwert. Der Endwert der Spannung beträgt beim Einschalten U0, beim Ausschalten 0. Der Endwert der Kondensatorladung ist beim Einschalten gleich C U0, beim Ausschalten gleich 0.

Der Strom nähert sich in beiden Fällen oszillierend dem Wert 0.



 

 


Wechselspannungskreise

[Bearbeiten]

Zeigerdarstellung von Wechselspannungen und –strömen

[Bearbeiten]

Technische Wechselspannungen sind überwiegend sinusförmig. (Wenn nicht, können sie mit einer Fourier-Reihe als Summe von sinusförmigen Spannungen dargestellt werden.)

Wegen der Verwandtschaft der e-Funktion mit imaginärem Exponenten mit der Sinus- und der Kosinusfunktion können diese mit vielfältigen Vorteilen durch rotierende »Zeiger« in der Gaußschen Zahlenebene dargestellt werden.

Setzt man



dann ist der Realteil von z = Re z = U cos ωt

und der Imaginärteil von z = Im z = U sin ωt.

Dabei ist ω = 2 π f die Kreisfrequenz von U, und t die Zeit. Der Zeiger rotiert dann mit dieser Kreisfrequenz in der Gaußschen Ebene.

Zeigerdiagramme sind nützlich zur Addition phasenverschobener Spannungen und Ströme und lassen sich auch zur Darstellung und Behandlung komplexer Widerstände und Leitwerte (siehe unten) verwenden.


Induktivität im Wechselspannungskreis

[Bearbeiten]

Da Spulen nie ohne Ohmschen Widerstand sind, behandeln wir die Induktivität L von Anfang an in einer Reihenschaltung mit einem Ohmschen Widerstand R. (Dies ist eine Ersatzschaltung für die Spule, bei der Induktivität und Ohmscher Widerstand eigentlich auf unendlich viele verschwindend kleine Elemente dL und dR verteilt sind, welche nacheinander vom Strom durchlaufen werden, also hintereinander geschaltet sind. Wie die Erfahrung bestätigt, dürfen die Elemente dL und dR je für sich zur Gesamtinduktivität L = Σ dL und zum Gesamtwiderstand R = Σ dR addiert und diese dann als in Reihe geschaltet aufgefasst werden.)


Bei der Behandlung dieser Schaltung taucht ein neuartiges Problem auf: Bei Gleichspannungskreisen war es gleichgültig, zu welcher Zeit eingeschaltet wurde, weil die Spannung immer dieselbe war. Daher verlief nach dem Einschalten das Anwachsen des Stromes immer in gleicher Weise. Im Wechselstromkreis dagegen verläuft dieser Vorgang unterschiedlich je nach dem Wert, den die Spannung beim Einschalten gerade hat. Wir haben hier also keine »zeitunabhängige« Randbedingung zur Berechnung der Konstanten bei der Lösung der Differentialgleichung. Wir können aber zunächst von dem Einschaltvorgang absehen und den sich danach einstellenden stationären Zustand untersuchen.

Nehmen wir an, die Spannung der Spannungsquelle verlaufe sinusförmig:



Für den Stromkreis gilt dann:



Wir machen für die Lösung den Ansatz



wobei δ ein noch zu bestimmender Phasenverschiebungswinkel ist. Mit diesem Ansatz nehmen wir an, der Strom wäre eine periodische Funktion der Zeit, deren Verlauf sich in immer gleicher Weise zyklisch wiederholt. Diese Annahme trifft jedoch für die Zeit unmittelbar nach dem Einschalten nicht zu, wie man durch eine etwas genauere Betrachtung zeigen kann. Sie gilt jedoch, wie die folgende Rechnung zeigt, für den stationären Zustand, der sich nach einiger Zeit offenbar einstellt. (Genaueres darüber später.)

Aus dem Ansatz folgt:



In die Differentialgleichung eingesetzt:



woraus folgt:




Der Koeffizientenvergleich der beiden Funktionen sin ωt und cos ωt ergibt:




Aus (2) folgt:


In (1) eingesetzt ergibt sich nach einigen Umformungen (wobei sin δ und cos δ durch tan δ ausgedrückt werden müssen):



und damit



Interpretation:

1. Der sinusförmige Strom hat gegenüber der Spannung eine negative Phasenverschiebung (δ < 0), die von R, und dem Produkt ωL abhängt. (Der Strom »eilt der Spannung nach«). In der folgenden Zeigerdarstellung rotieren die beiden Zeiger wie starr miteinander verbunden, entgegen dem Uhrzeigersinn.


2. Die Abhängigkeit des Stromes von der Spannung entspricht formal dem Ohmschen Gesetz, wobei jedoch an die Stelle des Ohmschen Widerstandes R nunmehr der Scheinwiderstand Z, im Werte von



tritt.

Das Produkt ωL heißt induktiver Widerstand RL (auch »Induktanz«) der Spule.

Für R gegen 0 und bei hohen Frequenzen ist der Gesamtwiderstand praktisch gleich dem induktiven Widerstand, der proportional zur Frequenz wächst. Die Phasenverschiebung geht dabei gegen – 90°. Der Strom eilt somit um beinahe 90° der Spannung nach.

Sehr nützlich ist es – besonders bei komplizierteren Schaltungen -, auch die Widerstände als Zeiger in der komplexen Zahlenebene darzustellen. Dabei wird der Ohmsche Widerstand (hier auch »Wirkwiderstand« ZW genannt) auf der reellen Achse aufgetragen, der induktive Widerstand (»Blindwiderstand« ZB) hingegen auf der positiven imaginären Achse. Der Gesamtwiderstand (»Impedanz« Z) ergibt sich dann als komplexe Zahl.


Der Winkel ψ ist jetzt der Phasenverschiebungswinkel der Spannung gegenüber dem Strom (also umgekehrt wie oben) und daher ψ = - δ.


Beachte: Die Zeiger der Widerstände rotieren nicht!

Kapazität im Wechselspannungskreis

[Bearbeiten]

Hier gilt:



Mit dem Ansatz für den stationären Zustand



findet man ähnlich wie oben




und schließlich



Auch hier entspricht der Zusammenhang zwischen I und U formal dem Ohmschen Gesetz, wobei an Stelle von R nunmehr der Betrag des komplexen Scheinwiderstand tritt, der sie wie folgt ergibt:



Der Phasenverschiebungswinkel ist nun positiv, der Strom eilt also der Spannung voraus. Wenn R oder ωC gegen 0 geht, dann geht δ gegen 90°.

Der komplexe Scheinwiderstand ist hier



Serienschaltung von Induktivität und Kapazität im Wechselspannungskreis

[Bearbeiten]

Hier gilt



Mit dem gleichen Ansatz wie oben findet man


und damit



Der Blindwiderstand ist also die Differenz von induktivem und kapazitivem Widerstand. Das Vorzeichen dieser Differenz ist gleich dem Vorzeichen der Phasenverschiebung zwischen Spannung und Strom.

Der komplexe Scheinwiderstand (Impedanz) ist



Sind induktiver und kapazitiver Widerstand gleich, ist der Blindwiderstand null und Z = R.

Die Blindwiderstände als Funktion von ω

Als Zeigerdiagramm:


 

Parallelschaltung von Wirk- und Blindwiderständen

[Bearbeiten]

Solche Parallelschaltungen werden auf ähnliche Weise wie oben berechnet. Dabei ergibt sich, dass (statt der Blindwiderstände) hier zunächst die Blindleitwerte GB addiert werden. Die Blindleitwerte GL und GC von Induktivität und Kapazität sind die Kehrwerte der Blindwiderstände. Zu der Differenz der Blindleitwerte wird der Wirkleitwert des parallel geschalteten Ohmschen Widerstandes geometrisch addiert. Das ergibt dann den Scheinleitwert G.





In komplexer Schreibweise:



Natürlich können auch die Leitwerte im Zeigerdiagrammen dargestellt werden.

Bemerkenswert ist noch, dass der Blindleitwert null werden kann.

Vertauscht man in der vorletzten Abbildung (Die Blindwiderstände als Funktion von ω) die Größen L und C, so stellen die Kurven die Blindleitwerte dar.

 

 

Einschaltvorgänge in Wechselstromkreisen

[Bearbeiten]

Einschaltvorgänge sind Anpassungsvorgänge, die von den speziellen Gegebenheiten der Schaltkreise und der Spannungsquelle, wie sie beim Einschalten vorliegen, asymptotisch zu den stationären Vorgängen hinführen, die wir im letzten Kapitel betrachtet haben.

Bei der Berechnung der Einschaltvorgänge wollen wir annehmen, dass unmittelbar vor dem Einschalten im Kreis keine Strom fließe und der Kondensator entladen sei. Das wesentliche Merkmal, das von der Spannungsquelle beigetragen wird, ist der Momentanwert der Spannung im Augenblick des Einschaltens. Dieser hängt vom Einschaltzeitpunkt tE ab, da



ist.

 

RL-Glied

[Bearbeiten]

Genauere Überlegungen lassen vermuten, dass der Strom unmittelbar nach dem Einschalten aus einem gegenüber der Spannung phasenverschobenen Wechselstrom und aus einem asymptotisch verschwindenden Anteil besteht. Daher der Ansatz:



Daraus folgt



Aus der Gleichung



ergibt sich dann




Der Vergleich der Koeffizienten der drei Funktionen von t liefert:





Daraus ergibt sich nach einigen Umformungen



Wie zu erkennen, hat sich außer dem Zusatzglied nichts verändert: der Widerstand (Impedanz) und der Phasenwinkel sind gleich geblieben.

Die noch zu bestimmende Konstante B ergibt sich aus der Bedingung I(tE) = 0:


Damit wird



Bei großen Frequenzen kann R gegenüber ωL vernachlässigt werden, und der Phasenverschiebungswinkel wird nahezu - π/2. Dann ist mit guter Annäherung



wobei der zweite Term in der Klammer nur relativ langsam gegen 0 geht.

 

RC-Glied

[Bearbeiten]

Aus der Gleichung



wird durch Differenzieren nach der Zeit



Aus dem gleichen Ansatz wie oben:



Durch eine ähnliche Rechnung wie oben findet man:



Da beim Einschalten der Kondensator entladen sein soll, ist seine Spannung null. Daraus folgt:



Da im Allgemeinen I(tE) nicht gleich null ist, ergibt sich für B ein etwas komplizierterer Wert:



und damit



Bei vernachlässigbar kleinem R geht k gegen unendlich und die Dauer des Einschaltvorgangs geht gegen null.

 

RCL-Glied

[Bearbeiten]

Der Einschaltvorgang für solche Glieder wird bei »Schwingkreisen« (siehe unten) behandelt.

 

 

Schwingkreise

[Bearbeiten]

Im einfachsten Fall besteht ein Schwingkreis aus einem Kondensator, dessen Platten mit einer Spule verbunden sind.

In der Praxis besitzt eine Spule einen Ohmschen Widerstand, der allenfalls bei hohen Frequenzen vernachlässigt werden kann. Streng genommen ist auch ein Kondensator nicht »verlustfrei«: die Isolation seiner Platten gegeneinander hat keinen unendlich hohen Widerstand und die Materie zwischen den Platten (das »Dielektrikum«, das Kondensatoren mit nennenswerten Kapazitäten überhaupt erst möglich macht) ist nicht verlustfrei, was sich besonders bei höheren Frequenzen bemerkbar macht. (Die Ursache dieser Verluste ist die Polarisation des Dielektrikums durch innere Ladungsverschiebung, wobei die Ladungen nicht ganz reibungslos hin und her verschoben werden, wenn der Kondensator an einer Wechselspannung liegt.) Ein Ersatzschaltbild, das alle diese Einflüsse berücksichtig, sieht so aus:


Zunächst wollen wir von allen Ohmschen Widerständen absehen und einen idealen Schwingkreis betrachten:


Verlustfreier Schwingkreis

[Bearbeiten]

Damit überhaupt etwas geschieht, müssen wir vor dem Einschalten den Kondensator aufladen (oder nach dem Einschalten in der Spule eine Spannung induzieren). Die Ladung des Kondensators sei Q0.



Hier empfiehlt sich wieder einmal die Einführung von Zählpfeilen.

Ein geschlossener Umlauf im Stromkreis ergibt: UL - UC = 0 oder UL = UC.

Aus



Da ein Strom von der eingezeichneten Richtung (und positivem Betrag) die Ladung des Kondensators verringert, ist

und somit



Gesucht ist demnach eine Funktion I(t), die bis auf einen konstanten Faktor gleich ihrer negativen zweiten Ableitung ist. Der Ansatz



führt zu der Gleichung



woraus folgt



Im Moment des Einschaltens (t = 0) sei I = 0. (Die »elektrische Trägheit« der Spule verhindert einen sprunghaften Anstieg der Stromstärke, wie er bei einem Ohmschen Widerstand oder einer Kapazität an einer Spannungsquelle auftreten würde.) Daraus folgt



Die Konstante A ist offensichtlich gleich dem Scheitelwert I0 der Stromstärke. Ihr Wert ergibt sich aus



woraus folgt



Also ist



und



Der Strom verläuft also in Form einer ungedämpften Sinusschwingung, der Verlauf der Spannung am Kondensator und damit auch der an der Spule ist eine Kosinusschwingung gleicher Frequenz. Strom und Spannung sind um 90° phasenverschoben.

Für den Energiegehalt von Spule und Kondensator gilt:




woraus folgt



Die anfangs zum Aufladen des Kondensators aufgewendete Energie schwingt also verlustfrei zwischen Kondensator und Spule hin und her.

Schwingkreis mit Ohmschem Widerstand

[Bearbeiten]

Aus



Auch diese Differentialgleichung ist uns aus der Mechanik bekannt (siehe Wikibook »Schwingbewegungen«); sie wurde dort in allen Einzelheiten behandelt. Ich begnüge mich daher mit der Angabe der den elektrischen Größen angepassten Lösungen.


1. Für


lautet die allgemeine Lösung



Bei den gleichen Anfangsbedingungen wie oben ergibt sich daraus



Allerdings hat ω jetzt einen anderen Wert als bei der ungedämpften Schwingung, deren »Eigenkreisfrequenz« ich zur Unterscheidung nun mit ω0 bezeichne:



2. Für



verläuft die Funktion aperiodisch:



Für die genannten Anfangsbedingungen ergibt sich



3. Der Grenzfall



ist ebenfalls aperiodisch und entspricht dem Grenzfall in der Mechanik.

Gedämpfter Schwingkreis an einer Wechselspannung

[Bearbeiten]

Im Schwingkreis befinde sich eine Wechselspannungsquelle mit der Spannung

U = U0 cos ω t.

Die Ausgangsgleichung lautet dann:



und nach Differenzieren



oder



Diese Gleichung ist formal gleich der Differentialgleichung der gedämpften erzwungenen mechanischen Schwingung (siehe Wikibook »Schwingbewegungen« unter »Die gedämpfte erzwungene Schwingung«).

Dabei entsprechen einander:



Mit diesen Entsprechungen lässt sich die gesamte Herleitung von dort übernehmen. Die allgemeine Lösung besteht wieder aus einem abklingenden Einschwingvorgang und einem stationären Zustand. Für diesen gilt:



mit



Der Phasenverschiebungswinkel (δ) ist positiv, null oder negativ, je nachdem ob bei der Erregerfrequenz ω der induktive Widerstand größer, gleich oder kleiner als der kapazitive Widerstand ist.



 

Gekoppelte Schwingkreise

[Bearbeiten]

Wir betrachten nun zwei Schwingkreise, die induktiv gekoppelt sind. Die Wechselinduktivität sei L1,2 = L2,1.


Analog wie oben bei einem einzelnen Schwingkreis ergibt sich hier:


Die Lösung dieses Gleichungssystems in seiner allgemeinsten Form ist sehr kompliziert. Ich beschränke mich daher auf den praktisch wichtigen Sonderfall, dass die beiden Schwingkreise völlig identisch sind. Es sei also L1 = L2= L, R1 = R2 = R und C1 = C2 =C.

Dann lauten die Differentialgleichungen

Zur Integration dieser Gleichungen bilden wir ihre Summe und ihre Differenz und erhalten dadurch zwei einfachere Differentialgleichungen für (I1 + I2) und (I1 - I2), die jetzt noch mit C multipliziert werden:

Beide Gleichungen haben nun dieselbe Form wie die Gleichung für den einfachen Schwingkreis (siehe oben), nur ist L in der einen durch (L + L12) und in der anderen durch (L - L12) ersetzt worden. Wir können die Lösungen von dort übernehmen, wobei wir uns jeweils auf die periodische Lösung beschränken können, wie sie für hinreichend kleinen Dämpfung (d. h. für hinreichend kleinen Ohmschen Widerstand R gilt. Die Lösungen lauten:

Wie man erkennt, sind die beiden Stromstärken im Allgemeinen trotz der Identität der beiden Schwingkreise keineswegs gleich.

Zur Vereinfachung der Diskussion der Lösung nehmen wir zunächst an, es sei R = 0. Dann ist der Vorgang ungedämpft, und die Gleichungen lauten:


Wegen der vier Integrationskonstanten, die von den Anfangsbedingungen abhängen, sind die Lösungen recht vielgestaltig. Das ist nicht verwunderlich, denn die Anfangsbedingungen mit ihren vier Parametern können sehr unterschiedlich sein. Wir wollen daher zunächst zwei sehr spezielle Fälle betrachten und dann einen typischen, etwas allgemeineren Fall.

1. Wir fragen zunächst danach, ob und unter welchen Bedingungen I1 = I2 sein kann. Dies ist für A2 = 0 der Fall. Die beiden Schwingkreise schwingen dann synchron und gleichsinnig. Zur Veranschaulichung ist hier der analoge Fall zweier gleicher gekoppelter Pendel nützlich. Auch diese können bei geeigneten Anfangsbedingungen synchron und gleichsinnig schwingen.

2. Ist es möglich, dass I2 = - I1 ist? Dies ist der Fall für A1 = 0. Die Schwingkreise schwingen dann synchron, aber gegensinnig. Auch dieser Fall kann bei zwei gekoppelten Pendeln beobachtet und daran veranschaulicht werden.

3. Wir wollen nun zwei einfache, plausible Anfangsbedingungen festlegen: Es sei I1(0) = I2(0) = 0.

Dann muss δ1 = δ2 = 0 sein. Diesen Fall betrachten wir nun genauer. Es ist dann:


Es treten hier also zwei Sinusschwingungen mit unterschiedlichen Kreisfrequenzen auf, von denen keine mit der Eigenkreisfrequenz der beiden Schwingkreise übereinstimmt, und wovon die erste kleiner, die zweite größer als die Eigenkreisfrequenz ist. Wir setzen nun

A2 = A1 + B,

wobei B positiv oder negativ sein kann. Damit wird:


Interpretation:

Der erste Term in jeder Gleichung ist eine Sinus- bzw. Kosinusschwingung, deren Kreisfrequenz das arithmetische Mittel von ω1 und ω2 ist, und dessen Amplitude sich gemäß einer Kosinus- bzw. Sinusfunktion mit der (deutlich kleineren) halben Differenz von ω1 und ω2 ändert. In der Akustik wird einer solcher Vorgang als Schwebung bezeichnet.

Die zweiten Terme sind gegenläufige Schwingungen gleicher Frequenz, die sich der Schwebung überlagern. Sie sind möglich, treten aber nur dann auf, wenn sie zu Beginn des Vorgangs in geeigneter Weise angeregt wurden. Normalerweise ist das nicht der Fall, und dann ist B = 0 und A2 = A1.

Falls in den Schwingkreisen Ohmsche Widerstände R vorhanden sind, beeinflussen sie die Frequenzen der Schwebung nicht, dämpfen aber deren Amplitude: der Schwebungsvorgang klingt exponentiell ab.

 

 

Die Maxwellschen Gleichungen

[Bearbeiten]

Maxwells Hypothese und die 1. Maxwellsche Gleichung

[Bearbeiten]

Zunächst eine kurze Wiederholung:

Das Amperesche Gesetz für das Magnetfeld eines unendlich langen zylindrischen Leiters besagt, dass das Linienintegral der magnetischen Feldstärke H über eine geschlossene Kurve gleich der Summe I aller von der Kurve umschlossenen Ströme ist. (Siehe dazu: Wikibook: »Der elektrische Strom; 5.3. Das magnetische Durchflutungsgesetz«.)



und in Differentialschreibweise



Betrachten wir nun einen Plattenkondensator mit Dielektrikum, der an einer Wechselspannung liegt. (Siehe dazu: Wikibook: »Elektrostatik, 6.2. Dielektrikum im elektrischen Feld«.) Das Dielektrikum wird durch Ladungsverschiebung polarisiert. Die Flächenladungsdichte σ an den Grenzflächen des Dielektrikums heißt auch Polarisation P und beträgt:



Dabei ist E die (hier wechselnde) elektrische Feldstärke im Kondensator. Wenn die Feldstärke sich ändert, ändert sich proportional dazu auch die Polarisation. Dabei werden ständig elektrische Ladungen verschoben. Dies ist gleichwertig mit einem elektrischen Wechselstrom, für den gilt:

Dabei ist A die Fläche des Kondensators.

Die Stromdichte dieses Stromes ist



Dieser »Verschiebungsstrom« liefert natürlich auch einen Beitrag zum magnetischen Feld, das den Stromkreis umgibt, und für das analog wie oben gilt



Maxwells Hypothese war nun, dass es auch im Vakuum (im »Äther«) so etwas wie einen Verschiebungsstrom IV gäbe, dessen Stromdichte


sein müsste. Zusammen mit dem Verschiebungsstrom im Dielektrikum gäbe das die gesamte Stromdichte



Demnach müsste für die gesamte, von den Verschiebungsströmen erzeugte Feldstärke HG gelten:



Das ist Maxwells Hypothese.

Nun hat sich das Konzept des »Äthers« und damit auch das des Verschiebungsstroms im Äther längst als unhaltbar erwiesen. (Wie überhaupt die Ätherhypothese kein Ruhmesblatt in der Geschichte der Physik war.) Man braucht dieses Konzept aber auch gar nicht, denn in der obigen Gleichung treten die Verschiebungsströme gar nicht mehr explizit auf. Als eigentliche Ursache der »elektromagnetischen Induktion« erscheint nämlich die zeitliche Ableitung (also die Änderungsgeschwindigkeit) der elektrischen Feldstärke. Daher lautet eine

Moderne Formulierung der Maxwellschen Hypothese:

Magnetische Felder werden nicht nur durch elektrische Ströme hervorgerufen, sondern auch durch wechselnde elektrische Felder (wobei dann auch das Magnetfeld ein Wechselfeld ist).

Die Erzeugung magnetischer Wechselfelder durch elektrische Wechselfelder ist als eigenständiges Phänomen aufzufassen, das nicht auf andere Phänomene zurückgeführt und durch diese erklärt werden kann. (Wie ja auch die Erzeugung eines Magnetfeldes durch einen Strom nicht weiter erklärt werden kann.)

Beim gleichzeitigen Auftreten eines elektrischen Stromes der Dichte j und eines elektrischen Wechselfeldes der Änderungsgeschwindigkeit dE/dt in einem Punkt gilt für die dadurch induzierte magnetische Feldstärke H in diesem Punkt:



wobei ρ der spezifische elektrische Widerstand des Mediums ist.

Dies ist übrigens die einzige der vier so genannten Maxwellschen Gleichungen, die tatsächlich auf Maxwell zurückgeht (1864). Die übrigen drei waren schon vor ihm bekannt. Auch gab es zur Zeit Maxwells zunächst keine experimentelle Begründung seiner Gleichung. Im Laufe der folgenden Jahrzehnte aber wurden alle daraus abgeleiteten Folgerungen experimentell bestätigt. Die eindrücklichste Bestätigung der Maxwellschen Hypothese war der Nachweis der Existenz elektromagnetischer Wellen durch Heinrich Hertz (1888/89), deren Möglichkeit aus den Maxwellschen Gleichungen abgeleitet werden konnte.


Die drei anderen Maxwellschen Gleichungen

[Bearbeiten]

Die übrigen drei Gleichungen lauten



Die erste Gleichung dieser Zeile stellt das Gesetz der magnetischen Induktion dar, nach der zweiten Gleichung ist die Quelldichte des Vektors εr ε0 E gleich der elektrischen Raumladungsdichte ρ. Die dritte Gleichung konstatiert die Quellenfreiheit des magnetischen Feldes.


Der elektrische Strom – Eigenschaften und Wirkungen: Teil IV: Elektromagnetische Wellen

[Bearbeiten]

Elektromagnetische Wellen in nicht leitenden Medien

[Bearbeiten]

Die Wellengleichung

[Bearbeiten]

Für in unserem Bezugssystem ruhende, isotrope, nicht leitende Medien gelten die im letzten Abschnitt aufgeführten Gleichungen in der Form





Wenn keine Raumladungen vorhanden sind, was wir jetzt voraussetzen wollen, gilt außerdem



Zur Lösung der Gleichungen eliminieren wir zunächst H. Dazu differenzieren wir die Gleichung (A) nach t und berechnen die Rotation der Gleichung (B). Da der betrachtete Körper ruht, sind die Differentiationen nach der Zeit und nach dem Ort (Rotationbildung) vertauschbar.




Nach einem Satz der Vektoranalysis ist



Da nach Voraussetzung div E = 0 sein soll, folgt daraus



Andererseits ist (siehe oben)



Somit ist schließlich




Dabei ist Δ der LAPLACE-Operator, das skalare Produkt des Nabla-Operators mit sich selbst. Auf Vektoren angewendet, bedeutet er



oder



   


Die Gleichung



ist die Differentialgleichung für die wellenartige Ausbreitung des Vektors E im Raum, wobei sowohl der örtliche wie der zeitliche Verlauf der Welle einer Sinuskurve (bzw. einer Kosinuskurve) folgt. Durch diese Differentialgleichung wird eine riesige Mannigfaltigkeit von Wellenphänomenen beschrieben, nämlich alle nur denkbaren Wellen solcher Art. Wie immer bei einer Differentialgleichung kommt es darauf an, die für bestimmte Gegebenheiten passende Lösung auszuwählen.

 

Die ebene Lösung der Wellengleichung

[Bearbeiten]

Ich beschränke mich nun auf einen besonders wichtigen und charakteristischen Fall, nämlich auf den einer homogenen ebenen Welle. Das ist eine Welle, die sich in einem räumlich unbegrenzten Medium mit einer ebenen Wellenfront linear ausbreitet, zum Beispiel in Richtung der X-Achse. In allen Punkten einer beliebigen Ebene senkrecht zur X-Achse hat dann die Feldstärke E jeweils denselben Wert. Innerhalb einer solchen Ebene ändert sich also E in Y- und Z-Richtung nicht, was mathematisch bedeutet, dass überall



ist. Dies gilt natürlich auch für die entsprechenden Ableitungen aller Komponenten von E. In Anbetracht dessen und wegen



wird auch



Das betrachtete elektrische Feld kann also keine Komponente in X-Richtung haben, es sei denn, diese wäre konstant. Ein solcher Fall (eines konstanten Feldes) interessiert uns aber hier nicht. Es sei also Ex = 0.

Durch ein ganz analoges Vorgehen beim Eliminieren von E ergibt sich Hx = 0.

Die betrachtete Welle ist also eine Transversalwelle: Die Schwingungen von E und H finden nur senkrecht zur Ausbreitungsrichtung statt. (Wie erkennbar, ist dies eine Folge der Quellenfreiheit der beiden Felder.)

Von der obigen Vektorgleichung bleiben nach dem oben Gesagten nur zwei Gleichungen übrig:



Die Welle kann natürlich aus einer Überlagerung von beliebig vielen Wellen mit unterschiedlichen Frequenzen bestehen, wie das z. B. beim Sonnenlicht der Fall ist. Es genügt hier jedoch, wenn wir uns auf eine »monochromatische« Welle beschränken, das heißt auf eine Welle einer einzigen Frequenz. Dann lautet der allgemeine Lösungsansatz:



Durch zweimaliges Differenzieren, Einsetzen und Kürzen durch die Exponentialfunktion erhalten wir



Die Integrale dieser uns vertrauten Schwingungsdifferentialgleichungen sind



Wählen wir das positive Vorzeichen des Exponenten, dann ist der Phasenwinkel ω a x umso größer, je größer x ist und umgekehrt. Folglich breitet sich die Welle längs der X-Achse nach links aus. Wählen wir das negative Vorzeichen, breitet sich die Welle längs der X-Achse nach rechts aus. Wir entscheiden uns für diesen zweiten Fall. Dann wird



oder einfacher



Wie eine einfache Überlegung zeigt, ist die Ausbreitungsgeschwindigkeit v der Welle (genauer: ihre Phasengeschwindigkeit)



Im Vakuum ist



Durch Einsetzen der Werte für ε0 und μ0 ergibt sich die Vakuumlichtgeschwindigkeit c = 300 000 km/s.

Die Amplituden von Ey und Ez hängen von den Erzeugungsbedingungen der Welle ab, ebenso ihr Phasenverschiebungswinkel δ. Für δ = 0 ist die Welle linear polarisiert, anderenfalls ist sie elliptisch polarisiert. (Letzteres bedeutet: Der Endpunkt des Vektors E läuft auf einer Ellipse herum.)

Bei der Berechnung von H beschränke ich mich auf eine linear polarisierte Welle mit Ez = 0.

Unter dieser Voraussetzung ergibt sich aus




Integriert:



Die additiven Integrationskonstanten wurden gleich null gesetzt, da sie konstante Felder darstellen, die hier uninteressant sind.

Das magnetische Feld steht also bei einer linear polarisierten Welle auf dem elektrischen Feld senkrecht und schwingt mit diesem phasengleich. Wenn sich die Welle in +X-Richtung ausbreitet, hat das elektrische Feld die Richtung der+Y-Achse, das magnetische Feld die Richtung der +Z-Achse.

 

Die Energiedichte der elektromagnetischen Welle und der POYNTING-Vektor

[Bearbeiten]

Die Energiedichte w = dE/dV im Raum einer elektromagnetischen Welle setzt sich zusammen aus der Energiedichte des elektrischen Feldes und der des magnetischen Feldes und beträgt daher



Wegen



kann man dafür auch schreiben



Dabei sind E und H die jeweiligen Momentanwerte der Feldstärken. Wie man sieht, verteilt sich die Gesamtenergie zu gleichen Teilen auf das elektrische und das magnetische Feld.

Da die Welle im Raum fortschreitet, wobei sich die »Wellenberge« und »Wellentäler« in Ausbreitungsrichtung verschieben, transportiert die Welle Energie in dieser Richtung mit der Geschwindigkeit cm (Lichtgeschwindigkeit im Medium). Betrachten wir einen hinreichend kleinen Quader von der Länge dx = cm dt und dem Querschnitt dy dz. Er enthält die Energie dW = cm dt dy dz w. In der Zeit dt durchströmt diese Energie die vordere Stirnfläche des Quaders. Die auf den Querschnitt und die Zeit bezogene Energie ist dann



Mit


ergibt sich



Diese Größe S heißt Intensität oder Energiestromdichte der Welle am betrachteten Ort. Der dazu gehörige Vektor, der parallel zur Ausbreitungsrichtung der Welle ist, heißt POYNTING-Vektor S:



 

Elektromagnetische Wellen in leitenden Medien

[Bearbeiten]

Wegen der etwas komplizierten Rechnungen führe ich zunächst folgende Abkürzungen ein:

εr ε0 = ε
μr μ0 = μ

Da Verwechslungen hier ausgeschlossen sind, bezeichne ich die elektrische Leitfähigkeit 1/ρ wie üblich mit σ.

Dann lauten die Feldgleichungen für den Fall, dass die Leitfähigkeit des Mediums nicht verschwindend klein ist,



Eliminiert man wieder wie oben H, so ergibt sich


.


Wieder beschränke ich mich auf ebene Wellen, die sich in Richtung der +X-Achse ausbreiten, sodass alle partiellen Ableitungen nach y und z gleich null sind, woraus sich Ex = Hx = 0 ergibt. Außerdem sei die Welle linear polarisiert (Ez = 0). Für eine zudem monochromatische Welle lautet dann der Ansatz:


.


Daraus folgt:



und somit


.


Andererseits ist



und daher schließlich


.


Dies ist formal die Differentialgleichung einer harmonischen Schwingung, jedoch mit einem komplexen Koeffizienten.

Mit dem Ansatz:



findet man



(Ich bezeichne die Konstante hier mit k, weil ich den Buchstaben a später für eine andere Größe brauche.) Für σ = 0 ergibt sich daraus der gleiche Wert wie für die Welle in nicht leitenden Medien. Aus demselben Grund wie dort, wählen wir auch hier das negative Vorzeichen und erhalten so



Zur weiteren Diskussion des Ergebnisses müssen wir die Wurzel im Exponenten untersuchen. Mit

ε μ ω² = a
μ σ ω = b

wird



und nach dem Gesetz für die Berechnung von Wurzeln aus komplexen Zahlen



wobei p und q die Abkürzungen für die beiden Wurzelausdrücke sind. Damit wird


Setzen wir dies in die Gleichung für Ey ein, erhalten wir schließlich



oder einfacher wieder



Dies ist die Gleichung einer gedämpften Welle mit dem »Dämpfungsfaktor« q und der Phasengeschwindigkeit v = 1/p. Die Amplitude der Welle nimmt also auf der Strecke x = 1/q jeweils auf den e-ten Teil ab.

Zur Berechnung von H gehen wir wieder aus von



Daraus folgt



Die komplexe Zahl piq kann dargestellt werden als


      mit      


Damit wird



In leitenden Medien ist also der magnetische Feldvektor gegenüber dem elektrischen um den Winkel - δ phasenverschoben.


Optik

[Bearbeiten]

20% fertig „Einführung in die Theoretische Physik“ ist nach Einschätzung seiner Autoren zu 20 % fertig

Motivation

[Bearbeiten]

Warum leuchtet der Himmel tagsüber blau, abends aber rot? Wieso sieht man nachts Sterne, tagsüber aber nicht? Wie funktioniert das Sehen weit entfernter Objekte? Ist Licht nun wellenförmig oder besteht es aus Teilchen?

Der Begriff Optik leitet sich aus dem griechischen Wort optike ab. Optik ist also die Lehre vom sichtbaren Licht. Im engeren Sinn ist Licht elektromagnetische Strahlung in einem Frequenzbereich beziehungsweise Wellenlängenbereich, der das Sinnesorgan menschliches Auge zu Sinnesempfindungen ab einer Mindestleuchtdichte der auf die Netzhaut des Auges fallenden Strahlung erregen kann. Neben der Lichtgeschwindigkeit c [m/s], der Geschwindigkeit jeglicher elektromagnetischer Strahlung ist eine wesentliche Kenngröße dieser Strahlung die Wellenlänge . Die Zuordnung einer Wellenlänge setzt voraus, dass sich diese Strahlung in einem periodischen Vorgang ausbreitet, also eine Periodendauer T [s] oder eine Strahlungsfrequenz f = 1/T [1/s] zugeordnet werden muss.

Für alle sich periodisch mit endlicher Geschwindigkeit ausbreitende Wellenformen, wie Schall und elektromagnetischer Strahlung, gilt:

Während Schall ein Ausbreitungsmedium, wie Gase, Flüssigkeiten oder isotrope oder anisotrope Festkörper, benötigt, kann sich elektromagnetische Strahlung auch im Vakuum, zum Beispiel im interstellaren Raum ausbreiten. c ist stets vom Ausbreitungsmedium mit seinen jeweiligen Zustandsgrößen wie Dichte, Temperatur, usw. abhängig. Im Verlauf der Entwicklung der Metrologie stellte sich heraus, dass von allen Grundgrößen der Physik die Zeit mit ihrer sich immer weiter verbessernden Definition der Sekundendauer und der experimentell sich immer weiter verkleinernden Werte der Messunsicherheiten für die Darstellung der Sekundendauer im Verlauf der Forschungsjahre (etwa 1983), mit relativen Messunsicherheiten von kleiner als 1/1 000 000 000 000 gemessener Zeitintervalle sich messtechnisch zur am besten beherrschten Grundgröße der Physik entwickelte. Die Messung der Vakuumlichtgeschwindigkeit als einer für viele Aussagen der theoretischen Physik wichtigen Naturkonstante konvergierte im Verlauf der Forschungsjahre im internationalen Wettbewerb der nationalen Forschungsanstalten mit vielen unterschiedlichen Messansätzen auf einen Wert von c = 299792458 m/s hin, der wegen der im Verlauf der Forschungsjahre wesentlich schlechter konvergierenden Unsicherheit der Meterdarstellung nur mit Messunsicherheiten größer als 1/1 000 000 000 der Lichtgeschwindigkeit angegeben werden konnte. Besonders um den Längenmessproblemen der Raumfahrt besser entsprechen zu können, wurde 1983 in internationaler Übereinkunft die Naturkonstante c, die eigentlich ein aus den Einheiten für Länge und Zeit resultierender Messwert mit zugehöriger Messunsicherheit sein müsste, durch eine messunsicherheitsfreie Definition ersetzt für die, um Zahlenwertänderungen im Wissensgebäude der Metrologie zu vermeiden, der glatte Zahlenwert von

festgelegt wurde. Die gleiche Vakuumlichtgeschwindigkeit gilt auch 28 Jahre später unverändert weiter, da die Längeneinheit Meter [m], mit der damals um den Faktor von ca. 1000 verbesserten Messunsicherheit der Zeitmessung gleichzeitig durch die neue Definition ersetzt wurde: 1 m ist die Strecke, die von Lichtstrahlung in 1/299792458 Sekunden durchlaufen wird. Inzwischen ist die Messung von Zeitintervallen seit dem Gültigwerden der derzeitigen Meter und Lichtgeschwindigkeitsdefinition bezüglich der Messunsicherheiten um ca. einen weiteren Faktor von 1000 verbessert worden. Nochmals ein weiterer Faktor von ca. 1000 ist zu erwarten, wenn die derzeitige Sekundendefinition von einer Atomfrequenzdefinition im Mikrowellenbereich auf eine Atomfrequenzdefinition im Lichtfrequenzbereich umgestellt wird, wozu international experimentelle Vorarbeiten geleistet werden.

Bei der Ausbreitung von elektromagnetischer Strahlung verändert sich die Lichtfrequenz nur, falls dem Lichtwellenfeld-Photonenstrom Energie entnommen oder zugeführt wird. Abhängig von der Auslegung optischer Experimente stellt sich diese Strahlung bevorzugt als Wellenvorgang oder als Teilchenstrom dar. Dabei beschreibt die Lichtfrequenz f zusammen mit der Naturkonstanten h, dem Planckschen Wirkungsquantum, den Energieinhalt der einzelnen Lichtteilchen, der Photonen.

Ein durchgehendes Verständnis optischer Vorgänge und Instrumente ist nur möglich, falls man von den Kenngrößen einer Lichtquelle ausgehend, über die Ausbreitungswege des Lichtes bis zum Lichtempfänger und seinen Ausgangssignalen ein Modell bildet, das sowohl deterministische Zusammenhänge als auch zufallsbedingte Anteile in den Signalen von Empfängern liefern kann.

Im engeren Sinn ist Optik die Lehre der elektromagnetischen Strahlung im Wellenlängenbereich des sichtbaren Lichts (ca. 380nm bis 780nm). Im weiteren Sinne wird allerdings der Bereich vom Infraroten bis Ultravioletten mit dazu genommen. Des Weiteren spricht man auch von der Röntgenoptik, deren Wellenlängenbereich sich auf das der Röntgenstrahlung bezieht.

1675 wurde von dem dänischen Astronomen Olaus Römer über astronomische Messungen zum ersten Mal ein vernünftiger Wert für die Geschwindigkeit des Lichts gefunden. Über nichtastronomische Messungen gelang es erstmals Fizeau im Jahr 1849, annehmbare Werte für die Lichtgeschwindigkeit zu ermitteln. Diese Messmethoden wurden später durch Foucault 1852 und dann noch von Michelson um 1930 verbessert. Seit dem Jahre 1983 liegt der heute gültige Wert der Lichtgeschwindigkeit bei

In den meisten Fällen ist allerdings der Wert von vollkommen ausreichend.

Geometrische Optik

[Bearbeiten]

Einfache Versuche zeigen, dass man in einer ersten Näherung gut davon ausgehen kann, dass Licht sich geradlinig als Strahl ausbreitet. Für erste Betrachtungen ist diese Annahme ausreichend (Grenze: Objekte, die das Licht begrenzen, haben eine Mindestgröße von etwa 100mal der Wellenlänge des verwendeten Lichts). Damit lassen sich Spiegel, Linsen und daraus zusammengesetzte Geräte (Mikroskop, Teleskop, usw.) beschreiben.


Reflexion und Brechung

[Bearbeiten]

Reflexionsgesetz

[Bearbeiten]

Einfallender und ausfallender Strahl bilden mit dem Lot, auch Grenzflächennormale genannt, gleiche Winkel. Außerdem bilden Einfallsstrahl und Lot eine Ebene, die Einfallsebene, in welcher auch der reflektierte Strahl liegt. Daraus resultiert:

Welcher Anteil der Energie des Strahls an der Grenzfläche reflektiert wird, hängt von den Brechzahlen der betreffenden Medien (und damit der Lichtgeschwindigkeit), dem Einfallswinkel sowie von der Polarisationsrichtung der Welle ab.

Brechungsgesetz

[Bearbeiten]

Unter Umständen wird nicht die ganze Energie einer elektromagnetischen Welle reflektiert, sondern teilweise oder zur Gänze transmittiert, was bedeutet, dass der Strahl in das Medium eintritt. Bei diesem Übergang der Welle von einem Medium ins andere ändert sich die Ausbreitungsrichtung des Strahles sowie die Wellenlänge seiner ihn beschreibenden Welle, wobei die Frequenz allerdings gleich bleibt. Das Verhältnis vom Sinus des Einfallswinkels zum Sinus des Brechungswinkels ist abhängig von den beiden Medien, zwischen denen der Übergang stattfindet. Die für beide Medien charakteristische Konstante n heißt Brechzahl. Wenn kleiner als ist, findet eine Brechung zum Lot statt, im umgekehrten Fall wird das Licht vom Lot weg gebrochen. Die Brechzahl des Vakuums ist als 1 definiert (näherungsweise gilt dieser Wert auch für Luft).

Totalreflexion

[Bearbeiten]

Nach dem Brechungsgesetz ist

.

Bei , also an der Grenzfläche vom optisch dichteren zum dünneren Medium kann jedoch

werden. In diesem Fall gibt es keine reelle Lösung für den Winkel , und es tritt keine Brechung auf. Der einfallende Strahl wird vollständig reflektiert; dieser Fall wird als Totalreflexion bezeichnet. Der Winkel , bei dem wird, wird als Grenzwinkel für Totalreflexion bezeichnet.

Dispersion

[Bearbeiten]

Wie erwähnt hängt die Geschwindigkeitsveränderung beim Übergang elektromagnetischer Strahlen von einem Medium in ein anderes von der Brechzahl n ab. Die Brechzahl eines Materials ist allerdings keine Konstante, sondern eine Funktion der Wellenlänge. Also:

Dies hat zur Folge, dass sich weißes Licht, welches ja aus allen für uns sichtbaren Farben, gleichbedeutend mit Wellenlängen, zusammensetzt, in die Farbfolge Rot, Orange, Gelb, Grün, Blau, Violett aufspaltet, sobald es durch ein Prisma geschickt wird. Das Licht wird dabei in sein Spektrum aufgespalten, und die nach dem Prisma sichtbar werdenden Bestandteile des weißen Lichtes sind nicht weiter aufspaltbar, eine Eigenschaft, die monochromatisch genannt wird. Ähnliche Vorgänge spielen auch in der Datenübertragung eine Rolle, weil auch hier Informationspakete weggeschickt werden, welche aus mehreren Wellen zusammengesetzt sind. Auch hier kommt es durch unterschiedliche Ausbreitungsgeschwindigkeit der Wellen in diesem Paket zu Dispersion, hierbei zerrinnt der abgeschickte Wellenberg und wird breiter.

Spiegel

[Bearbeiten]

Ein Spiegel reflektiert Licht.

  • Die Entfernung von einem Objekt vor dem Spiegel zum Spiegel ist genau so groß wie die Entfernung vom Spiegel bis zu einem (gedachten) Objekt hinter dem Spiegel. Um das zu zeigen bringt man zwei Objekte in Deckung, wie zwei Bleistifte, einer vor und einer hinter dem Spiegel. Man verschiebt nun den Bleistift hinter dem Spiegel so, dass er mit seinem Spiegelbild übereinstimmt und misst die jeweiligen Abstände
  • Ein Spiegel vertauscht nicht rechts und links, wie man mit einem Bleistift vor dem Spiegel nachweisen kann. Die Spitze vom Bleistift verändert nur dann ihre Richtung, wenn sie mehr oder weniger direkt auf den Spiegel zeigt. Der Spiegel vertauscht vorne und hinten.
  • Wirft man einen Strahl schräg auf einen Spiegel, wird dieser im gleichen Winkel reflektiert wie er eingefallen ist. Beide Strahlen liegen in einer Ebene.

Brechung an Grenzflächen

[Bearbeiten]

Linsen

[Bearbeiten]

Sammellinse

[Bearbeiten]

Mit speziellen Formen von Grenzflächen kann man nun mit der Brechung erreichen, dass Strahlen die von einem Punkt kommen, ins Unendliche abgebildet werden, das bedeutet, dass sie danach parallel verlaufen.

! Bild Sammellinse mit Fokus -> \infty !

in der geometrischen Optik sind die Vorgänge umkehrbar. Das bedeutet, mit der gleichen Linse kann man parallele Strahlen auf einen Punkt fokussieren.

man spricht deshalb bei dieser Linse von einer Sammellinse. Die wichtigste Größe ist die Brennweite f: das ist der Abstand zwischen dem Brennpunkt und Hauptebene der Linse. Wenn es sich um eine dünne Linse handelt, d. h. eine Linse, deren Dicke bei der Berechnung des Verlaufs der Lichtstrahlen vernachlässigt werden kann, ist die Hauptebene identisch mit Mittelebene der Linse.

Zerstreuungslinse

[Bearbeiten]

Linsenfehler

[Bearbeiten]
Chromatische Aberration
[Bearbeiten]

Die chromatische Aberration ist die durch Brechung erzeugter Farbsaum. Sie kann durch die Kombination verschiedene Glassorten für eine weitere Wellenlänge (Achromat) oder sogar für zwei weitere Wellenlängen (Apochromat) korrigiert werden.

Sphärische Aberration
[Bearbeiten]

Die sphärische Abberation ist eine durch Brechung oder Reflexion von Strahlen an sphärischen Oberflächen (konstanter Kugelradius) mit zunehmend großer Einfallshöhe verursachte Unschärfe, bei der es zu unterschiedlichen Schnittweiten im Bildraum kommt. In der Bildebene werden dadurch zunehmend große Zerstreuungkreise hervorgerufen. Sie kann durch aufwendiger gestaltete Oberflächen, wie asphärische Linsen oder parabolische Spiegel, vermindert werden.

Astigmatismus
[Bearbeiten]

Der Astigmatismus gehört zu den Abbildungsfehlern des Systems Auge mit den Abbildungseigenschaften der Hornhaut mit etwa 80% Anteil an der Abbildung und der Augenlinse im Inneren mit etwa 20 % Anteil an einem solchen Abbildungsfehler. Eine sphärische und korrekte Abbildung durch ein optisches System bildet in einer einzigen Brennpunktebene ab, in dem sich ein scharfes und deutliches reales (konvexe Abbildung) oder virtuelles (konkave Abbildung) Bild befindet. Ein astigmatisches System bildet einen Gegenstand in zwei Schnittebenen ab, dessen unscharfes Bild sich in einer Ausdehnung zwischen den beiden Schnittebenen befindet. Die Lage der beiden Schnittebenen kann um jeweils 90° gekreuzt sein oder in seltenen Fällen auch konfus und irregulär zueinander liegen. Um dies zu beheben, gibt in der technischen Optik solche korrektive Sammel- und Zerstreuungslinsen (Plus (Konvex)- und Minus (Konkav)linsen). Eine einzelne Linse, die einen Astigmatismus wieder zu einem einzigen deutlichen Bild aus den räumlich getrennten Schnittebenen vereint, wird asphärisches, torisches oder nur Zylinderglas genannt. Ein entsprechendes System in der geschliffenen Kombination der einzelnen asphärischen Gläser zur Korrektur solcher Abbildungseigenschaften ist ein  Anastigmat. Solche Systeme kommen zur Abbildungskorrektur in den Teleobjektiven, Mikroskopen und Lupen vor.

Siehe auch:  Abbildungsfehler#Astigmatismus schiefer Bündel

Optische Instrumente

[Bearbeiten]

Mit Hilfe der sich im Inneren des Auges befindlichen Augenlinse (Lens Cristalina), einer im angespannten Zustand gewölbten Konvexlinse, wird bei einem emmetropen Auge, das heißt in einem fehlerfrei abbildenden Auge, ein auf dem Kopf stehendes, um 180° gedrehtes reales Bild der betrachteten Objekte auf die Netzhaut (Retina) projiziert. Das Gehirn gleicht die Drehung wieder über verschiedene Reizleitungen, die vom Auge über einen sich vor dem Gehirn kreuzenden Sehnervenweg (Chiasma) führen, wieder aus. Um verschieden weit entfernte Objekte scharf sehen zu können, ist die Linse in der Lage, ihre konvexe Form zu verändern, um auf diese Weise ihre Brennweite zu variieren. Die weiteste Entfernung wird von Unendlich definiert bis in etwa maximal 8 cm vor dem Auge heran, vom Abstand der beiden Augen zueinander abhängig in die Nähe akkommodiert. Diese Naheinstellung oder Akkommodation entspricht auch der Fähigkeit eines einzelnen Auges, um Gegenstände noch deutlich sehen zu können. Die Augenlinse verändert dabei von Fern zu Nah ihre Form und wölbt sich durch die Ziliarmuskeln, in denen die Linse befestigt ist, entspannt in eine noch stärker gerundete Linsenform. Die akkommodative Brechkraft des Systems Auge - Linse beträgt von Unendlich bis ca. 5,00 m vor den Augen +/- 0 dpt, in 8 cm vor dem Auge wird eine Brechkraft von + 12,5 dpt verlangt. ( 1dpt = 1/m) Das Auge als Gesamtsystem mit den Eigenschaften von Hornhaut, Kammerwasser, Linse und Glaskörper beträgt in Anhängigkeit von der Baulänge des Auges 56,64 - 70,57 dpt in den ermittelten Normwerten vieler gemessener Augen.

Mit Hilfe einer Linse konvexer oder bikonvexer Art mit kurzer Brennweite wird ein aufrechtes virtuelles Bild eines Objekts erzeugt, welches sich innerhalb der Brennweite der Linse befindet und auf diese Weise vergrößert dargestellt wird.

Kamera

[Bearbeiten]

Sie besitzt ein aus mehreren Linsen zusammengesetztes, diverse Linsenfehler korrigierendes Objektiv. Dem Auge gleich wird nun ein umgedrehtes reelles Bild erzeugt. Mittels einer Umkehrlinse (konvex - oder ein Linsensystem, welches sich so verhält) wird das Bild nun, ein weiteres mal um 180° gedreht, auf einen Film oder Bildsensor projiziert.

Objektiv

[Bearbeiten]

Ein Objektiv ist ein System aus Linsen, Mechanik, sowie in Sonderfällen auch Elektronik. Es dient normalerweise den Zweck durch reale Linsen den Eigenschaften einer idealen Linse so nahe wie möglich zu kommen. Da jede reale Linse verschiedene Formen von Abberationen (Bildfehlern) aufweist, die aber durch die Kombination mehrere Linsen, zu Linsengruppen und Objektiven, abgemindert werden können. Die Vielfalt von Objektiven ist nahezu unbegrenzt. Sie reicht von winzigen Plastiklinsen-Objektiven in Handykameras, bis hin zu tonnenschweren Lithografieobjektiven, die zur Belichtung von Wafern in der Chipindustrie benötigt werden.

Mikroskop

[Bearbeiten]

Mit Hilfe eines Mikroskops können kleine Objekte unter einem größeren Sehwinkel betrachtet werden.

Teleskop

[Bearbeiten]

Mit Hilfe eines Teleskops können weit entfernte Objekte unter einem größeren Sehwinkel betrachtet werden.

Licht als elektromagnetische Welle

[Bearbeiten]

Im Allgemeinen bestehen elektromagnetische Wellen aus gleichfrequenten, versetzt schwingenden elektrischen und magnetischen Wellen. Die Schwingungsrichtungen dieser Transversalwellen sind gegeneinander um gekippt. Zeitlich sind sie um eine viertel Periode verschoben.

Aus den Maxwellgleichungen folgt die Wellengleichung:

mit

E(t): elektrische Feldstärke

Diese Gleichung für E(t) gilt allgemein für elektromagnetische Wellen, also auch für Funkwellen. Einen bestimmten Bereich der elektromagnetischen Wellen nennen wir Licht, da er vom menschlichen Auge registriert wird. Dabei ist E im allgemeinen eine komplexe Größe (siehe dazu auch Optik#Crashkurs: Komplexe Zahlen).

Die elektrische Feldstärke kann nicht direkt bestimmt werden, sondern nur (zum Teil) indirekt über die Intensität I, welches das Betragsquadrat der elektrischen Feldstärke multipliziert mit der Lichtgeschwindigkeit c und der  elektrische Feldkonstante ist:

(Abhängig vom verwendeten Einheitensystem kann der Vorfaktor variieren. Der hier genannte Vorfaktor gilt für SI)

Die Ausbreitung des Lichts

[Bearbeiten]

Aus der Beobachtung, dass sich Licht geradlinig ausbreitet, werden in der geometrischen Optik die Gesetzmäßigkeiten des Lichtes mit Hilfe des Strahlenmodells beschrieben.

  1. Die Lichtausbreitung erfolgt durch Lichtstrahlen. Diese Strahlen sind Lichtkegel mit infinitesimal kleinen Öffnungswinkeln.
  2. Ein Lichtstrahl unterliegt den Gesetzen der Reflexion und der Brechung.

Streng physikalisch gesehen breitet sich Licht jedoch wellenförmig aus. Die Eigenschaften von Schwingungen und Wellen kommen bei Interferenz und Beugung zum Tragen.

Huygenssches Prinzip

[Bearbeiten]
Wellenbrechung am Spalt nach dem Huygens-Fresnel-Prinzip. Die gelben Punkte zeigen gedachte Ausgangspunkte für neue (Kugel-)Wellen.

Es besagt, dass von jedem Punkt entlang einer Wellenfront wieder eine Halbkugelwelle ausgeht. Diese Kugelwellen interferieren miteinander und bilden eine neue Wellenfront. Die Kugelwelle besitzt die gleiche Ausbreitungsgeschwindigkeit und dieselbe Frequenz wie die ursprüngliche Wellenfront. Strahlen sind dabei Linien des Lichtes, welche senkrecht auf den Wellenfronten stehen.

Fermat'sches Prinzip

[Bearbeiten]

Nach dem Fermat'schen Prinzip breitet sich das Licht zwischen zwei definierten Punkten auf dem optisch kürzesten Weg aus. Die optische Weglänge ergibt sich hierbei aus der geometrischen Weglänge und der relativen optischen Dichte des Mediums im Vergleich mit der von Vakuum . ergibt sich aus dem Verhältnis der Ausbreitungsgeschwindigkeiten zueinander. Es gilt für die Werte , in den Medien 1 und 2 mit den Lichtausbreitungsgeschwindigkeiten und :

Und für die optische Weglänge gilt:

Im Allgemeinen ist zu beachten, dass die Ausbreitungsgeschwindigkeit von der Frequenz der elektromagnetischen Welle abhängen kann (Dispersion).

Polarisation

[Bearbeiten]

Licht ist eine elektromagnetische Welle. Sowohl die elektrische, als auch die magnetische Feldstärke schwingen senkrecht zur Ausbreitungsrichtung: Sie schwingen nach oben/unten, oder links/rechts, wenn sich die Welle nach vorne ausbreitet.

Licht von der Sonne oder einer Glühlampe (oder Neonröhre) ist unpolarisiert, es schwingt in alle möglichen Richtungen, weil die Entstehung unkontrolliert in einem statistischen Prozess stattfindet, das Licht also durch Elektronen bzw. Atome unterschiedlichster Schwingungsrichtungen emittiert wird. Mit doppelbrechenden Kristallen oder speziellen Filtern kann man aus unpolarisiertem Licht aber (linear) polarisiertes Licht filtern; dabei wird Licht einer Polarisationsrichtung hindurchgelassen, und die senkrecht dazu polarisierten Anteile werden reflektiert oder absorbiert. Polarisiertes Licht schwingt nur noch in einer Richtung.

Fällt eine polarisierte elektromagnetische Welle mit der Amplitude (Feldstärke) auf einen Polarisator, dessen Polarisationsrichtung gegenüber der des Lichts um den Winkel verdreht ist, ist die Amplitude hinter dem Polarisator

.

Mit Hilfe spezieller Lichterzeuger (Laser) lässt sich ohne Filterung polarisiertes Licht erzeugen. Dies ist jedoch keine inhärente Eigenschaft eines Lasers.

Überlagern sich zueinander senkrecht polarisierte Lichtwellen gleicher Stärke und mit einer Phasenverschiebung von 90°, so entsteht zirkular polarisiertes Licht. Hierbei rotiert die elektrische Feldstärke senkrecht zur Ausbreitungsrichtung. Der Betrag der Feldstärke ist dabei zu jedem Zeitpunkt gleich. Je nach Drehrichtung, welche von der Phasenlage bestimmt wird, handelt es sich um rechts- bzw. links zirkularpolarisiertes Licht. Im allgemeinen Fall, also unterschiedliche Stärke der Lichtstrahlen und beliebige Phasenverschiebung, liegt elliptisch polarisiertes Licht vor.

Im Photonenbild existieren wegen der Helizität der Photonen nur zirkularpolarisierte Photonen. Linear polarisiertes Licht besteht dann aus der Überlagerung von rechts- und links-zirkular polarisierten Photonen.

Interferenz

[Bearbeiten]

Allgemeines über Interferenz von Lichtwellen

[Bearbeiten]

Lichtwellen als elektro-magnetisches Phänomen können sich wie alle Wellen überlagern. Hier werden nun die Wellenberge bzw. -täler näher betrachtet respektive die Addition der Amplituden. Man unterscheidet zwischen destruktiver und konstruktiver Interferenz. Erstere kann wie folgt beschrieben werden:

Es kommt zur Auslöschung durch Interferenz wenn zwei kohärente, linear polarisierte und um eine halbe Wellenlänge verschobene Lichtbündel aufeinander treffen. Hierbei stößt ein Wellenberg des einen Lichtbündels auf das betragsmäßig gleich große Wellental des anderen Lichtbündels was zur Auslöschung führt.

Treffen nun zwei phasengleiche Lichtbündel aufeinander, so addieren sich ihre Amplituden was zu ihrer Verstärkung führt.

Kohärenz und Kohärenzbedingung

[Bearbeiten]

Haben zwei Wellen zueinander eine feste Phasenbeziehung, so werden sie als kohärent bezeichnet und erzeugen ein stationäres Interferenzmuster.

Bewegen sich zwei Wellen gleichzeitig, gleichschnell, mit gleicher Frequenz und zeitfester Phasenbeziehung zueinander, parallel im selben Medium, so ist die Kohärenzbedingung erfüllt. Als Beispiel sei der Laser-Strahl genannt.

Interferenz an planparallelen Platten

[Bearbeiten]

Hier interferieren der an der Oberfläche direkt reflektierte und der an der Unterseite reflektierte Strahl. Das farbige Interferenzmuster auf einem Ölfilm beschreibt dieses Phänomen, genauer gesagt die Interferenz an dünnen Schichten.

Michelson Interferometer

[Bearbeiten]

Grunderscheinungen der Beugung

[Bearbeiten]

Unter dem Begriff Beugungsphänomene werden all diejenigen Lichterscheinungen zusammengefasst, bei denen sich die Ausbreitung von Licht (im allgemeinen aller Strahlung) nicht mehr mit Hilfe der Gesetze der geometrischen Optik erklärt werden können. Man geht dann dazu über diese Phänomene dadurch zu beschreiben, dass sich Licht als Welle ausbreitet. Beugung tritt genau dann auf, wenn ein Hindernis (z. B. ein Spalt oder ein Schirm mit kreisförmigen Öffnungen) im Lichtweg steht. Daher tritt Beugung in der Optik grundsätzlich immer auf. Je nach den Umständen kann die Beugung allerdings vernachlässigt werden.

Die Beugung im Allgemeinen Fall wird typischerweise mit dem  Fresnelschen oder Fraunhoferschen Beugungsintegral beschrieben. Unterscheidungskriterium sind die Abstände von Lichtquelle und Beobachtungspunkt der Beugung von dem beugenden Objekt ausschlaggebend.

Im Folgenden soll auf den Spezialfall eingegangen werden, wenn kohärentes und parallel einfallendes Licht auf einen oder mehrere Spalte trifft. So ein präpariertes Licht emittiert ein Laser.

Beugung am Doppelspalt

[Bearbeiten]

Dieser Versuch wurde bereits (damals allerdings noch nicht mit einem Laser) 1802 von  Thomas Young durchgeführt.

Es wird das Licht (mit den in der Einleitung bereits beschriebenen Bedingungen) auf eine Ebene projiziert. Dabei ist für die folgenden Berechnungen wichtig, dass es genau senkrecht auftritt. In besagter Ebene mögen sich zwei Löcher mit dem Abstand zueinander befinden. Da dieses Problem radialsymmetrisch ist und wir es nur zweidimensional betrachten, können wir es auch als Spalte bezeichnen. Als nächstes machen wir eine weitere Vereinfachung des Problems: Die Spalte sind so klein, dass sie nach dem Huygenschen Prinzip lediglich eine einzige Kugelwelle pro Spalt erzeugen. Diese Vereinfachung wird später noch diskutiert. Das Bild, welches diese beiden Spalte werfen, wird auf einem zur ersten Ebene parallelen Schirm aufgefangen. Er möge sich im Abstand befinden.

Das Ergebnis eines Doppelspaltesexperiments

Kommen wir nun zum eigentlichen Experiment und gucken uns das Bild auf dem Schirm an. Aus der geometrischen Optik würde man erwarten, dass dort zwei Punkte in Größe der Löcher zu sehen ist. Da allerdings die Beugungseffekte nicht vernachlässigt werden dürfen und an den Spalten Kugelwellen entstehen, würde man erwarten, dass zwei „verschmierte“ Punkte zu sehen sind. Dies ist allerdings nicht der Fall. Es sind sogenannte Beugungsminima und -maxima zu erkennen.

ACHTUNG: Die hier verwendete Größe d ist in unserer Notation g.

Aber wie kann man dies erklären, was zunächst noch recht kontraintuitiv erscheint? Bei genauerer Überlegung fällt einem auf, dass man bereits diese Erscheinung aus dem Alltag kennt. Wenn man auf einer ruhigen, möglichst großen Wasserschale zwei Kugelwellen erzeugt, sieht man, dass die Wellen interferieren

Damit nun ein Beugungsminimum entsteht, müssen die beiden Wellen perfekt destruktiv interferieren. Zur Erinnerung: Das heißt, dass die Wellenberge der einen Welle auf die Wellentäler der anderen treffen und somit die Amplitude auf Null gesetzt wird. Da die Strahlen kohärent sein sollen, brauchen wir uns auch keine Gedanken über die zeitliche Entwicklung zu machen.

Guckt man sich nun einen Punkt auf dem Schirm an, so muss dieser aus den Wellen der beiden Spalte entstanden sein. Wenn nun dieser Punkt im ersten Minimum (bezogen auf den Mittelpunkt der Anordnung) liegt, so muss die Wegdifferenz der Strahlen - der sogenannte Gangunterschied - eine halbe Wellenlänge sein, damit es auch durch komplette destruktive Interferenz erklärt werden kann:

Wenn man die Phase einer Welle von zwei kohärente, unendlich ausgedehnte Wellen um verschiebt bzw. anders formuliert die Welle um genau ein ganzes seine Wellenlänge verschiebt, so erhält man wieder dasselbe Resultat.

Die Wellen interferieren komplett destruktiv.

Eine alternative Methode zur Bestimmung des Minimums nimmt an, dass zu irgendeiner Zeit die „Auslenkung“ der Wellen an den Öffnungen gleich null ist und dann perfekt sinusial ausbreiten. Beim Doppelspalt ist es nun, dass unter einem Winkel aufgrund des Gangunterschiedes, die zwei Wellen sich „auslöschen“ – die Superposition ist also eine Welle gleich Null. Es gilt also, die Gleichung zu lösen:

Eine mögliche Lösung ist . Das bedeutet also .

Aus dieser Überlegung lässt sich nun vorangegangene Gleichung für ein k-tes Minimum verallgemeinern:

Die analoge Überlegung, wie dies nun für ein k-tes Maximum aussieht, sei dem Leser als Übung überlassen. Hinweis: Welche Werte darf dann annehmen?

Der schwierigste physikalische Teil ist nun geschafft! Wir wissen nun also, warum ein Maximum oder Minimum entsteht, aber immer noch nicht so recht, wo man eins auf dem Schirm - oder allgemeiner formuliert in Abhängigkeit vom Winkel - findet.

Die Strecken und lassen sich zu einem rechtwinkligen Dreieck zusammensetzen, dessen Winkel an möge heißen. Dann ist aus der Trigonometrie bekannt, dass gilt:

Mit der  Umkehrfunktion (manchmal auch als bezeichnet) und den besprochenen Bedingungen für ein Minimum bzw. Maximum (einfach einsetzen) lässt sich diese Gleichung umformen.

Ein k-tes Minimum lässt sich finden unter dem Winkel

Jetzt haben wir die Extrema in Abhängigkeit vom Winkel. Anschaulicher wäre es, allerdings sagen zu können, wo sich diese in der Projektion auf dem Schirm befinden. Dazu bezeichnen wir die Strecke vom Mittelpunkt - dem Hauptmaximum - bis zum Punkt des Extremums mit . Mit der Strecke als Abstand vom Doppelspalt zum Schirm bildet sich ein rechtwinkliges Dreieck. Dieses möge an der Doppelspalt-Seite mit dem Winkel bezeichnet sein. Für das Dreieck gilt:

Da gilt, kann mit der  Taylor-Näherung die Näherung aufgestellt werden:

Interessant ist es, sich zu überlegen, wie lange diese Näherung noch „genügend präzise“ Werte angibt. Dies sei dem Leser überlassen.

Als nächstes wird diese Gleichung nach umgestellt und die gefundene Relation für eingesetzt.

Es ergibt sich eine Gleichung für den Doppelspalt, der die Position eines k-ten Minimums angibt:

Beugung am Gitter

[Bearbeiten]

Will man das vorangegangene Kapitel des Doppelspaltes für Spalte verallgemeinern, so kommt man zu einen Mehrfachspalt oder optischen Gitter.

Der Abstand von einem Spalt zum nächsten sei konstant und wieder mit bezeichnet. Dieser Abstand wird auch als Gitterkonstante bezeichnet. Außerdem werden die Größen und eingeführt. Dabei soll den Gangunterschied zweier benachbarter Spalte angeben. Da wir – wie zuvor beim Doppelspalt – die Bedingung stellen ist eine konstante und für jedes „Spaltpaar“ gleich. Dagegen ist der Abstand vom ersten Spalt bis zum Letzten. Es gilt also

Der Grund warum im Nenner steht sich kann am Fall für klargemacht werden. Es kann allerdings problemlos die Näherung verwendet werden, da in den Experimenten immer sehr viel größer als 1 ist. Mathematisch gesehen ergibt sich allerdings das Problem das für (die angesprochene Näherung kann jetzt natürlich nicht angewendet werden) nicht definiert ist. Da bei einem Gitter auch keinen Sinn ergibt kann es getrost aus der Definitionsmenge entfernt werden. Es bleibt: bzw. äquivalent dazu .

Doppelspalt (oben) und Fünffachspalt (unten) im Vergleich

Wenden wir uns nun dem Versuchsergebnis auf dem Schirm zu. Es ist zu sehen, dass die Intensitäten in den Maxima stärker werden und deren Breite abnimmt.

Die Superposition dieser drei Wellen ist gleich null

Zur Bestimmung der Minima wird das Problem zunächst auf vereinfacht. Analog zum Doppelspalt ist nun die Gleichung zu lösen:

Da eine konstante ist, ist auch die Phasendifferenz zwischen den Wellen konstant. Es gilt also:

Dies ist unter anderem erfüllt für .

Verallgemeinert man dies nun für Spalte, so kommt man auf einen Gangunterschied für das k-te Minimum von

Speziell gilt

Zusammengenommen ergibt sich eine Gleichung, die die Lage des Minimums für Öffnungen angibt:

Beugung am Einfachspalt

[Bearbeiten]

Bislang wurde die Annahme gemacht, dass aus einem Spalt eine einzige Kugelwelle entspringt. Dies wollen wir im Folgenden verallgemeinern und somit eine genauere Formulierung des Spalt- und Gitterversuchs erreichen.

Die Verallgemeinerung erfolgt dadurch, dass statt einen Doppelspalt oder Gitter eine einzige (kleine) Öffnung beleuchtet werden soll. Dabei wird die Öffnung auch Einzelspalt oder Einfachspalt genannt. Des Weiteren soll der Abstand zum Schirm deutlich größer sein als die Einfachspaltöffnung (also ). Der restliche Aufbau und seine benutzten Größen sollen vom vorherigen Kapitel übernommen werden.

Wichtig für die theoretische Beschreibung des Einfachspaltes ist, dass jetzt nicht mehr angenommen wird, dass nur eine Kugelwelle ausgesendet wird, wie es beim Spalt der Fall war. Es ist vielmehr die Superposition von unendlich Vielen. Dabei zu beachten sind die verwendeten Wörter „Spalt“ und „Einfachspalt“, die zwar beide für eine Öffnung stehen, jedoch in ihrer physikalischen Beschreibung und den verwendeten Annahmen unterscheiden. Dies ist zwar nicht notwendig und kann je nach Quelle variieren, soll jedoch hier des besseren Verständnisses verwendet werden.

Falls man lediglich an den Minima bzw. Maxima der Intensitätsverteilung interessiert ist, kann man in wenigen Schritten in Analogie zu den vorherigen Abschnitten zum Ergebnis kommen. Dies soll im Folgenden nur schnell umrissen werden.

Man fasse dazu das vom Einfachspalt ausgehende Licht (abhängig vom Punkt auf dem Schirm) in Bündel zusammen. Dabei erfolgt die Einteilung so, dass der Gangunterschied , welcher sich näherungsweise aus bestimmen lässt, einer halben Wellenlänge entspricht. Je nach Anzahl der möglichen Bündel ergeben sich dadurch die Minima und Maxima.

Beschreibung der gesamten Intensitätsverteilung

[Bearbeiten]

Bislang wurden lediglich charakteristische Stellen - mit anderen Worten Extrema - in der Intensitätsverteilung untersucht. Im Folgenden soll nun ein Ausdruck für das komplette Spektrum gefunden werden. Dazu ist es nötig komplexe Zahlen einzuführen. Das häufig in Schulbücher zu findende sogenannte „Zeigermodell“ beruht auf ebendiesen Zahlen.

Crashkurs: Komplexe Zahlen

[Bearbeiten]

Zur vollständigen Behandlung der komplexen Zahlen sei zum Beispiel auf das Wikibook Komplexe Zahlen oder das Wikibookkapitel in Mathematik für die gymnasiale Oberstufe verwiesen

Motivation der Einführung der komplexen Zahlen ist es die Gleichung lösen zu können. Dies erscheint zunächst nicht lösbar und so ist es auch, wenn man als Zahlenmenge nur die reellen Zahlen zur Verfügung hat. Man kann aber versuchen die Zahlenmenge so zu erweitern, dass es möglich wird.

In der Zahlenmenge der komplexen Zahlen wird die Gleichung lösbar und lautet , wobei die sogenannte imaginäre Einheit ist und per Definition gilt:

Anmerkungen:

  • Manchmal wird auch das Zeichen oder (in Kursivschrift) verwendet.
  • Es können natürlich noch weitere Gleichungen der Form gelöst werden: .

Allgemein wird eine komplexe Zahl (sprich: x Element aus C) aus einem Realteil und einem Imaginärteil zusammengesetzt:

.

Anmerkungen:

  • Das in der Gleichung mit Real- bzw. Imaginärteil bezeichnete können irgendwelche reelle Zahlen aus sein
  • Die Zahl hat keinen Realteil bzw. anders formuliert ist ihr Realteil gleich null.
Die Gaußsche Zahlenebene und 3 Beispiele für Komplexe Zahlen

Die bisher bekannten Zahlenmengen können auf einem Zahlenstrahl aufgetragen werden. Da sich eine komplexe Zahl aus zwei reellen Komponenten zusammensetzt ist für solche Zahlen eine Ebene nötig. Diese komplexe Ebene wird auch als Gaußsche Ebene bezeichnet. Per Konvention ist dabei der Realteil die Abszisse (x-Achse) und der Imaginärteil die Ordinate (y-Achse). Somit kann eine komplexe Zahl als Pfeil, der bei 0 beginnt und auf seinen Wert in der Ebene zeigt, dargestellt werden.

Als nächstes sollen zwei Zahlen addiert werden: und . Die Addition erfolgt nun komponentenweise – Real- und Imaginärteil werden also getrennt voneinander betrachtet. Die Summe ist also:

Dies ist ähnlich zur Vektoraddition, wo ebenfalls die komponentenweise addiert wird. Die Addition kann man sich auch grafisch vorstellen, indem man an das Ende des einen Pfeils (der zum Beispiel zu gehört) den Anfang des zweiten Pfeils (der dann zu gehört) legt. Der Wert auf den der zuletzt platzierte Pfeil nun zeigt ist die Lösung der Aufgabe.

Bis hier sieht alles so aus, als ob es nur eine andere Formulierung von Vektoren wäre. Und in der Tat kann man in diesem Buchkapitel immer wenn von komplexen Zahlen die rede ist, sich zwei-dimensionale Vektoren vorstellen. Man muss aber dabei immer im Hinterkopf behalten, dass es keine Vektoren sind. Um etwas zu motivieren, dass man mit komplexen Zahlen noch viel mehr schöne Sachen machen kann zwei Beispiele:

  • Komplexe Zahlen lassen sich multiplizieren. Hier findet sich keine Analogie zu Vektoren mehr.
  • Eine wichtige Gleichung, die die eulersche Zahl, komplexe Zahlen und die trigonometrischen Funktionen Sinus und Kosinus in Relation zueinander setzt ist die  eulersche Formel

Anmerkung:

Intensitätsverlauf des Einfachspalts

[Bearbeiten]

Achtung! Dieser Abschnitt wird gerade noch geschrieben und beinhaltet Bearbeitungsnotizen.

Ausgangspunkt für die Herleitung ist das Gitter. Es soll angenommen werden, dass jeder Spalt im Gitter nur eine einzige Kugelwelle aussendet. Später wird sich dies durch geeignete Grenzwertbildung als ein gerechtfertigter Ansatz erweisen.

Des Weiteren soll das Gitter Spalte besitzen. Dadurch ergeben sich Phasenbeziehungen (wobei ) zwischen benachbarten Spalten. Wenn man nun noch annimmt, dass die Spalte gleichmäßig verteilt sind, vereinfacht es sich zu einen spaltunabhängigen Phasenunterschied .

Das gesammte Gitter soll breit sein.

Interessiert man sich nun für die Intensität eines Punktes auf dem Schirm, muss über die Amplituden aller dazu beitragenden Kugelwellen aufsummiert werden:

Notizen:

  • vorher in anderen Kapiteln Kugelwellen einführen
  • Grenzwertbildung
  •  Geometrische Reihe anwenden
(für )
  • Relation Phasendifferenz und Winkel/Schirmposition von oben verwenden

Thermodynamik

[Bearbeiten]
Wikibooks Dieses Buch wurde in den Wikibooks:Buchkatalog aufgenommen.


Einleitung

[Bearbeiten]

Die Begriffe »Wärme«, »Temperatur« und »Wärmemenge« sind uns so geläufig, und der Umgang mit ihnen ist uns so vertraut und selbstverständlich, dass wir uns kaum mehr vorstellen können, wie schwierig und mühsam es war, für diese Begriffe wissenschaftlich befriedigende Definitionen und für die entsprechenden physikalischen Größen brauchbare Messvorschriften zu schaffen. Sicherlich war im 18. Jahrhundert die Wärmelehre eines der schwierigsten Gebiete der Physik.

Zwar besitzt der Mensch in der Oberfläche seines Körpers Sensoren für die »Warmheit« (oder »Kaltheit«) eines Gegenstandes seiner Umwelt, aber dieser »Temperatursinn« ist grob und zudem leicht zu täuschen und daher physikalisch unbrauchbar. Wie also können wir das Phänomen »Wärme« wissenschaftlich angehen?

Wir verabreden zunächst, dass wir die sinnlich (wenn auch sehr ungenau) wahrnehmbare »Warmheit« eines Körpers als seine »Temperatur« bezeichnen wollen. Weiter wollen wir annehmen (!), dass reine Substanzen jeweils bei immer denselben Temperaturen schmelzen und sieden. (Wir müssen natürlich zugeben, dass es sich dabei um eine Unterstellung oder Vorannahme handelt, deren Richtigkeit erst sehr viel später gezeigt werden kann. Aber wie oftmals in der Physik zeigt sich auch hier, dass man ohne gewisse Vorannahmen nicht weiterkommt. Mit zunehmender Entwicklung des jeweiligen Teilgebiets der Physik können diese Vorannahmen jedoch stets bestätigt oder aber widerlegt werden.) Durch die Schmelz- und Siedepunkte reiner Substanzen können wir beliebig viele, zumindest für Vergleiche brauchbare Fixpunkte der Temperatur erhalten, ohne dass wir diesen Fixpunkten schon genaue Werte der Temperatur zuordnen könnten. (Dabei sind die Schmelzpunkte besser geeignet als die Siedepunkte, da sie in weit geringerem Maß vom Luftdruck abhängen.)

Der nächste Schritt ist die Beobachtung, dass zwei Körper, die sich längere Zeit in engem Kontakt mit einander befinden, offenbar dieselbe Temperatur annehmen. Bringt man z. B. in ein »Temperaturbad«, das aus schmelzendem und geschmolzenem Eis (also Wasser) besteht, ein Stück stark gekühltes Eis, das zunächst noch nicht schmilzt, so beginnt es nach einiger Zeit ebenfalls zu schmelzen. (Ein sehr skeptischer Kritiker könnte einwenden, es handle sich dabei doch immerhin um dieselbe Substanz, und es könnte bei einer anderen Substanz anders sein. Aber man könnte z. B. ein Stück Eisen in die Eis-Wasser-Mischung bringen und nach einiger Zeit zeigen, dass man mit dem eisernen Körper ein Stück Eis anschmelzen kann. – Aber zugegeben, es handelt sich auch hier im Grunde um eine Unterstellung, die nicht leicht oder zunächst gar nicht beweisbar ist.)

Weiter kann man beobachten, dass anhaltende Wärmezufuhr (etwa mit einer elektrischen Heizplatte oder einem Gasbrenner) schließlich alles Eis der Mischung zum Schmelzen bringt, und dass danach die Temperatur des Wasserbades ständig steigt (was zunächst mit der Hand bemerkt werden kann), und dass dann nach und nach verschiedene Substanzen im Wasser zu schmelzen beginnen, und zwar beispielsweise der Reihe nach: Ameisensäure, Glycerin, Phenol und woodsches Metall. Irgendwann beginnt dann das Wasser zu sieden. Mit dem ersten thermischen Messgerät, das gleich erklärt werden wird, können wir zeigen, dass beim Sieden trotz Wärmezufuhr die Temperatur des Wassers sich nicht ändert.

Beim Erwärmen des Wassers kann ferner beobachtet werden, dass gewisse Eigenschaften von Körpern, die sich in dem Wasserbad befinden, sich mit der Temperatur verändern, z. B. nehmen das Volumen und der spezifische elektrische Widerstand zu.

Jetzt sind wir in der Lage, ein vorläufiges Thermometer zu bauen: Nach einer Idee von CELSIUS (1742) wird an einen kleinen Hohlkörper aus Glas eine Kapillare von konstantem inneren Querschnitt angeschmolzen und der Glaskörper mit Quecksilber gefüllt. Der Glaskörper wird in ein Eis-Wasser-Gemisch gebracht und der Stand der Quecksilbersäule an der Kapillare markiert. Während das Gemisch erwärmt wird, steigt infolge der Ausdehnung des Quecksilbervorrats der Quecksilberfaden in der Kapillare, bis das Wasser zu sieden beginnt. Auch jetzt wird der Stand der Quecksilbersäule an der Kapillare markiert. Der Abstand der beiden Marken wird in 100 gleiche Teile geteilt. Damit besitzen wir ein Gerät zur Messung der CELSIUS-Temperatur eines Körpers. Bei der Anwendung muss lediglich der Quecksilbervorrat des Thermometers über eine gewisse Zeit in engem Kontakt mit dem Körper sein, und zwar so lange, bis der Quecksilberfaden nicht mehr länger wird.

Selbstverständlich ist diese Temperaturmessung völlig willkürlich. Das zeigt ein Vergleich mit einem ähnlichen Thermometer, das z. B. mit Oktan gefüllt ist, und das – außer an den beiden Fixpunkten – stets eine etwas andere Temperatur anzeigt als das Quecksilberthermometer. Aber immerhin haben wir ein objektives Temperaturmaß gefunden – wir müssen nur stets angeben, ob es sich bei einer Temperaturangabe um die »Quecksilbertemperatur« oder um die »Oktantemperatur« handelt.

Dies wirft sofort die Frage auf, ob es denn überhaupt eine objektiv richtige Temperaturmessung gebe, und wenn ja, woran diese zu erkennen wäre. Ja, man kann sogar mit Recht fragen, ob der Begriff »Temperatur« überhaupt einen Sinn und eine objektive Bedeutung habe. Ferner: Wodurch unterscheidet sich physikalisch ein wärmerer Körper von einem kälteren? Was geschieht in einem Körper, wenn man ihn erwärmt, wenn man ihm »Wärme zuführt«, was ja zunächst nichts anderes bedeutet, als dass man ihn in Kontakt mit einem wärmeren Körper bringt. Wodurch findet der dabei beobachtbare Temperaturausgleich statt? Fließt dabei irgendetwas vom wärmeren Körper auf den kälteren, oder umgekehrt? Und wenn ja, was ist dieses »Etwas«? Ist es so etwas wie ein Stoff, eine Art Materie? Tatsächlich glaubten die Physiker lange Zeit, die Wärme sei etwas Stoffliches, so etwas wie ein Gas oder eine Flüssigkeit, obgleich man beim Temperaturausgleich zwischen zwei Körpern keine Veränderung ihrer Masse nachweisen konnte. Was also ist Wärme?

Im Grunde haben es alle schon immer gewusst: Man kann Wärme durch Reibung erzeugen - folglich kann sie kein Stoff sein. Wer kalte Hände hat, reibt sie aneinander, und schon die Steinzeitmenschen haben nach diesem Prinzip Feuer gemacht. Nur hat sich lange Zeit niemand darüber tiefere Gedanken gemacht.

Überall dort, wo der Energieerhaltungssatz der Mechanik nicht gilt, nämlich überall dort, wo Reibung im Spiel ist, tritt Wärme auf. Wärme ist also – neben der kinetischen und der potentiellen Energie der Mechanik - eine weitere Erscheinungsform der Energie. Damit ist allerdings die Frage, was denn einen wärmeren Körper von einem kälteren konkret unterscheide, noch lange nicht beantwortet, es sei denn, man gibt sich mit der Antwort zufrieden, er enthalte eben mehr Wärme oder mehr Energie. Aber worin manifestiert sich denn dieses Mehr an Energie? Und könnte die Wärmeenergie schließlich nicht doch auf eine der klassischen Energieformen der Mechanik – kinetische und potentielle Energie – zurückgeführt werden? Die Physiker mussten längere Zeit mit diesen Ungewissheiten leben, und sie haben einstweilen die leichter zugänglichen Wirkungen der Wärme untersucht.

Hier eine kurze Darstellung der Ergebnisse:

 

Längen- und Volumenausdehnung von Festkörpern und Flüssigkeiten

[Bearbeiten]

Die Längenzunahme Δl eines stabförmigen Körpers bei Erwärmung ist (fast immer, wenn auch nur in gewissen Grenzen) proportional zur ursprünglichen Länge l0 und zur Temperaturerhöhung ΔT:



Die neue Länge des Körpers beträgt dann



Die vom Material des Körpers abhängige Konstante α heißt linearer Ausdehnungskoeffizient.

Entsprechend gilt für die Volumenzunahme ΔV (auch von Flüssigkeiten)



und für das neue Volumen



Der Faktor αV heißt Volumenausdehnungskoeffizient.

Wie man für einen Quader leicht zeigen kann, ist annähernd αV = 3 α,

was jedoch auch allgemein gilt.

Anmerkung: Da die Wärmeausdehnung bei Festkörpern und Flüssigkeiten sehr gering ist, spielt im Allgemeinen die Ausgangstemperatur, bei der die Länge l0 bzw. das Volumen V0 gemessen wurde, keine Rolle. Ganz anders ist dies bei Gasen.

 

Das Verhalten von Gasen bei Erwärmung

[Bearbeiten]

Da Gase kein definiertes Eigenvolumen besitzen, sondern jeden ihnen dargebotenen Raum ausfüllen und andererseits kompressibel sind, hängt ihr Verhalten bei Erwärmung von den jeweiligen Bedingungen ab. Wir unterscheiden zunächst die Erwärmung bei konstantem Druck (»isobar«) und die bei konstantem Volumen (»isochor«).

Bei der isobaren Erwärmung wird das Gas in einen Zylinder mit beweglichem Kolben eingeschlossen, auf den von außen eine konstante Kraft wirkt. Dadurch wird der Druck des Gases konstant gehalten, und das Volumen nimmt bei Erwärmung zu.

Bei der isochoren Erwärmung wird das Gas in einen druckfesten Behälter eingeschlossen, dessen Volumen sich (praktisch) nicht ändert. Dann steigt bei Erwärmung der Druck des Gases.

Wegen der beträchtlichen Volumen- bzw. Druckänderung ist es jetzt nötig, stets von dem Volumen bzw. von dem Druck bei einer ganz bestimmten Temperatur auszugehen. Hierfür bietet sich wegen ihrer bequemen Reproduzierbarkeit die Temperatur 0 °C an. Da wir es fortan nicht mehr mit Temperaturdifferenzen zu tun haben, sondern mit bestimmten Temperaturen, müssen wir zwischen der CELSIUS-Temperatur und der KELVIN-Temperatur T unterscheiden.


Isobare Erwärmung

[Bearbeiten]

Hier gilt das 1. Gesetz von GAY-LUSSAC:



Dieses Ergebnis legt die Einführung einer neuen Temperaturskala nahe, deren Nullpunkt bei – 273,15 °C liegt. Für die Temperaturangaben T gemäß dieser neuen Skala gilt dann



Diese Temperatur heißt absolute Temperatur oder KELVIN-Temperatur. Ihre Grade werden mit K (nicht °K) bezeichnet. Dann gilt:



Für die Volumina bei den Temperaturen T1 und T2 gilt dann:



oder



Bei isobarer Erwärmung ist das Volumen der absoluten Temperatur proportional.

 

Isochore Erwärmung

[Bearbeiten]

Hier gilt das (formal völlig gleiche) 2. Gesetz von GAY-LUSSAC. Dabei fällt auf, dass der Volumenausdehnungskoeffizient und der Spannungskoeffizient (das ist das Gegenstück zum Ausdehnungskoeffizienten bei isochorer Erwärmung) für alle Gase (bei genügendem Abstand vom Kondensationspunkt) gleich sind und beide denselben Wert γ = 1/(273,15 Grad) = 0,003661/Grad haben.



woraus wieder folgt



oder



Bei isochorer Erwärmung ist der Druck der absoluten Temperatur proportional.

Die Proportionalität, die in diesen Gesetzen ausgedrückt wird, ist übrigens ein deutlicher Hinweis darauf, dass das CELSIUS-Thermometer ein brauchbares Instrument ist, dass es die Temperaturen objektiv richtig anzeigt. CELSIUS hatte bei der Wahl der Thermometerflüssigkeit offenbar eine glückliche Hand: der Ausdehnungskoeffizient von Quecksilber ist – wie sich nachträglich herausgestellt hat - sehr konstant.

 

Das Gesetz von BOYLE-MARIOTTE

[Bearbeiten]

Auf den ersten Blick scheint dieses Gesetz gar nicht zur Thermodynamik zu gehören, denn es beschreibt das Verhalten eines Gases bei konstanter Temperatur, wenn entweder sein Druck oder sein Volumen geändert wird. Dabei kann jedoch seine Temperatur nur dadurch konstant gehalten werden, dass man dem Gas entweder Wärme entzieht oder ihm Wärme zuführt, indem man seinen Behälter in ein Wärmebad von konstanter Temperatur bringt. Dann gilt:



oder



oder



Druck und Volumen eines Gases sind bei konstanter Temperatur zueinander umgekehrt proportional.

Die Konstante in der letzten Gleichung hängt außer von der Gasmenge von ihrer Temperatur ab. Die Graphen der Zustandsgleichung sind Hyperbeln, deren Scheitel mit zunehmender Temperatur immer weiter vom Ursprung entfernt sind. Durch jeden Punkt des p-V-Diagramms geht genau eine Hyperbel, und zu jeder Hyperbel und damit zu jedem Punkt des Diagramms gehört eine ganz bestimmte Temperatur.


 

Das allgemeine Gasgesetz

[Bearbeiten]

Wir betrachten nun eine allgemeine Zustandsänderung eines Gases, bei der sich alle drei Zustandsgrößen p, V und T ändern. Im Zustand (1) mögen die drei Zustandsgrößen die Werte p1, V1 und T1 haben. Dann werde das Gas auf beliebige Weise in einen anderen Zustand (2) übergeführt, in dem seine Zustandsgrößen die Werte p2, V2 und T2 haben. Zur Vereinfachung der Rechnung nehmen wir die Veränderung des Zustandes auf einem ganz bestimmten Weg im p-V-Diagramm vor. (Die Allgemeingültigkeit des Ergebnisses wird dadurch nicht beeinträchtigt.)



Zunächst werde das Gas bei konstantem Volumen durch Erwärmung auf den Druck p2 gebracht. Seine Temperatur sei dann Tx. Für diese Zustandsänderung gilt:



Daraus folgt:



Dann werde das Gas bei konstantem Druck auf die Temperatur T2 erwärmt. Für diese Zustandsänderung gilt:



Mit dem Wert von Tx von oben ergibt sich dann:



oder



Bleibt noch zu klären, wovon die rechts stehende Konstante abhängt und wie groß sie ist. Das Volumen des Gases ist bei einer beliebigen Temperatur der Anzahl der darin enthaltenen Moleküle proportional. Da diese Zahl sehr groß ist, rechnet man bequemer mit der Stoffmenge n des Gases.


Zur Gedächtnisauffrischung:

Die SI-Einheit der Stoffmenge n ist das Mol (Einheitenzeichen: mol). Ein Mol ist die Stoffmenge, in der so viel Teilchen enthalten sind wie Atome in 12,000... g des Kohlenstoffisotops C 12. Die Stoffmenge 1 mol enthält bei allen Stoffen 6,022 1367*1023 Teilchen.


Dann kann man schreiben:



oder



Der Proportionalitätsfaktor Rm ist die (universelle) molare Gaskonstante

.

Dieses Gesetz heißt »allgemeines Gasgesetz« und gilt streng nur für das ideale Gas (siehe unten), mit guter Annäherung jedoch auch für reale Gase bei genügender Entfernung vom Kondensationspunkt.

Das allgemeine Gasgesetz wird häufig auch in der Form



geschrieben. Dabei ist m die Masse des Gases und R die »spezifische Gaskonstante«. Sie ist von der Art des Gases abhängig; ihre Einheit ist [R] = J/(kg K). Diese Variante der allgemeinen Gasgleichung ist in der Regel wesentlich umständlicher, da die spezifische Gaskonstante für jedes Gas bzw. Gasgemisch neu berechnet werden muss, da sie von dem Gewicht eines Gasmoleküls abhängig ist. Es existieren auch Tabellenwerke in denen die Werte der spezifischen Gaskonstanten nachgeschlagen werden können.  

Ideales Gas und reale Gase

[Bearbeiten]

Ideales Gas

[Bearbeiten]

Was der Massenpunkt in der Mechanik ist, ist das ideale Gas in der Thermodynamik: ein überaus nützliches (aber in sich widersprüchliches) Gedankenkonstrukt.


Das ideale Gas besteht aus Molekülen, die zwar Masse, aber kein Volumen besitzen, also aus Massenpunkten. Von den Molekülen des idealen Gases wird ferner angenommen, dass sie keinerlei Kräfte - weder anziehende noch abstoßende - aufeinander ausüben. Zusammenstöße zwischen Molekülen (wie sollen punktförmige Moleküle überhaupt zusammenstoßen können?) und Stöße gegen die Wände des Gefäßes, in dem sich das Gas befindet, spielen erst in der kinetischen Gastheorie eine Rolle.


Die praktische Bedeutung dieser Idealvorstellung beruht darauf, dass viele »reale Gase« sich nahezu wie das ideale Gas verhalten, insbesondere dann, wenn ihr Zustand weit genug vom Kondensationspunkt (dem Verflüssigungspunkt) entfernt ist. Von allen realen Gasen kommt Helium dem idealen Gas am nächsten.

 

Reales Gas, van-der-WAALS-Zustandsgleichung

[Bearbeiten]

Ein reales Gas unterscheidet sich vom idealen Gas vor allem dadurch, dass seine Moleküle Anziehungs- und Abstossungskräfte aufeinander ausüben und dass sie ein Eigenvolumen haben. Daher müssen am allgemeinen Gasgesetz Korrekturen angebracht werden, die auf van der WAALS zurückgehen. Man erhält dann eine im Allgemeinen recht brauchbare Näherung, die sogar noch für Flüssigkeiten gilt.

1. Die Anziehungskräfte zwischen den Molekülen wirken sich so aus, als ob der äußere Druck größer wäre, als er tatsächlich ist. Diese scheinbare Druckerhöhung (der so genannte Binnendruck) ist nach der Theorie proportional dem Quadrat der Stoffmenge und umgekehrt proportional dem Quadrat des Gasvolumens.

2. Das Volumen, das den Molekülen tatsächlich zur freien Bewegung zur Verfügung steht, ist kleiner als das Volumen V des Gefäßes, in dem sich das Gas befindet. Dies wird durch einen Term n b (das so genannte Kovolumen) berücksichtigt, wobei b nach der Theorie gleich dem vierfachen Eigenvolumen der Moleküle eines Mols ist.

Durch diese Korrekturen erhält man die Zustandsgleichung realer Gase, die van-der-WAALS-Gleichung:



Dabei sind a und b die von der Gasart abhängigen »van-der-WAALS-Konstanten«, die experimentell ermittelt werden können (siehe unten). a gibt hier Informationen über die Anziehung und b über die Abstossung.  

Die Isothermen eines realen Gases (hier: CO2) sehen so aus:



Die Gestalt der Kurven wird entscheidend von der Temperatur bestimmt. Genau eine der Isothermen hat einen Wendepunkt mit waagerechter Wendetangente. Bei Kohlendioxid ist es die Isotherme für T = 304 K (31 °C). Der Wendepunkt heißt kritischer Punkt Pk des Isothermenfeldes. Die dazu gehörigen Zustandsgrößen heißen kritischer Druck pk (hier: 7,38 Mpa), kritisches Volumen Vk (hier: 127,5 n m3/mol) und kritische Temperatur Tk.


Aus der Zustandsgleichung:



folgt:




Für den kritischen Punkt sind wegen der waagerechten Wendetangente die erste und die zweite Ableitung gleich null. Folglich ist



und



Dividiert man die obere Gleichung durch die untere, erhält man nach einfachen Umformungen



damit aus der oberen Gleichung



und aus der Zustandsgleichung dann



Daraus ergibt sich



(Für das ideale Gas hat der Bruch p Vm/(n RmT) überall den Wert 1.)

 


Umgekehrt kann man die van-der-WAALS-Konstanten aus den kritischen Zustandsgrößen berechnen (das ist ihre oben erwähnte experimentelle Bestimmung):




Drückt man nun auch n Rm durch die kritischen Größen aus:



und ersetzt in der van-der-WAALS-Gleichung die Konstanten durch diese Werte, so erhält man:



Führt man nun statt der Zustandsgrößen p, V und T die auf den jeweiligen kritischen Wert bezogenen Größen ein (die so genannten reduzierten Zustandsgrößen), nämlich


 

 


so erhält man die »reduzierte Zustandsgleichung«, in der (explizit) keine individuellen Konstanten und keine Einheiten mehr auftreten:



(Die Bedeutung dieser Gleichung, die für alle Substanzen gelten sollte, wird häufig überschätzt. Da sie aus der van-der-WAALS-Gleichung hervorgegangen ist, unterliegt sie natürlich den gleichen Einschränkungen hinsichtlich der Gültigkeit wie diese.)

 

Verflüssigung realer Gase

[Bearbeiten]

Unterhalb der kritischen Temperatur haben die van-der-WAALS-Isothermen zwei Extremwerte. Komprimiert man ein Gas von unterkritischer Temperatur, so kann man bei großer Vorsicht (keine Verunreinigungen im Gas und an der Gefäßwand, Erschütterungsfreiheit) allenfalls den Punkt erreichen, in dem die Kurve ein Maximum hat. Im Allgemeinen beginnt bereits vorher (in einem Punkt A) die Verflüssigung des Gases. Dabei werden im Innern des Gases beträchtliche Wärmemengen (Kondensationswärme) frei, die nicht schnell genug abgeführt werden können, und die Substanz - ein Gas-Flüssigkeits-Gemisch - befindet sich zunächst in einem chaotischen Zustand. Bei konstant gehaltenem Druck nimmt das Volumen stark ab, und nachdem sich wieder ein Gleichgewichtszustand eingestellt hat, befindet sich die Substanz – nunmehr als Flüssigkeit – im Punkt B des Diagramms. Wie später gezeigt werden kann, liegt die waagerechte Linie AB so, dass bei einer Bewegung auf dieser Linie von außen genau so viel Arbeit verrichtet werden muss, als wenn sich die Substanz auf der theoretischen Kurve bewegt hätte. Das heißt: die beiden grauen Flächenstücke sind gleich groß.



Im kritischen Punkt Pk befindet sich die Substanz in einem Zustand, in dem zwischen Flüssigkeit und Gas nicht unterschieden werden kann. Oberhalb der kritischen Temperatur kann das Gas auch durch beliebig hohen Druck nicht verflüssigt werden. Mit steigender Temperatur nähern sich die Kurven rasch den entsprechenden Isothermen des idealen Gases, und zwar besonders schnell im rechten Teil, im Bereich großer Volumina.

 

Messung von Wärmemengen; Wärmekapazität

[Bearbeiten]

Der Thermometrie – der Temperaturmessung – folgte bei der Erforschung der Wärme die Kalorimetrie, die Messung von Wärmemengen.

In der Kalorimetrie spielen Mischungsversuche mit gleichen oder unterschiedlichen Substanzen von unterschiedlicher Temperatur eine bedeutende Rolle. Auch hier kommt man ohne eine Vorannahme nicht weiter. Diese besteht hier in der Annahme, dass bei der Mischung (oder bei engem Kontakt) von zwei zunächst unterschiedlich temperierten Substanzen und dem nachfolgenden Temperaturausgleich die ursprünglich kältere Substanz genau die Wärmemenge aufnimmt, welche die ursprünglich wärmere Substanz abgibt. (Es wird damit also eine Art Erhaltungssatz der Wärmemenge postuliert.) Unter dieser Voraussetzung ergaben sich folgende Resultate:

1. Die zur Erwärmung eines Körpers benötigte Wärmemenge ΔQ ist seiner Masse m und der Temperaturänderung ΔT proportional. (Das gleiche gilt für die bei der Abkühlung abzuführende Wärmemenge.)



Das Produkt c m heißt Wärmekapazität C des Körpers, der Proportionalitätsfaktor c ist die spezifische Wärmekapazität c des Materials, aus dem der Körper besteht (früher unkorrekt spezifische Wärme oder Artwärme genannt). Folglich ist



und



oder als Differentialquotient geschrieben:



2. Bei Gasen besteht ein beträchtlicher Unterschied zwischen den spezifischen Wärmekapazitäten cp bei isobarer Erwärmung und cV bei isochorer Erwärmung, und zwar ist stets cp > cV. Beim idealen Gas genügt zur Erklärung dieses Unterschieds die Tatsache, dass das Gas bei isobarer Erwärmung (die in einem Zylinder mit beweglichem Kolben erfolgt) sich ausdehnt und dabei gegen den äußeren Druck (mechanische) Arbeit verrichtet. (Ein deutlicher Hinweis darauf, dass Wärme eine Form von Energie ist.) Bei isobarer Erwärmung wird also ein Teil der zugeführten Wärmeenergie in Arbeit umgesetzt, und nur der Rest führt zur Erwärmung des Gases.


 

Der 1. Hauptsatz der Thermodynamik (Energieerhaltungssatz)

[Bearbeiten]

Was besagt der 1. Hauptsatz?

[Bearbeiten]

1. Wärme ist eine Form von Energie. Gewinnt man Wärme durch Aufwendung mechanischer Arbeit oder wandelt man Wärme in mechanische Arbeit um, so geschieht dies nach einem festen »Umwandlungskurs«: 1 kcal = 4,187 kJ. (Nach internationaler Übereinkunft werden daher Wärmemengen nur noch in Joule angegeben.)

2. Die gesamte Energie eines abgeschlossenen Systems (das ist ein System von Körpern, das mit seiner Umgebung keine Energie austauscht) ist konstant. Die Gesamtenergie des Systems setzt sich zusammen aus Wärmeenergie, mechanischer und elektromagnetischer Energie, sowie aus der Energie, die seiner Masse entspricht.

3. Daraus folgt: Wegen der Konstanz der Energie eines abgeschlossenen Systems ist es nicht möglich, eine Maschine zu konstruieren, die fortwährend Arbeit verrichtet, ohne Energie aus einer externen Quelle zu beziehen (»Perpetuum mobile 1. Art«).

Der 1. Hauptsatz ist ein nicht beweisbarer Grundsatz – ein Axiom –, dessen Verlässlichkeit darauf gründet, dass noch nie eine Ausnahme beobachtet wurde.


 

Die innere Energie U eines Systems

[Bearbeiten]

Die Summe der in einem System enthaltenen Energien bezeichnen wir als seine innere Energie U.

Betrachten wir eine beliebige Zustandsänderung einer Substanz (eines »Systems«) von einem Punkt A im p-V-Diagramm zu einem Punkt B. Dabei spielt es keine Rolle, ob die Substanz dem allgemeinen Gasgesetz gehorcht oder nicht. Dem Punkt A entspricht umkehrbar eindeutig ein Zustand A des Systems und dem Punkt B ebenso ein Zustand B. Der Zustandsänderung von A nach B entspreche eine Änderung ΔU der inneren Energie U. Diese Änderung ist entweder mit einer Energieaufnahme von außen (ΔU > 0) oder mit einer Energieabgabe (ΔU < 0) nach außen verbunden. Die Änderung ΔU muss von dem Weg unabhängig sein, auf dem das System von A nach B gebracht wurde. Wäre das nicht so, dann wäre es möglich, einen Weg von A nach B und einen anderen Weg von B zurück nach A so zu wählen, dass insgesamt eine Energieabgabe nach außen stattfände. Das System wäre dann schließlich in seinen ursprünglichen Zustand zurückgekehrt und hätte dennoch Energie nach außen abgegeben; es wäre ein Perpetuum mobile 1. Art.

Wenn also die Funktion U in A zunächst den Wert UA hatte, dann in B den Wert UB = UA + ΔU hat, dann hat sie nach der Rückkehr zu A den Wert UB - ΔU = UA - ΔU + ΔU = UA. Die innere Energie U ist also eine (eindeutige) Funktion des Ortes im p-V-Diagramm mit der Eigenschaft einer Potentialfunktion, wie sie vom Gravitationsfeld und vom elektrischen Feld her bekannt ist: Bei einem geschlossenen Umlauf im p-V-Diagramm ist die Änderung der inneren Energie des Systems gleich null.

Der Wert der Funktion U hängt somit nur von p und V ab, und da jede der beiden Zustandsgrößen durch die andere und T ausgedrückt werden kann, ist also sowohl

U = U(p, V), als auch U = U(p, T) und U = U(V, T)

Da U von keinen weiteren Größen abhängt, ist das Differential


ein vollständiges Differential, genau wie die Differentiale der beiden anderen Funktionen:



Die innere Energie U eines Systems ändert sich dann und nur dann, wenn es mit der Umgebung Wärme Q oder Arbeit W austauscht, und zwar ist

wobei aufgenommene Energien stets positiv, abgegebene stets negativ zu zählen sind. und stellen anschaulich kleine Zu- oder Abfuhren von Wärme und Arbeit dar. Der inneren Energie U des Systems sieht man es aber nicht mehr an, ob sie durch Zufuhr von Wärme oder durch Zufuhr von Arbeit gewachsen ist. Dieser Unterschied soll mit dem Zeichen deutlich gemacht werden.

Diese Gleichung ist die mathematische Formulierung des 1. Hautpsatzes.

Die innere Energie des idealen Gases - Die Versuche von GAY-LUSSAC und von JOULE-THOMSON

[Bearbeiten]

Zu den wesentlichen Eigenschaften des (fiktiven) idealen Gases gehört, dass seine Moleküle – außer bei Zusammenstößen – keine Kräfte aufeinander ausüben. Daher sollte die innere Energie des idealen Gases vom Abstand seiner Moleküle und damit von seinem Volumen unabhängig sein.

Die experimentelle Überprüfung dieser Folgerung scheint zunächst daran zu scheitern, dass es in der Realität das ideale Gas nicht gibt. Da aber reale Gase mit zunehmender Entfernung von ihrem Kondensationspunkt sich in ihrem Verhalten asymptotisch dem Verhalten des idealen Gases annähern, sollte durch Extrapolation aus dem Verhalten realer Gase eine Aussage über die innere Energie des idealen Gases gewonnen werden können.

Es gibt zwei klassische Versuche zum (angeblichen oder tatsächlichen) Nachweis der Unabhängigkeit der inneren Energie des idealen Gases von seinem Volumen. Um den nicht seltenen Verwechslungen und Verwirrungen entgegenzuwirken, beschreibe und diskutiere ich diese beiden Versuche ausführlicher.


1. Beim Überströmversuch von GAY-LUSSAC (um 1820) wurden zwei Glasgefäße A und B, die durch ein Rohr mit Hahn verbunden waren, in ein als Kalorimeter gedachtes wärme-isoliertes Wasserbad getaucht.



Das Gefäß A war zunächst mit Luft gefüllt, das Gefäß B evakuiert. Nach dem Öffnen des Hahns dehnte sich die Luft auf etwa das Doppelte aus. Das Wasser des Kalorimeters zeigte dabei keine Temperaturänderung. GAY-LUSSAC schloss daraus, dass die innere Energie der Luft (also eines realen Gases) nicht vom Volumen abhängt, anderenfalls hätte eine Abkühlung eintreten müssen.

Aus heutiger Sicht war die Versuchsanordnung für ihren Zweck völlig unbrauchbar und der aus den Beobachtungen gezogene Schluss falsch. Da die Masse des Wassers sehr groß gegenüber der des Gases war und die spezifische Wärmekapazität von Wasser etwa viermal so groß ist wie die von Luft, hätte selbst eine beträchtliche Temperaturänderung des Gases sich nicht messbar auf die Temperatur des Wassers ausgewirkt. (Versuche zum Nachweis eines Null-Effekts sind ohnehin immer heikel.) Was GAY-LUSSAC bei dem Versuch tatsächlich hätte beobachten können, wäre das Verhalten eines Gases bei isothermer Volumenänderung gewesen: Das Wasserbad hat nämlich dem Gas seine eigene, praktisch konstante Temperatur aufgezwungen. GAY-LUSSAC hätte also mit einem zusätzlichen Druckmesser das BOYLE-MARIOTTE-Gesetz bestätigen können – mehr nicht. Dennoch galt dieser Versuch noch lange als Beweis für die Volumenunabhängigkeit der inneren Energie des idealen Gases - und muss noch heute manchmal dafür herhalten.


2. Beim Versuch von JOULE-THOMSON (ab 1852) wurde dieser Mangel der Versuchsanordnung vermieden. Ebenso vermieden wurde das Auftreten von turbulenten Strömungen im Gas, das sich dadurch abkühlt (innere Energie wird in Bewegungsenergie der Gasströmung verwandelt). Man müsste dann eine Weile warten, bis das Gas zur Ruhe gekommen ist und wieder seine »richtige« Temperatur angenommen hat.



Die Versuchsanordnung besteht aus einem wärmeisolierten Zylinder, der in der Mitte durch eine Schicht gepresster Watte geteilt wird. Das Gas befindet sich zunächst im linken Teil. Es hat das Volumen V1 und den Druck p1. Durch eine Kraft F1 auf den linken Kolben wird ein Druck erzeugt, der um ein Winziges höher als p1 ist. Dadurch wird das Gas sehr langsam (»quasi-stationär«) durch die Watteschicht hindurchgepresst. Eine auf den Kolben im rechten Teil wirkende Kraft erzeugt einen Druck p2, der deutlich kleiner als p1 ist.

Am Ende ist die ganze Gasmenge durch die Watteschicht hindurchgetreten und hat nun das Volumen V2 > V1. Die Temperatur wurde mittels Thermoelementen recht genau gemessen.

Der Zweck dieses Versuches war zunächst der Nachweis der Abkühlung realer Gase bei adiabatischer Expansion, d. h. bei Ausdehnung ohne Wärmeaustausch mit der Umgebung. Dieser dabei tatsächlich beobachtete Effekt, der auf der gegenseitigen Anziehung der Moleküle des realen Gases beruht, heißt seither JOULE-THOMSON-Effekt. Er wurde erstmals 1895 von LINDE zur Verflüssigung von Luft benutzt.

Der Versuch wurde bei Zimmertemperatur mit verschiedenen Gasen von unterschiedlichen Drucken durchgeführt. Das Ergebnis war eine geringfügige Temperaturabnahme (außer bei Wasserstoff, dessen Temperatur zunahm). Zu beobachten war ferner, dass die Temperaturabnahme umso kleiner war, je weiter das benutzte Gas von seinem Kondensationspunkt entfernt war. Nun ist bekannt, dass sich reale Gase dem Verhalten des idealen Gases umso mehr nähern, je weiter sie von ihrem Kondensationspunkt entfernt sind. So kann aus den Ergebnissen geschlossen werden, dass sich das ideale Gas bei dem Versuch nicht abkühlen würde.

Im Fall des idealen Gases wäre dann wegen T = konst. nach dem Gesetz von BOYLE-MARIOTTE:



Nun ist aber das Produkt p1 V1 gleich der Arbeit W1, welche die am linken Kolben wirkende Kraft am Gas verrichtet, und das Produkt –p2 V2 ist gleich der Arbeit W2, welche die am rechten Kolben wirkende Kraft am Gas verrichtet. Folglich ist


 


Beweis: Es ist



wobei A der Zylinderquerschnitt und s1 die Verschiebung des linken Kolbens bedeuten.

Analog findet man




 

Es ist also die von außen am Gas verrichtete Arbeit ΔW = 0. Wegen der Wärmeisolierung ist auch ΔQ = 0 und somit auch ΔU = 0.

Bei der Volumenänderung ist also die innere Energie des idealen Gases unverändert geblieben.

Folglich gilt: Die innere Energie einer konstanten Menge idealen Gases ist von seinem Volumen unabhängig.

 

Die Arbeit der äußeren Kräfte bei der Kompression eines Gases

[Bearbeiten]

Da die Gestalt des Gefäßes, in dem das Gas eingeschlossen ist, keine Auswirkung auf seine Zustandsvariablen hat, können wir uns die Aufgabe dadurch erleichtern, dass wir uns das Gas in ein zylindrisches Gefäß mit beweglichem Kolben eingeschlossen denken.

Auf den Kolben wirke von außen die Kraft F ein, die der Druckkraft des Gases Fp = p A das Gleichgewicht halte. Bei einer geringfügigen (und daher vernachlässigbaren) Erhöhung der äußeren Kraft wird das Gas langsam (»quasi-statisch«) komprimiert. Die äußere Kraft werde dabei ständig der sich ändernden Druckkraft des Gases angepasst.

Bei einer Verschiebung des Kolbens um die kleine Strecke Δs verrichtet die äußere Kraft die Arbeit ΔW, für die wegen der Druckveränderung gilt:



Dabei ist Fmin die kleinste und Fmax die größte bei der Verschiebung auftretenden Kraft.

Bei der Verschiebung ändere sich der Druck (monoton steigend oder fallend) vom ursprünglichen Wert p um Δp auf p + Δp. Entsprechend ändere sich auch die wirkende Kraft von A p auf A (p + Δp). Für die dabei verrichtete Arbeit gilt:



und mit




Das Gleichheitszeichen gilt im Fall Δp = 0, der nicht ausgeschlossen werden kann. Das Minuszeichen kommt wie folgt zustande: Wenn die Arbeit positiv ist, hat Δs dieselbe Richtung wie F. Dann aber ist wegen des abnehmenden Volumens ΔV negativ.

Nach Division durch ΔV erhält man daraus:



Für ΔV gegen null ergibt sich:



woraus folgt:



und schließlich



Die Differentiale dW und dV sind hier keine »verschwindend kleine Größen«, vielmehr gilt für sie die moderne mathematische Verabredung über Differentiale (siehe oben).


Durch Integration gewinnt man daraus



Dabei ist P0 diejenige Stammfunktion von p, die keine additive Integrationskonstante hat.

Die Ausführung der Integration setzt natürlich voraus, dass p als Funktion von V bekannt ist und dass eine Stammfunktion gefunden werden kann. Dann ist auch P0 eine Funktion von V: P0 = P0(V) und ebenso ist W = W(V).

Für V = V1 ist dann

W(V1) = - P(V1 )+ C

und für V = V2 ist

W(V2) = - P(V2) + C.

Folglich ist



(Dabei ergibt sich die letzte Identität aus den Regeln der Integralrechnung.)


Dieser Rechenprozess kann (ebenso wie ähnliche andere) mathematisch einwandfrei abkürzend wie folgt beschrieben werden:

Aus der Näherung



ergibt sich für das Differential (in seiner oben erklärten Bedeutung):



Diese Differentialgleichung kann sofort zwischen den Grenzen W1 und W2 bzw. V1 und V2 integriert werden:



Für den Sonderfall der isobaren Kompression (p = konst.) gilt:



 

Aus der Integralrechnung ist bekannt, dass der Wert des bestimmten Integral gleich der Fläche A1,2 unter der Kurve ist, die bei der Zustandsänderung durchlaufen wurde.




Wird die Kurve von links nach rechts durchlaufen (V1 < V2), ist die Fläche positiv und die Arbeit der äußeren Kräfte negativ. Wird die Kurve von rechts nach links durchlaufen, ist die Fläche negativ und die Arbeit der äußeren Kräfte positiv.

Wie man sofort erkennt, ist die Arbeit vom Weg abhängig, auf dem die Zustandsänderung vorgenommen wurde. Das bedeutet, dass W keine Zustandsfunktion (von der Art einer Potentialfunktion) ist. Der Grund dafür, dass die Arbeit von der Wegführung abhängt, ist leicht einzusehen: Läuft der Weg durch einen Bereich hoher Drucke (also weiter oben), ist in dem Integranden p dV der eine Faktor und damit auch das Produkt größer.

Nimmt man mit dem Gas eine Zustandsänderung längs einer geschlossenen Kurve vor, so ist die dabei vom Gas verrichtete Arbeit keineswegs null, sondern – wie man sich leicht klar machen kann - dem Betrag nach gleich der von der geschlossenen Kurve umfassten Fläche.



Wird bei der Zustandsänderung die Kurve rechts herum (also im Uhrzeigersinn) durchlaufen, ist die vom Gas verrichtete Arbeit positiv, anderenfalls negativ.

 

Die spezifische Wärmekapazität von Gasen

[Bearbeiten]

Mit dem 1. Hauptsatz können wir nun auch die unterschiedlichen spezifischen Wärmekapazitäten cp und cV der Gase untersuchen.

In der Thermodynamik ist es nützlich und daher auch üblich, die spezifischen Wärmekapazitäten nicht für die Masse 1 kg, sondern für die Stoffmenge 1 Mol anzugeben, d. h. die benötigte Wärmemenge nicht auf die Masse m, sondern auf die Stoffmenge n zu beziehen. Um Verwechslungen sicher zu vermeiden, kennzeichne ich diese »molaren spezifischen Wärmekapazitäten« (früher unkorrekterweise »Molwärmen« genannt) durch einen zusätzlichen Index m. Ihre Definitionen lauten dann:

Molare spezifische Wärmekapazität bei konstantem Volumen:



Molare spezifische Wärmekapazität bei konstantem Druck:



Dabei ist n die Stoffmenge des Gases.


1. Die molare spezifische Wärmekapazität bei konstantem Volumen

Nach dem 1. Hauptsatz ist



wobei



Bei konstantem Volumen ist dW = 0 und daher dQ = dU und somit



 


2. Molare spezifische Wärmekapazität bei konstantem Druck

Nach dem 1. Hauptsatz ist



und daher



Aus



und für p = konstant



Aus



Damit wird



Daraus ergibt sich schließlich



Für das ideale Gas vereinfacht sich die Gleichung, weil seine innere Energie vom Volumen unabhängig ist. Es ist dann



und daher



Aus dem allgemeinen Gasgesetz in der Form



folgt



und damit ergibt sich schließlich



 


Für ein reales Gas greifen wir zur Berechnung von cp, mcV, m auf die allgemein gültige Gleichung von oben zurück:



Bei realen Gasen ist die innere Energie U auch vom Volumen abhängig (und daher ist der erste Term in der Klammer nicht gleich null), weil zwischen den Molekülen Anziehungskräfte (»Kohäsionskräfte«) wirken. Wenn das Gas sich ausdehnt, muss es gegen diese Kräfte Arbeit verrichten. Dabei wächst der mittlere Abstand der Moleküle und ihre potentielle Energie nimmt zu. Die Expansionsarbeit wird also in innere potentielle Energie umgesetzt.

Der »Binnendruck«, gegen den diese Arbeit zu verrichten ist, beträgt bei einem van-der-WAALS-Gas (siehe van-der-WAALS-Gleichung) n2a/V2. Bei einer Volumenzunahme um ΔV ist daher von den inneren Kräften die Arbeit



zu verrichten. Wir nehmen nun – was durchaus plausibel ist - an, die gesamte innere Energie U eines realen Gases wäre die Summe aus einem nur von der Temperatur abhängigen Anteil U1 und aus einem nur vom Volumen abhängigen Anteil U2:


U = U1 + U2.


Der erste Summand ist die dem Wärmegehalt entsprechende Energie, der zweite Summand ist die »innere potentielle Energie« der Moleküle.

Das vollständige Differential der inneren Energie U ist dann



da die partielle Ableitung von U1 nur von T und U2 nur von V abhängt. Der erste Summand in dieser Gleichung ist die Zunahme der inneren Energie infolge der Temperaturerhöhung dT, der zweite Summand die Zunahme der inneren Energie durch die Volumenzunahme dV.

Demnach ist dU2 das oben berechnete Differential dW der Expansionsarbeit:



Also ist



Aus der van-der-WAALS-Gleichung



berechnen wir die partielle Ableitung



Damit wird



oder



Der Term



ist nach der Zustandsgleichung identisch mit



Damit wird



Vernachlässigt man den Term n b gegenüber V, so erhält man als Näherung



wobei Vm =V/n das molare Volumen ist.

 

Die Energiefunktion für das ideale Gas und für reale Gase

[Bearbeiten]

Ausgehend von der Funktion U = U(V, T) erhalten wir für ihr vollständiges Differential den Ausdruck



1. Für das ideale Gas ist



und somit



und



Dabei ist U0 die innere Energie des Gases für T = 0, die in der Thermodynamik gleich null gesetzt wird. (Tatsächlich besitzt das Gas dann nur noch die Energie, die seiner Masse entspricht. Solange keine chemischen Reaktionen und keine Kernreaktionen stattfinden, ändert sich diese nicht. Sie kann daher außer Betracht bleiben.) Setzt man außerdem cV, m = konstant, so wird



2. Für ein reales Gas ist ebenfalls



Die partielle Ableitung von U nach V dagegen ist jetzt nicht null, sondern



woraus folgt



Damit wird



Wenn die spezifische Wärmekapazität cV, m von der Temperatur unabhängig ist, was praktisch für alle Gase (außer Wasserstoff) bis ca. 1000 K zutrifft, so ist



Wir vereinbaren wieder, dass die gesamte innere Energie der Substanz am absoluten Nullpunkt gleich null sein soll; es sei also U0 = 0. Dann muss



sein, wobei V0 das Volumen der Substanz am absoluten Nullpunkt ist. Dieses ist praktisch gleich dem Volumen VF der Substanz, nachdem das Gas zur Flüssigkeit kondensiert ist.

Damit ergibt sich schließlich


 

Die Enthalpie

[Bearbeiten]

Führt man den JOULE-THOMSON-Versuch mit einem realen Gas aus, dann ändert sich dessen Temperatur und damit auch seine innere Energie U. Diese sei zu Beginn U1, danach U2. Vom linken Kolben wird die Arbeit p1 V1 aufgewendet, während am rechten Kolben das Gas die Arbeit p2 V2 verrichtet. Da kein Wärmeaustausch mit der Umgebung stattfindet, muss nach dem 1. Hauptsatz die Änderung der inneren Energie gleich der Differenz der beiden Arbeiten sein:

U2 - U1 = p1 V1 - p2 V2

oder

U2 + p2 V2 = U1 + p1 V1.


Bei einem realen Gas bleibt beim JOULE-THOMSON-Versuch nicht die innere Energie U sondern die Summe U + p V konstant.

Diese Summe heißt Enthalpie H.



Da sowohl U als auch p und V nur Funktionen der Zustandsvariablen p, V und T des Gases sind, ist auch die Enthalpie nur von diesen Zustandsgrößen abhängig.

Also ist auch die Enthalpie eine Zustandsfunktion des Gases.

 

Der JOULE-THOMSON-Effekt

[Bearbeiten]

Das Verhalten realer Gase bei adiabatischer Expansion


Die innere Energie eines realen Gases ist (siehe oben)



Für seinen Druck p gilt nach der van-der-WAALS-Gleichung



Folglich ist seine Enthalpie



woraus folgt:



und



Vernachlässigt man n b gegen V und setzt näherungsweise cV, m + Rm = cp, m , so erhält man wegen ΔH = 0 schließlich



Die auftretende Veränderung der Gastemperatur ist also proportional zu ΔV (und damit auch proportional zu Δp); außerdem unterliegt sie zwei entgegengesetzt wirkenden Einflüssen: Die Anziehung der Moleküle, die sich in a ausdrückt, bewirkt bei der Ausdehnung eine Abkühlung, da ja gegen diese Anziehungskräfte Arbeit verrichtet werden muss. Im Gegensatz dazu bewirkt die Verminderung des effektiven Volumens durch das Eigenvolumen der Moleküle (das sich durch b ausdrückt) eine Erwärmung. Und schließlich beeinflusst die Temperatur T das Vorzeichen des Effekts. Bei positivem ΔV ergibt sich eine Abkühlung, wenn Rm b T < 2 a, also



ist.

Bei Luft tritt schon bei 0 °C eine deutliche Abkühlung ein, während Wasserstoff sich bei derselben Temperatur bei der Expansion erwärmt.

 

Adiabatische Zustandsänderungen des idealen Gases

[Bearbeiten]

Adiabatische Zustandsänderungen eines Systems sind solche, bei denen kein Wärmeaustausch mit der Umgebung stattfindet.

Eine adiabatische Zustandsänderung kann dadurch verwirklicht werden, dass man entweder das System vollständig gegen Wärmeaustausch isoliert (was natürlich nur angenähert möglich ist) oder aber die Zustandsänderung so schnell ablaufen lässt, dass dem System keine Zeit für einen nennenswerten Wärmeaustausch bleibt. Zum Beispiel sind die Zustandsänderungen (Druck- und Volumenänderungen) eines Mediums beim Durchgang einer Schallwelle adiabatisch.

Aus dem 1. Hauptsatz in der Form



ergibt sich mit dQ = 0



und mit (siehe dazu "Die Arbeit der äußeren Kräfte bei der Kompression eines Gases")



folgt daraus



Aus der Energiefunktion des idealen Gases ergibt sich



und somit



Aus dem allgemeinen Gasgesetz ergibt sich für dT:



und somit



und nach einfachen Umformungen schließlich



Mit der Abkürzung



ergibt die Integration der Gleichung



und schließlich



Wegen cp, m > cV, m ist κ > 1. Die Graphen der letztgenannten Funktion (die "Adiabaten") verlaufen also im p-V-Diagramm steiler als die Isothermen.

Indem man in der obigen Gleichung mit Hilfe der allgemeinen Zustandsgleichung jeweils eine der beiden Variablen durch T ersetzt, erhält man die Gleichungen



und


 

Der 2. Hauptsatz der Thermodynamik

[Bearbeiten]

 

Der CARNOT-Kreisprozess

[Bearbeiten]

Der CARNOT-Kreisprozess ist die idealisierte Zustandsänderung eines idealen Gases längs einer geschlossenen Kurve. Er besteht aus vier Teilprozessen, nämlich aus isothermen bzw. adiabatischen Expansionen und Kompressionen des Gases, das in einem Zylinder mit beweglichem Kolben eingeschlossen ist. Bei den Expansionen und Kompressionen sei der von außen durch den Kolben ausgeübte Druck nur sehr wenig verschieden von dem Druck des Gases, sodass alle Vorgänge mit sehr geringer Geschwindigkeit ablaufen. Durch eine minimale Änderung des jeweiligen Drucks könnte jeder Vorgang also auch umgekehrt verlaufen. Solche jederzeit umkehrbaren Prozesse werden in der Fachsprache als reversibel bezeichnet.

Im p-V-Diagramm sieht der Kreisprozess so aus:



Der Weg von A nach B und der von C nach D verlaufen auf einer Isotherme, der Weg von B nach C und der von D nach A auf einer Adiabate. Die Realisierung erfolgt, indem das Gas sich während der Zustandsänderung A-B im Wärmeaustausch mit einem Wärmebad der Temperatur T1 befindet, während der Zustandsänderung C-D im Wärmeaustausch mit einem Wärmebad der Temperatur T2. Während der Prozesse B-C und D-A dagegen ist der Zylinder, in dem sich das Gas befindet, thermisch isoliert. Damit die Temperaturen T1 und T2 während des Prozesses tatsächlich konstant bleiben, müssen die beiden Wärmebäder von praktisch unendlicher Wärmekapazität sein.


Die Temperatur des Gases in den Punkten A und B ist demnach gleich T1, in den Punkten C und D gleich T2.

Der Einfachheit halber nehmen wir an, die Stoffmenge des Gases sei 1 mol.

 

1. Das Gas wird isotherm expandiert (A-B). Die vom Gas dabei verrichtete Arbeit ist



Nach dem 1. Hauptsatz nimmt das Gas bei der Expansion eine der von ihm verrichteten Arbeit gleiche Wärmemenge aus dem Wärmebad auf.


2. Das Gas wird adiabatisch expandiert, wobei es sich wegen der nach außen abgegebenen Arbeit abkühlt. Die Expansion wird genau dann gestoppt, wenn das Gas die Temperatur T2 des zweiten Wärmebades angenommen hat. Das Volumen, das es dabei annimmt, ist



Die bei diesem Vorgang vom Gas verrichtete Arbeit ist



und mit




Mit Gleichung (2) ergibt sich daraus



3.Das Gas wird – in Kontakt mit dem zweiten Wärmebehälter – isotherm auf das Volumen V4 komprimiert, das so gewählt wird, dass von ihm aus das Gas durch adiabatische Kompression sein ursprüngliches Volumen V1 und damit auch seine ursprüngliche Temperatur T1 annehmen kann. Das Volumen V4 ergibt sich aus der Gleichung



Die dabei vom Gas verrichtete (negative) Arbeit ist (analog zum ersten Vorgang)



Bei diesem Vorgang wird von außen Arbeit zugeführt; nach dem 1. Hauptsatz wird eine gleiche Wärmemenge an das Temperaturbad abgegeben.


4. Das Gas wird nun adiabatisch auf das Volumen V1 komprimiert. Die dabei vom Gas verrichtete Arbeit ist negativ und beträgt analog zum zweiten Prozess



Das Gas befindet sich nun wieder in seinem Ausgangszustand. In seiner Umgebung ist aber durch den Kreisprozess eine Reihe von Veränderungen eingetreten: Das Gas hat dem ersten Wärmebehälter bei der Temperatur T1 eine bestimmte Wärmemenge entzogen und dem zweiten Wärmebehälter bei der Temperatur T2 eine bestimmte Wärmemenge zugeführt. Außerdem hat das Gas nach außen Arbeit abgegeben und von außen Arbeit aufgenommen. Die Summe dieser Arbeiten ist WA,B + WB,C + WC,D + WD,A und entspricht der im Diagramm umlaufenen Fläche. Bei der Berechnung der Summe zeigt sich, dass WD,A= - WB,C ist. Somit beträgt die Summe



Nach Gleichung (2) ist



und nach Gleichung (4)



und somit



und



Damit ergibt sich



Die dem ersten Wärmebehälter entzogenen Wärmemenge ist nach dem 1. Hauptsatz gleich der im ersten Teilprozess vom Gas verrichteten Arbeit, also



Von dieser Wärmemenge wurde bei dem Kreisprozess nur die oben angegebene Menge in Arbeit umgesetzt, der Rest wurde an den zweiten Wärmebehälter abgegeben. Diese »Abwärmemenge« beträgt – entsprechend der im 3. Teilprozess aufgenommenen Arbeit –



Betrachtet man den CARNOT-Kreisprozess als das Arbeitsprinzip einer »Wärmekraftmaschine« (besser: einer Wärme-Arbeits-Maschine), die zur Erzeugung mechanischer Arbeit aus Wärmeenergie dient, dann ist der Quotient aus gewonnener Arbeit und aufgewendeter Wärmeenergie der »Wirkungsgrad« η der Maschine:



Die Berechnung des Wirkungsgrades erfolgte hier für einen (einzigen) Zyklus des Kreisprozesses. Da dieser mit dem gleichen Ergebnis jedoch beliebig oft wiederholt werden kann, gilt das Resultat allgemein.


Mit dem Begriff »Wirkungsgrad« lässt sich die energetische Seite des Prozesses so beschreiben:


Die Maschine entnimmt dem Wärmespeicher 1 die Wärmemenge Q1 und erzeugt daraus die Arbeit W = ηQ1. Der Rest Q2 = (1 - η)Q1 wird dem Wärmespeicher 2 als Abwärme zugeführt.


Da der Kreisprozess in allen seinen Teilen reversibel geführt wurde, kann er auch insgesamt umgekehrt werden. Dann wird die Prozesskurve in umgekehrter Richtung (also gegen den Uhrzeigersinn) durchlaufen. Dabei wird unter Arbeitaufwand von außen dem Wärmespeicher 2 die Wärmemenge Q2 = (1 – η)Q1 entzogen und die Summe aus dieser Wärmemenge und der äußeren Arbeit W dem Wärmespeicher 1 zugeführt. Die dabei aufzuwendende Arbeit ist so groß wie die oben von der Maschine erzeugte, also gleich W = ηQ1. Die dem Wärmespeicher 1 zugeführte Wärmemenge ist so groß wie die ursprünglich entzogene, also gleich Q1. Dies ist das Prinzip einer idealen Wärmepumpe.

Der Wirkungsgrad ηQ der Wärmepumpe ist das Verhältnis der freigesetzten Wärmemenge zur aufgewendeten Arbeit und somit gleich dem Kehrwert des Wirkungsgrades der Wärme-Arbeitsmaschine:



Dass der Wirkungsgrad einer Wärmepumpe beträchtlich größer als 1 sein kann, widerspricht nicht dem 1. Hauptsatz. In der Gesamtenergiebilanz, für die ja der 1. Hauptsatz gilt, ist nämlich noch die aus dem Wärmespeicher 2 aufgenommene Wärmemenge zu berücksichtigen.


 

Ein Perpetuum mobile 2. Art

[Bearbeiten]

(Im Folgenden haben wir es mit einem Aggregat von zwei Systemen zu tun. Um daraus möglicherweise entstehenden Verwirrungen vorzubeugen, werden alle Wärme- und Arbeitsmengen positiv gezählt. Ihre Fließrichtungen sind durch Pfeile gekennzeichnet.)

Nehmen wir an, es gäbe einen Kreisprozess von höherem Wirkungsgrad als der des CARNOT-Prozesses und es würde eine Wärme-Arbeitsmaschine gebaut, die nach diesem Prozess arbeitet. Wir nennen sie eine Super-CARNOT-Maschine (SCM). Ihr Wirkungsgrad sei ηS > η, wobei η der oben berechnete Wirkungsgrad einer CARNOT-Maschine (CM) ist. Wir kombinieren nun die beiden Maschinen wie folgt:


Die Supermaschine entnimmt pro Zyklus dem Wärmespeicher 1 die Wärmemenge Q1 und wandelt einen Teil davon mit dem Wirkungsgrad ηS in mechanische Arbeit W = ηSQ1 um. Der Rest (1 – ηS)Q1 fließt in den Wärmespeicher 2. Genau diese Wärmemenge entnimmt eine als Wärmepumpe arbeitende CARNOT-Maschine dem Wärmespeicher 2 und befördert sie unter Aufwand mechanischer Arbeit (und um die gleiche Wärmemenge vermehrt) zurück in den Wärmespeicher 1.

Zum »Abpumpen« der Wärmemenge (1 – η)Q1 braucht die als Wärmepumpe arbeitende CARNOT-Maschine (siehe dort) die Arbeit W = ηQ1. Zum Abpumpen der Wärmemenge (1 – ηS)Q1 benötigt sie dann die Arbeit



Wegen ηS > η ist diese Arbeit kleiner als die von der Supermaschine abgegebene. Das gesamte Aggregat gibt also nach außen Arbeit ab und entnimmt dafür lediglich dem Speicher 1 Wärme.

Die zurückgeführte Wärmemenge Q3 ist nämlich kleiner als Q1, da CM weniger Arbeit aufnimmt, als SCM abgegeben hat. Dies kann auch durch Rechnung bestätigt werden:




woraus wegen ηS > η folgt: Q3 < Q1.

Weitere Veränderungen in der Umgebung des Aggregats gibt es nicht, da der Wärmeinhalt des Speichers 2 unverändert bleibt (der Speicher daher sogar entbehrlich geworden ist).

Ein Aggregat dieser Art wäre kein Perpetuum mobile 1. Art, da der 1. Hauptsatz gewahrt bleibt. Es käme aber in seiner praktischen Bedeutung einem solchen nahezu gleich, da es auf der Erde (in den Meeren und in größerer Tiefe) fast unbeschränkte Wärmevorräte gibt, die ohne störende Abwärme in Arbeit umgewandelt werden könnten. Man nennt daher ein solches Aggregat ein Perpetuum mobile 2. Art.

 

Die Aussagen des 2. Hauptsatzes

[Bearbeiten]

Vielfältige praktische Erfahrungen haben jedoch gezeigt, dass es nicht möglich ist, ein Perpetuum mobile 2. Art zu bauen. Das bedeutet: Es ist unmöglich, eine Maschine zu bauen, die lediglich einem Wärmespeicher Wärme entnimmt und diese in Arbeit umwandelt, ohne dass dabei auch andere Veränderungen in der Umgebung stattfinden. (Abwärme!)

Dies ist eine erste Formulierung des 2. Hauptsatzes der Thermodynamik. Er ist genau wie der 1. Hauptsatz ein Erfahrungssatz. Eine weitere – im Wesen äquivalente – Formulierung folgt unten.

Eine verfügbare Wärmemenge kann demnach nur zum Teil in mechanische Arbeit umgewandelt werden. Der umgewandelte Bruchteil (= Wirkungsgrad) ist umso höher, je höher die Temperatur T1 und je niedriger die Temperatur T2 ist.

Als erste Folgerung aus dem 2. Hauptsatz ergibt sich: Es gibt keinen Kreisprozess mit einem höheren Wirkungsgrad als dem des CARNOT-Prozesses, folglich auch keine Super-CARNOT-Maschine. Der CARNOT-Prozess ist also der ideale Kreisprozess mit höchstmöglichem Wirkungsgrad.

Der CARNOT-Kreisprozess hat aber nicht nur als Wärme-Arbeitsmaschine den größtmöglichen Wirkungsgrad, sondern auch – umgekehrt laufend - als Wärmepumpe. Stellen wir uns vor, es gäbe eine Super-CARNOT-Wärmepumpe und wir würden diese in einem Aggregat ähnlich wie oben (nur umgekehrt laufend) mit einer CARNOT-Wärme-Arbeitsmaschine kombinieren. Dann könnte die Super-CARNOT-Wärmepumpe mit einer geringeren Arbeitsmenge, als ihn die CARNOT-Maschine liefert, die gleiche Wärmemenge hinaufpumpen, wie sie die CARNOT-Maschine verbraucht. Im Endeffekt würde Arbeit erzeugt und dabei würde lediglich dem zweiten Wärmespeicher Wärme entzogen. Dies aber würde dem zweiten Hauptsatz widersprechen.

Wir können unser hypothetisches Aggregat aber noch zu einer weiteren Erkenntnis nützen: Stellen wir uns vor, wir würden die gesamte von der CARNOT-Maschine gelieferte Arbeit zum Betrieb der Super-CARNOT-Wärmepumpe verwenden. Dann könnte damit - wieder unter Wärmeentnahme aus dem zweiten Speicher – dem ersten Speicher mehr Wärme zugeführt werden, als die CARNOT-Maschine verbraucht hat. Dem unteren Wärmespeicher würde also ohne äußeren Arbeitsaufwand Wärme entzogen und dem oberen Speicher zugeführt. Da es aber keine Super-CARNOT-Wärmepumpe gibt, ist auch dieser Effekt nicht möglich.

Der 2. Hauptsatz besagt also auch, dass Wärme nicht ohne äußeren Arbeitsaufwand von einem Körper niedrigerer Temperatur auf einen Körper höherer Temperatur fließen kann.


 

Die mathematische Formulierung des 2. Hauptsatzes – Die Entropie

[Bearbeiten]

Der 2. Hauptsatz gibt uns also auf der Erfahrung beruhende Kriterien zur Unterscheidung von möglichen und unmöglichen Prozessen, die mit Hilfe des 1. Hauptsatzes nicht zu unterscheiden sind:

- Wärmenergie kann nicht restlos in mechanische Energie umgewandelt werden,

- Wärmeenergie kann nicht ohne äußeren Arbeitsaufwand von einem kälteren zu einem wärmeren Wärmespeicher übergehen.

Der 2. Hauptsatz benennt damit mögliche und unmögliche Ablaufrichtungen bestimmter Prozesse: Mechanische Energie kann durch Reibung vollständig in Wärmeenergie umgewandelt werden, aber nicht umgekehrt Wärmeenergie vollständig in mechanische Energie. Und: Wärmeleitungsvorgänge können nur in einer Richtung verlaufen, nämlich in derjenigen, die zum Temperaturausgleich der beteiligten Körper führt.

Daraus folgt auch, dass Bewegungsvorgänge, die mit Reibung und dadurch mit Wärmeerzeugung verbunden sind, nicht vollständig rückgängig gemacht werden können, weil die erzeugte Wärme nicht restlos in mechanische Energie zurück verwandelt werden kann. Der immer wieder als Beispiel angeführte Ziegel, der vom Dach fällt, wandelt seine potentielle Energie zunächst in kinetische Energie und Wärme (durch Luftreibung) um, und dann beim Aufprall auf den Boden seine kinetische Energie vollständig in Wärmeenergie. Es ist unmöglich, ihn unter Rückwandlung der Wärme in mechanische Energie wieder aufs Dach zu befördern.

Um weitere Folgerungen ziehen zu können, versuchen wir jetzt, dem 2. Hauptsatz eine mathematische Form zu geben, ähnlich wie es beim 1. Hauptsatz geschehen ist.

Ich gehe dabei von zwei Gleichungen aus, die wir beim CARNOT-Prozess erhalten haben:



(Dabei zählen vom System abgegebene Wärmemengen - z.B. Q2 - jetzt wieder negativ.)

Aus der letzten Gleichung folgt:



Ferner hatte sich ergeben:



und somit ist



Es soll nun versucht werden, dieses für den CARNOT-Prozess gültige Ergebnis zu verallgemeinern. Dazu betrachten wir einen beliebigen Kreisprozess eines beliebigen Gases (also nicht notwendig eines idealen Gases), der im p-V-Diagramm durch eine geschlossene Kurve dargestellt ist. Diese Kurve werde hier im Uhrzeigersinn durchlaufen, sodass dabei vom System mechanische Arbeit nach außen abgegeben wird.

Wir denken uns nun die p-V-Ebene von einem dichten Netz von Isothermen und Adiabaten bedeckt. Von diesem Netz und dem Kreisprozess gibt die folgende Abbildung einen sehr kleinen Ausschnitt wieder, der jedoch genügt, um zeigen, worum es geht.



Nun geschieht zweierlei:

1. Wir denken uns den betrachteten Kreisprozess statt entlang der schwarzen Randkurve auf einer zickzackförmigen Kurve geführt, die abwechselnd aus einem Stück einer Adiabate und einem Stück einer Isotherme verläuft. (Die Abschnitte der Zickzack-Kurve werden später beliebig klein gemacht.)

2. Wir verbinden das betrachtete System mit einer CARNOT-Maschine, welche die vom System abgegebene (bzw. aufgenommene) Wärme aufnimmt (bzw. abgibt). (Ein solcher Wärmeaustausch findet natürlich nur auf den Isothermen statt.) Zur CARNOT-Maschine gehöre ein Wärmespeicher der Temperatur T0, von der wir der Einfachheit halber annehmen wollen, sie sei höher als die bei dem betrachteten Kreisprozess auftretenden Temperaturen. Wenn das System Wärme abgibt, »pumpt« die CARNOT-Maschine diese unter äußerem Arbeitsaufwand in den Wärmespeicher; wenn das System Wärme aufnimmt, entnimmt die CARNOT-Maschine diese dem Wärmespeicher und führt sie unter Gewinnung mechanischer Arbeit) dem System zu. Das System stellt also für die CARNOT-Maschine den zweiten Wärmespeicher dar.

Die Wärmemenge, die bei einem solchen Vorgang dem Speicher bei der Temperatur T0 entnommen wird, sei ΔQ0, die gleichzeitig dem System bei der Temperatur TS zugeführte Wärmemenge sei ΔQS. (Wenn ΔQ0 positiv ist, ist ΔQS negativ und umgekehrt.) Für die CARNOT-Maschine gilt dann entsprechend der obigen Gleichung:



 

Wir müssen nun noch zeigen, dass die Wärmemenge, die dem System beim Durchlaufen eines Stücks der Zickzack-Kurve zugeführt (oder entnommen) wird, gleich der Wärmemenge ist, welche man dem System zuführen (oder entnehmen) müsste, wenn es die tatsächliche Kurve des Prozesses durchliefe.

Dazu betrachten wir einen Kreisprozess um eines der kleinen Dreiecke herum, wobei das Kurvenstück des ursprünglichen Kreisprozesses im Gegensinn durchlaufen wird (grauer Doppelpfeil).


Die Änderung ΔUACB der inneren Energie U für den geschlossenen Umlauf ist null und setzt sich zusammen aus den abgegebenen Arbeiten und den abgegebenen Wärmemengen:



Nun ist aber die Summe aller abgegebenen Arbeiten ΣABCΔW (dem Betrag nach) gleich der Fläche des Dreiecks ABC, und diese ist verschwindend klein gegenüber der Fläche des Trapezes, das die auf der Strecke CB verrichtete Arbeit ΔWCB, darstellt und diese Arbeit ist nahezu gleich der Wärmezufuhr ΔQCB auf dieser Teilstrecke. (Der geringe Unterschied, der davon herrührt, dass die innere Energie eines realen Gases auch etwas vom Volumen abhängt, fällt bei der Summenbildung über den ganzen Umfang später auch noch heraus.) Wenn man das Netz der Adiabaten und Isothermen später beliebig eng macht, geht die Arbeit ΔWCB zudem sehr viel schneller gegen null als ΔQCB.

Damit wird


und da ΔQAC = 0 ist (Adiabte!), ist



oder



Die betrachteten Wärmemengen sind also tatsächlich gleich. Folglich gelten unsere Ergebnisse auch für den tatsächlichen Verlauf des Kreisprozesses.

Die Summation aller übertragenen Wärmen ergibt:



und da T0 während des ganzen Prozesses konstant bleibt:



wobei Q0 die gesamte Wärmemenge ist, die dem Speicher der CARNOT-Maschine während des Kreisprozesses entnommen wurde.

Lässt man nun den Abstand der Adiabaten und den der Isothermen unbeschränkt gegen null gehen, dann gehen auch die einzelnen ΔQS gegen null, und aus der Summe wird ein Linienintegral über die geschlossenen Kurve K des Kreisprozesses:



Ist Q0 negativ, so wurde dem Wärmespeicher unter Aufwand mechanischer Energie Wärme zugeführt. Dies ist durchaus möglich; das betrachtete System hätte dann bei positivem Umlaufssinn Arbeit verrichtet und diese in Wärme umgesetzt.

Wäre Q0 dagegen positiv, so wäre dem Wärmespeicher Wärmeenergie entzogen worden und entweder im System oder in der CARNOT-Maschine in Arbeit umgewandelt worden, ohne dass in der Umgebung irgendwelche weitere Veränderungen (z. B. Abwärme) entstanden wären. Dann aber wäre die Anordnung ein Perpetuum mobile 2. Art.

Äußerstenfalls könnte Q0 gleich null sein. Dann wäre dem Wärmespeicher keine Wärme entzogen worden, und die gesamte vom System erzeugte Arbeit wäre in der CARNOT-Maschine in Form von Arbeit freigesetzt worden. Dies wäre bei einem vollkommen verlustfreien (reibungslosen) und daher reversiblen Prozess immerhin möglich.

Ist das geschlossene Linienintegral gleich null (reversibler Prozess), dann (und nur dann) ist das Wegintegral



zwischen zwei Zuständen A und B des Systems vom Weg unabhängig. Denn würde man das System auf einem anderen Weg vom Zustand B in den Zustand A zurückführen, dann müsste das geschlossene Linienintegral unabhängig vom gewählten Rückweg gleich null sein und daher



sein.

Das bedeutet aber, dass die Größe dQS/dT das (vollständige) Differential einer Zustandsgröße ist, deren Wert nur vom Ort im p-V-Diagram abhängt, solange die Zustandsänderungen reversibel ausgeführt werden. Wir bezeichnen diese Zustandsgröße, also die Stammfunktion



als die Entropie S des Systems (besser wäre: die Entropiefunktion des Systems, da die Entropie selbst jeweils ein bestimmter Wert der Entropiefunktion ist):

Bei einer reversibel durchgeführten Zustandsänderung eines Systems von A nach B beträgt also die Änderung seiner Entropie


Ist die Zustandsänderung von A nach B nicht reversibel, so denken wir uns sie durch einen reversiblen Prozess von B nach A zu einem Kreisprozesse ergänzt, der natürlich insgesamt irreversibel ist. Dann ist



Nun lässt sich leicht zeigen, dass der Wert des Integrals



negativ ist: Entsteht nämlich im System Reibungswärme, so muss bis zur Rückkehr in den Ausgangszustand diese zusätzlich in den Arbeitsspeicher geschafft werden, insgesamt also mehr Wärme als beim reversiblen Kreisprozess.


Für


folgt aus der oben stehenden Gleichung



Selbst wenn das Integral in obiger Gleichung gleich null ist, ist SB - SA > 0, d. h. die Entropie des Systems hat bei der Zustandsänderung von A nach B zugenommen. Also gilt:

Alle in einem abgeschlossenen System möglichen Zustandsänderungen verlaufen so, dass die Entropie des Systems dabei zunimmt.

Das Verhalten der Entropie ist also das entscheidende Kriterium für mögliche bzw. unmögliche Zustandsänderungen eines abgeschlossenen Systems.

Doch betrachten wir nun die obige Gleichung in dem Fall, dass das darin auftretende Integral nicht null ist:

Die irreversibel ausgetauschten Wärmemengen sind stets negativ (d. h. es sind abgegebene Wärmemengen), weil aufgenommene Wärmemengen jederzeit wieder abgegeben werden können, also die Aufnahme allein ein reversibler Vorgang ist. Das Integral ist also, wenn Wärme ausgetauscht wird, stets negativ, wodurch die Differenz größer wird. Daher stellt der Wert der Differenz ein Maß für die Irreversibilität des betrachteten Vorgangs dar.

 

Grundzüge der kinetischen Gastheorie

[Bearbeiten]

Einleitung

[Bearbeiten]

Die kinetische Gastheorie versucht das Verhalten von Gasen und ihre Wechselwirkung mit ihrer Umgebung aus der Annahme heraus zu erklären, dass selbst eine kleine Gasmenge (z. B. ein Kubikmillimeter) schon aus einer riesigen Zahl von Molekülen besteht, die sich mit beträchtlicher, aber nicht einheitlicher Geschwindigkeit bewegen und dabei häufig untereinander und mit den Gefäßwänden zusammenstoßen. Durch die Zusammenstöße mit den Wänden kommt der Druck zustande, den das Gas auf die Wände ausübt.

Die Moleküle haben keine einheitliche Geschwindigkeit. Im Laufe der Zeit kann jedes Molekül alle möglichen Geschwindigkeiten zwischen 0 und einem sehr großen Wert annehmen. Die Wahrscheinlichkeit aber, dass seine Geschwindigkeit zu einem bestimmten Zeitpunkt einen Wert in einem bestimmten Intervall zwischen v und v + Δv hat, hängt stark von v ab, also von der Lage des betrachteten Intervalls. (Die Notwendigkeit, stets mit Geschwindigkeitsintervallen zu rechnen, rührt daher, dass die Wahrscheinlichkeit dafür, ein Molekül mit einer ganz bestimmten, exakt definierten Geschwindigkeit v anzutreffen, gleich null ist.) Für Geschwindigkeiten in der Nähe von null ist diese Wahrscheinlichkeit sehr klein, mit zunehmendem v wächst sie, erreicht irgendwo ein Maximum und nähert sich mit weiter wachsendem v dem Wert null. Diese »Geschwindigkeitsverteilung« ist wegen der riesigen Zahl der Moleküle in jedem praktisch relevanten Volumen bei konstanter Temperatur zeitlich konstant. Sie wird hergestellt und aufrecht erhalten durch die ungeheuer große Zahl von Zusammenstößen der Moleküle miteinander.

Wenn ich bisher von Geschwindigkeit sprach, so war damit der Betrag der Geschwindigkeit gemeint. Für die Richtung der Geschwindigkeit der Moleküle gilt, dass sie ganz beliebig sein kann und dass (im stationären Zustand des Gases) alle möglichen Richtungen gleichberechtigt vertreten sind. Aber auch hier gilt, dass die Wahrscheinlichkeit dafür, ein Molekül mit einer ganz bestimmten Richtung anzutreffen, gleich null ist, sodass wir auch bei der Bewegungsrichtung immer mit Intervallen arbeiten müssen.

Eine gewisse Inkonsequenz der kinetischen Gastheorie besteht darin, dass sie auch im Fall des idealen Gases annehmen muss, dass die Moleküle häufig miteinander zusammenstoßen, obwohl sie wegen ihrer Punktförmigkeit gar nicht zusammenstoßen können.

Ein wichtiges Anwendungsbeispiel der kinetischen Gastheorie ist die Berechnung des Drucks, den ein Gas auf die Gefäßwände ausübt. Die exakte mathematische Behandlung dieses Problems ist eine etwas aufwändige, aber durchaus lohnende Übung.

 

Der Druck eines Gases bei konstanter Temperatur

[Bearbeiten]

Wegen der Komplexität des Problems müssen wir in mehreren Teilschritten vorangehen.

1. Wir berechnen zunächst die Anzahl der Moleküle in einem Volumen V, deren Bewegungsrichtung in einem bestimmten Richtungsintervall liegt.

Wir benutzen dazu räumliche Polarkoordinaten (Kugelkoordinaten; siehe Abbildung) nach Art der geographischen Koordinaten (geogr. Länge λ, geogr. Breite φ). Wir tragen die Geschwindigkeitsvektoren aller in der Einheitskugel (r = 1 Längeneinheit = 1 LE) vorhandenen Moleküle im Nullpunkt dieses Koordinatensystems (= Mittelpunkt der Einheitskugel) an und verlängern sie nötigenfalls bis zum Schnitt mit der Einheitskugel. Die Schnittpunkte bezeichnen wir als »Geschwindigkeitspunkte« oder kurz v-Punkte. Wenn wir (was plausibel ist) annehmen, dass die Richtung der Geschwindigkeit der Moleküle – unabhängig vom Betrag der Geschwindigkeit – im Raum gleichmäßig verteilt ist, so liegen die v-Punkte auf der Kugeloberfläche gleichmäßig verteilt.

Die Richtung, auf welche die Richtung der Geschwindigkeit der Moleküle bezogen werden soll, sei einerseits die »Nord-Süd-Achse« der Einheitskugel, andererseits der Nullmeridian.

Wir fragen nun nach der Anzahl ΔNψ,λ der »(ψ,λ)-Moleküle« in der Einheitskugel, und meinen damit die Moleküle, deren Richtung einerseits zwischen ψ und ψ + Δψ (also im Intervall [ψ, ψ + Δψ]) liegt, andererseits zwischen λ und λ + Δλ (also im Intervall [λ, λ + Δλ]). Dabei ist ψ = 90° - φ.


Die v-Punkte der (ψ, λ)-Moleküle liegen dann auf dem in der Abbildung markierten Flächenstück ΔA, für das gilt:



Befinden sich im Volumen V der Kugel insgesamt N Moleküle, so verhält sich die Anzahl ΔN der v-Punkte auf dem betrachteten Flächenstück zu N wie ΔA zur Oberfläche O der Kugel (wobei wir uns auf die oben angenommene gleichmäßige Verteilung berufen). Also ist



und


 

2. Als nächstes berechnen wir die Anzahl ΔN<subψ aller Moleküle, die mit der Nord-Süd-Achse einen Winkel im Intervall [ψ, ψ + Δψ] bilden, wobei der zweite Winkel (λ) nicht beachtet wird. Diese Anzahl ist proportional der Fläche ΔAZ der Kugelzone, auf der ΔA liegt, und es gilt:



woraus folgt:



3. Nun betrachten wir den Stoßvorgang eines Moleküls mit der Wand des Gefäßes. Die kinetische Gastheorie nimmt an, dieser Stoß verlaufe vollkommen elastisch, das heißt: die Normalkomponente der Geschwindigkeit werde umgekehrt, die Tangentialkomponente bleibe unverändert. Es gilt dann das Reflexionsgesetz: Einfallswinkel = Ausfallswinkel.



(Diese Annahme ist höchst gewagt, denn das Molekül stößt ja nicht – wie etwa ein Tischtennisball – gegen eine (makroskopisch gesehen) ebene Fläche, sondern gegen einen Verband von Molekülen, aus denen die Wand besteht. Daher gilt die Annahme nur im statistischen Mittel und auch nur dann, wenn die Temperatur des Gases und die der Wand gleich sind. Wir werden sehen, dass die Ergebnisse dennoch brauchbar sind.)

Wenn ein Molekül mit der Geschwindigkeit v unter dem Winkel ψ gegen die Normale auf die Wand trifft, wird die Normalkomponente v cos ψ seiner Geschwindigkeit umgewandelt in -v cos ψ die Tangentialkomponente v sin ψ bleibt unverändert. Bezeichnen wir die Masse eines Moleküls mit μ, so ist der Betrag seiner Impulsänderung Δp bei dem Stoß gleich – 2 μ v cos ψ; der auf die Wand ausgeübte »Kraftstoß« ist entgegengesetzt gleich, also gleich 2 μ v cos ψ.

Der durch die Molekülstöße auf die Wand ausgeübte Druck ist dann gleich der Summe der Kraftstöße, die in der Zeit Δt auf ein Flächenstück ΔA der Wand ausgeübt werden, dividiert durch diese Fläche und die Zeit Δt.


4. Wie viele der Moleküle des Gases aber stoßen in der Zeit Δt auf das Flächenstück? Das hängt (unter anderem) von der Geschwindigkeit der Moleküle ab. Da die Wahrscheinlichkeit, dass auch nur irgendeines der Moleküle eine ganz bestimmte Geschwindigkeit vk hat, gleich null ist, müssen wir wieder ein Geschwindigkeitsintervall betrachten. Wir fragen also nach der Anzahl der Moleküle, deren Richtung im Intervall [ψ, ψ + Δψ] und deren Geschwindigkeit im Intervall [vk - Δv, vk] liegt. Ihre mittlere Geschwindigkeit sei vk, m, für die wir wegen der Kleinheit des Intervalls den Wert



ansetzen dürfen.

Wenn unter den N Molekülen des Gases Nk Moleküle eine Geschwindigkeit im betrachteten Geschwindigkeitsintervall haben und ebenfalls gleichmäßig über das Volumen verteilt sind, so haben davon (analog zu Gleichung A)



Moleküle auch noch die passende Richtung. Wir nennen diese Moleküle zur Vereinfachung (k, ψ)-Moleküle.

Wir errichten nun über einem Flächenelement ΔA der Wand ein schiefes Prisma, dessen Mantellinien mit der Flächennormalen den Winkel ψ bilden. Die Länge der Mantellinien sei vk Δt.



Dann erreichen in der Zeit Δt alle in dem Prisma gelegenen (k, ψ)-Moleküle den Boden des Prismas. (Streng genommen handelt es sich dabei um einen beinahe prismatischen Körper, dessen rechte Seitenwand – siehe Abbildung - um den Winkel ψ + Δψ geneigt ist, was jedoch bei der folgenden Volumenberechnung vernachlässigt werden kann.) Die Höhe dieses Körpers ist vk Δt cosψ, sein Volumen daher



Befinden sich im Kugelvolumen V insgesamt Nk (k)-Moleküle, so befinden sich in dem betrachteten Prisma ΔNk,ψ,ΔV (k, ψ)-Moleküle, und das sind



Dabei sind auch alle jene Moleküle berücksichtigt, die unter beliebiger λ-Richtung (also von rings umher) auf das Flächenelement treffen.


5. Der von diesen Molekülen in der Zeit Δt auf das Wandelement übertragene Kraftstoß ist dann



Nach Division durch ΔA und Δt erhalten wir den ausgeübten Druck



Nun fragen wir nach dem Druck, der insgesamt von allen (k)-Molekülen, die unter irgendeinem Winkel auf das Flächenelement auftreffen, auf dieses ausgeübt wird. Dazu ersetzen wir Δψ durch dψ und integrieren zwischen den Grenzen 0 und π/2:



6. Berücksichtigen wir nun auch die Moleküle in den übrigen Geschwindigkeitsintervallen und summieren die von ihnen erzeugten Teildrucke, so erhalten wir den von dem Gas auf die Wand ausgeübten Druck:



Die Größe



ist das mittlere Geschwindigkeitsquadrat der Moleküle des Gases. Damit kann man schreiben:



und da μ N die Masse m des Gases und m/V seine Dichte ρ ist, folgt daraus



oder auch



Wenden wir diese Beziehung auf das ideale Gas an mit der Zustandsgleichung



wobei R die »spezifische Gaskonstante« ist, so ergibt ein Vergleich der rechten Seiten



woraus folgt: Das mittlere Geschwindigkeitsquadrat der Moleküle des idealen Gases ist proportional der absoluten Temperatur.

Da



ist (n = Zahl der Mole, Rm = universelle molare Gaskonstante), ergibt sich



was bedeutet: Die absolute Temperatur ist proportional der kinetischen Energie der Gasmoleküle.

Daraus ergibt sich eine Definition der absoluten Temperatur und zugleich deren mechanische Interpretation.

Quantenmechanik

[Bearbeiten]

50% fertig „Einführung in die Theoretische Physik“ ist nach Einschätzung seiner Autoren zu 50 % fertig

Info
Noch kein PDF neuer als 2014. Ein solches kann man im linken Seitenmenü unter Multi Format Export erzeugen

Einführung

[Bearbeiten]

Notation

[Bearbeiten]

In der Quantenmechanik werden viele, leicht unterschiedliche Notationen verwendet. In diesem Buch soll die folgende Notation Anwendung finden:

Definitionsgleichung. Der Term auf der Seite des Doppelpunkts wird definiert.
ist die komplex-Konjugierte der komplexen Zahl
ist die Transponierte der Matrix
ist der hermitesch adjungierte Operator zum Operator
Spezialfall adjungierte Matrix: .
ist =1 falls i=j, sonst =0.
ist =1 für =-1 für sonst =0. (Vorzeichen der Permutation)
Dreidimensionale Vektoren tragen eine Pfeil.
Skalarprodukt
Vektorprodukt
Gradient eines Skalarfelds auf
Divergenz eines Vektorfelds
Rotation eines Vektorfelds .

Dirac-Notation (abstrakte Darstellung):

  • Allgemeine Abhängigkeit eines Zustandes von einem Parameter:

  • Das benutzte quantentheoretische Bild wird durch einen Index an Zustand und Operator angegeben:

  • Darstellung eines Operators in einer bestimmten Basis :

Erklärung zur Notation

[Bearbeiten]

Ein Objekt mit der Notation "" wurde von Dirac ein 'Ket' genannt. Es dient als mathematisches Modell für den idealen, reinen Zustand eines Quantensystems. Die Kets sind Elemente eines möglicherweise hochdimensionalen Vektorraums. Ein Ket hat mehr oder weniger Attribute, welche Eigenwerte sind von linearen Abbildungen, genannt Operatoren. Das Ket ist also ein Eigenvektor zu diesen Operatoren. Allem was physikalisch messbar ist wird im Quantenmodell ein Operator zugeordnet. Dessen Eigenwertspektrum ist die Menge der experimentell messbaren Werte. Ein Spektrum hat diskrete und/oder kontinuierliche Wertebereiche. Ein Vektorraum ist nur dann sympathisch für die Physik (die Mathematik kann machen was sie will) wenn es darauf ein positiv-definites Skalarprodukt gibt. Konkret steht jedes ket auch in einer dualen Version, 'Bra' genannt, zur Verfügung. Zum Beispiel "". Die (fast) bilineare Paarung eines Bra und Ket produziert dann eine komplexe Zahl .

Aus Gründen, die später klar werden, braucht die Quantentheorie unbedingt komplexe Zahlen und Vektorräume darüber. Um die Norm des Vektors, das heißt seine Länge, die Wurzel des Skalarprodukts mit sich selbst, stets wohldefiniert zu halten, braucht es einen Trick: ist antilinear im ersten Argument, das heißt, Zahlenfaktoren werden da komplex konjugiert herausgezogen. Nur im zweiten Argument ist das Produkt linear. Eine solche Abbildung heißt sesquilinear, weil nicht wirklich streng bilinear.

Beispiel, die Schrödingerwellen auf der x-Achse. Die Kets sind die komplexwertigen Funktionen/Distributionen einer reellen Variablen. Jede Position x ist ein Eigenwert des X-Operators, der also ein kontinuierliches Spektrum hat. Eigenvektor ist die Deltafunktion am Ort x. Die Menge aller bilden eine orthonormierte kontinuierliche Basis des Hilbertraums. (Ersparen wir uns pingelige fundamental-mathematische Kritik). Also kann ein beliebiger Vektor , der zu beliebigem anderen Zeug ein Eigenvektor sei, in dieser Basis entwickelt werden. Integral ersetzt Summe: . Im Schrödinger-Bild ist ganz einfach der Funktionswert.

Die Gleichung: besagt, dass die Basis der Positions-Eigenvektoren ein Orthonormalsystem bildet.

Geschichtliches

[Bearbeiten]

Gegen Ende des 19. Jahrhunderts glaubten die Physiker, die Physik sei im Wesentlichen abgeschlossen. Die Physiker hatten zwei große Theorien, die Mechanik und die Elektrodynamik und die etwas dazwischen angesiedelte Theorie der Thermodynamik. Die Wechselwirkungen zwischen Materie und Strahlung wurden mithilfe des Lorentzschen Kraftgesetzes erklärt.

Zwar gab es einige ungeklärte Punkte, einige nicht erklärbare Beobachtungen, doch man gewöhnte sich langsam daran, sie zu ignorieren.

Diese Punkte waren:

  • Es gab kein Gesetz, welches das Energiespektrum des schwarzen Strahlers zutreffend beschrieb.
  • Die Temperaturabhängigkeit der spezifischen Wärmekapazität von Festkörpern und Gasen konnte nicht erklärt werden.
  • Es gab Widersprüche bei der Interpretation der Maxwellschen Gleichungen, und
  • der negative Ausgang des Michelson-Morley-Versuchs (1887) war unverständlich.

Und genau aus diesen scheinbar "letzten Problemen der Physik" heraus entstand fast das gesamte neue physikalische Weltbild.

Die beiden letztgenannten Probleme wurden von A. EINSTEIN durch die Spezielle Relativitätstheorie (1905) gelöst. Die übrigen Probleme wurden nach und nach durch die ebenso revolutionären Vorstellungen der Quantenmechanik behoben.

Für das erste Problem fand Max Planck eine Lösung, indem er seine Theorie von der Quantisierung der Energie aufstellte. Die Energie einer elektromagnetischen Welle ist eine ganzzahlige Vielfache von , wobei h eine neue Konstante darstellt. Einstein verallgemeinerte diese Theorie zu einer Teilchentheorie des Lichts mit Photonen (siehe Der Photoeffekt), welche alle die Energie besitzen. Ein Lichtstrahl ist gemäß dieser Theorie ein Strom von Lichtteilchen. Allerdings zeigt Licht gleichzeitig Wellenverhalten, wie in der klassischen Elektrodynamik beschrieben. Diese Doppelnatur des Lichts bezeichnet man als Welle-Teilchen-Dualismus.

Die ersten Probleme waren also bereits gelöst, allerdings waren die Lösungen einerseits schwer mit den vorhanden Theorien in Einklang zu bringen, anderseits sah man nun, auf welchen wackeligen Füßen die bisherigen Theorien standen.

Den nächsten Knacks erlitten die etablierten Theorien bereits 1911 als Ernest Rutherford seinen Streuversuch durchführte und dabei feststellte, dass das Atom zum größten Teil leer ist und nur einen kleinen positiv geladenen Kern besitzt, welcher von einer Elektronenhülle umkreist wird. Negativ geladene Elektronen, die um einen positiv geladenen Atomkern laufen, stellen gegeneinander bewegte elektrische Ladungen dar. Solche müssen nach der klassischen Elektrodynamik ständig elektromagnetische Wellen abstrahlen und damit Energie verlieren. Die Atome wären nicht stabil, müssten also in Sekundenbruchteilen zusammenfallen. Zusammen mit den Untersuchungen der Emissions- und Absorptionsspektren der Atome, welche bis dahin noch nicht erklärt waren und welche gegen eine kontinuierliche Energieabgabe der Elektronen sprachen, entwickelte Bohr daraus sein Atommodell mit quantisierten Elektronenbahnen.

Die Theorie der Lichtquanten von Max Planck und Albert Einstein und das Bohrsche Atommodell konnten jedoch nur Teilbereiche der Quantentheorie erklären und sie standen noch nicht auf einem gemeinsamen theoretischen Unterbau. Dies änderte sich 1923 als de Broglie seine Theorie über den Wellencharakter von Teilchen aufstellte, welche allerdings noch keine eindeutigen Vorhersagen ermöglichte, und wenig später (1925) Schrödinger und Heisenberg ihre beiden äquivalenten Formulierungen der Quantenmechanik herausgaben.

Im Folgenden werden zunächst die für die Quantenphysik grundlegenden Phänomene besprochen.

Mathematischer Rahmen der Quantenmechanik

[Bearbeiten]

Wie jede physikalische Theorie hat auch die Quantentheorie die Aufgabe, das Ergebnis von Experimenten vorherzusagen und in das existierende Weltbild einzubinden. Die Mathematik dient gerade in der Quantenphysik als wichtiges Hilfsmittel Zusammenhänge, jenseits der alltäglichen Erfahrung, zu erfassen und zu verstehen. Der Rahmen der sich hierbei für die Quantentheorie bewährt hat, ist die Theorie des Hilbert-Raumes und die Wahrscheinlichkeitstheorie. Der Zusammenhang zwischen den mathematischen Größen und der physikalischen Realität wird in den folgenden verschiedenen Kapiteln deutlich, immer wenn die Theorie quantitativ richtige Vorhersagen trifft.

Das Unterkapitel ist eher zum Nachschlagen als zum geradlinigen Lesen ausgelegt und soll später mit Sammlungen von Formeln ergänzt werden.

Der Photoeffekt

[Bearbeiten]

Im Jahre 1887 entdeckte H.R. HERTZ bei seinen bahnbrechenden Versuchen mit elektromagnetischen Wellen, dass ultraviolettes Licht eine Funkenentladung beeinflusst. Er beauftragte seinen Assistenten W. HALLWACHS mit der Untersuchung dieser Erscheinung, der daraufhin 1888 den "lichtelektrischen Effekt" (Hallwachs-Effekt, Photoeffekt) entdeckte und untersuchte. Das Ergebnis: Negativ geladene Metallkörper entladen sich bei Bestrahlung mit ultraviolettem Licht, positiv geladene nicht.

P. LENARD verlegte diese Versuche ins Vakuum und schaltete dadurch den störenden Einfluss der Luft aus. Er wies nach, dass die von dem Licht aus einer Metalloberfläche ausgelösten negativen Ladungen aus Elektronen bestehen. Genauere Untersuchungen (1902) zeigten:

1. Die Geschwindigkeit der ausgelösten Elektronen ist unabhängig von der Intensität des Lichtes. Höhere Lichtintensität vergrößert lediglich die Zahl der pro Zeiteinheit ausgelösten Elektronen.

2. Die Geschwindigkeit der ausgelösten Elektronen hängt nur von der Frequenz des Lichtes ab und steigt mit zunehmender Frequenz.

3. Bei abnehmender Frequenz des Lichtes verschwindet der Effekt plötzlich bei einer Grenzfrequenz .

4. Auch bei Strahlung von sehr geringer Intensität ("Helligkeit") tritt der Effekt praktisch sofort ein, nämlich in weniger als 10 - 8 Sekunden.

Alle diese Eigenschaften sind mit der Wellennatur des Lichtes nicht zu vereinbaren. Mit der in Jahrhunderten durch Interferenz- und Beugungserscheinungen gefestigten Vorstellung, das Licht sei eine Welle, kann der Photoeffekt nicht erklärt werden.

Die Erklärung gab EINSTEIN im Jahr 1905: In einem Lichtstrahl ist die Energie nicht (wie in einer Welle) kontinuierlich verteilt, sondern in einer endlichen Anzahl von voneinander getrennten (diskreten) "Energiequanten" konzentriert, die nur als Ganzes und nur einzeln absorbiert werden können. Die Energie E eines "Lichtquants" ist der Frequenz f des Lichtes proportional.

Der Proportionalitätsfaktor h ist das Plancksche Wirkungsquantum:

Wenn die Energie eines einzelnen Lichtquants nicht ausreicht, ein Elektron aus dem Metall herauszulösen (die "Austrittsarbeit" aufzubringen), dann vermögen es auch noch so viele Lichtquanten nicht.

Ist die Energie des Lichtquants größer als die Austrittsarbeit, dann wird der Überschuss dem Elektron als kinetische Energie mitgegeben.

Hochpräzise Messungen von MILLIKAN (1916) bestätigten die Theorie Einsteins vollkommen.

Der Erklärung des Photoeffekts (wie auch der des Compton-Effekts - siehe unten) haftet etwas Zwiespältiges an: Einerseits werden die Lichtquanten - auch Photonen genannt – als Korpuskeln oder Teilchen betrachtet, andererseits werden ihnen eine Frequenz und eine Wellenlänge zugeordnet, also Eigenschaften, die nur bei einer Welle Sinn haben. Dazu kommt, dass es beim Licht Phänomene gibt, nämlich Interferenz und Beugung, die nur durch die Welleneigenschaft des Lichts erklärt werden können. Wir haben es also hier mit einem "Dualismus" von Welle und Korpuskel zu tun, der zwei im Grunde unverträgliche Erklärungsmodelle verbindet. Die Erklärung des Photoeffekts hat einen hohen Preis: Sie ist nur möglich, wenn wir dem Licht zwei einander widersprechende, zwei einander ausschließende Eigenschaften zuschreiben, nämlich sowohl Welle als auch Korpuskelstrom zu sein. Dagegen hilft auch nicht der Erklärungsversuch, das Wellenmodell des Lichtes beschreibe lediglich die Dichteverteilung der Photonen, denn einer elektromagnetischen Welle wie dem Licht kommt zweifellos eine eigenständige Realität zu: elektrische und magnetische Felder sind physikalische Realitäten mit beobachtbaren Eigenschaften. Mit anderen Worten: hier liegt noch immer ein ungelöstes Problem von gewaltiger Tiefe vor, das nicht durch Gewöhnung beseitigt wird.

Der Compton-Effekt

[Bearbeiten]

Die Reaktion zwischen Photonen und Elektronen hat etwas vom Stoß zwischen Billiardkugeln. Nur die relativistische Kinematik von Energie- und Impulserhaltung ist zu berücksichtigen, wenn Teilchen sich der Lichtgeschwindigkeit nähern.

Wellen und Teilchen

[Bearbeiten]

De-Broglie-Wellenlänge

[Bearbeiten]
Beugung am Doppelspalt von Elektronen als Materiewellen

Untersuchungen (Photoeffekt und Doppelspaltversuch) ergaben, dass das Licht sowohl Wellen- als auch Teilcheneigenschaften besitzt. Für Photonen gilt:

De Broglie übertrug dies 1923 auf beliebige Teilchen:

mit dem relativistischen Impuls:

ergibt sich daraus die sogenannte De-Broglie-Wellenlänge:

Animierte Wellen-Interferenz. An den dunklen Punkten auf der Zielgeraden löschen die Wellen sich aus, an den roten Punkten verstärken sie sich. Deutung als Wahrscheinlichkeitswelle: Das Quadrat der Amplitude misst, wie viele Teilchen eintreffen.

Damit besitzt jedes Teilchen sowohl Wellen als auch Teilcheneigenschaften. Dies wurde 1927 durch Experimente bestätigt.

Der Phasenfaktor einer ebenen Welle hat die Form
Der Wellenvektor zeigt in Richtung der Ausbreitung und hat den Betrag Daher die vektorielle Form der Gleichung von de Broglie, einprägsam im Paar mit der Planck-Einstein-Gleichung zwischen Energie und Frequenz:

Die Elektronen im Vakuum haben keine klassische Bahnkurve. Wenn sie ein Hindernis wie den Doppelspalt durchqueren, bildet sich dahinter ein Interferenzmuster, wie es der de-Broglie-Wellenlänge entspricht. Das passiert auch im Langzeitversuch, wenn die Elektronen einzeln verschickt werden. Es ist kein kollektives Phänomen, sondern jedes Elektron wandert irgendwie durch beide Spalte zugleich und kollabiert am Ende zu einem scheinbar zufälligen Punkt auf dem Detektor-Bildschirm. Wird versucht, wie trickreich auch immer nachzuprüfen, durch welchen Spalt das Teilchen geht, verschwinden die Interferenzen. Jede Art von Messung demoliert die Materiewelle. Der Impulsübertrag zu dem erforderlichen Probeteilchen (Atom, Photon) auf einer Seite kann dabei verschwindend gering sein. Jedoch wird immer die Phase der Wellenfunktion dort zerwürfelt. Diese Kollaps-Idee, nach der es keine störungsfreien Messungen gibt, wurde in die Axiome der Quantenmechanik aufgenommen.

Grundkonzepte der Quantenmechanik

[Bearbeiten]

In diesem Abschnitt soll, nachdem im Abschnitt zum mathematischen Rahmen viel von abstrakten Hilbert-Räumen stand, der physikalische Rahmen der Quantentheorie abgesteckt werden. Zunächst werden die Postulate der (nicht-relativistischen) Quantenmechanik axiomatisch eingeführt. Hierbei spielt der Begriff der Messung eine besondere Rolle. Daran schließt sich dann eine Betrachtung der verschiedenen Bilder und Darstellungen der Quantentheorie an.

Die Axiome fassen didaktisch brutal zusammen, was die Physik in langer Kleinarbeit über Atome und Teilchen gelernt hat. Es gab eine Wellenmechanik, wo Frequenzen von stehenden Wellen den diskreten Energien entsprechen. Und eine Matrixmechanik erklärte, dass Messungen sich nicht beliebig vertauschen lassen. Die Mathematik der Operatoren auf (Funktionen-)Räumen mit Skalarprodukt brachte alle Erkenntnisse auf einen gemeinsamen Nenner.

Postulate für reine und abgeschlossene Quantensysteme

[Bearbeiten]

Im folgenden wird die theoretische Begründung der quantenphysikalischen Phänomene auf einige wenige Grundannahmen zurückgeführt. Diese Postulate bilden das axiomatische Grundgerüst für die nichtrelativistische Quantenmechanik. Eine Verallgemeinerung auf relativistische Phänomene erfolgt im Kapitel über die Klein-Gordon-Gleichung.

Postulat 1 (reiner Zustand):

Ein abgeschlossenes Quantensystem, das sich in einem reinen Zustand befindet, wird durch einen normierten Zustandsvektor auf einem komplexen, unitären Hilbert-Raum beschrieben.

Ein reiner Zustand enthält die bestmögliche Information über das System im Gegensatz zu einem statistischen Gemisch. Vom Zustandsvektor linear abhängige Vektoren beschreiben den selben Zustand. Daher wird jedem quantenmechanischen Zustand ein eindimensionaler Teilraum des Hilbertraumes zugeordnet. Diesen Teilraum bezeichnet man als Strahl. Der Hilbertraum ist ein linearer Vektorraum, deshalb folgt daraus, dass eine Linearkombination von Zustandsvektoren wiederum einen Zustandsvektor bildet. Das nennt man das Superpositionsprinzip.

Postulat 2 (Projektionsmessung, von Neumann Messung):

  1. Die durch eine Projektionsmessung an einem Quantensystem experimentell messbaren physikalischen Größen (z.B. Energie, Ort, Drehimpuls) werden durch hermitesche Operatoren auf dem Hilbertraum beschrieben. Diese Operatoren werden als Observablen bezeichnet.
  2. Mögliche Ergebnisse einer an einem Quantensystem durchgeführten Messung der Observablen A sind die Eigenwerte a dieses Operators. Diese ergeben sich mit der Wahrscheinlichkeit:

    Erwartungswert:
    Operator in Diagonalform (Spektraldarstellung):
    Der hermitesche Operator ist die Projektion des Vektors auf den Eigenvektor . Die Eigenzustände sind ein vollständiges Orthonormalsystem. Jeder Zustand hat die Reihenentwicklung

  3. Bei einer idealen Messung (ideal bezieht sich hier auf den Unterschied zwischen Experiment und Theorie) der Observablen A geht der Zustand des Systems in den zum Messwert gehörenden Eigenzustand über.

Bornsche Regel: In die Verteilungen von gemessenen Daten gehen die Zustandsvektoren nur in Form der Betragsquadrate ihrer Komponenten im jeweiligen Eigensystem ein. Die Phase ist beliebig wählbar.

Postulat 3 (Zeitentwicklung):

  1. Die Zeitenwicklung eines Quantensystems von nach lässt sich durch einen unitären Zeitentwicklungsoperator beschreiben. Er lässt die Norm von Zustandsvektoren unverändert und hat folgende Eigenschaften:

  2. Im Schrödinger-Bild genügt die zeitliche Entwicklung des Zustandsvektors der Schrödinger-Gleichung:

    Dabei entspricht der Hamiltonoperator der klassischen Hamiltonfunktion für N Teilchen, in der die Orte, Impulse, Potenziale,... zu Operatoren verwandelt werden:

    Hinweis: Die Festlegung der Schrödingergleichung als fundamentale Gleichung der Quantenmechanik ist eine beliebige. Ebensogut kann die gesamte Quantenmechanik auch aus dem Heisenbergbild, der Dirac-Gleichung (bzw. aus anderen Bildern, wo die Begriffe positives Skalarprodukt und Unitarität einen Sinn haben) entwickelt werden.

Kommentar. So trocken-formal die Postulate auch herkommen, so umwälzend und umstritten waren ihre Konsequenzen für das Weltbild der Physik. Dem Schema zufolge schalten die Quantensysteme um zwischen zwei grundverschiedenen Regeln, der unitären ungestörten Zeitentwicklung (Postulat 3) und dem nicht-unitären Zusammenbruch (Postulat 2), wenn sie messbar mit der Außenwelt reagieren. Auf der einen Seite gibt es eine Differenzialgleichung der Wellenfunktion, die deterministische, eindeutige, vorwärts und rückwärts in der Zeit zu berechnende Lösungen hat. Auf der anderen Seite passiert bei jeder Beobachtung oder Messung eine rätselhafte Lotterie, volkstümlich: ein Quantensprung. Stochastisch wird ein Eigenwert zu dem Operator ausgewählt, auf den der Beobachter sein Experiment eingestellt hat. Die Wellenfunktion wird dabei irreversibel zerstört und erleidet einen Kollaps auf die Eigenfunktion zum Messwert. Die Welle ist in keiner Weise direkt messbar; der Mond existiert nicht, solange keiner hinsieht, spottete Einstein. Nur die Eigenwerte der Messungen existieren. Bei nicht vertauschbaren Operatoren sind die entsprechenden Größen nicht gleichzeitig definiert. Die Streuungen solcher Werte sind fundamental durch Heisenbergs Unschärfe nach unten begrenzt. Also würfelt Gott, Einstein zum Trotz.

Die zeitabhängige Schrödinger-Gleichung

[Bearbeiten]

Die Schrödinger-Gleichung ist die grundlegende Gleichung der nicht-relativistischen Quantenmechanik. Sie entsteht, wenn die klassische Beziehung zwischen Energie, Impuls und Masse von Teilchen so mit de Broglies Beziehungen von Energie zu Frequenz und von Impuls zu Wellenlänge verknüpft wird, dass eine lineare homogene Wellengleichung herauskommt. Aus ihr folgen die Unschärferelation, die Drehimpulsquantelung und viele weitere Dinge, die die Quantenmechanik ausmachen. Für ein Teilchen der Masse m (etwa ein Elektron) im Potenzial V (etwa das eines Atomkerns) lautet sie:

Dabei ist der Laplace-Operator und das Plancksche Wirkungsquantum. Die freie Materiewelle nach de Broglie mit erfüllt erwartungsgemäß die Gleichung. Der imaginäre Faktor i sorgt dafür, dass es zeitperiodische Lösungen gibt, also Schwingungen bei nur erster Zeitableitung. Der Ausdruck auf der linken Seite wird Hamilton-Operator genannt:

Die Lösung dieser partiellen Differentialgleichung ist die Wellenfunktion die das Teilchen im Potenzial V beschreibt. Was sagt diese Wellenfunktion aber aus?

Statistische Interpretation

[Bearbeiten]

Die Wellenfunktion kann nach Born so verstanden werden, dass sie die Verteilung der Wahrscheinlichkeit beschreibt, bei einer Messung das Teilchen an einem bestimmten Ort anzutreffen. Da im Allgemeinen eine komplexe Zahl ist, wird das Betragsquadrat als Wahrscheinlichkeit genommen. Quadrat warum? Plausibel als Analogie zum Elektromagnetismus. Die Energiedichte des elektromagnetischen Feldes ist proportional zu dessen Quadrat. Wenn es aus Energiequanten besteht, dann misst das Quadrat des Wellenfeldes auch die relative Häufigkeit solcher Photonen.
Die Zustandsfunktion beschreibt ein Ensemble, kein Einzelexemplar. Zum Vergleich Experiment-Theorie wird an sehr vielen unabhängigen, gleichartig präparierten Systemen gemessen. Die Deutung als Wahrscheinlichkeit bringt einige Forderungen mit sich, die wir an die Wellenfunktion stellen müssen:

  • An irgendeinem Ort muss sich das Teilchen befinden, daher muss die Gesamtwahrscheinlichkeit 1 ergeben: bei Integration über den gesamten Raum. Dies ist die Normierungsbedingung.
  • Um diese Bedingung zu erfüllen muss quadratintegrabel sein, das heißt dieses Integral muss überhaupt bestimmt sein. Die Funktion ist für jeden Zeitpunkt t ein Zustands-Vektor im komplexen Hilbertraum
  • Daraus folgt auch, dass im Unendlichen auf 0 abfällt, was uns noch bei einigen Rechnungen zugute kommt.

Das alte Modell des zeitabhängigen Massenpunktes verschwimmt zu einer zeitabhängigen "Wolke" im Ortsraum, zum Zustandsvektor in Dirac-Notation Uns kommt eine Eigenschaft der Schrödinger-Gleichung zugute, die die Erfüllung der ersten Bedingung vereinfacht: sie ist linear! Damit lässt sich eine beliebige quadratintegrable Wellenfunktion normieren: Ist , dann erfüllt die Funktion ebenfalls die Schrödinger-Gleichung (wie man sich leicht durch Einsetzen klar machen kann), und zusätzlich die Normierungsbedingung.

Es seien noch zwei übliche Größen der Statistik erwähnt:

  • Der Erwartungswert einer Größe Q: , dabei ist das komplex konjugierte . Der Erwartungswert gibt die Mittelung einer Größe gewichtet mit ihrer Wahrscheinlichkeit an. Zu beachten ist, dass diese Mittelung keineswegs dem wahrscheinlichsten Wert entsprechen muss.
  • Die Standardabweichung: . Sie gibt an, wie weit ein Wert gestreut ist.

(Das Produkt ist hier die n-fache Anwendung eines linearen Operators Q und )

Bemerkungen. Das Superpositionsprinzip, also die streng lineare Form der Schrödinger-Gleichung, und die streng quadratische Form der Wahrscheinlichkeitsdichte (Bornsche Regel) gehören zusammen. Die Dichte muss nämlich eine Kontinuitätsgleichung erfüllen, von der Art "Zeitableitung der Dichte gleich Divergenz einer Strömung". Das heißt, die totale Wahrscheinlichkeit = 1 ist erhalten. Die Invarianz der Theorie unter Phasendrehungen bewirkt diese Erhaltung nach dem Satz von Noether. Und die Noetherschen Ströme für lineare Gleichungen sind nun mal quadratische Formen.
Weder das Superpositionsprinzip noch die Regel von Born lassen sich plausibel aus anderen Axiomen herleiten -- sie gehören zu den fundamentalen Postulaten der Quantenmechanik. Geringste Abweichungen von den Potenzen 1 bzw. 2 hätten verheerende theoretische Folgen.

Nach einem nichttrivialen Satz von Gleason bleibt die quadratische Wahrscheinlichkeit die einzige Wahl auf Hilbert-Räumen, wenn Stetigkeit, Additivität für orthogonale Projektionen und Unabhängigkeit vom Kontext (vom Spektrum der Observablen) verlangt werden. Beispiele von Kochen und Specker verbieten Zustandsfunktionen, die auf allen Orthogonalsystemen jeweils ein Wahrscheinlichkeitsmaß wären. Dies gilt als Beleg dafür, dass es keine kontextfreien (von Operator-Wahl unabhängigen) versteckten Zustandsvariablen gibt. Keine Naturbeschreibung ist schärfer als die mit Wellenfunktionen. Man kann nicht tiefer graben.

Die konstante Gesamt-Wahrscheinlichkeit ist das Quadrat der Hilbertvektor-Norm der Wellenfunktion. Die Gleichung muss also eine unitäre Zeitentwicklung abliefern. Der Hamilton-Operator ist als hermitescher Operator die infinitesimale Version eines solchen unitären Operators.

Ist der Kollaps der Welle bei Messungen ein plötzlicher unstetiger Vorgang am atomaren Objekt? Nein, nur die mathematische Korrektur der Anfangsbedingungen der Schrödinger-Gleichung, jedes Mal wenn das beobachtete Exemplar seinen zufälligen aber präzisen Messwert liefert. Wird etwa im Doppelspaltversuch die Information über den Weg eines Teilchens herausgekitzelt, muss es von dem Punkt an mit einer neuen Kugelwelle weitergehen. Die kann keine Interferenzen mehr abgeben.

Der Zufall regiert über alle elementaren Ereignisse mit Quanten. Keine tiefer liegenden Ursachen dafür wurden ausgemacht. Eine abschnittsweise gültige Wellengleichung ist die einzige bekannte Rechenhilfe.

Freies Teilchen

[Bearbeiten]

Zum besseren Verständnis der Schrödinger-Gleichung betrachten wir nun zunächst ein freies Teilchen (). Damit ergibt sich für die Schrödinger-Gleichung:

Diese Gleichung hat Lösungen der Form:

wobei

und

ein Vergleich dieser letzten Gleichung mithilfe der Einstein-De-Broglie-Beziehung ergibt eine Übereinstimmung mit:

Da die Schrödinger-Gleichung eine Differentialgleichung zweiter Ordnung und in linear und homogen ist, gilt für sie das Superpositionsprinzip, d.h. jede Linearkombination von Lösungen ist wieder eine Lösung. Solche Überlagerungen kann man als Integral darstellen:

Der Exponentialfaktor hat Werte vom Betrag 1 und ist eine fortschreitende Welle in Richtung des Vektors mit der Kreisfrequenz . Beschränkt man sich auf den eindimensionalen Fall, so ergibt sich:

Setzt man die Zeit , so ergibt sich:

Vergleicht man dies mit einer Fourier-Transformation, so sieht man, dass die Fourier-Transformierte von ist:

Aus der Theorie der quadrat-integrierbaren Funktionen folgt, das diese beiden letzten Gleichungen nicht nur für ein freies Teilchen, sondern für jedes Teilchen in einem beliebigen Potenzial gelten. Die Fourier-Transformation zerlegt jede geeignete Funktion in eine Summe von ebenen Wellen. Doch nur für die potenzialfreie Gleichung ist jede einzelne ebene Welle schon eine Lösung.

Die zeitunabhängige Schrödinger-Gleichung

[Bearbeiten]

Wenn man ein zeitlich konstantes Potential annimmt, lässt sich die Schrödinger-Gleichung mit Hilfe eines Separationsansatzes vereinfachen:

Teilt man durch sind die Variablen und getrennt, stehen also nur noch auf je einer Seite der Gleichung:

Es lässt sich also jede Seite als konstant in "ihrer" Variablen auffassen:

Dabei nennen wir die Konstante E. Warum, werden wir später noch sehen. Betrachten wir zunächst die zweite Gleichung:

Potenzialtopf der Vibrationen eines Moleküls

Diese einfache Differentialgleichung wird gelöst durch , wobei man durch Einsetzen erhält, womit der Zeitanteil der Wellenfunktion im Falle eines zeitunabhängigen Potentials lautet:

Nun zum Ortsanteil. Dieser ist bekannt als zeitunabhängige Schrödinger-Gleichung:

Für zeitunabhängige Potentiale haben wir die Lösung des Problems somit darauf vereinfacht, nur noch den Ortsanteil bestimmen zu müssen. Kurz, ist eine Eigenwert-Gleichung. Mit einer Eigenfunktion wird eine stationäre Lösung der Schrödinger-Gleichung. Das heißt, genau eine der Lösungen, die eine zeitlich konstante Wahrscheinlichkeitsverteilung für den Ort haben:

finden sich viele Beispiele zur eindimensionalen zeitunabhängigen Gleichung. In Potenzialtöpfen nimmt ein Teilchen diskrete Energie-Niveaus an. Es kann auch per Tunneleffekt die Wände durchqueren, da die Wellenfunktion exponentiell abfallende Ausläufer da hat, wo klassische Mechanik den Weg verbietet.

Umgang mit Operatoren

[Bearbeiten]

Messung von Quantensystemen

[Bearbeiten]

Die Kopenhagener Interpretation nach Bohr sieht die Quantenobjekte und die klassisch zu beschreibenden Messgeräte als zwei getrennte Welten. Die Quantenmechanik allein sei unfähig zu sagen, wie die Zustandsänderung eines Systems bei Messungen abläuft. Ist die Theorie unvollständig? Wie funktioniert dieser geheimnisvolle Kollaps? Warum reichen Gleichungen wie die von Schrödinger nicht aus, um die Natur in allen Dimensionen zu beschreiben, Atomkern bis makroskopisch? Seit fast einem Jahrhundert wird gerätselt, wie der Formalismus der Theorie auszulegen sei. Es herrscht Einigkeit über Algorithmen und Rechenmethoden, aber nicht beim Versuch, den Sinn des Ganzen zu erfassen. Feynman konnte mit Sicherheit sagen, niemand verstehe wirklich die Quantenmechanik.

Darstellungen

[Bearbeiten]

In der Geometrie können Punkte in diversen Koordinaten dargestellt werden. Das Dreibein eines kartesischen Koordinatensystems darf verschoben und gedreht werden. Auch krummlinige Koordinaten, wie Kugelkoordinaten, sind möglich. Analog dazu kann auch ein Quanten-Zustand bezogen auf verschiedene Basen oder Orthonormalsysteme dargestellt werden. In der Ortsdarstellung liegt er in der ursprünglichen Form als Wellenfunktion vor. Die Koordinaten sind die Funktionswerte an jedem Raumpunkt. Die Basis besteht aus Deltafunktionen. Sie sind die Eigenvektoren des Ortsoperators.

In der Impulsdarstellung ist die Basis die Menge der ebenen Wellen, die dann im Impulsraum als Deltafunktionen auftreten. Die Koordinaten einer allgemeinen Wellenfunktion sind die Fourier-Koeffizienten. Der Wellenvektor ist der Eigenwert, der zu jeder Basisfunktion gehört.

Mehr zu diesen und anderen Darstellungen auf der Unterseite

Heisenbergsche Unschärferelation

[Bearbeiten]

Nach den Postulaten der Theorie ergeben sich alle Messwerte, die aus atomar kleinen Systemen herauszuholen sind, als Eigenwerte von Operatoren. Unmittelbar nach der Messung wird die ganze verfügbare Information zum System reduziert auf einen Eigenvektor oder Eigenzustand. Viele Paare von Operatoren, wie die von Ort und Impuls, sind nicht vertauschbar und haben keine gemeinsamen Eigenvektoren. Man kann nicht beide Attribute ans selbe Objekt anheften. Die Ortsmessung zerstört die genaue Kenntnis des Impulses und umgekehrt. Die quantitative Analyse dieser Unverträglichkeit, und damit der Unmöglichkeit von klassischen Teilchenbahnen, ist Heisenberg zu verdanken.

Quantentheoretische Bilder und Zeitentwicklung

[Bearbeiten]

In Postulat 3 wurde als Zustandsgleichung für die zeitliche Entwicklung eines Quantensystems, die sog. Schrödinger-Gleichung angegeben. Dies entspricht der Darstellung der Quantenmechanik in einem speziellen Bild, in diesem Fall im Schrödinger-Bild. Wegen der Invarianz aller physikalischen Größen unter unitären Transformationen, gibt es jedoch eine unendliche Anzahl äquivalenter Bilder mit denen die Quantenmechanik beschrieben werden kann. Neben dem angesprochenen Schrödinger-Bild, sind das Heisenberg- und das Dirac-Bild noch von besonderem Intresse. In diesem Abschnitt sollen deswegen die verschiedenen quantenmechanischen Bilder und die entsprechenden Transformationen besprochen werden.

Der Harmonische Oszillator

[Bearbeiten]

Dieses wichtige eindimensionale Quantensystem zeigt beispielhaft, wie die Operator-Algebra eingesetzt werden kann, um das Spektrum zu erforschen. Die direkte Lösung der Schrödinger-Gleichung kommt da an zweiter Stelle.

Drehimpuls

[Bearbeiten]

Der Drehimpuls der klassischen Mechanik wird zu einem Operator auf dem Raum der Wellenfunktionen, indem der Impuls im Wesentlichen umgemünzt wird zu einer Ableitung nach den Ortskoordinaten. Die daraus folgende Operator-Algebra wird zuerst durchgerechnet, danach wird der Drehimpuls als Darstellung der Rotations-Symmetrie interpretiert und es wird errechnet, welches diskrete Spektrum von Quanten er hat.

Der Spin

[Bearbeiten]
Atome mit einzelnem äußeren Elektron (Ag) werden im inhomogenen Magnetfeld nach zwei Ausrichtungen sortiert.

Mit den Stern-Gerlach-Experimenten wurde schon 1922 entdeckt, dass ein Strahl von Silberatomen sich nur in zwei Ausrichtungen des magnetischen Moments aufspalten lässt. Die Analyse von Drehimpulsen mit der Schrödinger-Gleichung erschafft aber nur ungeradzahlige Multipletts, weil diese zu den ganzzahligen Darstellungen der Algebra gehören, also Wellenfunktionen haben mit Winkelanteilen wie Kugelfunktionen. Man erkannte, dass das Elektron einen Freiheitsgrad mit halbzahligem Drehimpuls besitzt. Für diese Zustände musste ein neuer Vektorraum an die Wellenfunktion angeflanscht werden. Es war Neue Physik über die bekannte Wellengleichung hinaus.

Das Wasserstoffatom

[Bearbeiten]

Der erste realitätsnahe Testfall für die Schrödingersche Wellengleichung war und ist das einfachste Atom überhaupt. In nullter Näherung hat das Atommodell zwei punktfürmige Teilchen, das schwere Proton der Masse M und das leichte Elektron der Masse m. Deren genaue Strukturen wie Spins, magnetische Momente, Zusammenbau aus noch elementareren Freiheitsgraden, werden zunächst vernachlässigt. Die elektrostatische Anziehung ist die einzige Kraft im Spiel und leitet sich ab vom Coulomb-Potenzial

(Die theoretische Physik fühlt sich noch oft pudelwohl ohne SI-Einheiten.) Das Zweikörpersystem hat also mit den Impulsen und den Ortskoordinaten die Hamiltonfunktion

seine klassische Energie. Der Schritt zur Quantenphysik besteht darin, diese Funktion zu einem Operator zu erheben.

  • Zuerst Berechnungen zum Coulomb-Zentralpotenzial: Unterseite

Die Energie-Eigenwerte der Radialgleichung werden nun ausgerechnet und stimmen haargenau mit der Energiequantelung überein, die das Bohrsche Atommodell geliefert hatte, bevor die Schrödinger-Gleichung entdeckt wurde.

Wasserstoff-Atom, Niveaus (n,l): "erlaubte" Uebergänge

Spin-Bahn-Kopplung und Clebsch Gordan Koeffizienten

[Bearbeiten]

Systeme, die aus mehreren Teilchen und/oder Freiheitsgraden zusammengebaut sind, haben dennoch Zustände mit definierten Werten des Gesamt-Drehimpulses. Dank einer Symmetrie ihres Hamilton-Operators. Wie kann man diese Zustände kombinieren aus den Drehimpuls-Zuständen und Spin-Zuständen der entkoppelten Bausteine?
Manche physikalische Eigenschaften der Systeme haben ein vektorielles oder tensorielles Verhalten unter Drehungen, etwa Dipole, Quadrupole... Die entsprechenden Operatoren befolgen dann bestimmte Regeln, wenn sie auf Zustandsräume mit wohldefinierten Drehimpulsen stoßen. Darunter viele Verbote, allgemein Auswahlregeln, für die Dynamik von Übergängen wie sie beispielsweise mit zeitabhängiger Störungsrechnung behandelt werden.
Das Kapitel soll in die Rechentechnik mit diesen Dingen einführen.

Näherungsmethoden

[Bearbeiten]
zeitunabhängige Störungstheorie
Variationsmethode
zeitabhängige Störung, Dynamik der Übergänge
WKB-Näherung

Streutheorie

[Bearbeiten]

Pfadintegralformulierung

[Bearbeiten]

Doppelspalt-Experiment nach Aharonov-Bohm: Magnetfeld und Schrödingerwelle sind räumlich getrennt, aber der Magnetfluss verschiebt die Interferenzen.

Elektromagnetische Felder

[Bearbeiten]

Aharonov-Bohm-Effekt
Quantisierung des EM-Feldes
Elektron-Photon-WW

Identische Teilchen

[Bearbeiten]

  • Permutationssymmetrie, Bosonen, Fermionen Unterseite

  • Fock-Darstellung, Erzeuger und Vernichter Unterseite
Zwei-Elektronen-Systeme

  • N-Fermionen-Systeme, zu Approximationsmethoden Unterseite

Symmetrien

[Bearbeiten]

  • Symmetrien als Transformationen im Hilbert-Raum Unterseite

Versteckte Variablen ? Bell'sche Ungleichungen

[Bearbeiten]

Relativistische Quantenmechanik

[Bearbeiten]

Vierervektoren

[Bearbeiten]

Einführung in Vierervektoren und Lorentztransformationen:

Operatoren

[Bearbeiten]

In der Relativistischen Quantenmechanik gebräuchliche Operatoren sind:

Der Viererimpuls:

Diese Operatoren produzieren auf ebenen Wellen, ob relativistisch oder nicht, die de-Broglie-Korrespondenz von Energie mit Frequenz und von Impuls mit Wellenvektor (reziproker Wellenlänge). Die relativistische Kinematik schreibt nun eine andere Gleichung zwischen Energie, Impuls und Masse von freifliegenden Teilchen als die nichtrelativistische. Im letzteren Fall führt das Einsetzen der Operatoren geradewegs zur Schrödinger-Gleichung, im ersteren zur Klein-Gordon-Gleichung. Doch Schrödinger in Person hatte die relativistische Gleichung unabhängig von Klein und Gordon schon auf Lager und schob sie schnell beiseite, denn sie hat zwei Strukturfehler:

  • Sie hat kein relativistisch invariantes positiv-definites Skalarprodukt, also keinen Hilbertraum, keine Wahrscheinlichkeitsinterpretation.
  • Sie hat mit Potentialtöpfen keinen Grundzustand niedrigster Energie; alles würde zerfallen in Richtung Energie minus Unendlich.

Dann kam Diracs geniale Idee, Differentialoperatoren erster Ordung zu finden, die Quadratwurzeln des Klein-Gordon-Operators sind. Das gelang ihm mit den Dirac-Matrizen und ergab Wellengleichungen, die den Spin und das magnetische Moment des Elektrons spontan richtig erfassten und die auch Antiteilchen, die Positronen, enthielten. Ein positives Skalarprodukt konnte auch ausgemacht werden, aber das negativ unbegrenzte Energiespektrum war immer noch problematisch. Man behalf sich mit der Erklärung, dass das Vakuum aus einem See bestehe, der ganz mit Teilchen gefüllt sei. Wie bei Halbleitern seien dann die Anregungen Elektronen bzw. Löcher in Bezug auf ein solches Fermi-Niveau.

Die Dirac-Gleichung repariert dann auch weitgehend die Feinstruktur des Wasserstoff-Atoms, aber nicht ganz richtig. Eine experimentelle Lamb-Verschiebung (Lamb Shift) sorgt für Unordnung. Es wurde klar, dass es voreilig war, die Dirac-Gleichung wie die von Schrödinger als Einteilchen-Gleichung zuzulassen. Erst die Theorie der Quantenfelder, die systematisch beliebiege Zahlen von Teilchen, Elektronen, Positronen, Photonen, erzeugen und vernichten kann, und insbesondere die Quantenelektrodynamik, brachte eklatante Erfolge. Der Lamb-Shift und das magnetische Moment des Elektrons konnten mit souveräner Genauigkeit ausgerechnet werden.

Wellengleichungen

[Bearbeiten]

Die wichtigen Wellengleichungen, die bei Lorentz-Transformationen intakt bleiben, sind hier behandelt:

Quantenfelder

[Bearbeiten]

Die folgenden Unterseiten beschäftigen sich mit der Feldtheorie, einer Version der relativistischen Quantenmechanik, die Prozesse mit vielen Teilchen beschreibt, deren Zahl und Typ nicht konstant sind. Insbesondere sollen zwei Fragen beantwortet werden, zwar nicht gründlich, aber einigermaßen ausreichend für einen ersten Duchgang.

  • Was ist die Quantenelektrodynamik?
  • Wie kommen die Feynman-Diagramme zustande?

Anhang

[Bearbeiten]

Die Verzeichnisse zu Personen und Sachen sind Links zu Wikipedia (deutsch). Zu ergänzen.


Statistische Mechanik

[Bearbeiten]

20% fertig „Einführung in die Theoretische Physik“ ist nach Einschätzung seiner Autoren zu 20 % fertig

Einleitung

[Bearbeiten]

Die statistische Mechanik schlägt eine Brücke zwischen den Mikrozuständen und makroskopischer Eigenschaften physikalischer Systeme. Makroskopische Systeme setzen sich aus sehr vielen Einzelkomponenten zusammen, deren Dynamik in der Regel aufgrund der hohen Komplexibilität nicht exakt gelöst werden kann. Dennoch können makroskopische Zustandsvariablen aus den statischen Verteilungen der Mikrozustände abgeleitet werden. Der in der phänomologischen Thermodynamik eingeführte Begriff der Entropie kann mathematisch definiert werden und aus den mikroskopischen Zuständen abgeleitet werden. Die statistische Mechanik findet in vielen Gebieten der Physik und benachbarten Naturwissenschaften Anwendung.

Ergodenhypothese

[Bearbeiten]

Der Phasenraum

[Bearbeiten]

Ein klassisches Vielteilchensystem mit Freiheitsgraden wird durch die Hamiltonfunktion beschrieben, die eine Funktion der generalisierten Koordinaten und Impulse darstellt. Als Phasenraum bezeichnet man die Zusammenfassung der Koordinaten und Impulse zu einem dimensionalen Raum . Die zeitliche Entwicklung des Systems ist bei Festlegung aller Anfangskoordinaten und Anfangsimpulsen, also einem Punkt im Phasenraum, eindeutig durch die Hamliton'schen Bewegungsgleichungen und festgelegt.

Die zeitliche Entwicklung der Phasenraumdichte , d.h. eine Verteilung von Mikrozuständen, liefert das Liouville'sche Theorem:

Die aus der klassischen Mechanik bekannte Poissonklammer ist wie folgt definiert

.

Gleichgewicht und Ensemble-Mittel

[Bearbeiten]

Man spricht von thermodynamischen Gleichgewicht wenn nicht explizit von der Zeit abhängt, also

gilt. Eine makroskopische Größe A ergibt sich dann durch Mittelwertbildung über den Phasenraum

Man kann sich das Ensemble als unendlich viele Realisierungen eines Systems vorstellen, deren Mikrozustände gerade entsprechend der Phasenraumdichte verteilt sind.

Zeitmittelwerte

[Bearbeiten]

Man kann auch eine Größe , welche als Funktion der Trajektorien des i-ten Teilchens in Abhängigkeit von der Zeit abhängt, über die Zeit mitteln. Wir können formal eine Zeitmittelung wie folgt definieren:

.

Das Ergodentheorem besagt nun folgendes: Bei einem System im thermischen Gleichgewicht stimmt die Zeitmittelung mit der Ensemblemittelung überein, also

.

Grundlagen der Wahrscheinlichkeitstheorie

[Bearbeiten]

In diesem Abschnitt soll ein kurzer Abriß der Wahrscheinlichkeitstheorie gemacht werden, da die Statistische Mechanik auf dem Fundament dieser mathematischen Theorie basiert. Die grundlegenden Begriffe lassen sich einfacher anhand von diskreten Ereignissen formulieren.

Ein diskreter Wahrscheinlichkeitsraum besteht aus einer abzählbaren Menge und einer Abbildung
.
Die Abbildung p soll normiert sein, d.h.

ist die Wahrscheinlichkeit von . Eine Untermenge heißt Ereignis.

Beispiel: Der faire Münzwurf besteht aus der Ereignismenge mit den Wahrscheinlichkeiten

Beispiel: Im Stern-Gerlach Versuch (1922) wurden Silberatome in Form eines Atomstrahls in einem inhomogenen Magnetfeld abgelenkt. Nachdem die Atome das Magnetfeld durchlaufen haben wurden sie auf einem Schirm detektiert. Dabei wurde entgegen den Erwartungen der klassischen Physik zwei diskrete Auftreffpunkte auf dem Schirm aufgenommen. Hier ist der Ereignisraum aus , d.h. Atom trifft am oberen oder unteren Punkt auf den Schirm auf. p gibt die entsprechende Wahrscheinlichkeit an.

Sei eine Wahrscheinlichkeitsraum dann heißt eine Abbildung eine Zufallsvariable
heißt Erwartungswert und
Varianz, sofern die Summen konvergieren


Ensembles in der statistischen Mechanik

[Bearbeiten]

Ein Zugang des Ensemble-Begriffs geschieht über die Postulierung folgender Eigenschaften der Verteilungsfunktion:

  1. soll dem System angepasste makroskopische Nebenbedingungen erfüllen.
  2. Alle anderen Größen sollen durch statistisch maximal unbestimmt sein

Nebenbedingungen im ersten Punkt können etwa konstante Teilchenzahl, Druck, Temperatur, Volumen usw. sein. Was im zweiten Teil mit statistisch maximal unbestimmt gemeint ist, wird nun im folgenden diskutiert. Dazu betrachtet man zunächst ein eine diskrete Ereignismenge , deren Elemente jeweils die statistischen Gewichte besitzen. Mit dem Eintreten eines bestimmten Ereignisses gewinnt man Information, die umso größer ist, je unwahrscheinlicher das Ereignis ist. Die Unkenntnis des mikroskopischen Systems quantifiziert man mit der sogenannten Ignoranzfunktion , die folgende Eigenschaften erfüllen soll:

  1. ist eine stetige und symmetrische Funktion der Wahrscheinlichkeiten der Ereignisse.
  2. In der Gleichverteilung, d.h. soll I maximal werden und monoton mit der Anzahl der Ereignisse wachsen.
  3. I soll additiv bei Vergröberung sein

Den letzten Punkt, kann man verstehen, indem man die Zusammenfassung verschiedener Ereignisse betrachtet, also . Zu diesen Blöcken von Ereignissen gehört ebenfalls wieder eine Ignoranzfunktion . Die Forderung nach Additivität in (3) lautet nun:
Der Satz von Shannon besagt, dass diese drei Forderungen die Ignoranzfunktion bis auf eine Konstante festlegen:

Anhand folgender Beispiele soll nun die Methode erläutert werden und gezeigt werden, wie man aus makroskopischen Nebenbedingungen Rückschlüsse auf die Verteilungsfunktionen ziehen kann.
Beispiel: Wir verifizieren Postulat 2 und zeigen, dass die Gleichverteilung die statistisch maximal unbestimmte Verteilung unter der einzigen Nebenbedingung der Normierung ist. Also wir fordern unter der Nebenbedingung . Dieses Problem führt auf die Gleichung

formuliert werden, wobei ein Lagrange'scher Multiplikator ist. Ableiten führt zu , also , also .
Wie später gezeigt wird, kann die Ignoranzfunktion mit der Entropie S und mit der Boltzmannkonstante identifiziert werden.

Der Shannon'sche Satz ist zunächst nur für diskrete Verteilungen definiert. Die Verteilungsfunktion über dem Phasenraum eines N-Teilchensystems hängt allerdings von kontinuierlichen Variablen ab. Um den Formalismus der maximalen Entropie auf kontinuierliche Systeme anzuwenden, führt man ein Referenzphasenvolumen ein und diskretisiert den Phasenraum somit in dimensionale Würfel. Die Ignoranz ist jetzt ein Funktional der Phasenraumdichte :

.

Mithilfe einer Variablentransformation und ist leicht einzusehen, dass bis auf eine additive Konstante unabhängig von der Wahl des Referenzvolumens ist.

Wenden wir uns dem Problem zu, die Verteilungsfunktion des mikrokanonischen Ensembles, in dem die konstante Energie als Nebenbedingung gefordert wird, mithilfe des Prinzip der maximalen Entropie abzuleiten.

Einfache Modellsysteme

[Bearbeiten]

Phasenübergänge und kritische Phänomene

[Bearbeiten]

Quantenstatistik

[Bearbeiten]

Grundlagen der Statistischen Mechanik im Nichtgleichgewicht

[Bearbeiten]

Boltzmann-Gleichung

[Bearbeiten]

Computersimulationsmethoden der statistischen Mechanik

[Bearbeiten]

Mathematische Ergänzungen

[Bearbeiten]

Grundlegendes zur Akustik

[Bearbeiten]

Dieses Buch steht im Regal Physik.

Vorwort

[Bearbeiten]

Akustik ist die Wissenschaft, die sich mit dem Ausstoß, der Übertragung und den Auswirkungen von Schall beschäftigt. Schall ist oftmals etwas Angenehmes (beispielsweise in der Musik). So beschäftigt sich die Raumakustik damit, einen Raum so gut wie möglich klingen zu lassen.

Manche Geräusche allerdings können sehr unangenehm sein und Menschen unbehaglich fühlen lassen. So ist die Geräuschreduzierung ein weiterer Aufgabenbereich der Akustik, besonders innerhalb der Transportindustrie.

Schall (vor allem in Form von Ultraschall) wird auch in der Forschung eingesetzt – zum Beispiel bei Sonarsystemen oder beim zerstörungsfreien Testen von Materialien.

Grundlagen der Akustik

[Bearbeiten]

Schall entsteht auf Grund von Luftdruckschwankungen. Um die Ausbreitung von Schall leichter zu verstehen, kann man sich vorstellen, dass der Raum in dünne Luftschichten aufgeteilt werden kann. Die Schwingung (aufeinanderfolgender Druck und Entspannung) dieser Schichten bei einer gewissen Geschwindigkeit, erlaubt dem Schall, sich auszubreiten und somit eine Welle zu erzeugen. In diesem Abschnitt wird nur die Ausbreitung von Schallwellen in einem Gebiet ohne akustische Quellen in einer homogenen Flüssigkeit betrachtet.

Wellengleichung

[Bearbeiten]

Schallwellen bestehen aus der Ausbreitung eines skalaren Feldes (dem akustischen Wechseldruck) und einem Vektorfeld (der akustischen lokalen Geschwindigkeit / der sogenannten Schallschnelle). Deshalb wird die Ausbreitung von Schallwellen von den folgenden zwei Gleichungen bestimmt, die äquivalent sind:

Diese Gleichungen erhält man durch die Erhaltungsgleichungen (Masse, Impuls und Energie), die thermodynamischen Zustandsgleichungen, die sowohl das Ausbreitungsmedium (Fluid) als auch die Gesetze ihres Verhaltens (Newtonsche Flüssigkeit, Fourier-Gesetz des Leitvermögens) beschreiben. Wenn die Zähigkeit und das Leitvermögen vernachlässigt werden, sehen wir, dass alle Störungen klein genug sind, um die vorhergehenden Gleichungen linearisieren zu können (z.B. kann der nicht-lineare Term in der Impuls-Gleichung vernachlässigt werden). Für spezielle Fälle, bei denen der akustische Überdruck zu hoch wird (zum Beispiel beim Überschallknall), müssen die nicht-linearen Terme beibehalten werden. Diese Fälle werden in der nicht-linearen Akustik behandelt.

In der Ausbreitungsgleichung ist die Ausbreitungsgeschwindigkeit der Schallwelle (die nichts mit der Wechselgeschwindigkeit der Flüssigkeitsschichten zu tun hat). Diese Ausbreitungsgeschwindigkeit erfüllt die folgende Gleichung:

Hierbei ist die Dichte und die Kompressibilität des Ausbreitungsmediums.

Helmholtz-Gleichung

[Bearbeiten]

Da das Geschwindigkeitsfeld für akustische Wellen rotationsfrei ist, können wir ein akustisches Potential definieren durch:

Bei Benutzung der Ausbreitungsgleichung des vorhergehenden Paragraphen, ist es leicht, folgende neue Gleichung zu erhalten:

Durch Anwendung der Fouriertransformation erhalten wir die weithin genutzte Helmholtz-Gleichung:

wobei die Wellenzahl ist, die mit verbunden ist. Die Benutzung dieser Gleichung ist oft der einfachste Weg, ein akustisches Problem zu lösen.

Die Schallintensität und die Dezibel-Skala

[Bearbeiten]

Die Schallintensität repräsentiert den akustischen Energiefluss verbunden mit der Wellenausbreitung:

Nun können wir die durchschnittliche Schallintensität definieren:

Allerdings gibt die Schallintensität keine gute Vorstellung vom Schallpegel, da die Empfindlichkeit unserer Ohren logarithmisch ist. Dafür definieren wir Dezibel durch Benutzung des akustischen Wechseldrucks oder der durchschnittlichen Schallintensität:

wobei für Luft und für jedes andere Medium eingesetzt wird. Außerdem ist W/m².

Lösungen der Wellengleichung

[Bearbeiten]

Ebene Wellen

[Bearbeiten]

Wenn wir die Ausbreitung einer Schallwelle studieren, fernab von der akustischen Quelle, kann sie als ebene 1D Welle angenommen werden. Wenn die Ausbreitungsrichtung entlang der x-Achse stattfindet, ist die Lösung:

wobei f und g beliebige Funktionen sein können. f beschreibt die Bewegung der Welle in Richtung positive x-Achse, wogegen g die Bewegung entgegen der x-Achse beschreibt.

Die Impuls-Gleichung liefert eine Relation zwischen und , was zum folgenden Ausdruck der spezifischen Impedanz führt:

Im Fall einer ebenen Welle bekommen wir den folgenden Ausdruck für die Schallintensität:

Kugelförmige Wellen

[Bearbeiten]

Allgemein breiten sich Schallwellen als Kugelwellen in alle Richtungen gleichermaßen aus. In diesem Fall nimmt die Lösung für das akustische Potential folgende Form an:

Der Umstand, dass das Potential linear mit dem Abstand zur Quelle abnimmt, ergibt sich aus dem Energieerhaltungssatz. Für ideale kugelförmige Wellen lässt sich die spezifische Schallimpedanz und die Schallintensität leicht berechnen.

Randbedingungen

[Bearbeiten]

Für die Randbedingungen, die zur Lösung der Wellengleichung verwendet werden, muss zwischen zwei möglichen Situationen unterschieden werden. Für ein nicht absorbierendes Medium können die Randbedingungen aus den üblichen Gleichungen der Mechanik hergeleitet werden. Für ein absorbierendes Material gelten diese nicht, daher kommt hier das Konzept der Schallimpedanz zum Einsatz.

Nichtabsorbierendes Material
In diesem Fall, stoßen wir auf Grenzbedingungen von Betonungen und auf Geschwindigkeiten an der Schnittstelle. Diese Bedingungen hängen davon ab, ob die Medien Festkörper, dünnflüssige oder klebrige Flüssigkeiten sind.
Absorptionsmaterial
Hier kennen wir die Gleichungen für die Mechanik im Absorptionsmaterial und so nicht, wir müssen den akustischen Scheinwiderstand als die Grenzbedingung verwenden. Dieser Scheinwiderstand, der häufig durch experimentelle Maße gegeben wird, hängt vom Material, der Flüssigkeit und der Frequenz der Schallwelle ab.

Grundlagen der Raumakustik

[Bearbeiten]

Die Raumakustik kann über folgende drei Theorien verstanden werden

  • Modaltheorie
  • Geometrische Theorie
  • Theorie von Sabine

Die Modaltheorie

[Bearbeiten]
Ein Parallelepiped

Diese Theorie leitet sich aus der homogenen Helmholtz-Gleichung ab. Betrachten wir die einfache Geometrie eines Parallelepipeds mit den Seitenlängen , und . Die Lösung dieses Problems mit getrennten Variablen ist:

Dabei hat jede Funktion , und die Form:

Mit der Grenzbedingung für und (und der analogen Grenzbedingung für die anderen Richtungen) erhält man den folgenden Ausdruck für den Druck:

wobei sind.

Es ist eine dreidimensionale stationäre (feststehende) Welle. Akustische Moden erscheinen mit ihren modalen Frequenzen und ihren modalen Formen. In einem nichthomogenen Problem, einem Problem mit einer Schallquelle Q in r0, ist der Enddruck in r die Summe des Beitrags aller Moden, die oben beschrieben sind.

Die Moduldichte ist die Anzahl von Modulfrequenzen enthalten in der Bandbreite von 1 Hertz. Es ist abhängig von der Frequenz , dem Raumvolumen und der Schallgeschwindigkeit :

Die modale Dichte hängt von der Quadratfrequenz ab. Damit nimmt sie schnell mit der Frequenz zu. An einem bestimmten Niveau der Frequenz sind die Moden nicht ausgezeichnet, und die modale Theorie ist nicht mehr relevant.

Die geometrische Theorie

[Bearbeiten]

Für Räume mit hohem Raummaß oder mit einer komplexen Geometrie ist die Theorie von der akustischen Geometrie anwendbar. Die Schallwellen beruhen auf Strahlen, die akustische Energie tragen. Diese Energie nimmt mit der Reflexion der Strahlen an der Raumwand ab. Der Grund dieses Phänomens ist die Schallabsorption der Wände.

Das Problem ist, dass diese Energie eine sehr hohe Zirkulationsenergie braucht. Die weiter unten beschriebene Theorie von Sabine wird deswegen oft bevorzugt, da sie leichter angewandt werden kann.

Die Theorie von Sabine

[Bearbeiten]

Beschreibung der Theorie

[Bearbeiten]

Diese Theorie benutzt die Hypothese des weitschweifigen Feldes. Das akustische Feld ist homogen und isotropisch. Um dieses Feld zu bestimmen, muss der Raum ausreichend widerhallen und die Raumfrequenzen müssen hoch genug sein, um den Effekt der Schallrückkopplung zu vermeiden.

Die Schwankung der akustischen Energie im Raum kann geschrieben werden als:

Dabei sind und die Leistungen, die von der akustischen Quelle erzeugt und von den Wänden absorbiert wird. Die absorbierte Leistung ist abhängig von der Schallenergie des Raumes:

Wobei ist das gleichwertige Absorptionsgebiet, das durch die Summe des Produktes des Absorptionskoeffizienten und des Fläche jedes Materials im Raum definiert ist:

Die Endgleichung ist:

Der stationäre Energie ist:

Nachhallzeit

[Bearbeiten]

Mit dieser beschriebenen Theorie kann die Widerhall-Zeit definiert werden. Es ist die Zeit, die benötigt wird, damit die Energie um 60 dB abnimmt. Es hängt vom Raumvolumen und dem Äquivalent des Absorptionsgebiets a ab:

Diese Widerhall-Zeit ist der wesentliche Parameter der Raumakustik und hängt von dem gleichwertigen Absorptionsgebiet und dem Absorptionskoeffizienten der Frequenz ab. Es wird für mehrere Maße verwendet:

  • Maß eines Absorptionskoeffizienten eines Materials
  • Maß der Kraft der Schallquelle
  • Maß der Übertragung einer Wand

Schallgeschwindigkeit

[Bearbeiten]

Die Schallgeschwindigkeit (von lat. celeritas, „Geschwindigkeit“) variiert abhängig vom Medium, das die Schallwellen durchdringen. Es werden gewöhnlich die Eigenschaften der Substanzen angegeben (z. B. siehe den Artikel über Natrium). Die Schallgeschwindigkeit mit bei 20°C sollte nicht mit der Lichtgeschwindigkeit verwechselt werden, die ebenfalls mit c angegeben wird und die im Vakuum beträgt.

Normalerweise meint man mit der Schallgeschwindigkeit die entsprechende Geschwindigkeit in Luft. Abgesehen vom Medium gibt es auch Unterschiede in der Abhängigkeit von den atmosphärischen Bedingungen. Am wichtigsten ist der Einfluss der Temperatur auf die Schallgeschwindigkeit während die Luftfeuchtigkeit nur einen geringeren Einfluss hat. Dagegen spielt der Luftdruck keine Rolle. Der Schall bewegt sich langsamer mit steigender Höhe über NN, was auf die Änderungen der kühler werdenden Temperatur zurückzuführen ist. Näherungsweise kann die Schallgeschwindigkeit in Metern pro Sekunde wie folgt berechnet werden:

wobei die Temperatur in °C ist.

Details

[Bearbeiten]

Eine genauere Berechnung erhält man mit

wobei

  • ( für Luft) die Gaskonstante für Luft ist. Die universelle Gas-Konstante , welche in \tfrac{\mathrm J}{\mathrm{mol}\cdot\mathrm K}</math> angegeben wird, wird durch die molare Masse von Luft dividiert
  • (Kappa) der adiabatische Index (1,402 bei Luft) ist gelegentlich auch als angegeben
  • die absolute Temperatur in Kelvin ist: .

In der Standard-Atmosphäre:

  • (= 0 °C = 32 °F), womit wir auf 331,5 m/s kommen (= 1087,6 ft/s = 1193 km/h = 741,5 mph = 643,9 Knoten).
  • (= 20 °C = 68 °F), womit wir auf 343,4 m/s kommen (= 1126,6 ft/s = 1236 km/h = 768,2 mph = 667,1 Knoten).
  • (= 25 °C = 77 °F), womit wir auf 346,3 m/s kommen (= 1136,2 ft/s = 1246 km/h = 774,7 mph = 672,7 Knoten).

Wenn wir von einem idealen Gas ausgehen, hängt die Schallgeschwindigkeit nur von der Temperatur ab, nicht vom Druck. Luft ist ein beinahe ideales Gas. Die Lufttemperatur variiert mit der Höhe über NN, womit wir bei Nutzung der Standard-Atmosphäre die folgenden Bedingungen haben (die eigentlichen Bedingungen können abweichen).

Höhe über NN Temperatur m/s km/h mph Knoten
0 (NN) 15 °C (59 °F) 340 1225 761 661
11000 m–20000 m
(Die Flughöhe von Durchschnitts-Jets,
und erste Überschallflieger)
-57 °C (-70 °F) 295 1062 660 573
29000 m (Flug mit X-43A) -48 °C (-53 °F) 301 1083 673 585

In einem nicht-streuenden Medium ist die Schallgeschwindigkeit unabhängig von der Frequenz, somit sind Energie-Transport-Geschwindigkeit und die der Schallverbreitung gleich. In einem streuenden Medium – ist die Schallgeschwindigkeit von der Frequenz abhängig. Die räumliche und zeitliche Streuung einer sich ausbreitenden Störung verändert sich ständig. Jede einzelne Frequenzkomponente breitet sich mit seiner eigenen Phasengeschwindigkeit aus, während sich die Energie der Störung mit der Gruppengeschwindigkeit ausbreitet. Wasser ist ein Beispiel für ein streuendes Medium.

Allgemein ist die Schallgeschwindigkeit gegeben durch

wobei

  • ein Koeffizient der Festigkeit ist
  • die Dichte ist

Demzufolge steigt die Schallgeschwindigkeit mit der Festigkeit des Materials und sinkt mit der Dichte.

Schallgeschwindigkeit in Luft

[Bearbeiten]
Einfluss der Temperatur
θ in °C c in m/s ρ in kg/m³ Z in N·s/m³
−10 325.4 1.341 436.5
−5 328.5 1.316 432.4
0 331.5 1.293 428.3
+5 334.5 1.269 424.5
+10 337.5 1.247 420.7
+15 340.5 1.225 417.0
+20 343.4 1.204 413.5
+25 346.3 1.184 410.0
+30 349.2 1.164 406.6

Freifeld und Hallraum

[Bearbeiten]

Zum exakten Messen von Schallquellen gibt es zwei grundsätzliche Möglichkeiten:

Freifeldraum
In einem Freifeldraum muss der Schall an der Wand möglichst gut absorbiert werden. Hierzu werden die Wände mit Keilen ausgekleidet. Die Keile müssen mindestens die Wellenlänge des zu absorbierenden Schalls haben. Wenn der Boden aus Beton ist, spricht man von einem Halb-Freifeldraum.
Hallraum
In einem Hallraum muss der Schall möglichst gut reflektiert werden, damit man überall im Raum praktisch dasselbe Ergebnis bekommt. Dazu wird der Raum mit Wänden aus Beton oder Stahl ausgeführt. Um keine stehenden Wellen im Raum zu bekommen, ist der Raum idealer weise windschief gebaut oder mit Reflektoren ausgerüstet. Das Volumen des Raums sollte mindestens 200 mal größer sein als das zu prüfende Objekt. Nachteil des Hallraums: Die Richtung aus der der Schall kommt ist nicht feststellbar.

Varianten der klassischen Mechanik

[Bearbeiten]

70% fertig „Einführung in die Theoretische Physik“ ist nach Einschätzung seiner Autoren zu 70 % fertig

Varianten der klassischen Mechanik


Vorangegangene Kapitel haben bereits gezeigt, dass in der klassischen Mechanik (d.h. wenn noch nicht die Notwendigkeit besteht, relativistische oder quantenmechanische Systeme zu betrachten) Newtons Axiome völlig genügen, um Bewegungen von Körpern zu beschreiben. Dennoch zeigt ein Blick in Lehrbücher der theoretischen Mechanik, dass es neben Newtons Mechanik noch andere Varianten geben muss:

  • Das d'Alembert'sche Prinzip,
  • die Lagrange'sche Mechanik,
  • die Hamilton'sche Mechanik und
  • die Hamilton-Jacobi-Theorie.

In den folgenden Kapiteln möchten wir daher diskutieren, was es mit diesen Prinzipien, Mechaniken und Theorien auf sich hat. Und genau an dieser Stelle geraten wir in einen Zwiespalt: Denn einerseits muss erklärt werden, was darunter verstanden wird und andererseits, wozu sie dienen, d.h. warum man diese Anstrengung überhaupt unternimmt. Damit insbesondere in einem einführenden Werk das Verständnis dieser Konzepte nicht durch zu komplizierte mathematischen Formalismen verhindert wird, beschränken wir uns zunächst auf einen einzelnen punktförmigen "Körper" (den wir meist auch "Teilchen" nennen werden), der sich in einem (quasi) eindimensionalen Raum bewegt. Als durchgängiges Beispiel verwenden wir den sog. eindimensionalen "Oszillator", den man sich z.B. als Federpendel realisiert denken kann. Die hieraus gewonnenen Erkenntnisse übertragen wir dann auf eindimensionale Vielteilchensysteme. Durch das Beschränken auf eine Dimension umgehen wir an vielen Stellen die Schwierigkeit, an die betrachteten mechanischen Systeme stellbare Zwangsbedingungen berücksichtigen zu müssen. Dies holen wir aber in einem eigenen Kapitel nach, da die Vorzüge jener Mechanik-Varianten z.T. erst bei Systemen in mehreren Raumdimensionen deutlich werden, wenn Zwangsbedingungen vorhanden sind.

Die Bedeutung dieser theoretischen Konzepte ragt übrigens bis in die moderne Physik hinein: In den sog. quantenfeldtheoretischen Beschreibungen z.B. der Festkörper- oder der Elementarteilchenphysik wird hierauf gerne zurückgegriffen.

Weitere Beispiele

[Bearbeiten]

Bisher wurden nur die einfachsten Beispiele besprochen: harmonische und anharmonische Oszillatoren, Rutschbewegungen entlang schiefer Ebenen und eine von vielen denkbare Realisierung eines physikalischen Pendels. Es gibt viele »Klassiker«, d.h. Beispiele, die sehr häufig in der Literatur beschrieben werden, z.B. weitere Pendeltypen (mathematische, Doppel-, sphärische, Foucault'sche Pendel, ...), hiermit verwandt: Rutsch- und Rollbewegungen entlang unterschiedlichster Bahntypen (beispielsweise entlang einer Zykloide), Gyroskope (freie Kreisel; symmetrische und asymmetrische Kreisel im Schwerefeld der Erde; ...), schwingende Saiten/ Wellenbewegungen (und in diesem Kontext der Zusammenhang zwischen Hamilton-Jacobi'scher Mechanik, der Quantenmechanik und der Eikonal-Näherung aus der Optik), Newtons Gravitationsgesetz usw. Der Wunschzettel ist an dieser Stelle beliebig lang. Beispiele, die bereits in den Kapiteln über die Newton'sche Mechanik diskutiert wurden, können hier mittels der übrigen Mechanik-Varianten nochmals betrachtet werden.

Ein echter Klassiker, an den man in Sachen »Mechanik« zunächst überhaupt nicht denken mag, stammte aus dem Gebiet des Elektromagnetismus: Die Lorentzkraft.

Referenzen

[Bearbeiten]
  1. F. Scheck, Theoretische Physik 1: Mechanik. Von den Newton'schen Gesetzen zum deterministischen Chaos (Springer, 2007).
  2. A. Sommerfeld, Band 1: Mechanik. (Harri Deutsch, 1977).
  3. M.R. Spiegel, Allgemeine Mechanik, Schaum's Outline (McGraw-Hill, 1985).
  4. M.R. Spiegel, Höhere Mathematik für Ingenieure und Naturwissenschaftler, Schaum's Outline (McGraw-Hill, 1983).
  5. A. Lindner, Grundkurs Theoretische Physik (Teubner, 1997).

Maxwell-Gleichungen in der klassischen Elektrodynamik

[Bearbeiten]

60% fertig „Einführung in die Theoretische Physik“ ist nach Einschätzung seiner Autoren zu 60 % fertig

Maxwell-Gleichungen in der klassischen Elektrodynamik


In vorangegangenen Kapiteln wurden bereits die wesentlichsten Resultate der Elektrostatik und Elektrodynamik vorgestellt. Aus diesen kristallisierten sich insbesondere die sog. »Maxwell'schen Gleichungen« der Elektrodynamik heraus. Im Folgenden soll der umgekehrte Weg beschritten werden: Ausgehend von den Maxwell-Gleichungen wird gezeigt, wie sich aus ihnen die Gesetze der klassischen Elektrodynamik und Elektrostatik ergeben. Der Begriff »klassisch« bedeute hier »nicht quantenmechanisch«. Auf eine (speziell-) relativistische Formulierung der Maxwell-Gleichungen wird hingegen eingegangen.

Mikroskopische Maxwellgleichungen

[Bearbeiten]

Die Maxwell-Gleichungen geben Beziehungen zwischen folgenden physikalischen Größen an, die wir als bekannt voraussetzen, da sie bereits in den früheren Kapiteln über Elektrodynamik und Elektrostatik vorgestellt und diskutiert wurden:

  • Ladung q: Neben der Masse m kann ein mechanischer Körper auch

eine Ladung besitzen. Ladungen können im Gegensatz zu Massen auch negativ sein;

  • eine Ladungsdichte ist von der Dimension

»Ladung pro Volumen«, d.h. , wobei wir hier über das Volumen des Körpers integriert haben;

  • die Stromdichte gibt Auskunft über die

Ladungsmenge, die durch eine Fläche je Zeiteinheit fließt, und hängt daher mit dem sog. (elektrischen) Strom I zusammen: , wobei wir hier über z.B. die Querschnittsfläche eines Leiters integriert haben;

  • In einem elektrisches Feld erfahren geladene

Körper Kräfte. Diese Körper können dabei auch durchaus ruhen;

  • In einem magnetischen Feld erfahren bewegte geladene Körper Kräfte.

In Abwesenheit von sog. »Dielektrika« oder »Magnetika« brauchen wir nicht zwischen der magnetische Induktion/ Flussdichte und dem Magnetfeld (später mit bezeichnet) unterscheiden;

Die Lichtgeschwindigkeit im Vakuum werde zudem mit c bezeichnet.

Wenn keine dielektrische oder (z.B. dia-, para-, ferro-)magnetische Materialien vorhanden sind, lauten die somit »mikroskopischen« Maxwell-Gleichungen (in ihrer differenziellen Formulierung):

  • : Diese Gleichung sagt

u.a. etwas darüber aus, dass es keine magnetischen Monopole gibt, während die folgende Gleichung zeigt, dass elektrische Monopole hingegen möglich sind.

  • : Hieraus lässt

sich nämlich u.a. das bekannte Coulomb-Gesetz der Elektrostatik herleiten. Eine Ladungsdichte ist also die Quelle eines elektrischen Feldes.

  • :

Diese Gleichung enthält das gleichermaßen bereits als bekannt vorausgesetzte Ampère'sches Durchflutungsgesetz und ist zudem noch um den sog. Maxwell'schen Verschiebungsstrom-Term erweitert. D.h. sowohl Ströme (bzw. wie hier: Stromdichten) als auch ein sich zeitlich änderndes elektrisches Feld bewirken ein magnetisches Wirbelfeld.

  • :

Jedes sich ändernde Magnetfeld erzeugt ein elektrisches Wirbelfeld. Diese Gleichung beschreibt also Faradays Induktionsgesetz. Im Minuszeichen vor der (partiellen) Zeitableitung der magnetischen Induktion liegt die Ursache der sog. Lentz'schen Regel.

Makroskopische Maxwellgleichungen

[Bearbeiten]

Bei Anwesenheit von Dielektrika oder Magnetika werden vom elektrischen Feld und von der magnetischen Flussdichte noch die elektrische Flussdichte bzw. das magnetisches Feld unterschieden. Die somit makroskopischen Maxwell'schen Gleichungen lauten dann:

  • (keine magnet. Monopole),
  • (Coulomb-Gesetz),

(Ampère'sches Durchflutungsgesetz, Verschiebungsstrom),

(Induktionsgesetz; Minuszeichen: Lentz'sche Regel).

Die elektrische Flussdichte hängt dabei mit dem elektrischen Feld über die elektrische Polarisation zusammen:


.


Die magnetische Flussdichte wird mit dem magnetischen Feld über die magnetische Polarisation verknüpft:


.


Man bezeichnet manchmal die Dielektrika bzw. Magnetika auch als polarisierbare Medien.

In sog. isotropen Dielektrika gilt



und in isotropen Magnetika gilt entsprechend:


,


wobei wir zudem die elektrische Suszeptibilität


,


und die magnetische Suszeptibilität



eingeführt haben.

Im nicht isotropen Fall existiert somit folgender Zusammenhang zwischen den mikroskopischen und den makroskopischen Maxwellgleichungen:

, mit , .

Im isotropen Fall erhalten wir für diesen hingegen:

, mit , , der Lichtgeschwindigkeit im Medium und dem Brechungsindex .

Die homogenen Maxwellgleichungen, d.h. und (also jene ohne Quellterme wie Ladungs- bzw. Stromdichten), bleiben hingegen bei Anwesenheit polarisierbarer Medien unverändert.

Induktionsgesetz

[Bearbeiten]

Mit Hilfe des Stokes'schen Integralsatzes können wir die Maxwell-Gleichung in eine Integralgleichung umwandeln:


,


weil mit gilt. Mit den folgenden weiteren Umformungen (über gleiche Indizes werde dabei von 1 bis 3 summiert)


,


weil mit und gilt,

erhalten wir schließlich durch erneutes Anwenden des Stokes'schen Satzes das Induktionsgesetz in Integralform:


.


Hierin führen wir die Induktionsspannung U und den magnetische Fluss ein:


.


Multiplizieren wir das dort auftretende elektrische Feld mit einer Ladung q, so ergibt sich offensichtlich die bekannte Lorentzkraft auf eine mit der Geschwindigkeit bewegten Ladung:


.


Wellengleichung für die elektrische Feldstärke

[Bearbeiten]

Für die elektrische Feldstärke lässt sich aus den mikroskopischen Maxwell-Gleichungen folgendermaßen eine Wellengleichung gewinnen:

Durch Einsetzen von



in jene inhomogene Maxwell-Gleichung mit der Stromdichte,


,


die zusätzlich noch partiell nach der Zeit abgeleitet wurde,


,


d.h.


,


weil

.

Die sich somit ergebende Wellengleichung lautet:


.


Wenn weder Ladungen noch Ströme vorhanden sind, gilt:


.


Eine allgemeine Lösung der letzteren Wellengleichung ist