Einführung in den Vektorraum – Serlo „Mathe für Nicht-Freaks“
Wir kennen aus der Schule bereits die Vektorräume und . Dort haben wir sie in Form des Koordinatensystems kennengelernt. Der Begriff des Vektorraums ist in der Mathematik sehr viel weiter gefasst. Im Folgenden werden wir ausgehend von den aus der Schule bekannten Vektorräumen den abstrakten mathematischen Begriff des Vektorraums entwickeln.
Der Vektorraum
[Bearbeiten]Im und sind uns Vektoren in Form von Punkten in der Ebene bzw. im Raum bekannt. Manchmal begegnen uns auch Pfeile als Repräsentanten von Vektoren im Koordinatensystem. Vektoren können im durch zwei und im durch drei Koordinaten beschrieben werden. Die Koordinaten stehen für bestimmte Werte. Die folgende Abbildung zeigt zum Beispiel die Pfeildarstellung des Vektors :
Oft reichen drei Koordinaten allerdings nicht aus, um alle gewünschten Informationen abzubilden. Dies zeigen die folgenden zwei Beispiele:
Beispiel (Radiosonde)
Mithilfe einer Radiosonde (Messballon) wollen wir die Erdatmosphäre untersuchen. Neben der Position der Sonde (drei Datenpunkte) erfassen wir verschiedene Messdaten, nämlich Temperatur und Luftdruck. Die drei Koordinaten des werden bereits benötigt, um die Position der Sonde darzustellen. Für die Darstellung der übrigen Messwerte benötigen wir zwei weitere Koordinaten. Wir nehmen an, dass sich die Sonde ausgehend von der Messstation 20 m in östlicher Richtung, 30 m in nördlicher Richtung und in einer Höhe von 15 m befindet. Unsere Instrumente in der Radiosonde zeigen zu diesem Zeitpunkt eine Temperatur von 13° C und einen Luftdruck von 1 bar an. Um alle erfassten Werte zu einem Zeitpunkt aufzuschreiben, notieren wir den Vektor . Dabei ermöglicht das hochgestellte T (transponiert) die platzsparende Schreibweise als Zeilenvektor. Die Schreibweise als Spaltenvektor ist
Somit befinden wir uns im , weil wir fünf Zahlen brauchen, um den Vektor zu beschreiben.
Beispiel (Aktien)
Wir betrachten die Aktienwerte der 30 im DAX (Deutscher Aktienindex) gelisteten Unternehmen zu einem bestimmten Zeitpunkt. Diese können wir in einem Vektor mit 30 Einträgen festhalten, wobei jeder Eintrag für den Wert der jeweiligen Aktie zu dem bestimmten Zeitpunkt steht. Wir erhalten einen Vektor im , der den aktuellen Zustand des Finanzmarktes angibt. Diesen können wir weiter ausbauen, indem wir nicht nur den DAX betrachten, sondern andere Aktien mit aufnehmen. Letztendlich können wir als Dimension unseres „Aktienvektors“ also eine beliebige natürliche Zahl wählen. Der aktuelle Zustand eines Aktienmarktes kann so durch einen Vektor aus dem mit Einträgen kodiert werden.
An den Beispielen haben wir gesehen, dass es notwendig ist, durch Hinzufügen weiterer Dimensionen zu einem allgemeinen Vektorraum zu erweitern. Beim Übergang vom zum können wir uns noch anschaulich vorstellen, dass wir die Dimension durch das Hinzufügen einer unabhängigen Richtung erhöhen. In höheren Dimensionen fehlt uns diese geometrische Vorstellung. Jedoch können wir uns höherdimensionale Vektorräume sehr gut in der Tupelschreibweise vorstellen. Eine zusätzliche Dimension können wir durch das Hinzufügen einer weiteren Zahl erreichen. Diese Zahlen können alle unabhängig voneinander gewählt werden und wir nennen sie Koordinaten.
Verallgemeinerung auf den
[Bearbeiten]Bisher haben wir durch Hinzufügen weiterer Dimensionen zu Vektorräume erzeugt. Nun wollen wir uns anschauen, welche Eigenschaften der reellen Zahlen dafür relevant sind und darauf aufbauend den Vektorraumbegriff weiter verallgemeinern. Mit den Rechenregeln in sind wir gut vertraut. Wir kennen auch schon die Vektoraddition und die skalare Multiplikation im und im . Diese können wir uns anschaulich vorstellen.
-
Addition zweier Vektoren im
-
Skalarmultiplikation im
Genauso können wir aber auch in höheren Dimensionen rechnen. So ist die Summe der Vektoren und :
Die skalare Multiplikation von mit dem Skalar können wir folgendermaßen berechnen:
Genauso wie im können wir allgemein auch im verfahren. Wir wollen uns jetzt überlegen, welche Eigenschaften von das Rechnen mit Vektoren im gewährleisten. Wir sehen an obigen Beispielen, dass die skalare Multiplikation und die Addition von Vektoren in den einzelnen Komponenten der Multiplikation beziehungsweise der Addition in entspricht. So rechnen wir in der ersten Komponente bei der Addition . Ebenso gilt für die skalare Multiplikation in der dritten Komponente .
Das Rechnen im wird also auf die Addition und Multiplikation in zurückgeführt. Hier haben wir eine weitere Möglichkeit der Abstraktion. Eine Menge, in der man wie in den reellen Zahlen addieren und multiplizieren kann, wird Körper genannt. Es sollte also ausreichen, wenn die Zahlen des Vektortupels aus einem Körper stammen. Somit können wir aus jedem allgemeinen Körper , wie den rationalen Zahlen oder den komplexen Zahlen , einen Vektorraum bilden. Analog zum starten wir dabei mit dem Körper und bauen durch Hinzufügen weiterer unabhängiger Richtungen einen Vektorraum auf.
Beispiel (Der Vektorraum )
Der Vektorraum ist wie der eine Menge von Tupeln , nur dass die Einträge ausschließlich rationale Zahlen aus und nicht reelle Zahlen aus sind. Es ist also . So sind und Vektoren aus . Demgegenüber ist kein Vektor aus , da in der zweiten Komponente mit keine rationale Zahl im Tupel steht.
Hinweis
Nicht nur in Körpern kann man Elemente addieren und multiplizieren, sondern auch in Ringen. Warum also abstrahieren wir nicht weiter von Körpern zu Ringen und betrachten ? Tatsächlich kann man das auch machen. Das resultierende Objekt heißt dann nicht mehr Vektorraum, sondern Modul. Einiges der Theorie von Vektorräumen überträgt sich auch auf Moduln. Jedoch ist die Theorie von Moduln komplizierter, weil wir in Ringen nicht durch alle Elemente teilen können, d.h. nicht immer multiplikative Inverse haben. Deshalb machen wir diesen zweiten Abstraktionsschritt erstmal nicht, sondern bleiben bei allgemeinen Körpern.
Zusammenhang mit Polynomstrukturen
[Bearbeiten]Oben haben wir Vektoren des in der Tupelschreibweise verwendet, um Systeme mit Informationseinheiten zu beschreiben. Die Struktur des Rechnens mit Tupel finden wir auch an anderer Stelle. Betrachten wir das Polynom zweiten Grades . Wir sortieren die Summanden stets so, dass die Exponenten vom Grad des Polynoms bis zur absteigend geordnet sind. Dabei stellen wir fest, dass dieses Polynom Ähnlichkeiten zum Vektor aufweist. Dabei steht der erste Koeffizient des Polynoms in der ersten Komponente des Vektors und so weiter.
Dieselbe Ähnlichkeit können wir auch zwischen der Addition und skalaren Multiplikation von Polynomen auf der einen und den zugehörigen Verknüpfungen von Vektortupeln auf der anderen Seite beobachten. Nehmen wir die Polynome mit und mit sowie den Skalar . Die Polynome können wir als Tupel schreiben:
Nun berechnen wir in beiden Darstellungsformen:
Auch die Multiplikation von mit dem Faktor korrespondiert mit der entsprechenden Rechnung in den zugehörigen Tupel:
Jedes Polynom zweiten Grades lässt sich auf die beschriebene Art durch einen dreidimensionalen Vektor eindeutig darstellen. Umgekehrt beschreibt jeder dreidimensionale Vektor eindeutig ein Polynom zweiten Grades. Somit finden wir eine bijektive Abbildung zwischen der Menge der Polynome zweiten Grades und dem . Analog existiert eine bijektive Abbildung zwischen Polynomen dritten Grades und dem und allgemein zwischen Polynomen -ten Grades und dem .
Bisher haben wir als Koeffizienten von Polynomen alle reellen Zahlen zugelassen. Wir können auch Polynome betrachten, deren Koeffizienten Elemente von sind. Dementsprechend sind die Einträge des korrespondierenden Vektors rationale Zahlen. Polynome -ten Grades mit rationalen Koeffizienten korrespondieren damit zu Vektoren aus dem Vektorraum .
Übergang zum allgemeinen Vektorraum-Begriff
[Bearbeiten]Wir haben festgestellt, dass wir mit Polynomen -ten Grades genauso wie mit Vektoren des rechnen können. Die Menge der Polynome -ten Grades weist also eine ähnliche Struktur wie der auf. Bei der Betrachtung aller Polynome, sprich der Polynome beliebigen Grades, stoßen wir mit der Vorstellung des allerdings an unsere Grenzen. In dieser Menge können die Polynome beliebig große Exponenten besitzen:
Um diese Menge durch Tupel zu beschreiben, brauchen wir unendlich viele Einträge. Der Raum aller Polynome umfasst unendlich viele Dimensionen, während wir im auf Dimensionen beschränkt sind. Damit kann die Menge aller Polynome nicht durch eine Menge ausgedrückt werden. Dennoch haben Polynome und Tupel eine gemeinsame Struktur, wie wir bereits gesehen haben. Dies ermöglicht einen weiteren Abstraktionsschritt: Indem wir diese gemeinsame Struktur in einer Definition zusammenfassen, können wir sowohl über Tupel als auch über Polynome und über andere Mengen mit diesen Strukturen sprechen.
Was ist diese gemeinsame Struktur? Die Gemeinsamkeit von Polynomen und von Tupel liegt darin, dass man sie addieren und skalieren kann und dass beide Operationen sich auf beiden Mengen ähnlich verhalten. Dies ist die gemeinsame Struktur, die Vektorräume haben: Vektoren sind Objekte, die man addieren und skalieren kann.
Wir haben einen strukturellen Unterschied zwischen dem und dem Vektorraum aller Polynome festgestellt. Gemeinsam ist ihnen jedoch, dass man ihre Elemente addieren und skalieren kann. Somit erscheint es naheliegend, diese Eigenschaft von Vektoren als definierende Eigenschaft eines jeden Vektorraums anzusehen.
Bis jetzt haben wir noch nicht überlegt, welche Rechenregeln für die Addition und Skalarmultiplikation von Vektoren in allgemeinen Vektorräumen gelten. In haben wir die Assoziativ- und Kommutativgesetze sowie das Distributivgesetz und kennen neutrale und inverse Elemente bezüglich der Addition und der Multiplikation. Wie wir oben gesehen haben, lässt sich das Rechnen im auf das Rechnen in zurückführen. Dementsprechend übertragen sich bestimmte Rechenregeln der reellen Zahlen auf den Vektorraum und analog von jedem Körper auf den .
Herleitung der Definition eines Vektorraums
[Bearbeiten]Die Addition, skalare Multiplikation und alle dazugehörigen Rechengesetze liefern die formale Definition des Vektorraumes. Ausgangspunkt unserer Beschreibung eines Vektorraums ist eine Menge , die alle Vektoren eines Vektorraums enthält. Damit unser Vektorraum mindestens einen Vektor enthält, fordern wir, dass nicht leer ist. Wir haben gesehen, dass die wesentliche Struktur eines Vektorraumes durch die Rechenoperationen, die auf ihm durchgeführt werden, gegeben wird. Wir müssen also Addition und skalare Multiplikation auf einem Vektorraum formal beschreiben.
Die additive Struktur eines Vektorraums
[Bearbeiten]Wir haben bereits definiert, dass ein Vektorraum eine nicht leere Menge sein soll. Nun definieren wir über Axiome, welche Eigenschaften ihre additive Struktur haben muss. Zunächst stellen wir fest, dass eine Addition von Vektoren eine innere Verknüpfung [1] ist. Sie ist also eine Abbildung, bei der zwei Vektoren auf einen anderen Vektor abgebildet werden. Der Funktionswert ist dabei die Summe der beiden Eingangsvektoren.
Diese Abbildung bezeichnen wir mit dem Symbol . So ist die Summe der beiden Vektoren und . Die Schreibweise ist analog zur Schreibweise zu verstehen, wobei wir anstelle von „“ das Symbol „“ schreiben. Statt der Notation wird in der Regel die sogenannte Infixnotation verwendet, die wir im Folgenden nutzen wollen.
Wir nutzen hier das Operationszeichen „“ zur besseren Unterscheidung zwischen der Vektoraddition und der Addition von Zahlen „“, die wir zunächst unabhängig voneinander betrachten können. In den meisten Lehrbüchern wird das Symbol „“ auch für die Vektoraddition verwendet. Ob die Addition von Vektoren oder von Zahlen gemeint ist, muss aus dem jeweiligen Kontext erschlossen werden. Auch wir werden später das Symbol „“ anstelle von „“ benutzen.
Um zu zeigen, dass die Menge mit einer Verknüpfung „“ versehen ist, schreiben wir . Damit wir aber „“ als Addition ansehen können, muss diese Operation gewisse charakteristische Eigenschaften erfüllen, die wir bereits aus der Addition von Zahlen kennen. Diese sind:
-
ist abgeschlossen bezüglich . Die Summe zweier Vektoren ergibt also wieder einen Vektor:
-
Die Vektoraddition ist kommutativ ( erfüllt das Kommutativgesetz):
-
Die Vektoraddition ist assoziativ ( erfüllt das Assoziativgesetz):
-
Die Vektoraddition besitzt ein neutrales Element. Dies bedeutet, dass es mindestens einen Vektor gibt, für den gilt:
Später werden wir zeigen, dass aus den anderen Axiomen bereits folgt, dass jeder Vektorraum genau ein neutrales Element besitzt. Dieses neutrale Element wird Nullvektor genannt. Für den Nullvektor aus dem Vektorraum schreiben wir „“. Wenn klar ist, aus welchem Vektorraum der Nullvektor stammt, dann notieren wir „“.
-
Für jeden Vektor existiert mindestens ein inverses Element . Für den zu inversen Vektor gilt:
Das heißt, dass die Addition jedes Vektors mit seinem Inversen stets das neutrale Element bzw. den Nullvektor ergibt. Wir werden später zeigen, dass der inverse Vektor eindeutig ist. Zu jedem Vektor gibt es also genau einen zu ihm inversen Vektor . Diesen Vektor nennen wir Inverses oder Negatives zu und schreiben dafür meist „“.
Eine Menge mit einer Verknüpfung, die die obigen fünf Axiome erfüllt, nennt man auch eine abelsche Gruppe[2].
Die skalare Multiplikation
[Bearbeiten]Wir haben bereits definiert, welche Eigenschaften die Addition von Vektoren erfüllen muss. Es fehlt noch die Skalierung von Vektoren. Damit wir die skalare Multiplikation von der normalen Zahlenmultiplikation unterscheiden können, verwenden wir dafür zunächst das Symbol „“. In Lehrbüchern wird das Symbol „“ anstelle von „“ benutzt oder der Punkt wird sogar ganz weggelassen. Welche Operation dann gemeint ist, ergibt sich aus dem Kontext. Wir werden diese Notation später ebenfalls verwenden. Die skalare Multiplikation bildet eine Zahl, auch Skalierungsfaktor oder Skalar genannt, und einen Vektor auf einen anderen Vektor ab.
Die Schreibweise bedeutet, dass um gestreckt (oder gestaucht) wird. Es liegt nahe, den Skalar durch zu definieren. Wir können dies aber noch verallgemeinern. Alle Mengen, in denen man ähnlich zu den reellen Zahlen addieren und multiplizieren kann, kommen als Grundmenge für Skalierungsfaktoren infrage. Eine solche Menge wird in der Mathematik Körper genannt.
Die Eigenschaften der skalaren Multiplikation „“ sind denen der Multiplikation von Zahlen ähnlich. Wir wollen die skalare Multiplikation nun formal durch Axiome definieren. Wie bei der Addition ist eine nicht leere Menge der Ausgangspunkt der Definition. Außerdem benötigen wir einen Körper . Die skalare Multiplikation ist eine äußere Verknüpfung , die folgende Eigenschaften erfüllt:
-
Skalares Distributivgesetz:
-
Vektorielles Distributivgesetz:
-
Assoziativgesetz für Skalare:
-
Sei das neutrale Element der Multiplikation im Körper , dann ist auch das neutrale Element der skalaren Multiplikation:
Um Vektoren skalieren zu können, benötigen wir für die Definition eines Vektorraums neben diesem auch einen Körper , aus dem die Skalierungsfaktoren stammen. Deswegen werden Vektorräume immer über einem Körper definiert. Wir sagen „ ist ein Vektorraum über “ oder kurz „ ist ein -Vektorraum“, um auszudrücken, dass die Skalierungsfaktoren für aus stammen.
Definition des Vektorraums
[Bearbeiten]Unsere Überlegungen können wir komprimiert aufschreiben, um die formale Definition eines Vektorraums zu erhalten:
Definition (Vektorraum)
Sei eine nichtleere Menge mit einer inneren Verknüpfung (der Vektoraddition) und einer äußeren Verknüpfung (der skalaren Multiplikation). Die Menge mit diesen beiden Verknüpfungen heißt Vektorraum über dem Körper bzw. -Vektorraum, wenn folgende Axiome gelten:
-
bildet zusammen mit der Verknüpfung eine abelsche Gruppe. Das heißt, folgende Axiome sind erfüllt:
- Assoziativgesetz: Für alle gilt:
- Kommutativgesetz: Für alle gilt:
- Existenz eines neutralen Elements: Es gibt ein Element , so dass für alle gilt: . Dieser Vektor heißt neutrales Element der Addition oder Nullvektor.
- Existenz eines inversen Elements: Zu jedem gibt es ein Element , so dass gilt: . heißt inverses Element zu . Statt schreiben wir auch .
-
Zusätzlich müssen folgende Axiome der skalaren Multiplikation erfüllt sein:
- Skalares Distributivgesetz: Für alle und alle gilt:
- Vektorielles Distributivgesetz: Für alle und alle gilt:
- Assoziativgesetz für Skalare: Für alle und alle gilt:
- Neutrales Element der skalaren Multiplikation: Für alle und für (das neutrale Element der Multiplikation in ) gilt: . 1 heißt neutrales Element der skalaren Multiplikation.
Anstelle von „“ schreibt man oft auch „“. Die letzte Schreibweise macht deutlich, dass zur Menge die Verknüpfungen und gehören.
Hinweis
Wir verwenden die Symbole „“ und „“, um sie von der Addition „“ und der Multiplikation „“ zu unterscheiden. In der Literatur wird diese Unterscheidung häufig nicht getroffen und aus dem Kontext wird deutlich, ob beispielsweise mit „“ eine Addition von Zahlen oder von Vektoren gemeint ist.