Mathe für Nicht-Freaks

Wikibooks

Über das Projekt

Was ist Mathematik?

Die Mathematik ist eine für unser Leben unentbehrliche Wissenschaft. Sie hilft uns, zu vielen Fragen und Problemen Lösungen zu finden und ist für zahlreiche weitere Wissenschaften unersetzlich. Für einige Menschen besitzt sie sogar einen Wert an sich. Dabei ist die Frage, was Mathematik ist, gar nicht leicht zu beantworten. Was macht also die Mathematik aus und womit beschäftigt sie sich?

Historisch ist die Mathematik aus der Untersuchung von geometrischen Figuren und dem Rechnen mit Zahlen entstanden. Heute beschäftigt sie sich in unterschiedlichen Teilgebieten mit abstrakten Strukturen, die in der Regel durch einige wenige Grundaussagen beschrieben werden. Diese Grundaussagen heißen Axiome und alle weiteren Eigenschaften und Gesetzmäßigkeiten der Struktur werden aus den Axiomen mit Hilfe der Logik hergeleitet. Ein Beispiel für eine solche Struktur sind die natürlichen Zahlen, die durch die Peano-Axiome beschrieben werden. Ein anderes Beispiel ist die euklidische Geometrie, die durch Hilberts Axiomensystem charakterisiert wird.

Wie funktioniert Mathematik?

Jede mathematische Theorie besitzt dabei ihre eigenen Axiome. Theorien bauen auch oftmals aufeinander auf, indem sie die Axiome einer Theorie um neue erweitern. Ob die Theorie dabei in sich stimmig ist, also keine Widersprüche erzeugt, zeigt sich erst im Laufe ihrer Entwicklung. Innerhalb einer Theorie werden aus den Axiomen weitere Aussagen hergeleitet, die man Theoreme oder Sätze nennt. Aus den neu gewonnenen Theoremen und den ursprünglichen Axiomen werden weitere Theoreme bewiesen, über die weitere Theoreme bewiesen werden und so fort. Am Ende hat man so eine Vielzahl von Sätzen hergeleitet, die eine mathematische Theorie ausmachen.

Oft wird der Aufbau einer mathematischen Theorie mit dem eines Gebäudes verglichen. Das Fundament bilden die Axiome. Darauf setzen die Theoreme auf und die Beweise sind der Mörtel, welcher alles zusammenhält. Am Ende entsteht so ein komplettes mathematisches Gebäude, die mathematische Theorie. Die Aufgabe des Mathematikers ist hier ähnlich der eines Maurers. Er findet und setzt Axiome für neue Theorien (Fundament legen) und beweist neue Theoreme (neue Steine mit Mörtel auf die Wand mauern).

Ziel einer mathematischen Theorie ist es, gewisse abstrakte Strukturen zu beschreiben und Vorhersagen über diese Strukturen zu machen. Die natürlichen Zahlen mit ihren Rechengesetzen oder Wahrscheinlichkeitsbetrachtungen sind Beispiele für solche Strukturen. Die Axiome einer Theorie legen die betrachtete Struktur fest und die Theoreme sind zusätzliche Eigenschaften der Struktur. Indem Theoreme aus den Axiomen logisch hergeleitet sind, ist garantiert, dass die Struktur die Eigenschaften besitzt, welche durch die Theoreme beschrieben werden. Dies begründet auch das Vorgehen des Beweisens. Immer, wenn man etwas findet, das alle Axiome einer Theorie erfüllt, sind dafür alle Theoreme der Theorie anwendbar, ohne dass man dies extra nachprüfen muss.

Bei der Erforschung einer mathematischen Theorie sieht man oft Muster, die häufig oder in „natürlicher Weise“ auftreten. Man gibt ihnen dann Namen, um sie einfach und kurz bezeichnen zu können. So werden neue Objekte definiert. Diese Definitionen sind entscheidend dafür, dass man kurz und trotzdem exakt über mathematische Theorien sprechen kann. Wenn wir zum Beispiel wissen, was die natürlichen Zahlen sind und wie man sie in Faktoren zerlegen kann, so stoßen wir auf die Struktur der Primzahlen (Zahlen, die sich nur durch eins und sich selbst teilen lassen). Ob und wann eine bestimmte Definition sinnvoll ist, ist durchaus nicht immer leicht zu beantworten. In Bezug auf die Primzahlen erwies es sich später als vorteilhaft, sie wie folgt zu definieren: „Eine Primzahl ist eine natürliche Zahl, die genau 2 Teiler hat.“ Weil die Eins jetzt keine Primzahl mehr ist, kann z. B. $90$ eindeutig (bis auf die Reihenfolge) durch das Produkt von vier Primzahlen ( $2\cdot 3\cdot 3\cdot 5$ ) dargestellt werden. Bei der Beschäftigung mit mathematischen Objekten erkennt man oft weitere Muster. Beispielsweise sieht man bei Primzahlen, dass es sehr viele von ihnen gibt. Man gelangt so zur Vermutung: Möglicherweise gibt es unendlich viele Primzahlen. Ganz gleich, wie offensichtlich eine Vermutung sein kann: Man muss sie nach den strengen Prinzipien der Logik beweisen.

Oft sind mathematische Theorien durch Naturbeobachtungen oder „die Welt um uns herum“ motiviert. So erhält man intuitive Ideen von Strukturen, die man mathematisch beschreiben will. Welche Axiome man als Grundlage einer Theorie wählen sollte, ist keine einfache Frage. Ein Beispiel sind die natürlichen Zahlen: Früh begegnet uns die Idee des Zählens und wir vergleichen Mengen, indem wir die Anzahl ihrer Elemente bestimmen. Ebenso ist uns klar, wie man Zahlen addieren kann. Die Aufgabe eines Mathematikers besteht nun darin, die Struktur der natürlichen Zahlen durch Axiome zu beschreiben. Dazu werden einige einleuchtende Eigenschaften der natürlichen Zahlen festgehalten. Als Mathematiker muss man nun die „richtigen“ Axiome finden, um die Struktur vollständig zu beschreiben. Sie müssen unabhängig voneinander sein und es sollten möglichst wenige davon gesetzt werden.

Sind die Axiome aber erst einmal gesetzt, so existieren sie unabhängig von der „Welt um uns herum“ – und alle daraus logisch ableitbaren Schlussfolgerungen ebenso. Anders als formulierte Naturgesetze der Physik oder Chemie können sie nicht durch spätere Experimente widerlegt werden, sondern gelten als „unbedingt wahr“. In diesem Moment löst sich die Mathematik von den Naturbeobachtungen und ist deshalb streng genommen auch keine Naturwissenschaft mehr. Von einigen wird die Mathematik deshalb den Geisteswissenschaften zugeordnet. Heutzutage wird sie oftmals als Strukturwissenschaft bezeichnet. Wenn die Gesetze der Logik universelle Gültigkeit haben (also zu jeder Zeit und an jedem Ort stimmen), so müsste jede andere Gesellschaft, wenn sie von denselben Axiomen ausgeht, dieselbe Mathematik entwickeln wie wir – ganz egal, ob es sich dabei um Menschen oder eine außerirdische Intelligenz handeln würde. Einmal bewiesene Aussagen haben innerhalb einer mathematischen Theorie eine ewige Gültigkeit und sind nicht mehr widerlegbar.

Die Frage, ob die Logik wirklich so universell ist und welche Axiome zu wählen sind, ist jedoch eine heikle und durchaus philosophische Frage. Als Grundlage des mathematischen Schlussfolgerns wird heutzutage die formale Logik verwendet. Die Logik – traditionell ein Teil der Philosophie – ist heute ein fester Bestandteil der Mathematik. Als axiomatische Grundlage verwendet man in der modernen Mathematik die Axiome der Mengenlehre nach Ernst Zermelo und Abraham Adolf Fraenkel (kurz: ZF) und zumeist das Auswahlaxiom (ZFC, vom englischen choice). Letzteres Axiom ist nicht völlig unumstritten, da sich damit teilweise kontraintuitive Ergebnisse beweisen lassen. Andererseits ist das Auswahlaxiom jedoch für viele Bereiche der Mathematik unerlässlich.

Wird Mathematik entdeckt oder erschaffen?

Diese Frage ist eher philosophischer Natur. Es gibt hierzu zwei unterschiedliche Positionen. In der ersten, der so genannten platonischen Sichtweise sind mathematische Objekte universell vorhanden und werden vom Mathematiker entdeckt. Der Konstruktivismus demgegenüber nimmt die Position ein, dass Mathematik von Menschen erschaffen wird: Ein mathematisches Objekt kann nur dann existieren, wenn man weiß, wie es konstruiert wird. Der Mathematiker Leopold Kronecker tätigte hierzu auch den Ausspruch: „Die ganzen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk.“ Hier betont Kronecker den konstruktiven Charakter der Mathematik, nennt aber mit den ganzen Zahlen auch ein für ihn platonisches Element.

Welche Sichtweise du der Mathematik gegenüber einnimmst, ist dir frei überlassen.^[1]

Mathematik und die Natur

Es ist tatsächlich bemerkenswert, dass sich die Natur durch unsere Mathematik sehr gut beschreiben lässt. Galileo Galilei schrieb dazu: „Das Buch der Natur ist mit mathematischen Symbolen geschrieben.“ Fast alle Wissenschaften nutzen die Mathematik, um mit ihr Modelle über ihr jeweiliges Forschungsfeld zu erstellen: Die Physik, die Chemie, die Biologie, die Wirtschaftswissenschaften und die Geographie zählen dabei noch zu den „direktesten Anwendern“. Jedoch praktisch alle empirischen Wissenschaften führen Beobachtungen durch und brauchen die Hilfsmittel der Statistik, um ihre Aussagen überprüfen zu können.

Dass sich die mehr oder weniger alltäglichen Phänomene mit Hilfe von Mathematik gut erklären lassen, mag vielleicht nicht verwundern: Schließlich wurde die Mathematik entwickelt, um solche Phänomene zu beschreiben. Es ist jedoch erstaunlich, wie universell die Methoden der Mathematik sind. Sie sind auch auf neuere Beobachtungen anwendbar und auf Phänomene, die nichts mit unserem Alltag zu tun haben: die Berechnungen von Planetenbahnen etwa oder elektromagnetische Felder und Ströme. Diese Dinge wurden entdeckt, als die Mathematik schon entwickelt war und nicht „mal eben angepasst“ werden konnte. Noch viel verblüffender ist die Tatsache, dass Mathematiker manchmal völlig abstrakte Konzepte entwickeln, ohne über eine mögliche Anwendung nachzudenken und diese Strukturen sich erst lange Zeit später in Naturbeobachtung wiederfinden, sozusagen „in der Natur realisiert“ sind. Hierfür gibt es streng genommen keinerlei logischen Grund. Schon Albert Einstein stellte sich die Frage, wie es kommt, dass die Mathematik „auf die Gegenstände der Wirklichkeit so vortrefflich passt.“

Viele mathematische Bereiche hängen auch sehr eng mit Naturbeobachtungen zusammen. Deswegen unterscheidet man häufig die reine von der angewandten Mathematik. Die Abgrenzung ist dabei oftmals unscharf, doch gibt es einige Forschungszweige, die man klar der einen oder der anderen Richtung zuweisen kann. „Algebra“ und „Zahlentheorie” zählen beispielsweise zur reinen Mathematik. Die Frage, wie man mit Hilfe von Computern am effizientesten Klimasimulationen durchführen kann, ist jedoch sicherlich angewandt und fällt in den Bereich der „Numerik“.

Teilgebiete der Mathematik

Die ältesten Teilgebiete der Mathematik sind die Geometrie und die Zahlentheorie. Die Geometrie beschäftigt sich mit Figuren in der Ebene wie Dreiecken oder Kreisen und mit Körpern im Raum wie Pyramiden, Quadern oder Kugeln. Die Zahlentheorie, auch Arithmetik genannt, untersucht die Eigenschaften der Zahlen, vor allem der natürlichen Zahlen $0,1,2,\dots$ , und die damit verbundenen Rechengesetze. Diese beiden Teilgebiete werden schon seit tausenden von Jahren betrieben. Sie waren nicht nur den Babyloniern, den Ägyptern und den Griechen bekannt, sondern auch den Chinesen, Indern und den Mayas.

Die grundlegenden Gebiete der modernen Mathematik sind Analysis und Lineare Algebra. Sie werden an den Hochschulen in der Regel als mehrsemestrige Kurse angeboten. Schwerpunkt in der Analysis sind Grenzwertprozesse wie Ableitungen oder Integrale. Die Lineare Algebra behandelt demgegenüber Vektorräume und lineare Abbildungen zwischen diesen Vektorräumen.

Eine Sonderrolle als Teilgebiete der Mathematik spielen seit dem 20. Jahrhundert die Logik und die Mengenlehre. Sie haben eine Doppelrolle: sie sind einerseits Teilgebiete der Mathematik und nutzen mathematische Methoden, stellen aber andererseits die Grundlagen für die gesamte Mathematik zur Verfügung. Die rasante Entwicklung der Naturwissenschaften, der Technik und der Informatik machte ein Nachdenken über die Grundlagen der Mathematik, und damit eine Beschäftigung mit Logik und Mengenlehre, notwendig.

Aus den Anfängen der Mathematik hat sich eine Vielzahl von weiteren Teilgebieten entwickelt. Der Brockhaus^[2] nennt 11 Teilgebiete:

Geometrie
Zahlentheorie
Algebra
Mengenlehre
Logik
Analysis
Funktionentheorie, -analysis
Topologie, Graphentheorie
Wahrscheinlichkeitstheorie und Statistik
Komplexitätstheorie
Numerische Mathematik

Im Wikipedia-Artikel „Teilgebiete der Mathematik“ werden 21 Teilgebiete genannt.

In der Funktionentheorie werden komplexe Funktionen analysiert. Die Topologie beschäftigt sich mit der Verformung von Körpern, die Graphentheorie mit Knoten und Kanten. Die Wahrscheinlichkeitstheorie untersucht zufällige Ereignisse, die Statistik entwickelt Methoden zur Auswertung von Messdaten. In der Numerischen Mathematik werden Berechnungsverfahren ermittelt und die Komplexitätstheorie untersucht den Aufwand von Rechenverfahren.

Charakteristisch für die Mathematik sind fließende Übergänge von einem Teilgebiet zum anderen. Immer wieder werden die in einem Teilgebiet entwickelten Methoden auch in anderen Teilgebieten verwendet. Daher ist es kaum möglich, die Teilgebiete exakt voneinander abzugrenzen.

Aussagenlogik

In den beiden vorangegangenen Kapiteln hast du Aussagen und Junktoren kennengelernt. Mit Hilfe der Junktoren kann man aus Aussagen weitere Aussagen erzeugen. Wir hatten auch gesehen, dass in der Mathematik eine formalisierte Sprache benutzt wird. Das hat mehrere Gründe:

Zum einen ist unsere natürliche Sprache nicht eindeutig. Die Eindeutigkeit der Begriffe und Zusammenhänge ist aber für die Mathematik ganz wesentlich.
Zum anderen werden in der Mathematik viele abstrakte Sachverhalte beschrieben und analysiert, für die neue Begriffe mit einer genau festgelegten Bedeutung benötigt werden.

Deshalb benutzt die Mathematik eine künstliche Sprache, die als formale Sprache bezeichnet wird. Wir werden diese Sprache schrittweise vorstellen und beginnen damit in diesem Kapitel. Die weiteren Schritte folgen in der Prädikatenlogik und in der Klassenlogik.

Die folgenden Definitionen erscheinen sehr formal, insbesondere dann, wenn ihr zum ersten Mal damit konfrontiert werdet. Diese formale Strenge hilft jedoch dabei, Fehlschlüsse zu vermeiden und die Mathematik auf eine sichere Grundlage zu stellen.

Die Sprache der Aussagenlogik

Für die Logik ist die formale Sprache besonders wichtig, denn mit Hilfe der Logik werden ja die mathematischen Beweise geführt. Beweise verlaufen nach ganz bestimmten Regeln. Das Einhalten dieser Regeln muss automatisiert nachprüfbar sein! Und das geht in einer formalisierten Sprache am besten. Die Sprache, in der Aussagen mit Junktoren verknüpft werden, ist die Sprache der Aussagenlogik. Wie unsere natürliche Sprache hat sie ein Alphabet:

Definition (Alphabet der Aussagenlogik)

Die Sprache der Aussagenlogik hat drei Arten von Zeichen:

die Aussagenkonstanten $K_{0},K_{1},K_{2},\dots$ , ${\mathsf {W}}$ und ${\mathsf {F}}$ ,
die Junktoren $\neg$ , $\land$ , $\lor$ , ${\dot {\lor }}$ , $\Rightarrow$ und $\Leftrightarrow$ ,
die Klammern $($ und $)$ .

Die Zeichen heißen ${\mathsf {W}}$ (Wahr) und ${\mathsf {F}}$ (Falsch), die Junktoren $\neg$ (Negation), $\land$ (Konjunktion), $\lor$ (Disjunktion), ${\dot {\lor }}$ (Kontravalenz), $\Rightarrow$ (Implikation) und $\Leftrightarrow$ (Äquivalenz).

Anmerkung: Genau genommen bestehen die Konstanten selbst aus mehreren Zeichen, dem Buchstaben $K$ und einer Zahl. Wir wollen die Konstanten hier aber als eine Einheit betrachten. Es ist nicht weiter wichtig, wie sie genau realisiert werden. Wichtig ist nur, dass wir ausreichend viele Konstanten haben und bei Bedarf immer noch ein paar neue hinzunehmen können.

Aus diesen Zeichen können nach bestimmten Regeln Wörter gebildet werden, die in diesem Zusammenhang Formeln oder wohlgeformte Zeichenreihen genannt werden. Zeichenreihen entstehen einfach dadurch, dass Zeichen aus dem Alphabet hintereinander geschrieben werden, zum Beispiel so: $(K_{3}\land {\mathsf {W}}\lor \neg K_{0}(\Rightarrow$ . Aber das ist keine Formel!

Definition (Formeln der Aussagenlogik)

Die Formeln der Aussagenlogik werden nach folgenden Regeln gebildet:

Jede Aussagenkonstante ist eine Formel, ${\mathsf {W}}$ und ${\mathsf {F}}$ sind Formeln.
Ist $A$ eine Formel, so ist auch $\neg A$ eine Formel.
Sind $A$ und $B$ Formeln, so sind auch $(A\land B)$ , $(A\lor B)$ , $(A\;\;\!\!{\dot {\lor }}\;\;\!\!B)$ , $(A\Rightarrow B)$ und $(A\Leftrightarrow B)$ Formeln.

Es gibt keine weiteren Formeln.

Eine solche Definition wird rekursiv (lat. zurückgehend) genannt, weil bei der Erzeugung weiterer Formeln auf bereits erzeugte Formeln zurückgegriffen wird.

Beispiel für eine Formel

Um zu zeigen, wie diese Regeln angewendet werden, zeigen wir, dass $(\neg (K_{1}\Leftrightarrow K_{2})\Leftrightarrow (K_{1}\;\;\!\!{\dot {\lor }}\;\;\!\!K_{2}))$ eine Formel der Aussagenlogik ist:

Zeile	Formel	Begründung
1	$K_{1}$	nach Regel 1, $K_{1}$ ist eine Aussagenkonstante
2	$K_{2}$	nach Regel 1, $K_{2}$ ist eine Aussagenkonstante
3	$(K_{1}\Leftrightarrow K_{2})$	nach Regel 3 angewendet auf Zeile 1 und 2
4	$\neg (K_{1}\Leftrightarrow K_{2})$	nach Regel 2 angewendet auf Zeile 3
5	$(K_{1}\;\;\!\!{\dot {\lor }}\;\;\!\!K_{2})$	nach Regel 3 angewendet auf Zeile 1 und 2
6	$(\neg (K_{1}\Leftrightarrow K_{2})\Leftrightarrow (K_{1}\;\;\!\!{\dot {\lor }}\;\;\!\!K_{2}))$	nach Regel 3 angewendet auf Zeile 4 und 5

Beweis über den Aufbau der Formeln

Die rekursive Definition der Formeln erlaubt ein besonderes Beweisverfahren. Um eine Behauptung für alle Formeln zu beweisen, genügen zwei Schritte:

Im ersten Schritt wird die Behauptung für die Aussagenkonstanten $K_{i}$ und für ${\mathsf {W}}$ und ${\mathsf {F}}$ gezeigt.
Im zweiten Schritt wird gezeigt, dass sich die Behauptung unter den Regeln vererbt. Das heißt Folgendes:
- Wenn die Behauptung für eine Formel $A$ gilt, dann gilt sie auch für die Formel $\neg A$ .
- Wenn die Behauptung für die Formeln $A$ und $B$ gilt, dann gilt sie auch für die Formel $(A\land B)$ , $(A\lor B)$ , $(A\;\;\!\!{\dot {\lor }}\;\;\!\!B)$ , $(A\Rightarrow B)$ und $(A\Leftrightarrow B)$ .

Es ist klar, dass die Behauptung dann für alle Formeln gelten muss, denn Formeln können ja nur aufgrund dieser Regeln entstehen! Wir zeigen als Beispiel den folgenden einfachen Satz:

Satz

Jede Formel enthält genauso viele linke wie rechte Klammern.

Beweis

Für beliebige Aussagenkonstanten $K_{i}$ und für ${\mathsf {W}}$ und ${\mathsf {F}}$ ist das richtig, denn sie enthalten gar keine Klammern.
Wenn $A$ genauso viele linke wie rechte Klammern enthält, dann gilt das auch für $\neg A$ , denn bei der Bildung der Negation kommen keine Klammern dazu. Haben schließlich $A$ und $B$ jeweils gleich viele linke wie rechte Klammern, so kommen bei $(A\land B)$ genau eine linke und eine rechte Klammer dazu. Also bleiben es gleich viele. So ist es auch bei den weiteren Regeln für $(A\lor B)$ , $(A\;\;\!\!{\dot {\lor }}\;\;\!\!B)$ , $(A\Rightarrow B)$ und $(A\Leftrightarrow B)$ . ✔

Klammerersparnis, Schreibweisen

Bei der Schreibweise von Formeln lassen wir die Außenklammern in der Regel weg und erlauben uns auch andere Freiheiten. Es muss nur immer klar sein, welche Formel im Sinne der obigen Definition gemeint ist. Natürlich übernehmen wir auch die Bindungsregeln aus dem Kapitel über Junktoren, um Klammern wegzulassen:

Negation $\neg$
Konjunktion $\land$
Disjunktion $\lor$
Implikation $\Rightarrow$
Äquivalenz $\Leftrightarrow$

Falls es dem Verständnis dient, setzen wir auch zusätzliche Klammern.

Aussagen formalisieren

Wir greifen nun einige Aussagen auf, die wir schon im Kapitel Junktoren angesprochen haben. Wenn wir Aussagen formalisieren, dann heißt das nichts anderes, als sie in eine Formel zu übersetzen, die der Aussage möglichst gut entspricht.

Beispiel 1: Zwei Aussagen werden mit dem Junktor und verbunden.

„ $2$ ist kleiner als $36$ und $5$ ist gerade.“

Zurzeit haben wir nur die Möglichkeit, die beiden Aussagen durch eine Konstante wiederzugeben, sagen wir durch $K_{1}$ („ $2$ ist kleiner als $36$ “) und $K_{2}$ („ $5$ ist gerade“). Dann lautet die formalisierte Aussage einfach:

K_{1}\land K_{2}

Da es hierbei auf die Konstanten $K_{1}$ und $K_{2}$ gar nicht ankommt, verwendet man einfach auch die Variablen $A$ und $B$ und schreibt $A\land B$ für die formalisierte Aussage. Wir wissen aber aus dem Zusammenhang, dass damit eine exakte Formel der Aussagenlogik gemeint ist.

Anmerkung: Wir werden in den Kapiteln Prädikatenlogik und Klassenlogik weitere Möglichkeiten kennenlernen, Aussagen besser zu formalisieren.

Verständnisfrage: Formalisiere die folgenden Aussagen:

Wenn Berlin in Deutschland liegt und der Rhein durch Deutschland fließt, dann liegt Berlin am Rhein.
Teilt $6$ eine natürliche Zahl $n$ , dann wird $n$ entweder von $2$ oder von $3$ geteilt.
Es gibt unendlich viele Primzahlen.

Antwort:

Sei $K_{1}:=$ Berlin liegt in Deutschland, $K_{2}:=$ Der Rhein fließt durch Deutschland, $K_{3}:=$ Berlin liegt am Rhein. Dann lautet die Formalisierung $(K_{1}\land K_{2})\Rightarrow K_{3}$ . Die Außenklammern haben wir nach der Klammerersparnisregel weggelassen.
$A\Rightarrow (B\;\;\!\!{\dot {\lor }}\;\;\!\!C)$ , wobei $A:=6{\text{ teilt }}n$ , $B:=2{\text{ teilt }}n$ und $C:=3{\text{ teilt }}n$ bedeuten. Hier haben wir für die Konstanten einfach $A,B,C$ anstelle von $K_{1},K_{2},\dots$ verwendet, weil ja klar ist, dass damit in diesem Zusammenhang Aussagenkonstanten gemeint sind.
Diese Aussage enthält keine Junktoren. In der Aussagenlogik kann man sie nur durch eine Konstante formalisieren.

Teilformeln

Beim rekursiven Aufbau einer Formel $A$ erhält man zwischendurch weitere Formeln. Diese Formeln werden Teilformeln genannt. Die genaue Definition ist natürlich ebenfalls rekursiv. Teilformeln, die keine echten Teilformeln haben, heißen atomare Formeln.

Definition (Teilformeln, atomare Formeln)

Die Aussagenkonstanten $K_{i}$ und die Formeln ${\mathsf {W}}$ und ${\mathsf {F}}$ sind atomare Formeln und Teilformeln von sich selbst.
Die Teilformeln von $\neg A$ sind die Teilformeln von $A$ und $A$ selbst. Die Teilformeln von $(A\land B)$ , $(A\lor B)$ , $(A\;\;\!\!{\dot {\lor }}\;\;\!\!B)$ , $(A\Rightarrow B)$ und $(A\Leftrightarrow B)$ sind die Teilformeln von $A$ und $B$ , sowie $A$ und $B$ selbst.

Verständnisfrage: Welche Teilformeln hat die im Beispiel oben erstellte Formel $(\neg (K_{1}\Leftrightarrow K_{2})\Leftrightarrow (K_{1}\;\;\!\!{\dot {\lor }}\;\;\!\!K_{2}))$ ?

Antwort:

Atomere Formeln: $K_{1}$ und $K_{2}$ . Weitere Teilformeln: $(K_{1}\Leftrightarrow K_{2})$ , $(K_{1}\;\;\!\!{\dot {\lor }}\;\;\!\!K_{2})$ , $\neg (K_{1}\Leftrightarrow K_{2})$ und die Formel $(\neg (K_{1}\Leftrightarrow K_{2})\Leftrightarrow (K_{1}\;\;\!\!{\dot {\lor }}\;\;\!\!K_{2}))$ selbst.

Junktor

Junktoren sind bestimmte Symbole in der Aussagenlogik, die Aussagen miteinander verbinden oder in eine Beziehung stellen. Das Wort Junktor stammt vom lateinischen Wort „iungere“ ab, was so viel wie „verknüpfen, verbinden“ bedeutet. Junktoren kann man deshalb gut mit Bindewörtern vergleichen, wie sie in natürlichen Sprachen vorkommen (Beispiele für Bindewörter sind „und“, „oder“, „aber“). Während Junktoren in der Logik Aussagen miteinander verknüpfen, verbinden Bindewörter einzelne Satzteile in einer natürlichen Sprache. Dementsprechend gibt es (wie du noch sehen wirst) in der deutschen Sprache für Junktoren ein äquivalentes oder ähnliches Bindewort.

Es gibt aber einen entscheidenden Unterschied: Die Bedeutung eines Junktors ist eindeutig definiert, wohingegen Bindewörter oftmals eine unterschiedliche Bedeutung (je nach Kontext, in dem sie verwendet werden) besitzen. So bedeutet „oder“ im Satz „Gehst du nun ins Kino oder bleibst du zu Hause?“, dass die angesprochene Person die Entscheidung hat, entweder ins Kino zu gehen oder zu Hause zu bleiben (es geht nur eines von beiden). Im Satz „Er freut sich über seinen Lottogewinn oder seine neue Freundin“ besitzt „oder“ eher die Bedeutung eines „und/oder“ (die Person kann sich sowohl über den Lottogewinn als auch über die neue Freundin freuen). Im Satz „Gehst du nun ins Kino oder ins Restaurant?“ kann „oder“ sowohl ausschließend als auch einschließend gemeint sein.

Es ist wichtig, dass du die Definitionen und Eigenschaften der einzelnen Junktoren genau kennst (insbesondere diejenigen Eigenschaften, die scheinbar der Intuition widersprechen), da dir sonst leicht Fehler in der Anwendung passieren. Es ist auch wichtig, dass du klar zwischen Bindewörtern der natürlichen Sprache und aussagelogischen Junktoren unterscheidest.

Einführende Beispiele

Nimm als Beispiel die folgenden zwei Aussagen:

Aussage $A$ : „ $36$ ist durch 2 teilbar.“

Aussage $B$ : „ $5$ ist gerade.“

Diese beiden Aussagen kannst du miteinander verknüpfen, indem du den Junktor „und“ verwendest. Du erhältst dadurch die Aussage: „ $36$ ist durch 2 teilbar und $5$ ist gerade.“ Beachte dabei, dass hier „und“ als Junktor verwendet wird. Du kannst aber auch die beiden Aussagen auf eine ganz andere Art und Weise miteinander verknüpfen, nämlich: „Wenn $36$ durch 2 teilbar ist, dann ist $5$ gerade.“ Hier ist der Junktor der „Wenn-dann“-Junktor, der beide Aussagen miteinander verknüpft. Beide Beispiele zur Übersicht:

Aussage „ $A$ und $B$ “: $\overbrace {36{\text{ ist durch }}2{\text{ teilbar}}} ^{\text{Teilaussage 1}}\ {\color {Orange}\overbrace {\text{ und }} ^{\text{Junktor}}}\ \overbrace {5{\text{ ist gerade}}} ^{\text{Teilaussage 2}}$

Aussage „Wenn $A$ , dann $B$ “: ${\color {Orange}\overbrace {\text{ Wenn }} ^{\text{Junk-}}}\overbrace {36{\text{ ist durch }}2{\text{ teilbar}}} ^{\text{Teilaussage 1}}\ {\color {Orange}\overbrace {\text{dann}} ^{\text{tor}}}\ \overbrace {5{\text{ ist gerade}}} ^{\text{Teilaussage 2}}$

Für Junktoren werden Symbole verwendet. So ist für den Junktor „und“ das Symbol $\land$ und für den „Wenn-dann“-Junktor das Symbol $\Rightarrow$ gebräuchlich. Damit können obige beide Aussagen folgendermaßen dargestellt werden:

Aussage „ $A$ und $B$ “: $\overbrace {36{\text{ ist durch }}2{\text{ teilbar}}} ^{\text{Teilaussage 1}}\ {\color {Orange}\overbrace {\land } ^{\text{Junktor}}}\ \overbrace {5{\text{ ist gerade}}} ^{\text{Teilaussage 2}}$

Aussage „Wenn $A$ , dann $B$ “: $\overbrace {36{\text{ ist durch }}2{\text{ teilbar}}} ^{\text{Teilaussage 1}}\ {\color {Orange}\overbrace {\Rightarrow } ^{\text{Junktor}}}\ \overbrace {5{\text{ ist gerade}}} ^{\text{Teilaussage 2}}$

Offene Frage: Überlege dir einige mathematische Aussagen. Welche Verknüpfungen sind in diesen Aussagen enthalten? Welche verknüpften Teilaussagen kannst du ausmachen?

Verständnisfrage: Nimm den Satz: „Wenn $x$ eine natürliche Zahl ist und $x$ gerade ist, dann ist $x$ durch 2 teilbar.“ Wie kannst du diesen Satz in Teilaussagen und Junktoren zerlegen?

{\begin{aligned}\overbrace {\left(\underbrace {x{\text{ ist eine natürliche Zahl}}} _{\mathrm {Teilaussage} }\ \underbrace {\mathrm {und} } _{\mathrm {Junktor} }\ \underbrace {x\mathrm {\ ist\ gerade} } _{\mathrm {Teilaussage} }\right)} ^{\mathrm {Teilaussage} }\\[0.5em]\qquad \overbrace {\mathrm {Wenn\ } \ldots \mathrm {,\ dann\ } \ldots } ^{\mathrm {Junktor} }\qquad \overbrace {x\mathrm {\ ist\ durch\ } 2\mathrm {\ teilbar} } ^{\mathrm {Teilaussage} }\end{aligned}}

Und mit Symbolen:

\overbrace {\left(\underbrace {x{\text{ ist eine natürliche Zahl}}} _{\mathrm {Teilaussage} }\ \underbrace {\land } _{\mathrm {Junktor} }\ \underbrace {x\mathrm {\ ist\ gerade} } _{\mathrm {Teilaussage} }\right)} ^{\mathrm {Teilaussage} }\qquad \overbrace {\Rightarrow } ^{\mathrm {Junktor} }\qquad \overbrace {x\mathrm {\ ist\ durch\ } 2\mathrm {\ teilbar} } ^{\mathrm {Teilaussage} }

Junktoren verbinden nur Aussagen

Du solltest dir auch merken, dass Junktoren nur Aussagen miteinander verbinden. Die durch den Junktor verbundenen Teile müssen also selbst wieder Aussagen und keine Satzfragmente oder Ähnliches sein. Nimm hierzu den Beispielsatz:

„7 und 42 sind natürliche Zahlen.“

Hier ist „und“ kein Junktor! Wenn dem so wäre, dann müssten die Satzteile „7“ sowie „42 sind natürliche Zahlen“ Aussagen sein, was sie aber nicht sind:

{\color {OliveGreen}\underbrace {7} _{\text{Satzfragment }}}{\color {Red}\overbrace {\text{ und }} ^{\text{ kein Junktor }}}{\color {Blue}\underbrace {42{\text{ sind natürliche Zahlen}}} _{\text{grammatikalisch falsch}}}

Anders sieht die Sache aus, wenn man obigen Satz leicht umformuliert:

„7 ist eine natürliche Zahl und 42 ist eine natürliche Zahl.“

Hier ist „und“ ein Junktor, weil die einzelnen Teile wiederum Aussagen sind:

{\color {OliveGreen}\underbrace {7{\text{ ist eine natürliche Zahl }}} _{\text{Aussage}}}{\color {Orange}\overbrace {\text{ und }} ^{\text{ Junktor }}}{\color {Blue}\underbrace {\ 42{\text{ ist eine natürliche Zahl}}} _{\text{Aussage}}}

Du siehst an obigem Beispiel gut, dass nicht jedes Bindewort der natürlichen Sprache automatisch ein Junktor ist und dass sauber zwischen Junktoren und deren zugeordneter Übersetzung unterschieden werden muss.

Die Junktoren

Im Folgenden stellen wir die für die Mathematik wichtigsten Junktoren vor. Um eine übersichtliche Notation zu erreichen, werden wir, wie es in der Mathematik üblich ist, als Platzhalter für Aussagen Großbuchstaben wie $A$ , $B$ und $C$ verwenden. Beachte, dass diese Platzhalter auch für Aussagen stehen können, die selbst wieder eine Verknüpfung von mehreren Aussagen sind. Neben jedem Junktor findest du eine sogenannte Wahrheitstabelle des jeweiligen Junktors. Sie gibt den Wahrheitswert der zusammengesetzten Aussage in Abhängigkeit der Wahrheitswerte der einzelnen Teilaussagen wieder. $W$ steht dabei für „wahr“ und $F$ steht für „falsch“.

Negation – die Verneinung einer Aussage

Wahrheitstabelle: Negation
$A$	$\neg A$
$\mathrm {F}$	$\mathrm {W}$
$\mathrm {W}$	$\mathrm {F}$

Der erste Junktor, den wir vorstellen, ist die Verneinung einer Aussage, welche Negation genannt wird. Die Negation kehrt den Wahrheitswert einer Aussage um: Aus „wahr“ wird durch Negation „falsch“ und analog aus „falsch“ wird „wahr“. Mit anderen Worten: Eine negierte Aussage $A$ ist genau dann wahr, wenn die Aussage $A$ falsch ist. Dies kannst du auch rechts der Wahrheitstabelle zur Negation entnehmen. Das Symbol der Negation ist $\neg$ . Wenn du also die Verneinung einer Aussage $A$ ausdrücken möchtest, so schreibst du $\neg A$ auf (gesprochen „nicht A“). Es gibt aber auch die Notation ${\overline {A}}$ (gesprochen „A quer“) beziehungsweise ${\sim }A$ , um die Negation von $A$ aufzuschreiben.

Es ist wichtig, dass du lernst, wie man eine Aussage richtig negiert. So ist zum Beispiel die Negation der Aussage „Es regnet“ nicht die Aussage „Es scheint die Sonne“, sondern die Aussage „Es regnet nicht“. Es könnte ja zum Beispiel sein, dass es bewölkt ist, es aber nicht regnet. Um eine logische Aussage zu negieren, gibt es einfache Umformungsregeln, die du beachten musst. Diese werden wir später im Kapitel „Aussagen negieren“ erklären.

Konjunktion – die Und-Verknüpfung

Wahrheitstabelle: Konjunktion
$A$	$B$	$A\land B$
$\mathrm {F}$	$\mathrm {F}$	$\mathrm {F}$
$\mathrm {F}$	$\mathrm {W}$	$\mathrm {F}$
$\mathrm {W}$	$\mathrm {F}$	$\mathrm {F}$
$\mathrm {W}$	$\mathrm {W}$	$\mathrm {W}$

Eine wichtige Verknüpfung zwischen zwei Aussagen $A$ und $B$ ist die Konjunktion, die Und-Verknüpfung „ $A$ und $B$ “. Das Symbol für „und“ ist $\land$ (als Merkhilfe kannst du an ein großes A vom Englischen „and“ für „und“ denken). Wenn du also notieren möchtest, dass sowohl die Aussage $A$ als auch die Aussage $B$ wahr ist, schreibst du $A\land B$ . Wie du aus der Wahrheitstabelle entnehmen kannst, ist eine Aussage $A\land B$ dann und nur dann wahr, wenn sowohl $A$ als auch $B$ wahr sind. Wenn bereits eine der beiden Teilaussagen falsch ist, ist die gesamte Aussage falsch. Dies deckt sich mit dem alltäglichen Gebrauch des Bindewortes „und“.

Disjunktion – die Oder-Verknüpfung

Wahrheitstabelle: Disjunktion
$A$	$B$	$A\lor B$
$\mathrm {F}$	$\mathrm {F}$	$\mathrm {F}$
$\mathrm {F}$	$\mathrm {W}$	$\mathrm {W}$
$\mathrm {W}$	$\mathrm {F}$	$\mathrm {W}$
$\mathrm {W}$	$\mathrm {W}$	$\mathrm {W}$

Außerdem kann man Aussagen noch über eine Oder-Verknüpfung miteinander verbinden. Dazu gibt es in der Logik die Disjunktion mit dem Symbol $\lor$ . Wenn du sagen möchtest, dass mindestens eine der beiden Aussagen $A$ , $B$ wahr ist, schreibst du $A\lor B$ („ $A$ oder $B$ “ ausgesprochen).

Beachte: In der Umgangssprache besitzt „oder“ zwei verschiedene Lesarten: So benutzen wir „oder“ im Sinne von „und/oder“ („Dieses Angebot richtet sich an junge Leute oder Kunstinteressierte.“) und in der Bedeutung als „entweder oder“ („Kommst du mit? Ja oder nein?“). Die Disjunktion ist das nicht-ausschließende Oder im Sinne von „mindestens“ („Der Bus hält, wenn jemand einsteigen oder jemand aussteigen will“).

Kontravalenz – die Entweder-oder-Verknüpfung

Wahrheitstabelle: Kontravalenz
$A$	$B$	$A\,{\dot {\lor }}\,B$
$\mathrm {F}$	$\mathrm {F}$	$\mathrm {F}$
$\mathrm {F}$	$\mathrm {W}$	$\mathrm {W}$
$\mathrm {W}$	$\mathrm {F}$	$\mathrm {W}$
$\mathrm {W}$	$\mathrm {W}$	$\mathrm {F}$

Die Kontravalenz ist ein Junktor im Sinne einer Entweder-oder-Verknüpfung. Man benutzt für sie das Symbol ${\dot {\lor }}$ („exklusiv oder“). Eine Aussage $A\,{\dot {\lor }}\,B$ ist genau dann wahr, wenn entweder $A$ oder $B$ , aber nicht beide Aussagen gleichzeitig wahr sind. Die Kontravalenz entspricht damit dem ausschließenden Oder im Sinne von „Dieses Jahr gewinnt (entweder) Bayern oder Dortmund die deutsche Fußballmeisterschaft“. Die Kontravalenz wird in der Mathematik seltener verwendet als die Disjunktion.

Implikation – die Wenn-dann-Verknüpfung

Wahrheitstabelle: Implikation
$A$	$B$	$A\Rightarrow B$
$\mathrm {F}$	$\mathrm {F}$	$\mathrm {W}$
$\mathrm {F}$	$\mathrm {W}$	$\mathrm {W}$
$\mathrm {W}$	$\mathrm {F}$	$\mathrm {F}$
$\mathrm {W}$	$\mathrm {W}$	$\mathrm {W}$

Eine wichtige Verknüpfung in der Aussagenlogik ist die Implikation, welche als Wenn-dann-Verknüpfung aufgefasst werden kann. Ihr Symbol ist $\Rightarrow$ ; weitere weniger gebräuchliche Schreibweisen sind $\rightarrow$ und $\supset$ . So bezeichnet $A\Rightarrow B$ die Aussage „Wenn $A$ , dann $B$ “. Weitere Sprechweisen für $A\Rightarrow B$ sind „Aus $A$ folgt $B$ “, „ $A$ impliziert $B$ “, „ $A$ ist eine hinreichende Bedingung für $B$ “ und „ $B$ ist eine notwendige Bedingung für $A$ “. Dabei wird $A$ Prämisse und $B$ Konklusion genannt:

\overbrace {\underbrace {A} _{\text{Prämisse}}\Rightarrow \underbrace {B} _{\mathrm {Konklusion} }} ^{\mathrm {Implikation} }

Die Bedeutung von $A\Rightarrow B$ ist demnach, dass wenn bereits die Aussage $A$ gilt, auch die Aussage $B$ gelten muss. Dabei muss aber kein kausaler Zusammenhang zwischen $A$ und $B$ vorliegen (was du vielleicht durch die Formulierung „Wenn $A$ , dann $B$ “ vermuten könntest). So ist die Aussage $4>1\Rightarrow {\sqrt {9}}=3$ („Aus $4>1$ folgt ${\sqrt {9}}=3$ “) eine wahre Aussage, auch wenn aus der Tatsache, dass $4>1$ ist, nicht kausal die Tatsache folgt, dass ${\sqrt {9}}=3$ ist.

Leicht begeht man bei der Implikation $A\Rightarrow B$ den Fehler zu glauben, dass dann auch $B\Rightarrow A$ gelten müsse. So gehen einige davon aus, dass aus dem Satz „Wenn es regnet, ist die Straße nass“ folgen müsse, dass, wenn die Straße nass ist, es auch regne. Dies ist aber nicht der Fall! So kann die Straße aufgrund einer Straßenreinigung nass sein oder es kann vor kurzem geregnet haben, ohne dass es momentan regnet.

Warnung

Viele mathematische Sätze sind als Implikationen definiert (aus gewissen Bedingungen $A$ folgt eine Tatsache $B$ ). Deshalb ist es wichtig, dass du dir merkst, dass eine Implikation nicht umkehrbar ist (der Pfeil geht schließlich nur von $A$ nach $B$ und nicht umgekehrt). Sonst passiert es dir schnell, dass du Fehler in deinen Beweisen machst.

Frage: Überlege dir selbst mathematische Beispiele, mit denen du andere Leute überzeugen kannst, dass Implikationen im Allgemeinen nicht umkehrbar sind.

Ein Beispiel ist die Implikation „Wenn viel Schnee draußen liegt, ist es kalt“. Die Umkehrung wäre „Wenn es kalt ist, dann liegt Schnee draußen”. Nun hat jeder von uns schon kalte Tage ohne Schnee erlebt, womit die umgekehrte Implikation nicht wahr sein kann.

Ein weiteres Beispiel ist:

f(x_{0}){\text{ ist in }}x_{0}{\text{ differenzierbar. }}\land \ f(x_{0}){\text{ ist ein lokales Extremum.}}\ \Rightarrow \ f'(x_{0})=0

Die Umkehrung wäre die Aussage:

Wenn die Ableitung einer Funktion $f$ an der Stelle $x_{0}$ gleich null ist, dann ist $f$ in $x_{0}$ differenzierbar und besitzt in $x_{0}$ ein lokales Extremum.

Ein Gegenbeispiel ist die Funktion $f(x)=x^{3}$ . Bei dieser Funktion ist die erste Ableitung bei $x=0$ null, da $f'(x)=3x^{2}$ und $3\cdot 0^{2}=0$ ist, aber diese Funktion besitzt keine lokale Extremstelle bei $x=0$ .

Beachte auch, dass nach der Wahrheitstabelle die Implikation bereits dann wahr ist, wenn die Prämisse $A$ falsch ist. So ist die Aussage $2+3=11\Rightarrow 7+5=4$ („Wenn $2+3=11$ ist, dann ist $7+5=4$ “) eine wahre Aussage, auch wenn $7+5\neq 4$ ist. Dieses Prinzip der Implikation wird ex falso quodlibet genannt oder zu Deutsch: „Aus Falschem folgt Beliebiges.“ Demnach ist eine Implikation nur dann und genau dann falsch, wenn die Prämisse $A$ wahr ist und die Konklusion $B$ falsch ist. Diese Tatsache kann zu recht kontraintuitiven Aussagen führen, die aber dennoch wahr sind. Betrachte dazu folgende Verständnisfrage:

Verständnisfrage: Welche der folgenden Aussagen sind wahr und welche sind falsch?

Wenn Berlin in England liegt, ist Schnee schwarz.
Wenn Berlin in England liegt, ist Schnee weiß.
Wenn Berlin in Deutschland liegt, ist Schnee schwarz.
Wenn Berlin in Deutschland liegt, ist Schnee weiß.
Wenn der Mond aus grünem Käse besteht, ist heute Sonntag.

Antwort: Die Aussagen (1) und (2) sind wahr, weil bereits die Prämisse „Berlin liegt in England“ falsch ist. Auch Aussage (4) ist wahr, weil sowohl die Prämisse als auch die Konklusion wahr ist. Nur Aussage (3) ist falsch (Prämisse ist wahr und Konklusion falsch). Aussage (5) ist an jedem Tag wahr.

Äquivalenz – die Genau-dann-wenn-Verknüpfung

Wahrheitstabelle: Äquivalenz
$A$	$B$	$A\Leftrightarrow B$
$\mathrm {F}$	$\mathrm {F}$	$\mathrm {W}$
$\mathrm {F}$	$\mathrm {W}$	$\mathrm {F}$
$\mathrm {W}$	$\mathrm {F}$	$\mathrm {F}$
$\mathrm {W}$	$\mathrm {W}$	$\mathrm {W}$

Der letzte Junktor, den wir vorstellen möchten, ist die Äquivalenz. Die Äquivalenz wird mit dem Doppelpfeil $\Leftrightarrow$ dargestellt. Die Sprechweise von $A\Leftrightarrow B$ ist dabei „Genau dann $A$ , wenn $B$ “, „ $A$ ist gleichwertig mit $B$ “ oder „ $A$ ist äquivalent zu $B$ “. Eine Aussage $A\Leftrightarrow B$ ist genau dann und nur dann wahr, wenn die beiden Aussagen $A$ und $B$ denselben Wahrheitswert besitzen. Ist eine der beiden Aussagen wahr und die andere falsch, ist $A\Leftrightarrow B$ falsch. Die Äquivalenz wird auch Bijunktion genannt.

Die Bedeutung der Aussage $A\Leftrightarrow B$ ist dabei, dass aus der Aussage $A$ die Aussage $B$ folgt und dass aus der Aussage $B$ die Aussage $A$ folgt. Dies erkennst du auch am Doppelpfeil – während bei der Äquivalenz der Pfeil von $A$ nach $B$ und umgekehrt geht, geht der Pfeil in der Implikation nur in eine Richtung (und zwar von der Prämisse zur Konklusion). Die Äquivalenz drückt damit eine Gleichwertigkeit zwischen zwei Aussagen aus, da zwei in Äquivalenz stehende Aussagen immer denselben Wahrheitswert besitzen (genau so ist die Äquivalenz definiert).

Verständnisfrage: Überlege dir Beispiele für eine Äquivalenzbeziehung.

Ein einfaches Beispiel aus der Mathematik ist

„Genau dann wenn $x$ durch 2 teilbar ist, ist $x$ gerade.“

Ein weiteres Beispiel aus dem Alltag ist

„Genau dann wenn Schaltjahr ist, hat der Februar 29 Tage.“

Ein Schaltjahr ist nämlich als ein solches Jahr definiert, wo der Februar 29 Tage hat^[3].

Verständnisfrage: Sei $A\Leftrightarrow B$ . Ist dann $A$ notwendige oder hinreichende Bedingung von $B$ und wie sieht es umgekehrt aus?

Weil bei $A\Leftrightarrow B$ aus $A$ die Aussage $B$ folgt und umgekehrt, ist $A$ sowohl notwendige als auch hinreichende Bedingung für $B$ und umgekehrt.

Bindungsreihenfolge der Junktoren (Präzedenzregeln)

Aus der Arithmetik kennst du bereits das Phänomen, dass bestimmte Operatoren stärker binden als andere. So bindet die Multiplikation $\cdot$ stärker als die Addition $+$ („Punktrechnung geht vor Strichrechnung“). Beispielsweise muss man $5+4\cdot 2$ als $5+(4\cdot 2)$ lesen. Jedoch ist diese Bindungsreihenfolge in der Logik nicht immer komplett und du musst Klammern einsetzen, um dem Leser die richtige Bindungsreihenfolge zu zeigen. Folgende Bindungsreihenfolge ist aber allgemein akzeptiert:

Negation bindet stärker als Konjunktion und Disjunktion bindet stärker als Implikation und Äquivalenz

Manchmal wird auch eine vollständige Bindungsreihenfolge definiert. Diese lautet dann meistens (der am stärksten bindende Junktor steht am Anfang):

Negation $\neg$
Konjunktion $\land$
Disjunktion $\lor$
Implikation $\Rightarrow$
Äquivalenz $\Leftrightarrow$

Die Kontravalenz ${\dot {\lor }}$ hat keinen festen Platz in der obigen Liste. Sie bindet stärker als die Implikation und schwächer als die Negation. Wenn aber die Kontravalenz zusammen mit der Disjunktion $\lor$ oder der Konjunktion $\land$ auftritt, solltest du deinen Ausdruck entsprechend Klammern^[4].

Nach obiger Bindungsreihenfolge muss also die Aussage $\neg A\land B\Rightarrow B\lor C\land A$ als $((\neg A)\land B)\Rightarrow (B\lor (C\land A))$ gelesen werden. Ich empfehle dir aber (und werde dies auch im Buch umsetzen), bei der Unterscheidung der Bindung zwischen Konjunktion und Disjunktion sowie zwischen Implikation und Äquivalenz Klammern einzusetzen.

Wenn mehrere Implikationen nacheinander ohne Klammerung verwendet werden, gilt in der Literatur meistens folgende Definition:

A\Rightarrow B\Rightarrow C\Rightarrow D

bedeutet

A\Rightarrow (B\Rightarrow (C\Rightarrow D))

Verständnisfrage: Wie musst du die Klammern in folgenden Ausdrücken richtig setzen (nach der vollständigen Liste zur Bindungsreihenfolge)?

$A\land \neg B\Rightarrow C$
$A\land B\Rightarrow \neg C\Leftrightarrow A$
$C\lor (C\Leftrightarrow B)\land A$

Antwort:

$(A\land (\neg B))\Rightarrow C$
$((A\land B)\Rightarrow (\neg C))\Leftrightarrow A$
$C\lor ((C\Leftrightarrow B)\land A)$

Quantor

Was sind Quantoren?

Neben den Junktoren gibt es noch eine zweite wichtige Gruppe von logischen Symbolen, die Quantoren. Während Junktoren Aussagen miteinander verknüpfen, legen Quantoren fest, für welche Objekte $x$ einer Grundmenge eine Aussageform $A(x)$ gilt. Eine Aussageform $A(x)$ ist dabei ein sprachlich sinnvoller Ausdruck, in dem die Variable $x$ vorkommt und der durch Belegung dieser Variablen mit einem konkreten Wert in eine Aussage übergeht. So sind die Ausdrücke

$x$ ist eine gerade Zahl

und

$x$ ist ein Mensch

Beispiele für solche Aussageformen $A(x)$ , die von der Variablen $x$ abhängen.

Wir möchten den Begriff „Quantor“ an einem Beispiel erklären. Stelle dir dazu vor, wir verwenden gerade die Menge der reellen Zahlen. Dies bedeutet, dass alle Variablen, die wir benutzen, nur mit reellen Zahlen belegt werden sollen. Betrachte nun folgende Aussage:

Für alle $x$ gilt, dass $x^{2}\leq 0$ ist.

In diesem Beispiel ist „für alle“ ein Quantor, der Allquantor. Er behauptet, dass die Aussageform $x^{2}\leq 0$ für alle Belegungen der Variablen $x$ wie zum Beispiel $x=-{\tfrac {1}{2}}$ , $x=42$ oder $x=0$ gültig sein soll. Wir können also folgende Struktur der obigen Aussage erkennen:

\underbrace {\text{Für alle}} _{\text{Allquantor}}\ \underbrace {x} _{\text{Variable}}{\text{ gilt, dass }}\underbrace {x^{2}\leq 0} _{{\text{Aussageform }}A(x){\text{, in Abhängigkeit von }}x}{\text{ ist.}}

Wie auch bei Junktoren werden für Quantoren bestimmte Symbole verwendet. Für den Allquantor ist das Symbol $\forall$ am geläufigsten. So kann die obige Aussage „Für alle $x$ gilt, dass $x^{2}\leq 0$ ist“ auch so geschrieben werden:

\forall x:x^{2}\leq 0

Wir können aber auch andere Quantoren zur Bindung der Variablen $x$ in der Aussageform $x^{2}\leq 0$ verwenden. Anstatt auszudrücken, dass die Aussageform $x^{2}\leq 0$ für alle Belegungen von $x$ gültig ist, können wir auch sagen, dass diese Aussageform für mindestens eine reelle Zahl $x$ wahr ist. Dieser Quantor „es gibt mindestens ein“ wird Existenzquantor genannt und hat das Symbol $\exists$ . So besitzt die Aussage „Es gibt mindestens ein $x$ mit $x^{2}\leq 0$ “ folgende Struktur:

\underbrace {\text{Es gibt mindestens ein}} _{\text{Existenzquantor}}\ \underbrace {x} _{\text{Variable}}{\text{ mit }}\underbrace {x^{2}\leq 0} _{{\text{Aussageform }}A(x){\text{, in Abhängigkeit von  }}x}

Formal aufgeschrieben wird daraus:

\exists x:x^{2}\leq 0

Verständnisfrage: Sind obige Aussagen $\forall x:x^{2}\leq 0$ und $\exists x:x^{2}\leq 0$ für reelle Zahlen wahr oder falsch?

Die Aussage $\forall x:x^{2}\leq 0$ ist falsch, da sie für die erlaubte Belegung $x=1$ nicht stimmt. Es ist nämlich $1^{2}=1>0$ .
Die Aussage $\exists x:x^{2}\leq 0$ ist wahr. Die Zahl $0$ ist nämlich eine reelle Zahl mit $0^{2}\leq 0$ . Damit existiert (mindestens) eine reelle Zahl, welche die Aussageform $x^{2}\leq 0$ erfüllt.

Arten von Quantoren

Allquantor

Allquantor
Symbol:	$\forall$
Bedeutung:	„für alle“ oder „für jede(s)“
Schreibweise:	$\forall x:A(x)$

Im vorherigen Abschnitt hast du den Allquantor bereits kennen gelernt. Sein Symbol ist $\forall$ (ein umgedrehtes A – „für Alle“). Die Schreibweise des Allquantors ist $\forall x:\,A(x)$ . Dies bedeutet „Für alle $x$ gilt $A(x)$ “ oder „Für jedes $x$ gilt $A(x)$ “. Dabei ist $A(x)$ eine beliebige Aussageform, in der die Variable $x$ vorkommt. In der Literatur ist auch die Schreibweise $\bigwedge _{x}A(x)$ zu finden, die wir aber in diesem Projekt nicht verwenden werden.

Die Menge der Objekte, auf die sich der Quantor bezieht, muss eindeutig bestimmt sein (und kann sich zum Beispiel aus dem Kontext ergeben). Wenn du eben natürliche Zahlen behandelst, so behauptet eine Aussage $\forall x:\,A(x)$ , dass die Aussageform $A(x)$ für alle Belegungen von $x$ aus den natürlichen Zahlen zu einer wahren Aussage wird. Untersuchst du reelle Zahlen, so behauptet $\forall x:\,A(x)$ , dass die Aussageform $A(x)$ für alle reellen Zahlen $x$ zu einer wahren Aussage wird.

Wenn du die Bezugsmenge des Allquantors explizit angeben möchtest oder musst, kannst du die deutlichere Schreibweise $\forall x\in M:\ A(x)$ verwenden. Sie ist eine Kurzschreibweise für $\forall x:x\in M\Rightarrow A(x)$ und bedeutet: „Für alle $x$ aus der Menge $M$ gilt die Aussage $A(x)$ .“

Aufgabe: Überlege dir einige (mathematische) Aussagen, in denen du den Allquantor verwenden kannst und schreib diese auf.

Folgende Beispiele können mit dem Allquantor aufgeschrieben werden:

Für jedes Auto gilt: Es fährt oder es steht.
Für alle reellen Zahlen $x$ und alle natürlichen Zahlen $y$ ist $x+y=x\cdot y$ .
Alle Schwäne sind weiß.

Aufgabe: Wie lauten die obigen Aussagen in Quantorenschreibweise?

$\forall x:\ x{\text{ ist ein Auto}}\Rightarrow (x{\text{ fährt}}\lor x{\text{ steht}})$
$\forall x\in \mathbb {R} \ \forall y\in \mathbb {N} :\ x+y=y\cdot x$
$\forall x:\ x{\text{ ist ein Schwan}}\Rightarrow x{\text{ ist weiß}}$

Existenzquantor

Existenzquantor
Symbol:	$\exists$
Bedeutung:	es existiert mindestens ein
Schreibweise:	$\exists x:A(x)$

Dieser Quantor wird für Aussagen folgender Form verwendet: „Es gibt mindestens ein $x$ , so dass $A(x)$ gilt“. Dieser Quantor heißt Existenzquantor. Sein Symbol ist ein horizontal gespiegeltes E, welches für „es Existiert mindestens ein“ steht. Analog zum Allquantor haben Existenzaussagen die Form $\exists x:\,A(x)$ . Diese Schreibweise steht für „Es gibt mindestens ein $x$ , so dass $A(x)$ gilt“ oder „Es existiert mindestens ein $x$ , für welches $A(x)$ gilt“. Auch hier ist $x$ eine Variable und $A(x)$ eine Aussageform, die von $x$ abhängt. In der Literatur kannst du auch die Schreibweise $\bigvee _{x}A(x)$ finden.

Wie auch beim Allquantor muss die Bezugsmenge $M$ des Quantors klar sein (z. B. aus dem Kontext). Muss die Bezugsmenge explizit angegeben werden, so kannst du die Schreibweise $\exists x\in M:\,A(x)$ verwenden. Sie ist eine Kurzschreibweise für $\exists x:x\in M\land A(x)$ und bedeutet: „Es gibt mindestens ein $x$ aus der Menge $M$ , für welches die Aussage $A(x)$ wahr ist“.

Hinweis

In der Mathematik gibt es folgende Konvention: Eine Aussage der Form „Es gibt ein …“ ist immer als Aussage der Form „Es gibt mindestens ein …“ zu verstehen.

Verständnisfrage: Übersetze folgende Aussagen in die formelle Schreibweise mit dem Existenzquantor:

Es gibt eine Zahl $x$ , so dass $x\cdot 0=5$ ist.
Es gibt schöne Männer.
Jeder Mensch besitzt einen Seelenverwandten.

Antwort:

$\exists x:\,x{\text{ ist eine Zahl }}\land x\cdot 0=5$
$\exists x:\,x{\text{ ist ein Mann }}\land \ x{\text{ ist schön}}$
$\forall x:\,\left(x{\text{ ist ein Mensch}}\Rightarrow \exists y:\,y{\text{ ist ein Seelenverwandter von }}x\right)$

Eindeutiger Existenzquantor

Eindeutiger Existenzquantor
Symbol:	$\exists !$
Bedeutung:	es existiert genau ein
Schreibweise:	$\exists !x:A(x)$

Der letzte Quantor, den wir dir vorstellen möchten, ist der eindeutige Existenzquantor $\exists !$ . Die Schreibweise zu diesem Quantor (der auch Eindeutigkeitsquantor genannt wird) ist $\exists !x:\,A(x)$ . Dies bedeutet so viel wie

(*) Es gibt genau ein $x$ , so dass die Aussageform $A(x)$ für dieses $x$ eine wahre Aussage ist.

Beachte den Unterschied zwischen dem Existenzquantor und dem eindeutigen Existenzquantor: Während beim Existenzquantor die Aussageform $A(x)$ für mindestens eine Belegung von $x$ gilt, gilt beim eindeutigen Existenzquantor die Aussageform $A(x)$ für genau eine Belegung von $x$ aus der Grundmenge.

Auch bei diesem Quantor muss sich die Bezugsmenge durch den Kontext ergeben. Wenn du sie explizit angeben möchtest, kannst du die Schreibweise $\exists !x\in M:\,A(x)$ verwenden. Sie ist eine Kurzschreibweise für $\exists !x:x\in M\land A(x)$ und bedeutet: „Es gibt genau ein $x$ aus der Menge $M$ , für welches die Aussage $A(x)$ wahr ist.“ Alternative und in der Literatur auch verbreitete Schreibweisen für den eindeutigen Existenzquantor sind $\exists _{1}$ und ${\overset {1}{\exists }}$ .

Verständnisfrage: Überlege dir, ob folgende Aussagen wahr sind:

$\exists x\in \mathbb {R} :x^{2}=4$
$\exists !x\in \mathbb {R} :x^{2}=4$
$\exists !x\in \mathbb {N} :x^{2}=4$

Antwort:

Wahr. Da $2\in \mathbb {R}$ und $2^{2}=4$ ist, gibt es mit $2$ mindestens eine reelle Zahl, deren Quadrat gleich 4 ist.
Falsch. Es ist $2,-2\in \mathbb {R}$ und $(-2)^{2}=2^{2}=4$ . Somit gibt es kein eindeutiges Element $x\in \mathbb {R}$ mit $x^{2}=4$ .
Wahr. $2$ ist nämlich die einzige natürliche Zahl, deren Quadrat gleich $4$ ist. Beachte hier, dass $-2$ keine natürliche Zahl ist.

Der eindeutige Existenzquantor $\exists !$ lässt sich mit Hilfe des Existenzquantors $\exists$ und des Allquantors $\forall$ beschreiben, nämlich so:

(**) Es gibt mindestens ein $x$ mit $A(x)$ und wenn zwei Objekte $x$ und $y$ die Aussageformen $A(x)$ und $A(y)$ erfüllen, so sind sie gleich.

Die Formulierungen (*) und (**) beschreiben genau denselben Sachverhalt! Das ist der Grund dafür, dass der Quantor $\exists !$ üblicherweise wie folgt definiert wird:

Definition (Eindeutiger Existenzquantor)

\exists !x:A(x):\iff \exists x:A(x)\land \forall x\,\forall y:(A(x)\land A(y)\implies x=y)

Damit ist auch klar, wie Aussagen mit $\exists !$ zu beweisen sind:

Zunächst wird $\exists x:A(x)$ bewiesen,
anschließend wird gezeigt, dass aus $A(x)$ und $A(y)$ für beliebige $x$ und $y$ die Gleichheit $x=y$ folgt.

Notation

Für Ausdrücke mit Quantoren werden in der Literatur verschiedene Schreibweisen verwendet^[5]. So findet man anstelle vom Ausdruck $\forall x:A(x)$ auch die Notationen:

$\forall x\ A(x)$
$\forall x\ .\ A(x)$
$\forall x(A(x))$
$\forall _{x}A(x)$

Gleiches gilt für den Existenzquantor $\exists x:A(x)$ :

$\exists x\ A(x)$
$\exists x\ .\ A(x)$
$\exists x(A(x))$
$\exists _{x}A(x)$

Manchmal werden in der Literatur auch Existenzquantoren der Art $\exists _{=n}$ bzw. $\exists _{\leq n}$ verwendet. Ihre Bedeutung ist:

$\exists _{=n}\,x:A(x)$ bedeutet, es gibt genau $n$ Objekte $x$ mit der Eigenschaft $A(x)$
$\exists _{\leq n}\,x:A(x)$ bedeutet, es gibt höchstens $n$ Objekte $x$ mit der Eigenschaft $A(x)$
$\exists _{\geq n}\,x:A(x)$ bedeutet, es gibt mindestens $n$ Objekte $x$ mit der Eigenschaft $A(x)$

Wir werden in diesem Projekt aber die Schreibweise $\forall x:A(x)$ und $\exists x:A(x)$ verwenden. Auch kann man aufeinanderfolgende Quantoren vom selben Typ zusammenfassen, indem man die verschiedenen eingeführten Variablen durch Kommata trennt. So kannst du anstelle von $\forall x\,\forall y:A(x,y)$ auch folgende Schreibweise benutzen: $\forall x,y:A(x,y)$ . Analog kann man anstelle von $\exists x\,\exists y:A(x,y)$ auch kürzer $\exists x,y:A(x,y)$ schreiben.

Aussageform und Substitution

Du hast dich vielleicht schon darüber gewundert, dass wir manchmal den Begriff „Aussage“ und manchmal den Begriff „Aussageform“ benutzen. Der Unterschied liegt darin, dass Aussageformen freie Variablen besitzen, während in Aussagen keine freien Variablen vorkommen. Doch was sind freie Variablen?

Freie und gebundene Variablen

Variablen sind Platzhalter (Leerstellen) in einem sprachlichen Ausdruck, die für Elemente der Grundmenge stehen. Sie können durch Quantoren oder andere Operatoren gebunden werden. Die Bedeutung der gebundenen Variablen ist an den Operator gekoppelt, in dessen Wirkungsbereich sie liegen. So besagt $\forall x:A(x)$ , dass die Aussage $A(x)$ zutrifft, egal welches Element aus dem Grundbereich für $x$ genommen wird. $\exists x:A(x)$ dagegen heißt nur, dass es wenigstens ein Element aus dem Grundbereich gibt, für das $A(x)$ zutrifft. Eine Variable, die nicht gebunden ist, heißt frei.

So ist die Variable $x$ im Ausdruck $x\geq 23$ frei und im Ausdruck $\forall x:x\geq 23$ durch den Allquantor $\forall$ gebunden. Aber nicht nur Quantoren können Variablen binden. Auch durch Mengenausdrücke der Form $\{x:\ldots \}$ oder durch Summen $\sum _{k=\ldots }^{\ldots }\ldots$ können Variablen gebunden werden. Solltest du Summen oder Mengen noch nicht kennen: Kein Problem. Diese werden wir später behandeln. Generell gilt:

Definition (Freie und gebundene Variablen)

Eine Variable ist gebunden, wenn sie durch einen mathematischen Operator (z. B. einen Quantor) eingeführt wurde und im Wirkungsbereich dieses Operators liegt. Ansonsten ist eine Variable eine freie Variable.

Hier noch einige Beispiele:

Beispiel (freie und gebundene Variablen)

${\color {YellowOrange}\forall x}:{\color {Orange}\underbrace {x} _{\text{gebunden}}}+{\color {OliveGreen}\underbrace {y} _{\text{frei}}}=42$
${\color {OliveGreen}\underbrace {x} _{\text{frei}}}=4\Rightarrow {\color {YellowOrange}\exists x}:{\color {Orange}\underbrace {x} _{\text{gebunden}}}+4=8$
${\color {YellowOrange}\exists x}:\,({\color {OliveGreen}\underbrace {y} _{\text{frei}}}+{\color {Orange}\underbrace {x} _{\text{gebunden}}}=5\land {\color {YellowOrange}\forall y}:{\color {Orange}\underbrace {x} _{\text{gebunden}}}\cdot {\color {Orange}\underbrace {y} _{\text{gebunden}}}=8)$

Verständnisfrage: Welche der Variablen in den folgenden Ausdrücken sind frei und welche sind gebunden?

$a+b+c=5$
$a=b\lor \exists b:a=b$
$\forall a,b:t=a+b$
$\forall x:a=9$

Antwort:

${\color {OliveGreen}\underbrace {a} _{\text{frei}}}+{\color {OliveGreen}\underbrace {b} _{\text{frei}}}+{\color {OliveGreen}\underbrace {c} _{\text{frei}}}=5$
${\color {OliveGreen}\underbrace {a} _{\text{frei}}}={\color {OliveGreen}\underbrace {b} _{\text{frei}}}\,\lor \,{\color {YellowOrange}\exists b}:{\color {OliveGreen}\underbrace {a} _{\text{frei}}}={\color {Orange}\underbrace {b} _{\text{gebunden}}}$
${\color {YellowOrange}\forall a,b}:{\color {OliveGreen}\underbrace {t} _{\text{frei}}}={\color {Orange}\underbrace {a} _{\text{gebunden}}}+{\color {Orange}\underbrace {b} _{\text{gebunden}}}$
${\color {YellowOrange}\forall x}:{\color {OliveGreen}\underbrace {a} _{\text{frei}}}=9$

Terme

Variablen sind Platzhalter für Elemente aus einem Grundbereich. Grundbereiche in der Mathematik sind häufig die Zahlbereiche $\mathbb {N}$ , $\mathbb {Z}$ , $\mathbb {Q}$ , $\mathbb {R}$ oder $\mathbb {C}$ . Es kann aber auch eine ganz andere Menge der Grundbereich sein, beispielsweise die Menge aller Menschen, Autos oder Musikinstrumente. Ausdrücke, die Elemente aus dem Grundbereich bezeichnen, werden Terme genannt. Mit Hilfe von Operationssymbolen (auch Verknüpfungen genannt) wie $+$ , $-$ und $\cdot$ werden aus Termen weitere Terme gebildet. Zu einem Operationssymbol gehört eine natürliche Zahl als Stellenzahl, die angibt, wie viele Terme zu einem neuen Term verknüpft werden. Die Terme, die verknüpft werden, heißen Argumente, das Ergebnis der Verknüpfung Resultat.

Beispiel (Operationssymbole)

Das Pluszeichen „ $+$ “ ist 2-stellig und macht aus zwei Zahlen eine dritte, die Summe: $(1+2)$ .
Das Vorzeichen „ $-$ “ ist 1-stellig: $-13$ . Das Subtraktionszeichen „ $-$ “ dagegen ist 2-stellig: $(7-3)$ .
Beim größten gemeinsamen Teiler „ $\operatorname {ggT}$ “ und beim kleinsten gemeinsamen Vielfachen „ $\operatorname {kgV}$ “ werden die Argumente in der Regel dahinter notiert: $\operatorname {ggT} (36,70)$ und $\operatorname {kgV} (12,9)$ .
Die Potenz ist 2-stellig, aber das Operationssymbol wird gar nicht notiert. Stattdessen wird die Verknüpfung durch das Hochstellen widergegeben: $2^{16}$ .
Der Durchschnitt „ $\cap$ “ und die Vereinigung „ $\cup$ “ von Mengen sind 2-stellige Verknüpfungen: $(A\cap B)$ und $(A\cup B)$ .
Das Komplement einer Menge „ $(\ldots )^{\complement }$ “ ist 1-stellig und wird häufig hochgestellt hinter dem Argument notiert: $A^{\complement }$ .
Bei mehrstelligen Verknüpfungen $f$ stehen die Argumente in Klammern hinter dem Symbol: $f(x_{1},x_{2},\dots ,x_{n})$

Bei 2-stelligen Operationssymbolen werden die Klammern weggelassen, wenn sie nicht erforderlich sind.

Definition (Term)

Terme sind sprachliche Ausdrücke, die eine Zahl oder ein anderes Objekt bezeichnen. Insbesondere sind Variable Terme. Mit Hilfe von Verknüpfungen können aus Termen weitere Terme gebildet werden.

Terme treten oftmals als Teile von Aussagen auf.

Beispiel (Terme)

${\forall x}:{\color {Orange}\underbrace {x+y} _{\text{Term}}}={\color {OliveGreen}\underbrace {42} _{\text{Term}}}$
${\color {OliveGreen}\underbrace {x} _{\text{Term}}}={\color {YellowOrange}\underbrace {4} _{\text{Term}}}\implies \exists x:{\color {SkyBlue}\underbrace {x+4} _{\text{Term}}}={\color {WildStrawberry}\underbrace {8} _{\text{Term}}}$
$\exists x:\,({\color {SkyBlue}\underbrace {y+x} _{\text{Term}}}={\color {WildStrawberry}\underbrace {5} _{\text{Term}}}\land \forall y:{\color {OliveGreen}\underbrace {x\cdot y} _{\text{Term}}}={\color {YellowOrange}\underbrace {8} _{\text{Term}}})$

Einige Terme aus diesen Beispielen enthalten weitere Terme: So enthält der Term „ $x+y$ “ die Terme „ $x$ “ und „ $y$ “ und der Term „ $4\cdot x$ “ enthält die Terme „ $4$ “ und „ $x$ “.

Prädikate

Von Verknüpfungen sind Prädikate (auch Relationssymbole genannt) zu unterscheiden. Prädikate haben wie Verknüpfungen eine Stellenzahl. Die Argumente von Prädikaten sind ebenfalls Terme, aber das Resultat ist eine Aussage oder eine Aussageform. Beispiele für Prädikate sind größer-gleich ( $\geq$ ) und die Teilmengenbeziehung ( $\subseteq$ ).

Definition (Prädikat)

Prädikate verbinden Terme zu Aussagen bzw. Aussageformen. Sie haben eine Stellenzahl. Ist $P$ ein $n$ -stelliges Prädikat, so heißt $P(x_{1},x_{2},\dots ,x_{n})$ , dass $P$ auf $x_{1},x_{2},\dots ,x_{n}$ zutrifft. 2-stellige Prädikate werden meist zwischen die Argumente geschrieben.

Hinweis

Die Schreibweise von Prädikaten ist genau dieselbe wie bei Verknüpfungen! Es muss also aus dem Zusammenhang erschlossen werden, was von beiden gemeint ist.

Beispiel (Prädikat)

$\forall x,y,z:{\color {Orange}\underbrace {x} _{\text{Term}}}{\color {SkyBlue}\underbrace {\quad \quad \leq \quad \quad } _{\text{Prädikat}}}{\color {OliveGreen}\underbrace {y} _{\text{Term}}}\Rightarrow {\color {WildStrawberry}\underbrace {x+z} _{\text{Term}}}{\color {SkyBlue}\underbrace {\quad \quad \leq \quad \quad } _{\text{Prädikat}}}{\color {Sepia}\underbrace {y+z} _{\text{Term}}}$
$x{\color {SkyBlue}\underbrace {<} _{\text{Prädikat}}}y\lor x{\color {SkyBlue}\underbrace {=} _{\text{Prädikat}}}y\lor x{\color {SkyBlue}\underbrace {>} _{\text{Prädikat}}}y$
$13\;{\color {SkyBlue}\underbrace {\text{ist Primzahl}} _{\text{Prädikat}}}$

Aussageformen, Formeln

Mit Hilfe der Begriffe freie und gebundene Variable können wir definieren, was Aussageformen sind:

Definition (Aussageform, Formeln)

Aussageformen sind sprachliche Ausdrücke mit freien Variablen, die durch Belegung dieser Variablen mit konkreten Werten in eine Aussage übergehen.

Als Oberbegriff von Aussagen und Aussageformen ist die Bezeichnung Formel üblich:

Definition (Formel)

Eine Formel ist eine Aussage oder eine Aussageform und damit ein Oberbegriff für beide Konzepte. Jede Formel ist damit entweder eine Aussage oder eine Aussageform.

Verständnisfrage: Welche der folgenden formalen Ausdrücke sind Aussagen und welche sind Aussageformen?

$x+y=y+x$
$\forall x:x+y=y+x$
$\forall x\forall y:x+y=y+x$
$x>0\implies \exists x:x^{2}=4$
$\forall x:\left(x<4\land \exists y:x+y=23\right)$

Antwort:

Aussageform ( $x$ und $y$ kommen frei im Ausdruck vor)
Aussageform ( $y$ kommt frei im Ausdruck vor)
Aussage (keine freien Variablen)
Aussageform ( $x$ kommt frei im Ausdruck vor)
Aussage (keine freien Variablen)

Der Wahrheitsgehalt der obigen Aussagen und Aussageformen hängt jeweils von der gewählten oder vorgegebenen Grundmenge ab.

Substitution von Termen für Variablen

Ersetzt man in einem Ausdruck eine freie Variable durch einen Term, so nennt man diesen Vorgang Substitution. Das kommt beispielsweise beim Lösen von Gleichungssystemen vor. Beispiel:

$x+{\frac {1}{2}}y=7$
$x-y=1$

Aus der 2. Gleichung erhalten wir $x=1+y$ , was wir als Substitution $x:=1+y$ nutzen können. Daher ersetzen wir in Gleichung 1. die Variable $x$ durch den Term $1+y$ und erhalten so: $1+y+{\frac {1}{2}}y=7$ , woraus sich schließlich $y=4$ ergibt.

Beim Substituieren musst du darauf achten, dass du nur und wirklich nur freie Variablen durch den entsprechenden Term ersetzt. Gebundene und quantifizierte Variablen müssen unangetastet bleiben. Beispiel:

{\begin{array}{c}{\color {ForestGreen}x}+y=7\cdot {\color {ForestGreen}x}\land \exists {\color {Periwinkle}x}:{\color {Periwinkle}x}=0\\\downarrow \\{\text{Substitution }}{\color {OliveGreen}x}:={\color {Orange}y+8}\\\downarrow \\{\color {Orange}(y+8)}+y=7\cdot {\color {Orange}(y+8)}\land \exists {\color {Periwinkle}x}:{\color {Periwinkle}x}=0\end{array}}

Beachte, dass die gebundene Variable ${\color {Periwinkle}x}$ nicht verändert wurde. Wenn im Substitutionsterm freie Variablen vorkommen, die in der Aussageform bereits gebunden sind, dann müssen diese gebundenen Variablen umbenannt werden. Es dürfen nämlich durch die Substitution keine Variablen gebunden werden, die vorher frei waren:

{\begin{array}{c}\exists {\color {RubineRed}y}:{\color {ForestGreen}x}>{\color {RubineRed}y}\\\downarrow \\{\text{ Umbenennung }}{\color {RubineRed}y}:={\color {CornflowerBlue}z}\\\downarrow \\\exists {\color {CornflowerBlue}z}:{\color {ForestGreen}x}>{\color {CornflowerBlue}z}\\\downarrow \\{\text{Substitution }}{\color {ForestGreen}x}:={\color {Orange}y\cdot 42}\\\downarrow \\\exists {\color {CornflowerBlue}z}:{\color {Orange}(y\cdot 42)}>{\color {CornflowerBlue}z}\end{array}}

Im obigen Beispiel wird durch die Substitution ${\color {OliveGreen}x}:={\color {Orange}y\cdot 42}$ die freie Variable ${\color {Orange}y}$ neu eingeführt. Jedoch ist in der ursprünglichen Aussageform bereits ${\color {RubineRed}y}$ durch den Existenzquantor gebunden. Deswegen muss die gebundene Variable ${\color {RubineRed}y}$ umbenannt werden (hier in die Variable ${\color {CornflowerBlue}z}$ ). Würde man dies nicht tun, dann würde die freie Variable ${\color {Orange}y}$ ebenfalls gebunden werden, was bei einer Substitution nicht erlaubt ist.

Definition (Substitution)

Gegeben sei ein Ausdruck $A(x)$ mit der freien Variablen $x$ und ein beliebiger Term $t$ . Dann entsteht der Ausdruck $A(t)$ durch die Substitution $x:=t$ dadurch, dass alle Vorkommen von $x$ durch $t$ ersetzt werden. Sollten durch die Substitution freie Variable gebunden werden, so sind die gebundenen Variablen vorher umzubenennen.

Eine andere Schreibweise für diese Substitution ist ${\binom {x}{t}}$ , für den substituierten Term $A{(_{t}^{x})}$ .

Verständnisfrage: Wie lauten folgende Aussageformen beziehungsweise Aussagen nach der Substitution?

$x+y=y+x$ für die Substitution $x:=6$
$\forall x,y:x+y=y+x$ für die Substitution $x:=6$
$x+x=y\cdot x$ für die Substitution $x:=y$
$a=b+c$ für die Substitution $x:=a+b$

Antwort:

$6+y=y+6$
$\forall x,y:x+y=y+x$ . In der Aussage $\forall x,y:x+y=y+x$ ist $x$ keine freie Variable und kann daher nicht ersetzt werden.
$y+y=y\cdot y$
$a=b+c$

Verständnisfrage: Wieso können sich Aussagen durch eine Substitution nicht ändern?

Weil Aussagen per Definition keine freien Variablen besitzen und nur freie Variable substituiert werden, bleiben Aussagen bei einer Substitution unverändert.

Tautologie

Es gibt Aussagen, die sind immer wahr. Das klassische Beispiel hierfür ist die Bauernregel: „Wenn der Hahn kräht auf dem Mist, dann ändert sich das Wetter oder es bleibt wie es ist.“ $H$ stehe für die Aussage „Der Hahn kräht auf dem Mist“ und $X$ für „Das Wetter ändert sich“, dann können wir diese Bauernregel folgendermaßen formalisieren:

\underbrace {H\implies X\lor \neg X} _{{\text{Wenn }}H{\text{ dann }}X{\text{ oder }}\neg X.}

Da Aussagen entweder „wahr“ oder „falsch“ sind, ist leicht zu sehen, dass die Bauernregel immer wahr ist. Dabei kommt es überhaupt nicht darauf an, ob der Hahn kräht oder nicht. Denn $X$ oder $\neg X$ – eine dieser beiden Aussagen ist wahr. Es spielt auch keine Rolle, was genau mit $X$ gemeint ist: es muss nur eine Aussage sein! $X$ könnte auch für die Behauptung stehen: „Es gibt kleine, grüne Männchen auf dem Mars.“

Woran liegt es, dass diese Aussage immer wahr ist? Es liegt daran, wie die Aussage mit Junktoren aus Teilaussagen zusammengebaut ist. Wir wissen, dass die Negation $\neg$ den Wahrheitswert umdreht: aus ${\mathsf {W}}$ wird ${\mathsf {F}}$ und umgekehrt aus ${\mathsf {F}}$ wird ${\mathsf {W}}$ . Die Oder-Verbindung $\lor$ wird wahr, wenn eine der beiden Teilaussagen wahr ist. Also ist $X\lor \neg X$ immer wahr. Die Implikation $A\implies B$ ist nur dann falsch, wenn die Prämisse $A$ wahr ist und die Konklusion $B$ falsch ist. In unserem Beispiel aber ist die Konklusion $X\lor \neg X$ immer wahr. Daher ist auch $H\implies X\lor \neg X$ immer wahr. Mit Junktoren zusammengesetzte Aussagen, die immer wahr sind, werden Tautologien oder auch allgemeingültige Aussagen genannt:

Definition (Tautologie)

Eine mit Junktoren zusammengesetzte Aussage heißt tautologisch oder allgemeingültig, wenn sie bei jeder möglichen Interpretation seiner Teilaussagen mit Wahrheitswerten wahr ist.

Besonders wichtige Tautologien sind Äquivalenzen. Zwei Aussagen $A$ und $B$ sind nämlich genau dann äquivalent, wenn die zusammengesetzte Aussage $A\iff B$ eine Tautologie ist. Das wird oft bei Beweisen genutzt. Statt direkt die Aussage $A$ zu beweisen, wird eine dazu äquivalente Aussage $B$ gezeigt.

Beispiel (Äquivalente Aussagen)

Die folgenden drei Aussagen sind äquivalent:

$A\implies B$
$\neg B\implies \neg A$ (Kontraposition)
$\neg (A\land \neg B)$ (Widerspruchsbeweis)

Es sind also tautologisch:

$A\implies B\iff \neg B\implies \neg A$
$A\implies B\iff \neg (A\land \neg B)$

Eine alternative Formulierung des Widerspruchbeweises ist im Übrigen $A\land \neg B\implies {\mathsf {F}}$ .

Überprüfung einer Tautologie

Wir werden jetzt drei Möglichkeiten vorstellen, wie du überprüfen kannst, ob eine Aussage eine Tautologie ist oder nicht. Alle diese Möglichkeiten sollen am Beispiel der Kontraposition $(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$ demonstriert werden.

Wahrheitstabelle erstellen

Erklärung der Äquivalenz von dem direktem Beweis, der Kontraposition und dem Widerspruchsbeweis. (YouTube-Video vom Kanal Quatematik)

Eine Methode ist es, eine Wahrheitstabelle für die zu untersuchende Aussage aufzustellen, vgl. Kapitel „Wahrheitstabelle“. Wenn in der letzten Spalte der Wahrheitstabelle nur „wahr“ als resultierender Wahrheitswert auftritt, ist die untersuchte Aussage eine Tautologie. Sobald ein resultierender Wahrheitswert „falsch“ ist, ist die Aussage keine Tautologie.

Aufgabe: Stelle die Wahrheitstabelle für $(A\lor B)\Leftrightarrow (B\lor A)$ auf.

$A$	$B$	$A\lor B$	$B\lor A$	$(A\lor B)\Leftrightarrow (B\lor A)$
${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {W}}$	${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\boldsymbol {\mathsf {W}}}$

Ergebnis: Die Aussage ist eine Tautologie.

Aufgabe: Stelle die Wahrheitstabelle für $(A\Rightarrow B)\Leftrightarrow (B\Rightarrow A)$ auf.

$A$	$B$	$A\Rightarrow B$	$B\Rightarrow A$	$(A\Rightarrow B)\Leftrightarrow (B\Rightarrow A)$
${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {W}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {W}}$	$\color {red}{\boldsymbol {\mathsf {F}}}$
${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {F}}$	$\color {red}{\boldsymbol {\mathsf {F}}}$
${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$

Ergebnis: Die Aussage ist keine Tautologie.

Aufgabe: Stelle die Wahrheitstabelle für $(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$ auf.

$A$	$B$	$\neg A$	$\neg B$	$A\Rightarrow B$	$\neg B\Rightarrow \neg A$	$(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$
${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {W}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$

Ergebnis: Die Aussage ist eine Tautologie.

Aufgabe: Stelle die Wahrheitstabelle für $(X\Rightarrow Y)\Leftrightarrow (\neg X\lor Y)$ auf.

$X$	$Y$	$\neg X$	$X\Rightarrow Y$	$\neg X\lor Y$	$(X\Rightarrow Y)\Leftrightarrow (\neg X\lor Y)$
${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {W}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {F}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$
${\mathsf {F}}$	${\mathsf {F}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\mathsf {W}}$	${\boldsymbol {\mathsf {W}}}$

Ergebnis: Die Aussage ist eine Tautologie.

Äquivalenzumformungen verwenden

Wenn du die Tautologie einer Äquivalenz $X\Leftrightarrow Y$ beweisen musst, kannst du versuchen, die Aussage $X$ durch bereits bekannte Äquivalenzbeziehungen in die Aussage $Y$ umzuformen. Für unser Beispiel nehmen wir an, dass wir die folgenden Äquivalenzen bereits kennen:

$X\Rightarrow Y\Leftrightarrow \neg X\lor Y$ (Umformung der Implikation)
$X\lor Y\Leftrightarrow Y\lor X$ (Kommutativität von $\lor$ )

Mit diesen beiden Äquivalenzen können wir die Kontraposition beweisen:

{\begin{aligned}&A\Rightarrow B\\&{\color {RedOrange}\updownarrow {\text{ Umformung nach 1.}}}\\[0.3em]\Leftrightarrow \quad &\neg A\lor B\\&{\color {RedOrange}\updownarrow {\text{ Kommutativität nach 2.}}}\\[0.3em]\Leftrightarrow \quad &B\lor \neg A\\&{\color {RedOrange}\updownarrow {\text{ Umformung nach 1.}}}\\[0.3em]\Leftrightarrow \quad &\neg B\Rightarrow \neg A\\\end{aligned}}

Baummethode

Diese Methode ist eine Art des Widerspruchsbeweises. Du beweist hier, dass eine Aussage $A$ eine Tautologie ist, indem du zeigst, dass diese Aussage nie falsch sein kann, weil sich sonst ein Widerspruch ergibt. Dabei zerlegst du die zu untersuchende Aussage schrittweise in ihre Teilaussagen und schaust dir nur diejenigen Fälle an, die zu einer falschen Aussage führen würden.

Nehmen wir an, dass $(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$ falsch ist. Dann muss entweder $A\Rightarrow B$ falsch sein und $\neg B\Rightarrow \neg A$ wahr sein oder umgekehrt. Im ersten Fall muss $A={\mathsf {W}}$ und $B={\mathsf {F}}$ sein. Dies ist aber ein Widerspruch dazu, dass $\neg B\Rightarrow \neg A$ wahr ist (weil für $A={\mathsf {W}}$ und $B={\mathsf {F}}$ die Aussage $\neg B\Rightarrow \neg A$ falsch ist).

Im zweiten Fall muss $\neg B={\mathsf {W}}$ und $\neg A={\mathsf {F}}$ sein. Dies bedeutet $B={\mathsf {F}}$ und $A={\mathsf {W}}$ . Aber auch das führt zu einem Widerspruch, weil $A\Rightarrow B={\mathsf {W}}$ ist (für $B={\mathsf {F}}$ und $A={\mathsf {W}}$ ist die Aussage $A\Rightarrow B$ falsch). Schematisch könnte man dies in einem Baum darstellen (deswegen auch der Name). Dabei stellt jeder Ast einen zu betrachtenden Fall dar:

{\begin{array}{ccc}(A\Rightarrow B)&\Leftrightarrow &(\neg B\Rightarrow \neg A):F\\\color {RoyalBlue}{\text{1. Fall}}&&\color {RedOrange}{\text{2. Fall}}\\\color {RoyalBlue}\downarrow &&\color {RedOrange}\downarrow \\A\Rightarrow B:{\mathsf {F}}&&A\Rightarrow B:{\mathsf {W}}\\\neg B\Rightarrow \neg A:{\mathsf {W}}&&\neg B\Rightarrow \neg A:{\mathsf {F}}\\\color {RoyalBlue}\downarrow &&\color {RedOrange}\downarrow \\A:{\mathsf {W}}&&B:{\mathsf {F}}\\B:{\mathsf {F}}&&A:{\mathsf {W}}\\\neg B\Rightarrow \neg A:{\mathsf {W}}&&A\Rightarrow B:{\mathsf {W}}\\\color {RoyalBlue}\downarrow &&\color {RedOrange}\downarrow \\\color {RoyalBlue}{\text{Widerspruch}}&&\color {RedOrange}{\text{Widerspruch}}\end{array}}

Liste von Tautologien

Assoziativgesetze

Bei der Disjunktion und bei der Konjunktion ist es egal, in welcher Reihenfolge du die Aussagen auswertest:

$(A\lor B)\lor C\Leftrightarrow A\lor (B\lor C)$
$(A\land B)\land C\Leftrightarrow A\land (B\land C)$

Kommutativgesetze

Bei der Disjunktion und bei der Konjunktion ist es egal, in welcher Reihenfolge die einzelnen Teilaussagen verknüpft werden. Dies ist in der deutschen Sprache nicht unbedingt der Fall. Betrachte dazu folgende zwei Aussagen, welche in der Bedeutung einen leichten Unterschied aufweisen: „Ralf aß Haferbrei und er bekam Bauchschmerzen“ und „Er bekam Bauchschmerzen und Ralf aß Haferbrei“.

$(A\lor B)\Leftrightarrow (B\lor A)$
$(A\land B)\Leftrightarrow (B\land A)$

Distributivgesetze

Eine Disjunktion kann in eine Konjunktion hineingezogen werden und umgekehrt.

$A\lor (B\land C)\Leftrightarrow (A\lor B)\land (A\lor C)$
$A\land (B\lor C)\Leftrightarrow (A\land B)\lor (A\land C)$

Absorptionsgesetze

$A\land (A\lor B)\Leftrightarrow A$
$A\lor (A\land B)\Leftrightarrow A$

Idempotenzgesetze

$A\land A\Leftrightarrow A$
$A\lor A\Leftrightarrow A$

Doppelte Verneinung

$\neg \neg A\Leftrightarrow A$

Satz vom ausgeschlossenen Dritten

$A\lor \neg A$ (lateinisch: tertium non datur, übersetzt: ein Drittes gibt es nicht.)

Satz vom Widerspruch

$\neg (A\land \neg A)$

Durch Anwendung der de Morganschen Regel, der doppelten Verneinung und der Kommutativität lässt sich der Satz vom Widerspruch in den Satz vom ausgeschlossenen Dritten umformen: $\neg (A\land \neg A)\iff \neg A\lor \neg \neg A\iff \neg A\lor A\iff A\lor \neg A$

Die de-Morgansche Regel

Bei der Negation einer Und- beziehungsweise einer Oder-Verknüpfung wird die Negation reingezogen und die Klammer aufgelöst. Aus einem $\land$ wird dabei ein $\lor$ und umgekehrt.

$\neg (A\land B)\Leftrightarrow \neg A\lor \neg B$
$\neg (A\lor B)\Leftrightarrow \neg A\land \neg B$

Negation von Implikation und Äquivalenz

$\neg (A\Rightarrow B)\Leftrightarrow A\land \neg B$
$\neg (A\Leftrightarrow B)\Leftrightarrow (A\Leftrightarrow \neg B)$
$\neg (A\Leftrightarrow B)\Leftrightarrow (\neg A\Leftrightarrow B)$

Prinzip der Kontraposition

Diese Äquivalenz wird oft genutzt, um eine Implikation zu beweisen, Redewendung: Beweis der Kontraposition.

$(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$

Beweis durch Widerspruch

Auch mit Hilfe der folgenden Äquivalenz kann eine Implikation bewiesen werden, Redewendung: Beweis durch Widerspruch.

$(A\Rightarrow B)\Leftrightarrow \neg (A\land \neg B)$
$(A\Rightarrow B)\Leftrightarrow (A\land \neg B)\Rightarrow {\mathsf {F}}$

Darstellung von Implikation und Äquivalenz

Mit Hilfe dieser Gesetze kann die Implikation und die Äquivalenz auf Aussagen mit anderen Junktoren zurückgeführt werden.

$A\Rightarrow B\Leftrightarrow \neg A\lor B$
$(A\Leftrightarrow B)\Leftrightarrow (A\Rightarrow B)\land (B\Rightarrow A)$
$(A\Leftrightarrow B)\Leftrightarrow (\neg A\lor B)\land (A\lor \neg B)$

Gesetze mit Wahr und Falsch

Im Folgenden steht ${\mathsf {W}}$ für „wahr“ und ${\mathsf {F}}$ für „falsch“. ${\mathsf {W}}$ und ${\mathsf {F}}$ können als 0-stellige Junktoren angesehen werden.

${\mathsf {F}}\Rightarrow A$ (Aus Falschem folgt Beliebiges.)
$A\Rightarrow {\mathsf {W}}$
$A\land {\mathsf {W}}\Leftrightarrow A$
$A\lor {\mathsf {F}}\Leftrightarrow A$
$A\lor {\mathsf {W}}$
$\neg (A\land {\mathsf {F}})$
$\lnot A\Leftrightarrow (A\Rightarrow {\mathsf {F}})$ (Wird gelegentlich als Definition für $\neg$ verwendet.)

Aussagen formalisieren

Wir möchten nun zeigen, wie Aussagen in natürlicher Sprache in die formale Schreibweise der Logik übersetzt und wie umgekehrt formale Ausdrücke in die natürliche Sprache umformuliert werden können. Hier kann wie beim Lernen einer Fremdsprache vorgegangen werden: Die einzelnen Wörter und Satzfragmente in natürlicher Sprache übersetzt man in die dazu äquivalente Form der Logik und umgekehrt. Dabei werden zur Übung auch Ausdrücke betrachtet, wie sie in der Analysis 1 betrachtet werden.

Vokabelliste

Die folgende Vokabelliste listet Satzfragmente in natürlicher Sprache mit ihren Übersetzungen in der formalen Ausdrucksweise der Logik gleich:

natürliche Sprache	formale Schreibweise
nicht $A$	$\neg A$
$A$ und $B$	$A\land B$
$A$ oder $B$ („oder“ im Sinne von „und/oder“)	$A\lor B$
Wenn $A$ , dann $B$	$A\Rightarrow B$
$B$ dann, wenn $A$
Aus $A$ folgt $B$
$A$ impliziert $B$
$A$ ist hinreichend für $B$
$B$ ist notwendig für $A$
Genau dann $A$ , wenn $B$	$A\iff B$
Dann und nur dann $A$ , wenn $B$
$A$ ist gleichwertig mit $B$
$A$ ist äquivalent zu $B$
$A$ ist notwendig und hinreichend für $B$
Für alle $x$ ist $A(x)$	$\forall x:\,A(x)$
Jedes $x$ erfüllt $A(x)$
Es ist $A(x)$ für alle $x$
Für alle $x$ aus $M$ ist $A(x)$	$\forall x\in M:\,A(x)$
Jedes $x$ der Menge $M$ erfüllt $A(x)$
Es ist $A(x)$ für alle $x\in M$
Für alle $x$ ab $3$ ist $A(x)$	$\forall x\geq 3:A(x)$
Jedes $x$ größer oder gleich $3$ erfüllt $A(x)$	$\forall x\geq 3:A(x)$
Es gibt ein $x$ mit $A(x)$	$\exists x:\,A(x)$
Es existiert ein $x$ , so dass $A(x)$ gilt
Für mindestens ein $x$ gilt $A(x)$
Es gibt ein $x$ aus $M$ mit $A(x)$	$\exists x\in M:\,A(x)$
Für mindestens ein $x\in M$ gilt $A(x)$	$\exists x\in M:\,A(x)$
Es gibt ein $x$ ab $3$ mit $A(x)$	$\exists x\geq 3:A(x)$
Für wenigstens ein $x$ ab $3$ gilt $A(x)$	$\exists x\geq 3:A(x)$
Es gibt genau ein $x$ mit $A(x)$	$\exists !x:\,A(x)$
Es existiert genau ein $x$ , so dass $A(x)$ gilt
Für genau ein $x$ gilt $A(x)$
Es gibt genau ein $x$ aus $M$ mit $A(x)$	$\exists !x\in M:\,A(x)$
Für genau ein $x\in M$ gilt $A(x)$	$\exists !x\in M:\,A(x)$

Beispiele

Übersetzung von formaler in natürliche Sprache

Wir möchten dir an Beispielen zeigen, wie du die obige Vokabelliste anwenden kannst, um Aussagen aus der formalen in die natürliche Sprache zu übersetzen.

Beispiel (Beispiel 1: Übersetzung von formaler in natürliche Sprache)

Wir übersetzen nun die Aussage $a<b\land b<c\Rightarrow a<c$ schrittweise in natürliche Sprache:

{\begin{aligned}&a<b\land b<c\Rightarrow a<c\\[0.5em]&\quad {\color {Purple}\downarrow \,{\mathsf {Bindungsreihenfolge\,beachten}}}\\[0.5em]&(a<b\land b<c)\Rightarrow a<c\\[0.5em]&\quad {\color {Purple}\downarrow \,A\Rightarrow B\longleftrightarrow {\text{Wenn }}A{\text{, dann }}B}\\[0.5em]&{\text{Wenn }}a<b\land b<c{\text{, dann }}a<c\\[0.5em]&\quad {\color {Purple}\downarrow \,A\land B\longleftrightarrow A{\text{ und }}B}\\[0.5em]&{\text{Wenn }}a<b{\text{ und }}b<c{\text{, dann }}a<c\\[0.5em]\end{aligned}}

Beispiel (Beispiel 2: Übersetzung von formaler in natürliche Sprache)

Das folgende Beispiel zeigt die schrittweise Übersetzung der Aussage

\forall x\in \mathbb {R} \,\exists y\in \mathbb {R} :\,x+y=0

in die Aussage „Für jede reelle Zahl $x$ gibt es eine reelle Zahl $y$ mit $x+y=0$ “:

{\begin{aligned}&\forall x\in \mathbb {R} \,\exists y\in \mathbb {R} :\,x+y=0\\[0.5em]&\quad {\color {Purple}\downarrow \,\forall x\in \mathbb {R} :A(x)\longleftrightarrow {\text{Für alle }}x{\text{ aus }}\mathbb {R} {\text{ gilt }}A(x)}\\[0.5em]&{\text{Für alle }}x{\text{ aus }}\mathbb {R} {\text{ gilt }}\exists y\in \mathbb {R} :\,x+y=0\\[0.5em]&\quad {\color {Purple}\downarrow \,\exists y\in \mathbb {R} :A(y)\longleftrightarrow {\text{Es gibt mindestens ein }}y{\text{ aus }}\mathbb {R} {\text{ mit }}A(y)}\\[0.5em]&{\text{Für alle }}x{\text{ aus }}\mathbb {R} {\text{ gilt }}({\text{Es gibt mindestens ein }}y{\text{ aus }}\mathbb {R} {\text{ mit }}x+y=0)\\[0.5em]&\quad {\color {Purple}\downarrow \,{\mathsf {Aussage\ sch{\ddot {o}}ner\ formulieren}}}\\[0.5em]&{\text{Für jede reelle Zahl }}x{\text{ gibt es eine reelle Zahl }}y{\text{ mit }}x+y=0\\[0.5em]\end{aligned}}

Übersetzung von natürlicher in formale Sprache

Bei der Übersetzung einer Aussage aus natürlicher Sprache in die formale Schreibweise gehen wir die umgekehrte Richtung der obigen beiden Beispiele. Auch hier kann mit Hilfe der Vokabelliste schrittweise die Aussage übersetzt werden. Gegebenenfalls müssen wir die Aussage zunächst umformulieren, damit die Regeln aus der Vokabelliste anwendbar sind. Das folgende Beispiel demonstriert eine solche Übersetzung:

Beispiel (Übersetzung von natürlicher in formale Sprache)

Das folgende Beispiel demonstriert die Formalisierung der Aussage „Alle ungeraden Zahlen ab 3 sind Primzahlen“. Dabei nutzen wir das Prädikat $P(x)$ , welches für „ $x$ ist eine Primzahl“ steht:

{\begin{aligned}&{\text{Alle ungeraden Zahlen ab 3 sind Primzahlen}}\\[0.3em]&\quad {\color {Purple}\left\downarrow \,{\mathsf {Allquantor}}\,\forall \;{\mathsf {eingef{\ddot {u}}hrt\,und\,Text\,umformuliert}}\right.}\\[0.3em]&\forall x:({\text{ist}}\,x\,{\text{ungerade und ist}}\,x\,{\text{größer als oder gleich}}\,3,\,{\text{dann ist}}\,x\,{\text{Primzahl}})\\[0.3em]&\quad {\color {Purple}\left\downarrow \,{\mathsf {Junktoren}}\,\land \;{\mathsf {und}}\,\Rightarrow \,{\mathsf {eingesetzt}}\right.}\\[0.3em]&\forall x:(x\,{\text{ist ungerade}}\land \,x\,{\text{ist größer als oder gleich}}\,3\Rightarrow x\,{\text{ist Primzahl}})\\[0.3em]&\quad {\color {Purple}\left\downarrow \,{\mathsf {Pr{\ddot {a}}dikate}}\,\geq \;{\mathsf {und}}\,P\,{\mathsf {eingesetzt,mit}}\,P:={\text{ist Primzahl}}\right.}\\[0.3em]&\forall x:(x\,{\text{ist ungerade}}\land \,x\geq 3\Rightarrow P(x))\\&\quad {\color {Purple}\left\downarrow \,(x\,{\text{ist ungerade}})\,{\mathsf {umgeschrieben}}\right.}\\[0.3em]&\forall x:(({\text{es gibt keine Zahl, die mit 2 multipliziert x ergibt)}}\land \,x\geq 3\Rightarrow P(x))\\&\quad {\color {Purple}\left\downarrow \,{\mathsf {Negation}}\,\neg \,{\mathsf {eingesetzt}}\right.}\\[0.3em]&\forall x:(\neg ({\text{es gibt eine Zahl die mit 2 multipliziert x ergibt}})\land \,x\geq 3\Rightarrow P(x))\\&\quad {\color {Purple}\left\downarrow \,{\mathsf {Existenzquantor}}\,\exists \,{\mathsf {eingesetzt}}\right.}\\[0.3em]&\forall x:(\neg \exists y:{\text{2 mal y ist x}}\land \,x\geq 3\Rightarrow P(x))\\&\quad {\color {Purple}\left\downarrow \,{\mathsf {Multiplikation}}\,\cdot \,{\mathsf {und}}\,={\mathsf {eingesetzt}}\right.}\\[0.3em]&\forall x:(\neg \exists y:2\cdot y=x\land \,x\geq 3\Rightarrow P(x))\\\end{aligned}}

Übungsaufgaben

Verständnisfrage: Übersetze folgende Aussagen der formalen Logik in die natürliche Sprache

$\exists y\in \mathbb {R} \,\forall x\in \mathbb {R} :\,x+y=x$
$a>0\land b>0\Rightarrow a+b>0$
$\forall \epsilon >0\,\exists \delta >0\,\forall x,y\in D:\,|x-y|<\delta \Rightarrow |f(x)-f(y)|<\epsilon$

1. Aussage:

{\begin{array}{l}\exists y\in \mathbb {R} \,\forall x\in \mathbb {R} :\,x+y=x\\[0.5em]\quad \downarrow \\[0.5em]{\text{Es gibt ein }}y\in \mathbb {R} {\text{, so dass }}\forall x\in \mathbb {R} :\,x+y=x.\\[0.5em]\quad \downarrow \\[0.5em]{\text{Es gibt ein }}y\in \mathbb {R} {\text{, so dass für alle }}x\in \mathbb {R} {\text{ gilt, dass }}x+y=x.\\[0.5em]\quad \downarrow \\[0.5em]{\text{Es gibt eine reelle Zahl }}y{\text{,}}\\[0.5em]{\text{so dass für alle reellen Zahlen }}x{\text{ die Gleichung }}x+y=x{\text{ erfüllt ist.}}\end{array}}

2. Aussage:

{\begin{array}{l}a>0\land b>0\Rightarrow a+b>0\\[0.5em]\quad \downarrow \\[0.5em]{\text{Wenn }}a>0\land b>0{\text{ ist, dann ist }}a+b>0.\\[0.5em]\quad \downarrow \\[0.5em]{\text{Wenn }}a>0{\text{ und }}b>0{\text{ ist, dann ist }}a+b>0.\end{array}}

3. Aussage:

{\begin{array}{l}\forall \epsilon >0\,\exists \delta >0\,\forall x,y\in D:\,|x-y|<\delta \Rightarrow |f(x)-f(y)|<\epsilon \mathrm {.} \\[0.5em]\quad \downarrow \\[0.5em]{\text{Zu jedem }}\epsilon >0\,\exists \delta >0:\,\forall x,y\in D:\,|x-y|<\delta \Rightarrow |f(x)-f(y)|<\epsilon \mathrm {.} \\[0.5em]\quad \downarrow \\[0.5em]{\text{Zu jedem }}\epsilon >0{\text{ gibt es ein }}\delta >0{\text{,}}\\[0.5em]{\text{so dass }}\forall x,y\in D:\,|x-y|<\delta \Rightarrow |f(x)-f(y)|<\epsilon \mathrm {.} \\[0.5em]\quad \downarrow \\[0.5em]{\text{Zu jedem }}\epsilon >0{\text{ gibt es ein }}\delta >0{\text{,}}\\[0.5em]{\text{so dass für alle }}x,y\in D{\text{ gilt: }}|x-y|<\delta \Rightarrow |f(x)-f(y)|<\epsilon \mathrm {.} \\[0.5em]\quad \downarrow \\[0.5em]{\text{Zu jedem }}\epsilon >0{\text{  gibt es ein }}\delta >0{\text{,}}\\[0.5em]{\text{so dass für alle }}x,y\in D{\text{ gilt: Wenn }}|x-y|<\delta {\text{ ist, dann ist }}|f(x)-f(y)|<\epsilon \mathrm {.} \\[0.5em]\quad \downarrow \\[0.5em]{\text{Zu jedem }}\epsilon >0{\text{ gibt es ein }}\delta >0{\text{,}}\\[0.5em]{\text{so dass für alle }}x,y\in D{\text{ mit }}|x-y|<\delta {\text{ gilt }}|f(x)-f(y)|<\epsilon \mathrm {.} \end{array}}

Verständnisfrage: Übersetze folgende Aussagen der natürlichen Sprache in die formale Schreibweise der Logik

Zu jedem $\epsilon >0$ gibt es ein $N\in \mathbb {N}$ , so dass für alle $n\geq N$ die Ungleichung $|a-a(n)|<\epsilon$ erfüllt ist.
Zu jedem $\epsilon >0$ und $x\in D$ gibt es ein $\delta >0$ , so dass $|f(x)-f(y)|<\epsilon$ für alle $y\in D$ mit $|x-y|<\delta$ .
Für jeden Menschen gibt es einen anderen, der ihn liebt.

Antwort:

$\forall \epsilon >0:\,\exists N\in \mathbb {N} :\,\forall n\in \mathbb {N} :\,n\geq N\Rightarrow |a-a(n)|<\epsilon$
$\forall \epsilon >0:\,\forall x\in D:\,\exists \delta >0:\,\forall y\in D:\,|x-y|<\delta \Rightarrow |f(x)-f(y)|<\epsilon$
$\forall x:\,x{\text{ ist ein Mensch }}\Rightarrow \exists y:\,y{\text{ ist ein Mensch }}\land y{\text{ liebt }}x$

Häufige Fehler beim Übersetzen

Aussage in natürlicher Sprache	Falsche Übersetzung	Richtige Übersetzung	Erklärung
$x$ und $y$ sind reelle Zahlen.	$x\land y\in \mathbb {R}$	$x,y\in \mathbb {R}$	Der Junktor $\land$ kann nur Aussagen miteinander verbinden.
Für alle natürlichen Zahlen $n$ und ganzen Zahlen $k$ gilt …	$\forall n\in \mathbb {N} \land k\in \mathbb {Z} :\ldots$	$\forall n\in \mathbb {N} \,\forall k\in \mathbb {Z} :\ldots$	Wird „und“ für eine Aufzählung benutzt, dann darf es nicht mit $\land$ übersetzt werden.
Für alle $x$ mit $x<1$ gilt …	$\forall x\mid x<1:\ldots$	$\forall x:(x<1\Rightarrow \ldots )$ oder auch $\forall x<1:\ldots$	Das Symbol $\mid$ aus der Mengenschreibweise $\{x\mid A(x)\}$ kann nicht für Aussagen eingesetzt werden. Hier ist eine Implikation notwendig.
Es ist $\|a_{n}\|<\epsilon$ für alle $n\geq N$ .	$\|a_{n}\|<\epsilon \ \forall n\geq N$ .	$\forall n\geq N:\|a_{n}\|<\epsilon$ .	Die Quantoren müssen immer vor dem Ausdruck stehen, den sie quantifizieren.

Aussagen negieren

In diesem Kapitel werden wir dir erklären, wie du mathematische Aussagen und Aussageformen negieren kannst. Hierzu werden wir den Weg über die formale Schreibweise gehen, weil Ausdrücke dieser Schreibweise leichter zu negieren sind. Das liegt daran, dass Aussagen in der formalen Schreibweise durch einfache Umformungsregeln negiert werden können. Dies ist deutlich einfacher als Ausdrücke intuitiv zu negieren.

Du kannst ja einmal versuchen, folgende Beispiele zu negieren. Du wirst sehen, dass die intuitive Negation nicht einfach ist (an dieser Stelle wird nicht erwartet, dass du bereits die folgenden Ausdrücke negieren kannst). Die ersten beiden Aussageformen stammen im Übrigen aus der Analysis 1 und werden dir damit im weiteren Studium durchaus begegnen. Versuche also mal folgende Ausdrücke zu negieren:

Zu jedem $\epsilon >0$ gibt es ein $N\in \mathbb {N}$ , sodass für alle $n\geq N$ die Ungleichung $|a-a(n)|<\epsilon$ erfüllt ist.
Zu jedem $\epsilon >0$ und $x\in D$ gibt es ein $\delta >0$ , sodass $|f(x)-f(y)|<\epsilon$ für alle $y\in D$ mit $|x-y|<\delta$ .
Für jeden Menschen gibt es einen anderen, der ihn liebt.

Die Negation dieser Ausdrücke findest du später im Abschnitt „Beispiele“.

Allgemeine Vorgehensweise

Um nun eine in natürlicher Sprache gegebene Aussage zu negieren, kannst du folgendermaßen vorgehen:

{\begin{aligned}{\begin{array}{l}{\text{Negation einer Aussage in natürlicher Sprache.}}\\[0.5em]\qquad {\color {Orange}\left\downarrow {\text{Übersetzung}}\right.}\\[0.5em]{\text{Negation einer Aussage in formaler Sprache.}}\\[0.5em]\qquad {\color {Orange}\left\downarrow {\text{schrittweise Anwendung von Umformungsregeln}}{\color {White}{\text{Ü}}}\right.}\\[0.5em]{\text{negierte Aussage in formaler Sprache.}}\\[0.5em]\qquad {\color {Orange}\left\downarrow {\text{Übersetzung}}\right.}\\[0.5em]{\text{negierte Aussage in natürlicher Sprache.}}\\[0.5em]\end{array}}\end{aligned}}

Sollte die Aussage in formaler Schreibweise vorliegen, dann entfallen der erste und der letzte Schritt. Diese beiden Schritte, also die Übersetzung von natürlicher in formale Schreibweise und umgekehrt, erklären wir dir im Kapitel „Aussagen formalisieren“.

Umformungsregeln zum Negieren

Wie wir bereits gesagt haben, gelten Regeln zur Negation von Aussagen in formaler Schreibweise. Diese sind:

Form der Negation	umgeformte Aussage	Bedeutung
$\neg (\neg A)$	$A$	$A$
$\neg (A\land B)$	$\neg A\lor \neg B$	Nicht $A$ oder nicht $B$ .
$\neg (A\lor B)$	$\neg A\land \neg B$	Nicht $A$ und nicht $B$ .
$\neg (A\implies B)$	$A\land \neg B$	Obwohl $A$ , gilt nicht $B$ .
$\neg (A\iff B)$	$A\;\;\!\!{\dot {\lor }}\;\;\!\!B$	Entweder $A$ oder $B$ (aber nicht beides gleichzeitig).
	$A\iff \neg B\,$	Genau dann $A$ , wenn nicht $B$ .
	$\neg A\iff B\,$	Genau dann nicht $A$ , wenn $B$ .
$\neg (\forall x:\,A(x))$	$\exists x:\,\neg A(x)$	Es gibt ein $x$ mit nicht $A(x)$ .
$\neg (\forall x\in M:\,A(x))$	$\exists x\in M:\,\neg A(x)$	Es gibt ein $x\in M$ mit nicht $A(x)$ .
$\neg (\exists x:\,A(x))$	$\forall x:\,\neg A(x)$	Für alle $x$ ist nicht $A(x)$ .
$\neg (\exists x\in M:\,A(x))$	$\forall x\in M:\,\neg A(x)$	Für alle $x\in M$ ist nicht $A(x)$ .
$\neg (\exists !x:\,A(x))$	$\forall x:(\neg A(x)\lor \exists y:(A(y)\land x\neq y))$	Für jedes $x$ gilt: $x$ hat nicht die Eigenschaft $A(x)$ oder es gibt ein von $x$ verschiedenes $y$ mit der Eigenschaft $A(y)$ .
$\neg (\exists !x:\,A(x))$	$\forall x:\neg A(x)\lor \exists y,x:(A(y)\land A(x)\land x\neq y)$	Es gibt kein oder mindestens zwei $x$ mit $A(x)$ .

Wieso sind die Umformungsregeln so? Das liegt daran, dass die Aussagen der ersten Spalte äquivalent zu den Aussagen der zweiten Spalte sind. Dies bedeutet, dass die Aussagen der ersten Spalte genau dann wahr sind, wenn die entsprechenden Aussagen der zweiten Spalte wahr sind. Wenn du dir die umgeformten Aussagen anschaust, dann siehst du, dass die Negation in den Teilaussagen weitergereicht wird. So können die Ausdrücke schrittweise durch die Umformungsregeln negiert werden, bis am Ende die Negationszeichen ganz innen stehen.

Bei der Negation der Äquivalenz $\neg (A\iff B)$ kannst du dir im Übrigen aussuchen, ob du diese Aussage zu $A\,{\dot {\lor }}\,B$ oder zu $A\iff \neg B$ oder zu $\neg A\iff B$ umformst. Die erste Umformung ist einfacher, verwendet aber die Kontravalenz ${\dot {\lor }}$ . Diese wird in der Mathematik nicht häufig verwendet und möglicherweise wurde sie nicht in deiner Vorlesung besprochen.

Zur Regel mit dem eindeutigen Existenzquantor

Bei der Regel mit dem eindeutigen Existenzquantor haben wir ausgenutzt, dass wir $\exists !x:\,A(x)$ auch folgendermaßen schreiben können:

\exists x:(A(x)\land \forall y:(A(y)\implies x=y))

Diese Aussage kann nun mit den anderen Umformungsregeln negiert werden, sodass man dann am Ende erhält:

\neg (\exists !x:\,A(x))\iff \forall x:(\neg A(x)\lor \exists y:(A(y)\land x\neq y))

Man kann auch einen anderen Weg gehen: Man fängt mit der Aussage

„Es gibt genau ein $x$ mit $A(x)$ .“

an und negiert diese intuitiv zu

„Es gibt kein oder mindestens zwei $x$ mit $A(x)$ .“

Diese Aussage in der Prädikatenlogik formalisiert lautet

\forall x:\neg A(x)\lor \exists y,x:(A(y)\land A(x)\land x\neq y)

Dies ist dann die zweite Möglichkeit, um einen Ausdruck mit einem eindeutigen Existenzquantor zu negieren.

Beispiele

Ausführliches Beispiel

Betrachten wir zunächst folgende Aussage

„Zu jedem $x$ gibt es ein $y$ , das kleiner als $x$ ist.“

Diese lässt sich mit den Methoden aus dem Kapitel „Aussagen formalisieren“ umschreiben. Die formalisierte Aussage lautet

\forall x\,\exists y:y<x

Diese lässt sich nun schrittweise negieren, indem die obigen Umformungsregeln verwendet werden:

{\begin{array}{l}\neg (\forall x\,\exists y:y<x)\\[0.5em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[0.5em]\exists x:\neg (\exists y:y<x)\\[0.5em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\exists x:A(x))\iff \forall x:\neg A(x)\right.}\\[0.5em]\exists x\,\forall y:\neg (y<x)\\[0.5em]\qquad {\color {Gray}\left\downarrow \ \neg (y<x)\iff y\geq x\right.}\\[0.5em]\exists x\,\forall y:y\geq x\end{array}}

Das Ergebnis ist damit die Aussage $\exists x\,\forall y:y\geq x$ . Die Negation der obigen wahren Aussage führt damit zu der falschen Aussage:

„Es gibt ein $x$ , so dass alle $y$ größer oder gleich $x$ sind.“

Beispiele aus der Einleitung

Betrachten wir nun das erste Beispiel aus der Einleitung:

Zu jedem $\epsilon >0$ gibt es ein $N\in \mathbb {N}$ , sodass für alle $n\geq N$ die Ungleichung $|a-a(n)|<\epsilon$ erfüllt ist.

Zum Negieren der Aussage gehen wir schrittweise wie im ersten Beispiel vor:

{\begin{array}{l}{\text{Negation der Aussage: Zu jedem }}\epsilon >0{\text{ gibt es ein }}N\in \mathbb {N} {\text{,}}\\[0.3em]{\text{sodass für alle }}n\geq N{\text{ die Ungleichung }}|a-a(n)|<\epsilon {\text{ erfüllt ist.}}\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Übersetzung in formale Schreibweise}}\right.}\\[1em]\neg \left(\forall \epsilon >0\,\exists N\in \mathbb {N} \,\forall n\in \mathbb {N} :\,n\geq N\implies |a-a(n)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[1em]\exists \epsilon >0:\neg \left(\exists N\in \mathbb {N} \,\forall n\in \mathbb {N} :\,n\geq N\implies |a-a(n)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\exists x:A(x))\iff \forall x:\neg A(x)\right.}\\[1em]\exists \epsilon >0\,\forall N\in \mathbb {N} :\neg \left(\forall n\in \mathbb {N} :\,n\geq N\implies |a-a(n)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[1em]\exists \epsilon >0\,\forall N\in \mathbb {N} \,\exists n\in \mathbb {N} :\,\neg \left(n\geq N\implies |a-a(n)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (A\implies B)\iff A\land \neg B\right.}\\[1em]\exists \epsilon >0\,\forall N\in \mathbb {N} \,\exists n\in \mathbb {N} :\,n\geq N\land \neg \left(|a-a(n)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ \neg \left(|a-a(n)|<\epsilon \right)\iff |a-a(n)|\geq \epsilon \right.}\\[1em]\exists \epsilon >0\,\forall N\in \mathbb {N} \,\exists n\in \mathbb {N} :\,n\geq N\land |a-a(n)|\geq \epsilon \\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Übersetzung in natürliche Sprache}}\right.}\\[1em]{\text{Es gibt ein }}\epsilon >0{\text{, sodass es für alle }}N\in \mathbb {N} {\text{ ein }}n\in \mathbb {N} {\text{ mit }}n\geq N{\text{ und }}|a-a(n)|\geq \epsilon {\text{ gibt.}}\end{array}}

Übungsaufgabe

Aufgabe

Negiere folgende Aussagen:

Für alle $R>0$ gibt es ein $n\in \mathbb {N}$ , sodass $|x_{n}|\geq R$ .
Für alle $\epsilon >0$ und $x\in D$ gibt es ein $\delta >0$ , sodass $|f(x)-f(y)|<\epsilon$ für alle $y\in D$ mit $|x-y|<\delta$ .
Für jeden Menschen gibt es einen anderen, der ihn liebt.
$\forall x\exists y:A(x)\implies B(y)$

Lösung

Erste Aussage:

{\begin{array}{l}{\text{Negation der Aussage: Für alle }}R>0{\text{ gibt es ein }}n\in \mathbb {N} {\text{, sodass }}|x_{n}|\geq R\mathrm {.} \\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Übersetzung in formale Schreibweise}}\right.}\\[1em]\neg \left(\forall R>0\,\exists n\in \mathbb {N} :|x_{n}|\geq R\right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[1em]\exists R>0:\neg \left(\exists n\in \mathbb {N} :|x_{n}|\geq R\right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\exists x:A(x))\iff \forall x:\neg A(x)\right.}\\[1em]\exists R>0\,\forall n\in \mathbb {N} :\neg \left(|x_{n}|\geq R\right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (|x_{n}|\geq R)\iff |x_{n}|<R\right.}\\[1em]\exists R>0\,\forall n\in \mathbb {N} \,:|x_{n}|<R\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Übersetzung in natürliche Sprache}}\right.}\\[1em]{\text{Es gibt ein }}R>0{\text{, so dass für alle }}n\in \mathbb {N} {\text{, }}|x_{n}|<R{\text{ gilt.}}\end{array}}

Zweite Aussage:

{\begin{array}{l}{\text{Negation der Aussage: Für alle }}\epsilon >0{\text{ und }}x\in D{\text{ gibt es ein }}\delta >0{\text{,}}\\[1em]{\text{sodass }}|f(x)-f(y)|<\epsilon \ {\text{für alle }}y\in D{\text{ mit }}|x-y|<\delta \mathrm {.} \\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Übersetzung in formale Schreibweise}}\right.}\\[1em]\neg \left(\forall \epsilon >0\,\forall x\in D\,\exists \delta >0\,\forall y\in D:|x-y|<\delta \implies |f(x)-f(y)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[1em]\exists \epsilon >0:\neg \left(\forall x\in D\,\exists \delta >0\,\forall y\in D:|x-y|<\delta \implies |f(x)-f(y)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[1em]\exists \epsilon >0\,\exists x\in D:\neg \left(\exists \delta >0\,\forall y\in D:|x-y|<\delta \implies |f(x)-f(y)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\exists x:A(x))\iff \forall x:\neg A(x)\right.}\\[1em]\exists \epsilon >0\,\exists x\in D\,\forall \delta >0:\neg \left(\forall y\in D:|x-y|<\delta \implies |f(x)-f(y)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[1em]\exists \epsilon >0\,\exists x\in D\,\forall \delta >0\,\exists y\in D:\neg \left(|x-y|<\delta \implies |f(x)-f(y)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (A\implies B)\iff A\land \neg B\right.}\\[1em]\exists \epsilon >0\,\exists x\in D\,\forall \delta >0\,\exists y\in D:|x-y|<\delta \land \neg \left(|f(x)-f(y)|<\epsilon \right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (|f(x)-f(y)|<\epsilon )\iff |f(x)-f(y)|\geq \epsilon \right.}\\[1em]\exists \epsilon >0\,\exists x\in D\,\forall \delta >0\,\exists y\in D:|x-y|<\delta \land |f(x)-f(y)|\geq \epsilon \\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Übersetzung in natürliche Sprache}}\right.}\\[1em]{\text{Es gibt ein }}\epsilon >0{\text{ und ein }}x\in D{\text{,}}\\[1em]{\text{so dass für alle }}\delta >0{\text{ es ein }}y\in D{\text{ mit }}|x-y|<\delta {\text{ und }}|f(x)-f(y)|\geq \epsilon {\text{ gibt.}}\end{array}}

Dritte Aussage:

{\begin{array}{l}{\text{Negation der Aussage: Für jeden Menschen gibt es einen anderen, der ihn liebt.}}\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Übersetzung in formale Schreibweise. Sei }}M{\text{ die Menge aller Menschen.}}\right.}\\[1em]\neg \left(\forall x\in M\,\exists y\in M:y{\text{ liebt }}x\right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[1em]\exists x\in M:\neg \left(\exists y\in M:y{\text{ liebt }}x\right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\exists x:A(x))\iff \forall x:\neg A(x)\right.}\\[1em]\exists x\in M\,\forall y\in M:\neg \left(y{\text{ liebt }}x\right)\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Übersetzung in natürliche Sprache}}\right.}\\[1em]{\text{Es gibt einen Menschen, so dass alle Menschen ihn nicht lieben.}}\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformulierung}}\right.}\\[1em]{\text{Es gibt einen Menschen, den }}{\mathit {kein\ Mensch}}{\text{ liebt.}}\end{array}}

Vierte Aussage:

{\begin{array}{l}\neg (\forall x\exists y:A(x)\implies B(y))\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\forall x:A(x))\iff \exists x:\neg A(x)\right.}\\[1em]\exists x\,\neg (\exists y:A(x)\implies B(y))\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (\exists x:A(x))\iff \forall x:\neg A(x)\right.}\\[1em]\exists x\forall y:\neg (A(x)\implies B(y))\\[1em]\qquad {\color {Gray}\left\downarrow \ {\text{Umformungsregel: }}\neg (A\implies B)\iff (A\land \neg B)\right.}\\[1em]\exists x\forall y:\left(A(x)\land \neg B(y)\right)\end{array}}

Beweis

Was sind Beweise?

Ein Beweis ist eine fehlerfreie Herleitung eines mathematischen Satzes aus Axiomen und bereits bewiesenen Aussagen. Er besteht aus endlich vielen Teilschritten, wobei bei jedem Teilschritt streng logisch eine neue Aussage aus den vorhergehenden Aussagen geschlossen wird. Beweise spielen damit eine wichtige Rolle in der Mathematik, denn jeder neue Satz einer Theorie muss durch einen Beweis begründet werden. Um Sätze beweisen zu können oder auch Beweise nachvollziehen zu können, ist es notwendig, die Beweistechniken zu kennen.

Wie ist ein Beweis aufgebaut? Die Voraussetzungen, von denen wir beim Beweis eines Satzes ausgehen, nennt man Prämissen. Dies sind Aussagen, die entweder Axiome der Theorie oder bereits bewiesene Sätze sind. Aus diesen Prämissen werden nun durch logische Schlussfolgerungen weitere Aussagen hergeleitet, aus denen wiederum durch logische Schlussfolgerungen neue Aussagen hergeleitet werden usw. Am Ende dieser Herleitungen steht die zu beweisende Aussage. Durch einen solchen Beweis (der in der rechten Abbildung skizziert ist) hat man nun folgende Aussage bewiesen:

\mathrm {<} {\text{Prämissen}}\mathrm {>} \Rightarrow \mathrm {<} {\text{zu beweisende Aussage}}\mathrm {>}

Wie können logische Schlussfolgerungen aussehen? Stelle dir vor, du hast bereits die Implikation „Wenn $A$ , dann $B$ “ als Satz in deiner Theorie bewiesen oder es ist ein Axiom deiner Theorie oder eine Tautologie. Nimm außerdem an, du hast die Aussage $A$ bereits hergeleitet oder sie ist eine Prämisse deines Beweises. Da nun sowohl die Aussage $A$ als auch die Aussage „Wenn $A$ , dann $B$ “ gilt, kannst du dir aus beiden Aussagen die Aussage $B$ logisch erschließen und deinem Beweis hinzufügen.

Neben Implikationen können auch Äquivalenzen zur logischen Schlussfolgerung herangezogen werden. Denn wenn eine Äquivalenz $A\Leftrightarrow B$ gilt, so gilt sowohl die Implikation $A\Rightarrow B$ als auch die Implikation $B\Rightarrow A$ , die für logische Schlussfolgerungen nach dem obigen Prinzip verwendet werden können.

Das Ende eines Beweises wird oft durch „qed“ gekrönt. Dies steht für quod erat demonstrandum und bedeutet so viel wie „was zu beweisen war“. Auch die Symbole □ bzw. ■ sind als Markierungen für ein Beweisende verbreitet.

Beispiel

Stelle dir vor, du möchtest folgenden Satz beweisen:

k=x+y\Rightarrow \left({\tfrac {k}{2}}\right)^{2}\geq xy

Dabei sind $k$ , $x$ und $y$ reelle Zahlen. Bei diesem Satz ist $k=x+y$ Prämisse und $({\tfrac {k}{2}})^{2}\geq xy$ die zu beweisende Aussage. Wenn der Satz direkt bewiesen wird, so sieht der Beweis folgendermaßen aus (im nächsten Kapitel wird beschrieben, was ein „direkter Beweis“ ist):

{\begin{array}{c}{\text{Prämisse: }}k=x+y\\{\color {Orange}|}\\{\color {Orange}{\text{logische Schlussfolgerungen}}}\\{\color {Orange}\downarrow }\\{\text{zu beweisende Aussage: }}\left({\tfrac {k}{2}}\right)^{2}\geq xy\end{array}}

Wir stellen dir nun einen möglichen Beweis für obigen Satz vor. Wundere dich nicht, wenn der Beweis „vom Himmel zu fallen“ scheint. Im nächsten Abschnitt werden wir erklären, warum der Beweis so aufgebaut werden musste. Dort erklären wir auch, wie man den Beweis selbst finden kann. Lies dir also erst einmal nur den Beweis durch und versuche, dessen Schlussfolgerungen nachzuvollziehen.

Beweis

Es ist $\left(x-{\tfrac {k}{2}}\right)^{2}\geq 0$ (Quadratzahlen sind stets nichtnegativ). Diese Ungleichung lässt sich umformen:

{\begin{array}{ll}&\left(x-{\tfrac {k}{2}}\right)^{2}\geq 0\\[0.4em]\Rightarrow \ &x^{2}-kx+\left({\tfrac {k}{2}}\right)^{2}\geq 0\\[0.4em]\Rightarrow \ &\left({\tfrac {k}{2}}\right)^{2}\geq kx-x^{2}\\[0.4em]\Rightarrow \ &\left({\tfrac {k}{2}}\right)^{2}\geq x\cdot (k-x)\end{array}}

Nun ist nach Voraussetzung $k=x+y$ , also $y=k-x$ . Wenn wir nun für $k-x$ die Variable $y$ einsetzen, erhalten wir die Ungleichung:

\left({\tfrac {k}{2}}\right)^{2}\geq xy

Dieser Beweis lässt sich folgendermaßen in einem Diagramm skizzieren:

Wenn Beweise vom Himmel fallen

Vielleicht kennst du dieses Gefühl: Du lernst gerade einen neuen Beweis kennen und fragst dich, wie der Autor sich den Beweis „ausgedacht“ hat. Der Beweis scheint vom Himmel gefallen zu sein oder einem göttlichen Einfall entsprungen.

Bevor du dir das nächste Mal diese Frage stellst, solltest du dir Folgendes vor Augen halten: Der Beweis ist eine fehlerfreie Herleitung der Richtigkeit einer Aussage. Es ist kein Lösungsweg, sondern nur das Endergebnis eines Lösungsweges. Beweise erklären in der Regel nicht, wie man diese gefunden hat oder finden kann. Durch Beweise können zwar mathematische Konzepte und Zusammenhänge erklärt werden, dies ist aber kein wesentliches Ziel eines Beweises.

In den seltensten Fällen kann ein Mathematiker einen Beweis sofort führen (sofern er den Beweis des Satzes nicht bereits kennt). In der Regel muss er sich erst einmal auf einem Schmierblatt Gedanken über den Satz machen. Wenn er irgendwann, irgendwie (und dies kann durchaus sehr, sehr lange dauern) einen Beweis gefunden hat, schreibt er diesen als Endergebnis auf. Auch ist oft der Weg, wie der Beweis geführt wird, ein ganz anderer, als der, auf dem ein Mathematiker im Lösungsweg auf den Beweis gekommen ist. Einem Außenstehenden, der nur den Beweis, aber nie den eigentlichen Lösungsweg zu Gesicht bekommen hat, stellt sich da natürlich die Frage, wie „man auf den Beweis kommt“.

Betrachten wir das obige Beispiel: den Beweis des Satzes $k=x+y\Rightarrow \left({\tfrac {k}{2}}\right)^{2}\geq xy$ . Wir haben den Beweis mit der wahren Aussage $\left(x-{\tfrac {k}{2}}\right)^{2}\geq 0$ begonnen. Ein Leser kann sich hier durchaus fragen, wie wir auf diese Ungleichung gekommen sind. Diese Frage löst sich auf, wenn wir zeigen, was auf dem Schmierblatt stand (wie unser Lösungsweg aussah):

Schmierblatt (ordentlich aufgeschrieben):

${\begin{array}{l}\left({\tfrac {k}{2}}\right)^{2}\geq xy\\[0.5em]\qquad \left\downarrow \ k=x+y\Rightarrow y=k-x\right.\\[0.5em]\left({\tfrac {k}{2}}\right)^{2}\geq x\cdot (k-x)\\[0.5em]\qquad \downarrow \\[0.5em]\left({\tfrac {k}{2}}\right)^{2}\geq xk-x^{2}\\[0.5em]\qquad \downarrow \\[0.5em]x^{2}-kx+\left({\tfrac {k}{2}}\right)^{2}\geq 0\\[0.5em]\qquad \left\downarrow {\text{ quadratische Ergänzung}}\right.\\[0.5em]\left(x-{\tfrac {k}{2}}\right)^{2}-\left({\tfrac {k}{2}}\right)^{2}+\left({\tfrac {k}{2}}\right)^{2}\geq 0\\[0.5em]\qquad \downarrow \\[0.5em]\left(x-{\tfrac {k}{2}}\right)^{2}\geq 0\qquad {\text{(wahre Aussage)}}\\[0.5em]\end{array}}$

Es fällt einiges auf: Zum einen siehst du, dass der Lösungsweg auf dem Schmierblatt nicht perfekt ist. So mussten wir erst quadratisch ergänzen, bevor wir erkannt haben, dass $x^{2}-kx+\left({\tfrac {k}{2}}\right)^{2}=\left(x-{\tfrac {k}{2}}\right)^{2}$ ist. Einem findigen Mathematiker würde dies sofort auffallen. Zum anderen ist dieser Lösungsweg nicht für einen Beweis geeignet: Er beginnt nicht mit der Prämisse des Satzes, sondern mit dem, was wir beweisen möchten. Dies ist problematisch, denn man kann einen Beweis schlecht mit dem beginnen, was man eigentlich zeigen möchte. Am Ende erhalten wir zwar eine wahre Aussage, aber sie ist nicht die Aussage, die wir beweisen möchten. Da wir nicht deutlich gemacht haben bzw. überlegt haben, dass die Termumformungen umkehrbar sind (die Pfeile zeigen nur „nach unten“), können wir mit Hilfe des Schmierblattes nicht begründen, dass man von der unteren wahren Aussage die zu beweisende Aussage $\left({\tfrac {k}{2}}\right)^{2}\geq xy$ herleiten kann.

Du siehst: Das, was wir auf dem Schmierblatt geschrieben haben, ist für einen Beweis ungeeignet. Deswegen mussten wir den Beweis (mit Hilfe dessen, was auf dem Schmierblatt stand) anders formulieren. Wir haben mit der wahren Aussage $\left(x-{\tfrac {k}{2}}\right)^{2}\geq 0$ begonnen und aus dieser schrittweise die Zielaussage $\left({\tfrac {k}{2}}\right)^{2}\geq xy$ hergeleitet.

Das Schmierblatt erklärt nun, wieso wir mit $\left(x-{\tfrac {k}{2}}\right)^{2}\geq 0$ angefangen haben und wie wir auf diese Ungleichung gekommen sind. Leider wird in den seltensten Fällen neben dem Beweis eines Satzes auch der Lösungsweg dargestellt oder die Idee dahinter genannt. Oftmals muss der Leser selbst herausfinden, wie man auf einen bestimmten Beweis selbst kommen kann, was sehr schwer sein kann. Wir werden uns in diesem Buch darum bemühen, Beweise so zu formulieren, dass aus ihnen auch die Idee dahinter leicht herausgelesen werden kann.

Direkter und indirekter Beweis

Es gibt zwei wichtige Arten von Beweisen: direkte Beweise und indirekte Beweise (auch Widerspruchsbeweise genannt).

Direkter Beweis

Erklärung des direkten Beweises, des Widerspruchsbeweises und der Kontraposition. (YouTube-Video vom Kanal Quatematik)

Beim direkten Beweis wird der zu beweisende Satz $S$ direkt bewiesen. Dies bedeutet, dass man mit den Voraussetzungen von $S$ beginnt und aus diesen die zu beweisende Aussage direkt durch logische Schlussfolgerungen herleitet. Ein direkter Beweis nimmt also folgende Form an:

{\begin{array}{c}{\text{Prämissen und Voraussetzungen von }}S\\{\color {Orange}|}\\{\color {Orange}{\text{logische Schlussfolgerungen}}}\\{\color {Orange}\downarrow }\\{\text{Konklusion von }}S\end{array}}

Beispiel

Betrachten wir ein Beispiel. Stelle dir vor, wir müssen den Satz

„Die Summe von drei aufeinanderfolgenden natürlichen Zahlen ist durch 3 teilbar.“

beweisen. Dieser Satz lässt sich folgendermaßen als Implikation formulieren:

„Wenn $n$ eine natürliche Zahl ist, dann ist $n+(n+1)+(n+2)$ durch 3 teilbar.“

In dieser Implikation ist „ $n$ ist eine natürliche Zahl“ die Prämisse und „ $n+(n+1)+(n+2)$ ist durch 3 teilbar“ die Konklusion. Ein direkter Beweis hätte also folgende Form:

{\begin{array}{c}n{\text{ ist eine natürliche Zahl.}}\\{\color {Orange}|}\\{\color {Orange}{\text{logische Schlussfolgerungen}}}\\{\color {Orange}\downarrow }\\n+(n+1)+(n+2){\text{ ist durch 3 teilbar.}}\end{array}}

Ein solcher Beweis könnte so aussehen (Implikationen der logischen Schlussfolgerungen sind orange):

{\begin{array}{c}n{\text{ ist eine natürliche Zahl.}}\\{\color {Orange}|}\\{\color {Orange}{\text{Wenn }}n{\text{ eine natürliche Zahl ist, dann ist auch }}n+1{\text{ eine natürliche Zahl.}}}\\{\color {Orange}\downarrow }\\n+1{\text{ ist eine natürliche Zahl.}}\\{\color {Orange}|}\\{\color {Orange}{\text{Ist }}k{\text{ eine natürliche Zahl, dann ist }}3\cdot k{\text{ durch 3 teilbar.}}}\\{\color {Orange}\downarrow }\\3\cdot (n+1){\text{ ist durch 3 teilbar.}}\\{\color {Orange}|}\\{\color {Orange}3\cdot (n+1)=3\cdot n+3}\\{\color {Orange}\downarrow }\\3\cdot n+3{\text{ ist durch 3 teilbar.}}\\{\color {Orange}|}\\{\color {Orange}3\cdot n+3=n+n+n+1+2=n+(n+1)+(n+2)}\\{\color {Orange}\downarrow }\\n+(n+1)+(n+2){\text{ ist durch 3 teilbar.}}\end{array}}

Anstatt deinen Beweis so wie obigen zu strukturieren, kannst du ihn auch als Fließtext schreiben (dies ist meistens kompakter):

„Sei $n$ eine natürliche Zahl. Damit ist auch $n+1$ eine natürliche Zahl und somit $3\cdot (n+1)$ durch 3 teilbar. Da $3\cdot (n+1)=3\cdot n+3=n+(n+1)+(n+2)$ ist, ist $n+(n+1)+(n+2)$ durch 3 teilbar.“

Widerspruchsbeweis

Neben dem direkten Beweis gibt es eine zweite Art des Beweises, den Widerspruchsbeweis oder indirekten Beweis. Wenn du einen mathematischen Satz $S$ indirekt beweisen möchtest, so führst du seine Negation $\neg S$ durch logische Schlussfolgerungen zu einem Widerspruch. Dabei nenne ich im Folgendem $\neg S$ Widerspruchsannahme. Ein Widerspruchsbeweis hat also folgende Form:

{\begin{array}{c}{\text{Widerspruchsannahme }}\neg S\\{\color {Orange}|}\\{\color {Orange}{\text{logische Schlussfolgerungen}}}\\{\color {Orange}\downarrow }\\{\text{Widerspruch}}\end{array}}

Um einen Widerspruchsbeweis erfolgreich durchzuführen, musst du zunächst den zu beweisenden Satz $S$ richtig negieren. Wie du dies machen kannst, kannst du im Abschnitt „Aussagen negieren“ nachlesen.

Doch wie haben wir den Satz $S$ bewiesen, wenn wir die Widerspruchsannahme $\neg S$ zu einem Widerspruch geführt haben? Wenn du die Widerspruchsannahme $\neg S$ zu einem Widerspruch geführt hast, so weißt du, dass $\neg S$ falsch sein muss, also $\neg S=\mathrm {F}$ ist. Damit ist die doppelte Verneinung $\neg \neg S$ von $S$ wahr ( $\neg \neg S=\neg \mathrm {F} =W$ ). Nun ist $\neg \neg S\Leftrightarrow S$ eine Tautologie, was du an folgender Wahrheitstabelle erkennst:

$S$	$\neg S$	$\neg \neg S$	$\neg \neg S\Leftrightarrow S$
$\mathrm {W}$	$\mathrm {F}$	$\mathrm {W}$	$\mathrm {W}$
$\mathrm {F}$	$\mathrm {W}$	$\mathrm {F}$	$\mathrm {W}$

Da $\neg \neg S\Leftrightarrow S$ eine Tautologie ist, ist $\neg \neg S$ dann und nur dann wahr, wenn $S$ wahr ist (siehe Definition der Äquivalenz). Wir haben durch den Widerspruchsbeweis bewiesen, dass $\neg \neg S$ wahr ist (da $\neg S$ falsch ist). Damit muss aber wegen obiger Tautologie $S$ wahr sein. Genau dies ist zu zeigen, wenn wir den Satz $S$ beweisen wollen.

Beispiel

Stelle dir vor, wir wollen den Satz

„Die Summe von drei aufeinanderfolgenden natürlichen Zahlen ist durch 3 teilbar.“

durch einen Widerspruchsbeweis beweisen (diesen Satz haben wir bereits oben direkt bewiesen). Diesen Satz können wir als Implikation definieren:

„Wenn $n$ eine natürliche Zahl ist, dann ist $n+(n+1)+(n+2)$ durch 3 teilbar.“

Um diese Implikation indirekt zu beweisen, müssen wir zunächst die Widerspruchsannahme formulieren, also die obige Implikation negieren. Wir erhalten:

Widerspruchsannahme: „ $n$ ist eine natürliche Zahl und $n+(n+1)+(n+2)$ ist nicht durch 3 teilbar.“

Diese Annahme müssen wir nun durch logische Schlussfolgerungen zu einem Widerspruch führen. Eine solche Herleitung könnte so aussehen:

{\begin{array}{c}{\text{Widerspruchsannahme: }}n{\text{ ist eine natürliche Zahl und}}\\n+(n+1)+(n+2){\text{ ist nicht durch 3 teilbar.}}\\{\color {Orange}|}\\{\color {Orange}{\text{Ist }}A\land B{\text{ wahr, so ist }}A{\text{ wahr.}}}\\{\color {Orange}\downarrow }\\n+(n+1)+(n+2){\text{ ist nicht durch 3 teilbar.}}\\{\color {Orange}|}\\{\color {Orange}n+(n+1)+(n+2)=3\cdot n+3}\\{\color {Orange}\downarrow }\\3\cdot n+3{\text{ ist nicht durch 3 teilbar.}}\\{\color {Orange}|}\\{\color {Orange}3\cdot n+3=3\cdot (n+1)}\\{\color {Orange}\downarrow }\\3\cdot (n+1){\text{ ist nicht durch 3 teilbar.}}\\{\color {Orange}|}\\{\color {Orange}{\text{Ist }}3\cdot k{\text{ nicht durch 3 teilbar, so ist }}k{\text{ keine natürliche Zahl.}}}\\{\color {Orange}\downarrow }\\n+1{\text{ ist keine natürliche Zahl.}}\\{\color {Orange}|}\\{\color {Orange}{\text{Ist }}k{\text{ keine natürliche Zahl, so ist }}k-1{\text{ keine natürliche Zahl.}}}\\{\color {Orange}\downarrow }\\(n+1)-1{\text{ ist keine natürliche Zahl.}}\\{\color {Orange}|}\\{\color {Orange}(n+1)-1=n}\\{\color {Orange}\downarrow }\\n{\text{ ist keine natürliche Zahl. Widerspruch!}}\end{array}}

Auch diesen Beweis kannst du in einem Fließtext schreiben:

Widerspruchsannahme: Sei $n$ eine natürliche Zahl und $n+(n+1)+(n+2)$ nicht durch 3 teilbar. Wegen $n+(n+1)+(n+2)=3\cdot n+3=3\cdot (n+1)$ ist $3\cdot (n+1)$ nicht durch 3 teilbar. Damit ist $n+1$ keine natürliche Zahl, da, wenn $n+1$ eine natürliche Zahl wäre, so wäre $3\cdot (n+1)$ durch 3 teilbar. Wenn $n+1$ keine natürliche Zahl ist, ist auch $n$ keine natürliche Zahl. Dies ist aber ein Widerspruch dazu, dass $n$ nach Widerspruchsannahme eine natürliche Zahl ist ↯.

Fallunterscheidung und Kontraposition

Neben den verschiedenen Arten mathematischer Beweise gibt es einige Methoden, die du in Beweisen verwenden kannst: die vollständige Fallunterscheidung, der Beweis durch Kontraposition und die vollständige Induktion. Diese Liste ist nicht vollständig und es gibt gewiss vielfältige Wege einen Beweis zu führen. Dennoch kann dir der nachfolgende Abschnitt als Inspirationsquelle für eigene Beweise dienen.

Vollständige Fallunterscheidung

Bei vollständiger Fallunterscheidung wird der Beweis in eine endliche Anzahl von Fällen $\mathrm {F} _{1},\ \mathrm {F} _{2},\ \ldots \ \mathrm {F} _{n}$ aufgeteilt. Für jeden der Fälle muss der zu beweisende Satz unter zusätzlicher Annahme der Fallbedingung $\mathrm {F} _{k}$ bewiesen werden. Ein Beweis durch vollständige Fallunterscheidung hat damit folgende Form:

{\begin{array}{c}{\text{Prämissen}}\\[2ex]{\begin{array}{c}{\text{Fall }}F_{1}:\\{\color {Orange}|}\\{\color {Orange}{\text{logische}}}\\{\color {Orange}{\text{Schlussfolgerungen}}}\\{\color {Orange}\downarrow }\\{\text{zu beweisende Aussage}}\end{array}}{\begin{array}{c}{\text{Fall }}F_{2}:\\{\color {Orange}|}\\{\color {Orange}{\text{logische}}}\\{\color {Orange}{\text{Schlussfolgerungen}}}\\{\color {Orange}\downarrow }\\{\text{zu beweisende Aussage}}\end{array}}\ldots {\begin{array}{c}{\text{Fall }}F_{n}:\\{\color {Orange}|}\\{\color {Orange}{\text{logische}}}\\{\color {Orange}{\text{Schlussfolgerungen}}}\\{\color {Orange}\downarrow }\\{\text{zu beweisende Aussage}}\end{array}}\end{array}}

Mit dem einfachsten Fall kann man beginnen; manchmal fließen die hierbei gewonnenen Erkenntnisse bei der Bearbeitung anderer Fälle ein. Insofern kann eine relativ schwierige Gesamtaufgabe in mehrere leichter zu lösende Teilaufgaben reduziert werden gemäß dem Motto: teile und herrsche!

Zu achten ist darauf, dass bei der Aufteilung des Beweises in unterschiedliche Fälle der zu beweisende Satz vollständig abgedeckt wird. So kann z. B. beim Beweis eines Satzes, der für alle ganzen Zahlen gelten soll, eine Aufteilung in positive und negative Zahlen sinnvoll sein. Dann muss aber auch das Auftreten der Zahl Null als dritter Fall bewiesen werden.

Beispiel

Als Beispiel beweisen wir folgenden Satz mit Hilfe vollständiger Fallunterscheidung (Quelle: Wikipedia-Artikel „Beweis (Mathematik)“):

„Ist $p$ eine Primzahl ungleich zwei, dann gibt es eine natürliche Zahl $k$ mit $p=4\cdot k+1$ oder $p=4\cdot k+3$ .“

Wir werden folgende vier Fälle unterscheiden:

$p=4k$
$p=4k+1$
$p=4k+2$
$p=4k+3$

Da $p$ eine natürliche Zahl ist (nur natürliche Zahlen können per Definition Primzahlen sein), muss einer der obigen vier Fälle auftreten. Unsere Fallunterscheidung ist damit vollständig. Betrachten wir nun die vier Fälle:

Fall 1: $p=4k$

$p$ ist durch 4 teilbar und damit keine Primzahl. Somit ist die Prämisse der zu beweisenden Implikation falsch und damit die gesamte Implikation wahr.

Fall 2: $p=4k+1$

Die Konklusion der zu beweisenden Implikation und damit die gesamte Implikation ist wahr.

Fall 3: $p=4k+2$

Es ist $p=4k+2=2(2k+1)$ . Damit ist $p$ durch 2 teilbar. Da nach Voraussetzung der zu beweisenden Implikation $p\neq 2$ ist, kann $p$ keine Primzahl sein. Somit ist die Prämisse der zu beweisenden Implikation falsch und damit die gesamte Implikation wahr.

Fall 4: $p=4k+3$

Die Konklusion der zu beweisenden Implikation und damit die gesamte Implikation ist wahr.

In jedem der Fälle konnten wir beweisen, dass unter der Bedingung der jeweiligen Fallunterscheidung die zu beweisende Implikation wahr ist. Da unsere Fallunterscheidung vollständig ist, ist die zu beweisende Implikation unabhängig vom jeweiligen Fall wahr.

Beweis durch Kontraposition

Der Beweis durch Kontraposition ist eine Beweismethode, die für Beweise von Implikationen der Form $A\Rightarrow B$ verwendet werden können. Diese Beweismethode basiert auf der Tautologie $(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$ .

Verständnisfrage: Zeige, dass die Aussage $(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$ eine Tautologie ist.

Um zu zeigen, dass $(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$ eine Tautologie ist, können wir die Wahrheitstabelle dieser Aussage aufstellen und uns überzeugen, dass der resultierende Wahrheitswert immer wahr ist:

$A$	$B$	$(A\Rightarrow B)$	$\Leftrightarrow$	$(\neg B\Rightarrow \neg A)$
$\mathrm {W}$	$\mathrm {W}$	$\mathrm {W}$	$\mathbf {W}$	$\mathrm {W}$
$\mathrm {W}$	$\mathrm {F}$	$\mathrm {F}$	$\mathbf {W}$	$\mathrm {F}$
$\mathrm {F}$	$\mathrm {W}$	$\mathrm {W}$	$\mathbf {W}$	$\mathrm {W}$
$\mathrm {F}$	$\mathrm {F}$	$\mathrm {W}$	$\mathbf {W}$	$\mathrm {W}$

Die Aussage $(A\Rightarrow B)\Leftrightarrow (\neg B\Rightarrow \neg A)$ ist also eine Tautologie und damit immer wahr. Dies bedeutet, dass $A\Rightarrow B$ dann und nur dann wahr ist, wenn $\neg B\Rightarrow \neg A$ wahr ist. Wenn wir also einen Satz der Form $A\Rightarrow B$ beweisen wollen, können wir alternativ auch die Aussage $\neg B\Rightarrow \neg A$ beweisen. Beim Beweis durch Kontraposition macht man genau dies: Anstatt einen Satz der Form $A\Rightarrow B$ direkt zu beweisen, wird die Aussage $\neg B\Rightarrow \neg A$ bewiesen.

Um also Kontraposition erfolgreich anwenden zu können, musst du wissen, wie man Aussagen richtig negiert. Dies kannst du im Abschnitt „Aussagen negieren“ nachlesen.

Beispiel

Als Beispiel wollen wir folgenden Satz mit Hilfe der Kontraposition beweisen (im Folgenden gehe ich davon aus, dass $n$ eine Quadratzahl, also ein Element der Menge $\{k^{2}\,|\,k\in \mathbb {N} \}$ ist):

„Ist $n$ gerade, dann ist ${\sqrt[{2}]{n}}$ gerade.“

Dieser Satz hat die Form einer Implikation $A\Rightarrow B$ mit:

\underbrace {n{\text{ ist gerade}}} _{=\ A}\Rightarrow \ \underbrace {{\sqrt[{2}]{n}}{\text{ ist gerade}}} _{=\ B}

Um diesen Satz durch Kontraposition beweisen zu können, müssen wir erst einmal die Aussage $\neg B\Rightarrow \neg A$ , also die Negation der Aussagen $A$ und $B$ bestimmen:

{\begin{aligned}\neg A&=\neg \left(n{\text{ ist gerade}}\right)\\&=n{\text{ ist ungerade}}\end{aligned}}

{\begin{aligned}\neg B&=\neg \left({\sqrt[{2}]{n}}{\text{ ist gerade}}\right)\\&={\sqrt[{2}]{n}}{\text{ ist ungerade}}\end{aligned}}

Damit erhalten wir für $\neg B\Rightarrow \neg A$ :

\left({\sqrt[{2}]{n}}{\text{ ist ungerade}}\right)\Rightarrow \left(n{\text{ ist ungerade}}\right)

Diesen Satz werden wir direkt beweisen. Wir suchen also einen Beweis der Form

{\begin{array}{c}{\sqrt[{2}]{n}}{\text{ ist ungerade}}\\{\color {Orange}|}\\{\color {Orange}{\text{logische Schlussfolgerungen}}}\\{\color {Orange}\downarrow }\\n{\text{ ist ungerade}}\end{array}}

Beweis: Sei ${\sqrt[{2}]{n}}$ eine natürliche Zahl und ungerade. Wir müssen nun zeigen, dass $n$ ungerade ist. Da ${\sqrt[{2}]{n}}$ ungerade ist, gibt es eine natürliche Zahl $k\geq 0$ mit ${\sqrt[{2}]{n}}=2\cdot k+1$ . Damit ist

{\begin{aligned}n&=\left({\sqrt[{2}]{n}}\right)^{2}\\&=\left(2\cdot k+1\right)^{2}\\&=4k^{2}+4k+1\\&=2\cdot \underbrace {\left(2k^{2}+2k\right)} _{=:\ m}+1\\&=2\cdot m+1\\\end{aligned}}

Also ist $n$ eine ungerade Zahl. q. e. d.

Vollständige Induktion

Die Vollständige Induktion wird im nächsten Abschnitt dieses Buches ausführlich vorgestellt. Zur Vollständigkeit nenne ich hier nur das Prinzip dieser Beweismethode:

Definition (Vollständige Induktion)

Sei $A(n)$ eine Aussageform in der freien Variablen $n\in \mathbb {N}$ . Sei $A(1)$ (oder $A(0)$ ) eine wahre Aussage (Induktionsanfang) und die Implikation $A(k)\Rightarrow A(k+1)$ für alle $k\in \mathbb {N}$ erfüllt (Induktionsschritt), dann ist die Aussageform allgemeingültig in $\mathbb {N}$ .

Vollständige Induktion

Die vollständige Induktion ist eine wichtige Beweismethode, die dir in deinem Studium noch häufig begegnen wird. Dabei kann man ihre Wirkungsweise gut mit dem Dominoeffekt vergleichen. Doch wie sieht ein „Beweis mit dem Dominoeffekt“ konkret aus? Betrachten wir zunächst eine Beispielaufgabe, die mit Hilfe der vollständigen Induktion gelöst werden kann.

Eine Beispielaufgabe

Unsere Beispielaufgabe ist die „Gauß'sche Summenformel“, auch „kleiner Gauß“ genannt. Sie heißt so, weil der neunjährige Carl Friedrich Gauß diese Summenformel in einer Mathestunde entdeckt hat (Gauß ist der geniale Mathematiker, dessen Gesicht später den Zehn-Mark-Schein in Deutschland zieren sollte). Laut Anekdote^[6] konnte der kleine Gauß die Summe der ersten $100$ natürlichen Zahlen sofort und ohne längeres Rechnen angeben.

Seine Idee war dabei, dass es zwischen $1\ldots 100$ genau $50$ Paare von Zahlen gibt, deren Summe $101$ ist: $1+100$ , $2+99$ , $3+98$ und so weiter bis $50+51$ . Wenn man seinen „Trick“ verallgemeinert, kommt man auf folgende Formel:

Für jede natürliche Zahl $n$ ist die Summe $1+2+3+\dots +n$ gleich ${\frac {n\cdot (n+1)}{2}}$ .

Gut. Wir könnten nun anfangen, diese Behauptung für einzelne natürliche Zahlen $n$ zu beweisen:

Für $n=1$ :

$1={\frac {1(1+1)}{2}}$ , stimmt ✔

Für $n=2$ :

$1+2=3={\frac {2(2+1)}{2}}$ , stimmt auch ✔

und so weiter und so fort…

Doch dies ist keine Möglichkeit, einen Beweis zu führen, da es unendlich viele natürliche Zahlen gibt und es daher grundsätzlich unmöglich ist, alle Summen auszurechnen (denk an die armen Mitschüler von Gauß, wie sie versucht haben, die einzelnen Zahlen nacheinander aufzusummieren). Wir brauchen also eine andere Lösungsmethode. Wir haben dir in der Einleitung dieses Kapitels gesagt, dass diese Aufgabe durch vollständige Induktion gelöst werden kann und dass diese Beweismethode einem Dominoeffekt ähnelt. Doch wie lässt sich ein Dominoeffekt in dieser Aufgabe ausnutzen? Analysieren wir dazu die Aufgabe:

Wenn du dir die Aufgabe durchliest, wirst du erkennen, dass es in der Aufgabenstellung eine freie Variable gibt (die natürliche Zahl $n$ ). Wenn du für diese freie Variable einen bestimmten Wert einsetzt, entsteht eine konkrete Aussage. Durch Nachrechnen kannst du feststellen, ob diese Aussage wahr oder falsch ist. Wenn du z. B. für $n$ die Zahl $42$ einsetzt, entsteht die (wahre) Aussage:

Die Summe $1+2+3+\dots +42$ ist gleich ${\frac {42\cdot (42+1)}{2}}$ .

Ein solcher Ausdruck, der eine (oder auch mehrere) freie Variable enthält und der durch Belegung dieser Variablen mit Werten in eine Aussage übergeht, wird Aussageform genannt und mit $A(n)$ bezeichnet. $A(n)$ heißt so viel wie: Eine Aussageform mit dem Namen $A$ und der freien Variablen $n$ , also $A$ in Abhängigkeit von $n$ . Die obige Aussage wäre demnach $A(42)$ . Hier einige weitere Beispiele:

$A(1)$ lautet: Die Summe $1$ ist gleich ${\frac {1\cdot (1+1)}{2}}$ .

$A(4)$ lautet: Die Summe $1+2+3+4$ ist gleich ${\frac {4\cdot (4+1)}{2}}$ .

Unsere Aufgabe ist es, zu beweisen, dass die Aussageform bei Einsetzung aller natürlichen Zahlen $n$ immer eine wahre Aussage ergibt. Eine solche Aussageform, die für alle natürlichen Zahlen stets eine wahre Aussage liefert, nennt man „allgemeingültig in $\mathbb {N}$ “.

Unsere Aufgabe ist mit einer Dominoreihe vergleichbar.

Doch wie kann man jetzt den Dominoeffekt ins Spiel bringen? Dazu werden wir eine Analogie zwischen der Aussageform und einer Dominoreihe finden: Stelle dir dazu eine unendlich lange Dominoreihe vor, die irgendwo im Raum anfängt. Diese Dominoreihe ist durchnummeriert (der erste Dominostein ist die Eins, der zweite die Zwei und so weiter). Nun führen wir eine Beziehung zwischen der Dominoreihe und der zu beweisenden Aussageform $A(n)$ ein. Wir sagen, dass der erste Dominostein für die Aussage $A(1)$ steht, der zweite Dominostein für die Aussage $A(2)$ und so weiter. Gehen wir nun davon aus, dass beim Fallen eines Dominosteins die Wahrheit der ihm zugewiesenen Aussage bewiesen ist. Wenn also Dominostein Nummer $7$ umfällt, ist die Aussage $A(7)$ wahr und beim Fall von Dominostein Nummer $23$ ist die Aussage $A(23)$ wahr.

Wir haben nun das Problem der Aufgabe auf das von uns aus der Kindheit bekannte Problem zurückgeführt, eine Dominoreihe zum Umfallen bringen zu wollen.

Frage: Was musst du tun, damit alle Dominosteine umfallen? Wie muss dazu die Dominoreihe aufgebaut sein?

Wenn du darüber nachdenkst, kommst du auf zwei Bedingungen, die du erfüllen musst, damit alle Dominosteine umfallen.

Du musst den ersten Dominostein umstoßen.
Die Dominoreihe muss so aufgebaut sein, dass beim Fall eines Dominosteins auch sein Nachfolger umfällt.

Wenn beide Bedingungen eingehalten werden, fallen alle Steine in der Dominoreihe nacheinander um („Dominoeffekt“). Du musst also dafür Sorge tragen, dass beides erfüllt ist.

Frage: Wie lauten die beiden Lösungsschritte aus der Antwort der eben gestellten Frage, wenn wir diese in das Ausgangsproblem zurückübersetzen, die Allgemeingültigkeit einer Aussageform zu beweisen?

Erster Lösungsschritt: Zeige, dass die Aussageform für $n=1$ erfüllt ist.
Zweiter Lösungsschritt: Zeige, dass unter der Annahme, dass die Aussageform für ein beliebiges $n=k$ erfüllt ist, die Aussageform auch für den Nachfolger $n=k+1$ erfüllt sein muss.

Dass durch den Beweis dieser beiden Lösungsschritte die Aufgabe gelöst ist, kannst du folgendermaßen erkennen: Zunächst wird im ersten Lösungsschritt gezeigt, dass die Behauptung für $n=1$ wahr ist. Wenn wir nun dieses Wissen auf den zweiten Lösungsschritt anwenden (wenn also $n=k=1$ ist), folgt, dass die Behauptung auch für $n=k+1=1+1=2$ wahr sein muss. Wenn wir nochmal den zweiten Lösungsschritt anwenden, folgt die Wahrheit für $n=2+1=3$ und bei nochmaliger Anwendung für $n=3+1=4$ und so weiter…

Wir müssen also die obigen beiden Lösungsschritte beweisen, um die Aufgabe zu lösen. Hier ist der Beweis mit den beiden notwendigen Lösungsschritten:

1. Lösungsschritt: Für $n=1$ lautet die zu beweisende Aussage $1={\frac {1\cdot (1+1)}{2}}$ . Durch Nachrechnen der rechten Seite, zeigt man, dass diese Aussage wahr ist.

2. Lösungsschritt: Gehen wir davon aus, dass die Aussage für $n=k$ bereits bewiesen ist. Gehen wir also davon aus, dass gilt:

$\underbrace {1+2+3+\dots +k={\frac {k\cdot (k+1)}{2}}} _{\text{Die Gleichung haben wir gegeben.}}$

Wir müssen nun die Summenformel für $k+1$ beweisen. Wir müssen also beweisen, dass gilt:

$\underbrace {1+2+3+\dots +k+(k+1)={\frac {(k+1)\cdot ((k+1)+1)}{2}}} _{\text{Zielgleichung: Diese Gleichung soll gezeigt werden}}$

Durch Termumformungen zeigen wir nun, dass die linke Seite der Gleichung gleich der rechten Seite der Gleichung ist. Wir müssen also Termumforungen der folgenden Form finden:

1+2+3+\dots +k+(k+1)=\ldots =\ldots =\ldots ={\frac {(k+1)\cdot ((k+1)+1)}{2}}

Die notwendigen Termumformungen sind:

{\begin{aligned}\overbrace {1+2+3+\dots +k+(k+1)} ^{\text{linke Seite der Zielgleichung}}&={\color {OliveGreen}(1+2+3+\dots +k)}+(k+1)\\[0.5em]&\qquad {\color {OliveGreen}\downarrow \ {\text{Gegebene Gleichung einsetzen}}}\\[0.5em]&={\color {OliveGreen}{\frac {k\cdot (k+1)}{2}}}+(k+1)\\[0.5em]&={\frac {k\cdot (k+1)}{2}}+{\frac {2\cdot (k+1)}{2}}\\[0.5em]&={\frac {k\cdot (k+1)+2\cdot (k+1)}{2}}\\[0.5em]&\qquad {\color {Gray}\left\downarrow \ a\cdot b=b\cdot a\right.}\\[0.5em]&={\frac {(k+1)\cdot k+(k+1)\cdot 2}{2}}\\[0.5em]&\qquad {\color {Gray}\left\downarrow \ (k+1){\text{ ausklammern}}\right.}\\[0.5em]&={\frac {(k+1)\cdot (k+2)}{2}}\\[0.5em]&\qquad {\color {Gray}\left\downarrow \ k+2=(k+1)+1\right.}\\[0.5em]&=\underbrace {\frac {(k+1)\cdot ((k+1)+1)}{2}} _{\text{rechte Seite der Zielgleichung}}\\\end{aligned}}

Unter Annahme der gegebenen Gleichung können wir also die linke Seite der Zielgleichung in die rechte Seite der Zielgleichung umformen. Damit haben wir die Zielgleichung bewiesen.

Wir haben so eine kurze und elegante Lösung der Aufgabe gefunden (Gauß' Lehrer wäre sicherlich stolz auf uns ).

Das Prinzip der vollständigen Induktion

Erklärung des Prinzip der vollständigen Induktion anhand eines Beispiels. (YouTube-Video vom Kanal Quatematik)

Doch was ist nun das Prinzip der vollständigen Induktion? Dazu schauen wir uns die obige Beispielaufgabe an und versuchen, das dabei verwendete Beweisprinzip zu verallgemeinern.

Zunächst stellen wir fest, dass es sich um eine Aussageform handelt, deren einzige freie Variable eine natürliche Zahl ist. Die Aufgabe besteht nun darin, zu beweisen, dass die Aussageform für alle natürlichen Zahlen erfüllt ist, also allgemeingültig in $\mathbb {N}$ ist.

Nun haben wir im ersten Schritt bewiesen, dass die Aussageform für die kleinste natürliche Zahl erfüllt ist (in unserem obigen Beispiel war diese kleinste natürliche Zahl die Eins; in bestimmten Fällen kann es aber auch eine andere natürliche Zahl sein, je nachdem, wie die zu beweisende Aufgabe lautet). Dieser Schritt wird Induktionsanfang genannt und entspricht in unserer obigen Analogie dem Umstoßen des ersten Dominosteins.

Im zweiten Schritt haben wir bewiesen, dass, wenn die Aussageform für eine beliebige natürliche Zahl $k$ erfüllt ist, sie auch für $k+1$ erfüllt sein muss. Dieser Schritt wird Induktionsschritt genannt und entspricht in unserer obigen Analogie der Tatsache, dass die Dominoreihe so aufgebaut sein muss, dass beim Fall eines Dominosteins auch der nächste Dominostein umfallen muss. Die dabei getroffene Annahme, dass die Aussageform für ein beliebiges $k$ erfüllt ist, nennt man Induktionsvoraussetzung oder auch Induktionsannahme (das war die gegebene Gleichung im zweiten Lösungsschritt). Die unter Annahme der Induktionsvoraussetzung zu beweisende Aussage $A(k+1)$ wird Induktionsbehauptung genannt (das war unsere obige Zielgleichung). Der Induktionsschritt hat also die Form:

\overbrace {\underbrace {A(k)} _{\begin{smallmatrix}{\text{Induktionsvoraussetzung}}/\\{\text{Induktionsannahme}}\end{smallmatrix}}\implies \underbrace {A(k+1)} _{\text{Induktionsbehauptung}}} ^{\text{Induktionsschluss}}

Im Folgenden werden wir nur noch den Begriff „Induktionsvoraussetzung“ verwenden. Fassen wir zusammen: Die vollständige Induktion lässt sich beim Beweis der Allgemeingültigkeit von Aussageformen $A(n)$ anwenden, deren eine freie Variable $n$ eine natürliche Zahl ist. Zum Beweis durch vollständige Induktion musst du folgendes leisten:

Induktionsanfang: Beweise, dass $A(1)$ eine wahre Aussage ist.
Induktionsschritt: Beweise, dass wenn $A(n=k)$ $A(n=k)$ wahr ist, auch $A(n=k+1)$ $A(n=k+1)$ wahr sein muss. Dabei können folgende Teilschritte identifiziert werden:
- Induktionsvoraussetzung: Die Aussage $A(k)$ ist wahr für ein beliebiges $k\in \mathbb {N}$ .
- Induktionsbehauptung: Die Aussage $A(k+1)$ ist wahr.
- Beweis des Induktionsschritts: Beweise, dass unter Annahme der Induktionsvoraussetzung die Induktionsbehauptung wahr ist.

Der Induktionsschritt hat dementsprechend folgende Form:

{\begin{array}{c}{\text{Induktionsvoraussetzung}}\\{\color {Gray}|}\\{\color {Gray}{\text{Beweis}}}\\{\color {Gray}\downarrow }\\{\text{Induktionsbehauptung}}\end{array}}

Oftmals (insbesondere bei einfacheren Aufgaben) werden Induktionsvoraussetzung und Induktionsbehauptung weggelassen, wenn sie dem Autor zu trivial erscheinen, als dass sie ausführlich erwähnt werden müssten. Auch der Induktionsanfang bzw. der Induktionsschritt werden manchmal nicht ausgeführt. Oft geben Lehrbuchautoren nur den Hinweis, dass eine bestimmte Aufgabe durch vollständige Induktion bewiesen werden kann und überlassen dem Leser die Auseinandersetzung mit dem jeweiligen Beweis. In diesem Kapitel werden aber alle Teilschritte der vollständigen Induktion ausgeführt.

Wenn wir nun die obige Beweismethode in mathematischer Sprache formulieren, erhalten wir die Definition der vollständigen Induktion.

Definition (Vollständige Induktion)

Sei $A(n)$ eine Aussageform mit der freien Variable $n\in \mathbb {N}$ . Sei $A(1)$ eine wahre Aussage (Induktionsanfang) und die Implikation $A(k)\implies A(k+1)$ für alle $k\in \mathbb {N}$ erfüllt (Induktionsschritt), dann ist die Aussageform allgemeingültig in $\mathbb {N}$ .

Einige Fragen zur vollständigen Induktion

Frage: Muss man zum Beweis mit vollständiger Induktion immer den Induktionsanfang und den Induktionsschritt durchführen oder kann man sich auch unter Umständen einen der beiden Schritte sparen?

Zur vollständigen Induktion gehören immer Induktionsanfang und Induktionsschritt. Wenn du einen der beiden Schritte weglassen würdest, wäre deine Lösung unvollständig und besäße damit keine Beweiskraft.

Die Antwort auf diese Frage kannst du dir auch über die Analogie zur Dominoreihe überlegen: Wenn du den Induktionsanfang weglässt, entspricht dies der Tatsache, dass du den ersten Dominostein nicht umstößt, was zur Folge hat, dass kein Dominostein umfällt.

Wenn du den Induktionsschritt weglässt, könntest du nach der Analogie nicht gewährleisten, dass ein Dominostein beim Umfallen auch seinen Nachfolger mitreißt. Damit könntest du nicht garantieren, dass alle Dominosteine umfallen (zwei Dominosteine könnten zum Beispiel zu weit voneinander entfernt stehen). Deine Lösung hätte dann keine Beweiskraft.

Frage: Da die Dominoreihe unendlich ist, benötigt sie auch unendlich lange zum Umfallen. Dies würde bedeuten, dass ein Beweis mit vollständiger Induktion nie vollständig wäre (da zu keiner Zeit alle Steine umgefallen sind). Heißt das nicht, dass man die vollständige Induktion nie zu Ende führen kann?

Diese Frage zeigt eine der Grenzen der Dominoanalogie. Die Zeit, die ein Dominostein benötigt, um umzufallen und dabei den nächsten Stein anzustoßen, ist für die Mathematik nicht relevant. Es ist nur wichtig, dass jeder Stein in endlich vielen Schritten fällt.

Beispiele vollständiger Induktion

Schema zum Beweis mit vollständiger Induktion

Beispiel einer Aufgabe mit Hilfe der vollständigen Induktion

Die folgende Übersicht hilft dir, einen Beweis mit Hilfe vollständiger Induktion zu führen, wie sie im Abschnitt „Prinzip der vollständigen Induktion“ definiert wurde. Zwar kannst du viele Induktionsbeweise nach diesem Schema lösen, aber es gibt auch Ausnahmen!

Lösungsweg: Beweis auf Schmierblatt finden

Kein Beweis fällt vom Himmel – so auch kein Induktionsbeweis. Bevor du den gesuchten Beweis aufschreiben kannst, musst du ihn erst einmal finden (klingt logisch, oder? ). Das folgende Schema soll dir dabei helfen. Die einzelnen Fragen beziehungsweise Schritte kannst du auf Schmierpapier oder im Kopf durchführen. In den nächsten Abschnitten wird dieses Schema an typischen Induktionsaufgaben erklärt und exemplarisch angewandt.

Vorüberlegungen
Fragen/Schritt	Anmerkungen
Über welche Variable wird die Induktion geführt?	Oftmals ist diese Variable $n$ (hat sich so etabliert). Dies muss aber nicht sein und ist aufgabenabhängig.
Wie lautet die Aussageform, deren Allgemeingültigkeit zu beweisen ist?	Mach dir klar, wie die Aussageform aussieht, deren Allgemeingültigkeit du beweisen möchtest/musst.

Induktionsanfang
Fragen/Schritt	Anmerkungen
Welchen Wert hast du für die Induktionsvariable im Induktionsanfang? Welches ist die kleinste natürliche Zahl für den Induktionsanfang?	Meistens geht aus der Aufgabenstellung hervor, wie der Induktionsanfang lautet. Manchmal ist dies aber nicht der Fall und du musst den Induktionsanfang selbst herausfinden, etwa durch Probieren.
Wie lautet die zu beweisende Aussage für den Induktionsanfang	Setze in die Aussageform die oben gefundene Zahl für den Induktionsanfang ein.
Finde einen Beweis für den Induktionsanfang	Hier musst du den Beweis für die oben gefundene Aussage finden. Bei Gleichungen bzw. Ungleichungen gelingt dir dies zum Beispiel dadurch, dass du beide Seiten dieser Gleichung oder Ungleichung ausrechnest und die dadurch entstanden Werte vergleichst.

Induktionsschluss
Fragen/Schritt	Anmerkungen
Wie lautet die Induktionsvoraussetzung?	—
Wie lautet die Induktionsbehauptung?	Achte darauf, dass du die Induktionsbehauptung richtig formulierst, dass du also Klammern um $k+1$ setzt. Wenn du zum Beispiel die zu bearbeitende Aussageform $A(n)$ lautet „ $2n+1$ ist ungerade“ lautet die Induktionsbehauptung $A(n=k+1)$ nicht „ $2k+2$ ist ungerade“, sondern „ $2(k+1)+1=2k+3$ ist ungerade“.
Finde den Beweis für den Induktionsschritt	Finde den Beweis dafür, dass unter Annahme der Induktionsvoraussetzung die Induktionsbehauptung gilt. Hier ist Kreativität gefragt, denn es gibt kein Beweisschema F. Aber meistens kannst du Aufgaben des gleichen oder ähnlichen Typs auf ähnliche Weise lösen (natürlich nicht immer). Das heißt, wenn du schon einige Induktionsbeweise gesehen oder durchgeführt hast, wird es dir leichter fallen, ähnliche Aufgaben zur vollständigen Induktion zu lösen. Es heißt mal wieder: Übung macht den Meister!

Beweis aufschreiben

Nachdem du dir den Beweis im Kopf oder auf Schmierpapier überlegt hast, geht es nun darum, einen sauberen und formal richtigen Beweis aufzuschreiben. Das folgende Schema gibt dir eine mögliche Struktur vor, wie du dies machen kannst:

Aussageform, deren Allgemeingültigkeit für $n\in \mathbb {N}$ bewiesen werden soll:

1. Induktionsanfang:

2. Induktionsschritt:

2a. Induktionsvoraussetzung:

2b. Induktionsbehauptung:

2c. Beweis des Induktionsschritts:

Bedenke, dass das obige Beweisschema nur eine Möglichkeit ist, einen Beweis für vollständige Induktion aufzuschreiben, an dem du dich aber gut orientieren kannst. Sollten dir mal in einer Klausur, Test oder ähnlichem ein paar Punkte der vollständigen Induktion fehlen, schreibe die restlichen trotzdem auf. Oft werden sie auch schon bewertet.

Beweis einer Summenformel

Als erste Beispielaufgabe wähle ich den Beweis einer Summenformel, da dies ein typisches Anwendungsgebiet der vollständigen Induktion ist. Aber auch Produktgleichungen kannst du auf eine ähnliche Art lösen. Unsere Beispielaufgabe lautet:

„Beweise durch vollständige Induktion, dass $\sum _{k=1}^{n}(2k-1)^{2}={\frac {n\cdot (2n-1)\cdot (2n+1)}{3}}$ für alle natürlichen Zahlen $n$ ist.“

Beweisfindung auf dem Schmierblatt

Notwendige Vorüberlegungen

Frage: Über welche Variable wird die Induktion geführt?

$n$

Frage: Wie lautet die zu beweisende Aussageform?

$A(n):\sum _{k=1}^{n}(2k-1)^{2}={\frac {n\cdot (2n-1)\cdot (2n+1)}{3}}$

Der Doppelpunkt steht dabei für „ist definiert durch“.

Induktionsanfang

Frage: Was ist die kleinste sinnvoll einsetzbare natürliche Zahl für $n$ ?

Nach der Aufgabenstellung ist $n\in \mathbb {N}$ , also $n\in \{1,2,3,\ldots \}$ . Die kleinste, sinnvoll einsetzbare natürliche Zahl ist damit die $1$ , womit die Induktion startet.

Frage: Wie lautet die zu beweisende Aussage für den Induktionsanfang?

Nach dem Einsetzen der $1$ für $n$ in der Aussageform erhalten wir die Aussage:

A(1):\sum _{k=1}^{1}(2k-1)^{2}={\frac {1\cdot (2\cdot 1-1)\cdot (2\cdot 1+1)}{3}}

Aufgabe: Finde einen Beweis für den Induktionsanfang.

Bei Summenformeln musst du die im Induktionsanfang entstandene Gleichung verifizieren. Dies erreichst du durch Nachrechnen der beiden Seiten der Gleichung, welche identisch sein müssen. Bei unserer Aufgabe erhalten wir für den linken Term der Gleichung:

\sum _{k=1}^{1}(2k-1)^{2}=(2\cdot 1-1)^{2}=1^{2}=1

Für den rechten Term der Gleichung erhalten wir:

{\frac {1\cdot (2\cdot 1-1)\cdot (2\cdot 1+1)}{3}}={\frac {1\cdot 1\cdot 3}{3}}={\frac {3}{3}}=1

Damit stimmen beide Seiten der obigen Gleichung überein, so dass $A(1)$ wahr ist.

Induktionsschritt

Frage: Wie lautet die Induktionsvoraussetzung?

Die Induktionsvoraussetzung $A(n=l)$ lautet $\sum _{k=1}^{l}(2k-1)^{2}={\frac {l\cdot (2l-1)\cdot (2l+1)}{3}}$ . Wir benutzen hier den Variablennamen $l$ , weil der Name $k$ bereits als Laufindex in der Summe vorkommt.

Frage: Wie lautet die Induktionsbehauptung?

Die Induktionsbehauptung $A(n=l+1)$ lautet $\sum _{k=1}^{l+1}(2k-1)^{2}={\frac {(l+1)\cdot (2\cdot (l+1)-1)\cdot (2\cdot (l+1)+1)}{3}}$ .

Aufgabe: Finde den Beweis für den Induktionsschritt.

Wir müssen nun beweisen, dass unter Annahme der Induktionsvoraussetzung die Induktionsbehauptung gilt. Bei Summenformeln können meistens folgende Schritte identifiziert werden:

1. Zerlege die Summe der Induktionsbehauptung so, dass du die Induktionsvoraussetzung anwenden kannst.

Dazu musst du von der Summe so viele Summanden extra schreiben (oder in einer eigenen Summe zusammenfassen), dass die restliche Summe der Summe in der Induktionsvoraussetzung entspricht:

\underbrace {\sum _{k=1}^{l+1}(2k-1)^{2}} _{\text{linke Seite der Induktionsbehauptung}}=\underbrace {\sum _{k=1}^{l}(2k-1)^{2}} _{\begin{matrix}{\text{hier lässt sich die}}\\{\text{Induktionsvoraussetzung einsetzen}}\end{matrix}}+\quad \underbrace {(2\cdot (l+1)-1)^{2}} _{\text{restlicher Summand}}

2. Induktionsvoraussetzung anwenden.

Nun kann die Induktionsvoraussetzung verwendet werden:

{\begin{aligned}\sum _{k=1}^{l+1}(2k-1)^{2}=\ &{\color {OliveGreen}\sum _{k=1}^{l}(2k-1)^{2}}+(2\cdot (l+1)-1)^{2}\\&\quad {\color {OliveGreen}\left\downarrow \ {\text{Induktionsvoraussetzung verwenden}}\right.}\\=\ &{\color {OliveGreen}{{l\cdot (2l-1)\cdot (2l+1)} \over 3}}+(2\cdot (l+1)-1)^{2}\\\end{aligned}}

Somit müssen wir jetzt folgende Gleichheit beweisen:

{\frac {l\cdot (2l-1)\cdot (2l+1)}{3}}+(2\cdot (l+1)-1)^{2}={\frac {(l+1)\cdot (2\cdot (l+1)-1)\cdot (2\cdot (l+1)+1)}{3}}

3. Termumformungen finden, um eine Seite der Gleichung in die andere zu überführen.

Wie du auf die notwendigen Termumformungen kommst wird im Abschnitt „Terme – Notwendige Termumformungen finden“ beschrieben. Du kannst die obige Gleichung durch Termumformumgen zum Beispiel so beweisen:

{\begin{alignedat}{2}{\frac {l\cdot (2l-1)\cdot (2l+1)}{3}}+(2\cdot (l+1)-1)^{2}&\qquad &&{\frac {(l+1)\cdot (2\cdot (l+1)-1)\cdot (2\cdot (l+1)+1)}{3}}\\{\frac {l\cdot (2l-1)\cdot (2l+1)+3\cdot (2l+1)^{2}}{3}}&&&{\frac {(l+1)\cdot (2l+1)\cdot (2l+3)}{3}}\\{\frac {(2l+1)\cdot (l\cdot (2l-1)+3\cdot (2l+1))}{3}}&&&{\frac {(l+1)\cdot (2l+1)\cdot (2l+3)}{3}}\\{\frac {(2l+1)\cdot \left(2l^{2}-l+6l+3\right)}{3}}&&&{\frac {(2l+1)\cdot \left(2l^{2}+3l+2l+3\right)}{3}}\\{\frac {(2l+1)\cdot \left(2l^{2}+5l+3\right)}{3}}&\ =&&{\frac {(2l+1)\cdot \left(2l^{2}+5l+3\right)}{3}}\\\end{alignedat}}

Beweis aufschreiben

Nun kann der Beweis nach dem obigen Schema aufgeschrieben werden.

Aussageform, deren Allgemeingültigkeit für $n\in \mathbb {N}$ bewiesen werden soll:

\sum _{k=1}^{n}(2k-1)^{2}={\frac {n\cdot (2n-1)\cdot (2n+1)}{3}}

1. Induktionsanfang:

Für $n=1$ gilt:

\sum _{k=1}^{1}(2k-1)^{2}=(2\cdot 1-1)^{2}=1^{2}=1={\frac {3}{3}}={\frac {1\cdot (2\cdot 1-1)\cdot (2\cdot 1+1)}{3}}

Damit ist $A(1)$ wahr.

2. Induktionsschritt:

2a. Induktionsvoraussetzung:

\sum _{k=1}^{l}(2k-1)^{2}={\frac {l\cdot (2l-1)\cdot (2l+1)}{3}}

2b. Induktionsbehauptung:

\sum _{k=1}^{l+1}(2k-1)^{2}={\frac {(l+1)\cdot (2\cdot (l+1)-1)\cdot (2\cdot (l+1)+1)}{3}}

2c. Beweis des Induktionsschritts:

Es gilt:

{\begin{aligned}\sum _{k=1}^{l+1}(2k-1)^{2}&=\left(\sum _{k=1}^{l}(2k-1)^{2}\right)+(2\cdot (l+1)-1)^{2}\\[0.3em]&{\color {OliveGreen}\left\downarrow \ {\text{Induktionsvoraussetzung verwenden}}\right.}\\[0.3em]&={\frac {l\cdot (2l-1)\cdot (2l+1)}{3}}+(2\cdot (l+1)-1)^{2}\\&={\frac {l\cdot (2l-1)\cdot (2l+1)+3\cdot (2l+1)^{2}}{3}}\\[0.3em]&{\color {OliveGreen}\left\downarrow \ (2l+1){\text{ ausklammern}}\right.}\\[0.3em]&={\frac {(2l+1)\cdot {\Big (}l\cdot (2l-1)+3\cdot (2l+1){\Big )}}{3}}\\&={\frac {(2l+1)\cdot (2l^{2}-l+6l+3)}{3}}\\&={\frac {(2l+1)\cdot (2l^{2}+2l+3l+3)}{3}}\\&={\frac {(2l+1)\cdot (2l\cdot (l+1)+3\cdot (l+1))}{3}}\\&={\frac {(l+1)\cdot (2l+1)\cdot (2l+3)}{3}}\\\end{aligned}}

Damit ist die Induktionsbehauptung bewiesen.

Beweise von Ungleichungen

Ungleichung mit Summenformel

Aufgabe

Beweise, dass für alle $n\in \mathbb {N}$ die Ungleichung $\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}\geq {\frac {n}{2}}$ gilt.

Lösungsweg

Ungleichungen zu beweisen, ist ein weiteres Problem, bei der die vollständige Induktion oftmals eingesetzt wird. Hier sind die notwendigen Termumformungen meist raffinierter als beim Beweis von Summenformeln und man muss geschickte Abschätzungen für Terme finden.

Diese Beispielaufgabe beschreibt eine wichtige Abschätzung der harmonischen Reihe, die noch später im Buch relevant wird (die Folge $1,\,{\tfrac {1}{2}},\,{\tfrac {1}{3}},\ldots$ nennt man harmonische Folge, die Summe über diese Folge wird dementsprechend harmonische Reihe genannt). Die Aussageform, deren Allgemeingültigkeit zu beweisen ist, lautet:

A(n):\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}\geq {\frac {n}{2}}

Frage: Wie lautet der Induktionsanfang?

Fangen wir wie immer mit dem Induktionsanfang an. Wie oben ist die kleinste sinnvoll einsetzbare Zahl für $n$ die $1$ . Die Aussage für $A(1)$ , die wir beweisen müssen, lautet:

A(1):\sum _{k=1}^{2^{1}-1}{\frac {1}{k}}\geq {\frac {1}{2}}

Nun Rechnen wir die linke Seite der Ungleichung aus und erhalten:

\sum _{k=1}^{2^{1}-1}{\frac {1}{k}}=\sum _{k=1}^{1}{\frac {1}{k}}={\frac {1}{1}}=1

Da $1>{\tfrac {1}{2}}$ ist, ist damit die Ungleichung für $n=1$ und somit der Induktionsanfang bewiesen.

Nun geht es mit dem Induktionsschritt weiter. Nach Induktionsvoraussetzung nehmen wir an, dass $\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}\geq {\frac {n}{2}}$ für ein bestimmtes $n$ gültig ist. Unsere Aufgabe ist es, zu beweisen, dass unter dieser Annahme $\sum _{k=1}^{2^{n+1}-1}{\frac {1}{k}}\geq {\frac {n+1}{2}}$ auch gültig sein muss (beachte, dass wir für die Induktionsbehauptung überall $n$ durch $n+1$ ersetzt haben). Da wir in der vollständigen Induktion irgendwie die Induktionsvoraussetzung verwenden müssen, sollten wir die Summe so zerlegen, dass die Summe der Induktionsvoraussetzung auftritt (mal schauen, ob uns das gelingt und weiterhilft). Es ist $\sum _{k=1}^{2^{n+1}-1}{\frac {1}{k}}=\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}+\sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{k}}$ .

Die rechte Seite der Ungleichung lässt sich auch als Summe schreiben (dadurch können wir beide Seiten besser miteinander vergleichen). Es ist ${\frac {n+1}{2}}={\frac {n}{2}}+{\frac {1}{2}}$ und somit lautet unsere zu beweisende Ungleichung:

\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}+\sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{k}}\geq {\frac {n}{2}}+{\frac {1}{2}}

Wir wissen nach der Induktionsvoraussetzung bereits, dass $\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}\geq {\frac {n}{2}}$ ist. Wenn wir nun beweisen könnten, dass $\sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{k}}\geq {\frac {1}{2}}$ wäre, wäre unsere Induktionsbehauptung bewiesen. Hier brauchen wir eine geschickte Abschätzung der Summe. Wir wissen, dass die Summanden ${\frac {1}{k}}$ mit wachsendem $k$ immer kleiner werden. Da wir die Summe nach unten abschätzen müssen, könnten wir alle Summanden mit dem kleinsten in der Summe vorkommenden Summanden abschätzen. Dies gibt uns die Möglichkeit, die Summe zu vereinfachen und daraus vielleicht eine Abschätzung zu bekommen. Der kleinste Summand wäre ${\frac {1}{2^{n+1}-1}}$ . Da sich mit ${\frac {1}{2^{n+1}}}$ die Summe wahrscheinlich besser zusammenfassen lässt und ${\frac {1}{2^{n+1}-1}}>{\frac {1}{2^{n+1}}}$ ist, versuchen wir mal die Abschätzung mit ${\frac {1}{2^{n+1}}}$ . Wir erhalten:

\sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{k}}\geq \sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{2^{n+1}}}={\frac {1}{2^{n+1}}}\cdot \sum _{k=2^{n}}^{2^{n+1}-1}1

Frage: Wie viele Summanden hat nun die Summe $\sum _{k=2^{n}}^{2^{n+1}-1}$ ?

Die Summe hat $2^{n+1}-1-2^{n}+1=2^{n}\cdot (2-1)=2^{n}$ Summanden.

Damit ergibt sich die Ungleichung:

\sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{k}}\geq {\frac {1}{2^{n+1}}}\cdot \sum _{k=2^{n}}^{2^{n+1}-1}1={\frac {1}{2^{n+1}}}\cdot 2^{n}={\frac {1}{2}}

Somit haben wir den Beweis für die Induktionsbehauptung gefunden.

Beweis

Die Aussageform, deren Allgemeingültigkeit zu beweisen ist, lautet:

A(n):\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}\geq {\frac {n}{2}}

1. Induktionsanfang:

Für $n=1$ ist

\sum _{k=1}^{2^{1}-1}{\frac {1}{k}}=\sum _{k=1}^{1}{\frac {1}{k}}={\frac {1}{1}}=1\geq {\frac {1}{2}}

2a. Induktionsvoraussetzung:

Sei $\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}\geq {\frac {n}{2}}$ .

2b. Induktionsbehauptung:

Wenn $\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}\geq {\frac {n}{2}}$ ist, dann ist $\sum _{k=1}^{2^{n+1}-1}{\frac {1}{k}}\geq {\frac {n+1}{2}}$ .

2c. Beweis der Induktionsbehauptung:

Zunächst gilt für alle $n\in \mathbb {N} _{\geq 1}$ :

\sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{k}}\geq \sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{2^{n+1}}}={\frac {1}{2^{n+1}}}\cdot \sum _{k=2^{n}}^{2^{n+1}-1}1={\frac {1}{2^{n+1}}}\cdot 2^{n}={\frac {1}{2}}

Damit ist wegen der Induktionsvoraussetzung:

\sum _{k=1}^{2^{n+1}-1}{\frac {1}{k}}=\sum _{k=1}^{2^{n}-1}{\frac {1}{k}}+\sum _{k=2^{n}}^{2^{n+1}-1}{\frac {1}{k}}\geq {\frac {n}{2}}+{\frac {1}{2}}={\frac {n+1}{2}}

Ungleichung ohne Summenformel

Aufgabe

Bestimmen Sie alle $n\in \mathbb {N} _{>0}$ für die gilt:

{\frac {4^{n}}{n+1}}<{\frac {(2n)!}{(n!)^{2}}}

Lösungsweg

Vorüberlegung: Wie kommen wir an unsere $n$ , welche die Ungleichung erfüllen?

Zunächst können wir für die ersten natürlichen Zahlen $n$ überprüfen, ob sie die Bedingung erfüllen:

{\begin{array}{l|rcl|c}n&{\dfrac {4^{n}}{n+1}}&<&{\dfrac {(2n)!}{(n!)^{2}}}&?\\\hline 1&2&<&2&\color {red}{f}\\\hline 2&{\frac {16}{3}}&<&{\frac {72}{12}}&\color {green}{w}\\\hline 3&16&<&20&\color {green}{w}\end{array}}

Die Aussage ist für $n=2$ und $n=3$ wahr. Wir vermuten deswegen, dass die Ungleichung für alle $n\geq 2$ erfüllt ist.

Beweis

Die Ungleichung ${\frac {4^{n}}{n+1}}<{\frac {(2n)!}{(n!)^{2}}}$ ist für alle $n\geq 2$ erfüllt.

Aussageform, deren Allgemeingültigkeit für $n\in \mathbb {N}$ mit $n\geq 2$ bewiesen werden soll:

{\frac {4^{n}}{n+1}}<{\frac {(2n)!}{(n!)^{2}}}

1. Induktionsanfang:

{\begin{array}{lrcl}&{\dfrac {4^{2}}{2+1}}&<&{\dfrac {(2\cdot 2)!}{(2!)^{2}}}\\[5pt]\iff &{\dfrac {16}{3}}&<&{\dfrac {4!}{4}}\\[5pt]\iff &{\dfrac {64}{12}}&<&{\dfrac {72}{12}}\end{array}}

2. Induktionsschritt:

2a. Induktionsvoraussetzung:

{\frac {4^{n}}{n+1}}<{\frac {(2n)!}{(n!)^{2}}}

2b. Induktionsbehauptung:

{\frac {4^{n+1}}{n+2}}<{\frac {(2n+2)!}{((n+1)!)^{2}}}

2c. Beweis des Induktionsschritts:

{\begin{array}{lrcl}&{\dfrac {4^{n+1}}{n+2}}&<&{\dfrac {\left(2(n+1)\right)!}{\left((n+1)!\right)^{2}}}\\[5px]\iff &{\dfrac {4^{n}\cdot 4}{n+2}}&<&{\dfrac {(2n+2)!}{((n+1)!)^{2}}}\\[5px]\iff &{\dfrac {4(n+1)}{n+2}}\cdot {\dfrac {4^{n}}{n+1}}&<&{\dfrac {(2n+2)(2n+1)(2n)!}{((n+1)\cdot n!)^{2}}}\\[5px]\iff &{\dfrac {4(n+1)}{n+2}}\cdot {\dfrac {4^{n}}{n+1}}&<&{\dfrac {(2n+2)(2n+1)(2n)!}{(n+1)^{2}\cdot (n!)^{2}}}\\[5px]\iff &\color {OliveGreen}{\dfrac {4(n+1)}{n+2}}\cdot \color {Orange}{\dfrac {4^{n}}{n+1}}&<&\color {OliveGreen}{\dfrac {(2n+2)(2n+1)}{(n+1)^{2}}}\cdot \color {orange}{\dfrac {(2n)!}{(n!)^{2}}}\\[5px]\end{array}}

Aus der Induktionsvoraussetzung wissen wir bereits, dass ${\textstyle \color {Orange}{\frac {4^{n}}{n+1}}<\color {Orange}{\frac {(2n)!}{(n!)^{2}}}}$ gilt. Beweisen wir nun deswegen die fehlende Ungleichung:

{\begin{array}{lrcl}&{\dfrac {4(n+1)}{n+2}}&<&{\dfrac {(2n+2)(2n+1)}{(n+1)^{2}}}\\[5pt]\iff &4(n+1)^{3}&<&(2n+2)(2n+1)(n+2)\\[5pt]\iff &4(n+1)^{3}&<&2(n+1)\cdot 2\left(n+{\dfrac {1}{2}}\right)\cdot (n+2)\\[5pt]\iff &(n+1)^{3}&<&(n+1)\left(n+{\dfrac {1}{2}}\right)(n+2)\\[5pt]\iff &(n+1)^{2}&<&\left(n+{\dfrac {1}{2}}\right)(n+2)\\[5pt]\iff &n^{2}+2n+1&<&n^{2}+{\dfrac {5}{2}}n+1\\[5pt]\iff &2n&<&{\dfrac {5}{2}}n\end{array}}

Die untere Ungleichung kann direkt miteinander verglichen werden und ist insbesondere für alle $n\geq 2$ wahr.

Beweis von Teilbarkeit

Aufgabe

Beweise, dass alle Zahlen der Form $a_{m}=m^{3}+5m$ mit $m\in \mathbb {N} _{\geq 0}$ durch 6 teilbar sind.

Lösungsweg

Als letztes Beispiel betrachten wir eine Aufgabe zur Teilbarkeit.

Frage: Über welche Variable ist die Induktion zu führen?

Die Induktionsvariable ist $m$ .

Frage: Wie lautet die Aussageform, deren Allgemeingültigkeit zu beweisen ist?

$A(m):a_{m}=m^{3}+5m{\text{ ist durch }}6{\text{ teilbar.}}$

Im Induktionsanfang musst du wie bei den obigen Beispielen die kleinste sinnvoll einsetzbare Zahl einsetzen und die so ausgerechnete Zahl auf die gewünschte Teilbarkeit überprüfen (beachte dabei, dass jede ganze Zahl ein Teiler von $0$ ist).

Frage: Wie lautet der Induktionsanfang?

Der Induktionsanfang ist laut Aufgabenstellung für $m=0$ zu führen. Wir erhalten $a_{0}=0^{3}+5\cdot 0=0$ , was durch sechs teilbar ist.

Frage: Wie lautet die Induktionsvoraussetzung?

Die Zahl $a_{m}=m^{3}+5m$ ist durch 6 teilbar.

Frage: Wie lautet die Induktionsbehauptung?

Die Zahl $a_{m+1}=(m+1)^{3}+5(m+1)$ ist durch 6 teilbar.

Im Beweis des Induktionsschritts hilft es meist, den erhaltenen Term, den du auf Teilbarkeit überprüfen sollst, durch Termumformungen auf eine Summe zu bringen, bei der du weißt, dass jeder seiner Summanden durch die gewünschte Zahl teilbar ist. Versuche dabei die Summe in so eine Struktur zu bringen, dass du die Induktionsvoraussetzung verwenden kannst.

Frage: Wie lautet der Beweis für den Induktionsschritt?

Wir erhalten nach obiger Vorgehensweise:

{\begin{aligned}a_{m+1}&=(m+1)^{3}+5(m+1)\\&=m^{3}+3m^{2}+3m+1+5m+5\\&=(m^{3}+5m)+6+(3m^{2}+3m)\\&=(m^{3}+5m)+6+3\cdot m\cdot (m+1)\\\end{aligned}}

Nach Induktionsvoraussetzung wissen wir, dass $m^{3}+5m$ durch 6 teilbar ist. Der Summand $6$ ist auch durch sechs teilbar. Und wie sieht es mit $3\cdot m\cdot (m+1)$ aus? Da entweder $m$ oder $m+1$ gerade ist, ist entweder $m$ oder $m+1$ durch zwei teilbar. Damit muss auch $3\cdot m\cdot (m+1)$ durch 6 teilbar sein.

Beweis

Aufgabe: Schreibe den Beweis auf.

Die Aussageform, deren Allgemeingültigkeit zu beweisen ist, lautet:

A(m):\ a_{m}=m^{3}+5m{\text{ ist durch }}6{\text{ teilbar.}}\!\,

1. Induktionsanfang:

Für $m=0$ ist $a_{0}=0^{3}+5\cdot 0=0$ durch 6 teilbar.

2a. Induktionsvoraussetzung:

Es ist $m^{3}+5m$ durch 6 teilbar.

2b. Induktionsbehauptung:

$(m+1)^{3}+5(m+1)$ ist durch 6 teilbar.

2c. Beweis der Induktionsbehauptung:

Es ist $a_{m+1}=(m+1)^{3}+5(m+1)=m^{3}+3m^{2}+3m+1+5m+5$ . Normalerweise würdest du jetzt Potenzen von m zusammenfassen zu $a_{m+1}=m^{3}+3m^{2}+8m+6$ . Das ist zwar richtig, aber nicht zielführend. Vielmehr musst du den Term $m^{3}+5m$ der Induktionsvoraussetzung ins Spiel bringen, hier durch Umordnen, so dass sich $a_{m+1}=(m^{3}+5m)+3m^{2}+3m+6$ ergibt. Am Term $3m^{2}+3m$ kannst du nicht sofort ablesen, dass er für alle $m\in \mathbb {N}$ durch 6 teilbar ist. Ein weiterer Induktionsbeweis lässt sich jedoch vermeiden, denn wenn du ausklammerst $3m^{2}+3m=3m(m+1)$ , ist die Teilbarkeit sofort zu erkennen, weil m oder m+1 durch 2 teilbar ist. Damit sind alle 3 Summanden von $a_{m+1}=(m^{3}+5m)+3m(m+1)+6$ durch 6 teilbar und der Induktionsbeweis in allen Einzelheiten nachvollziehbar geführt.

Mengenlehre

Erklärung und Definition

Erklärung der Mengenvorstellung anhand von Beispielen. (YouTube-Video vom Kanal Quatematik)

Zur Definition von Mengen (Video vom Podcast The Wicked Mu)

Der Begriff der Menge ist eines der wichtigsten und grundlegendsten Konzepte der Mathematik. Das ist auch der Grund, warum er dir schon so früh im Studium begegnet. Doch was ist eine Menge?

Hierzu möchten wir die originale Definition von Georg Cantor, dem Begründer der Mengenlehre, aus dem Jahr 1895 verwenden:

Cantors originale Mengendefinition

Definition (Naive Definition einer Menge von Cantor)

„Unter einer ‚Menge‘ verstehen wir jede Zusammenfassung $M$ von bestimmten wohlunterschiedenen Obje[k]ten $m$ uns[e]rer Anschauung oder unseres Denkens (welche die ‚Elemente‘ von $M$ genannt werden) zu einem Ganzen.“^[7]

Eine Menge ist also der Zusammenschluss von verschiedenen Objekten zu einem neuen Objekt, welches all die zusammengeschlossenen Objekte umfasst. Betrachte hierzu folgende Polygone:

Diese Polygone wurden zu einer Menge zusammengeschlossen, was durch die Ellipse angedeutet wird. Hier könnte man sich die Menge als eine Art „Behältnis“ vorstellen, welche alle Polygone als Inhalt enthält. Dieses Bild ist jedoch nicht ganz korrekt. Ein Behältnis bleibt nämlich dasselbe, auch wenn man seinen Inhalt ändert. Dies ist bei Mengen anders: Diese ändern ihre Identität, wenn man neue Elemente hinzufügt oder bestehende entfernt.

Die Vorstellung einer Menge als „Inhalt eines Behältnisses“ ist hier besser. Wenn du also eine Menge von verschiedenen Objekten hast, so kannst du dir diese Menge als Inhalt eines Behältnisses vorstellen. Dabei ist die Menge ein Objekt, welches den Inhalt des Behältnisses darstellt und nicht das Behältnis selbst:

Eine Beispielmenge
Dieselbe Menge als imaginäre Box
Bessere Vorstellung: Menge als Inhalt einer imaginären Box

Diese Vorstellung entspricht in etwa dem alltäglichen Gebrauch des Begriffs „Menge“. Nimm den alltäglichen Begriff einer „Menschenmenge in einem Stadion“ als anschauliches Beispiel:

Eine Menschenmenge in einem Stadion

Niemand würde diese Menge mit dem Stadion, was in unserem Beispiel quasi das Behältnis ist, gleichsetzen. Vielmehr entspricht die (Menschen-)Menge im Stadion der Zusammenfassung von allen Personen innerhalb des Stadions zu einem Ganzen. Diese Menge kann man dabei als „Inhalt des Stadions“ auffassen, wobei wir für dieses Beispiel alle anderen Gegenstände innerhalb des Stadions nicht beachten. Wenn neue Personen das Stadion betreten oder verlassen, dann ändert sich auch die Menge der Leute im Stadion. Genauso verändern Mengen in der Mathematik ihre Identität, wenn Elemente entfernt oder hinzugefügt werden.

Beachte, dass wir in diesem Beispiel mit der Menschenmenge im Stadion was anderes als die Anzahl der Leute im Stadion meinen. Unsere Menge ändert sich, wenn beispielsweise eine Person das Stadion verlässt und danach eine andere Person das Stadion betritt. Genauso ist es auch in der Mathematik: Wenn du innerhalb einer Menge ein Objekt mit einem anderen austauscht, dann veränderst du die Identität dieser Menge. Ignoriere bitte auch Unzulänglichkeiten, die in diesem anschaulichen Beispiel aus mathematischer Sicht stecken. Beispielsweise haben wir nicht geklärt, was ein Mensch ist und was seine Identität ausmacht.

Anders als in der realen Welt, wo Behältnisse und damit ihre Inhalte räumlich begrenzt sind, können Mengen beliebig groß sein und unendlich viele Elemente umfassen. Auch müssen ihre Elemente keine gemeinsamen Eigenschaften besitzen. Sie können sehr unterschiedlich sein.

Grundlegende Notationen für Mengen

Die Elementbeziehung bei Mengen (Video vom Podcast The Wicked Mu)

Zur Bezeichnung von Mengen werden in der Regel Großbuchstaben verwendet. Wenn die Elemente einer Menge selbst keine Mengen sind, nutzt man für sie oft Kleinbuchstaben. Man schreibt $x\in M$ – „ $x$ ist ein Element von $M$ “, wenn $x$ eines der Objekte bezeichnet, das in der Menge $M$ enthalten ist. Ist dies nicht der Fall, schreibt man $x\notin M$ – „ $x$ ist kein Element von $M$ “.

Das Element-Symbol $\in$ wurde im Übrigen 1889 von Giuseppe Peano in seiner Arbeit Arithmetices principia nova methodo exposita eingeführt. Es ist eine veränderte Darstellung des Anfangsbuchstaben ε (Epsilon) vom griechischen Wort εστί („estí“, was „ist“ bedeutet)^[8].

Beispiele für Mengen

Stelle dir folgende Ansammlung von Objekten vor:

Aus dieser Ansammlung können wir die vier Objekte Trommel, Spielkarte, Digitalkamera und Gitarre zu einer Menge zusammenfassen:

Wenn wir die gerade von uns gebildete Menge mit $M$ bezeichnen, so können wir aufschreiben:

${\text{Trommel}}\in M$ – „Die Trommel ist ein Element der Menge $M$ .“

${\text{Buch}}\notin M$ – „Das Buch ist kein Element der Menge $M$ .“

Verständnisfrage: Sei $M$ die im obigen Beispiel gebildete Menge. Welche der folgenden Aussagen sind wahr?

${\text{Gitarre}}\in M$
${\text{Gitarre}}\notin M$
${\text{Basketball}}\in M$
${\text{Spielkarte}}\notin M$

Antwort:

wahr
falsch
falsch
falsch

Zahlenbereiche als Mengen

Auch Zahlenbereiche werden in der Mathematik als Mengen aufgefasst. So ist die Menge der natürlichen Zahlen die Zusammenfassung aller Zahlen $1,2,3,4,\ \ldots$ zu einer Menge. Diese Menge wird mit dem Buchstaben $\mathbb {N}$ mit (meistens links) doppelter Vertikalen notiert. Auch andere Zahlenbereiche werden als Mengen aufgefasst:

Zahlenbereich	Symbol
Natürliche Zahlen	$\mathbb {N}$
Ganze Zahlen	$\mathbb {Z}$
Rationale Zahlen	$\mathbb {Q}$
Reelle Zahlen	$\mathbb {R}$
Komplexe Zahlen	$\mathbb {C}$

Verständnisfrage: Welche der folgenden Aussagen sind wahr?

$1\in \mathbb {N}$
${\tfrac {1}{2}}\in \mathbb {N}$
$42\notin \mathbb {N}$
$\pi \notin \mathbb {N}$

Antwort:

wahr: $1$ ist eine natürliche Zahl.
falsch: ${\tfrac {1}{2}}$ ist keine natürliche Zahl.
falsch: $42$ ist eine natürliche Zahl. Also ist die Aussage, dass diese nicht in $\mathbb {N}$ sei, falsch.
wahr: $\pi$ ist keine natürliche Zahl.

Die Extensionalität von Mengen

Die Extensionalität von Mengen (Video vom Podcast The Wicked Mu)

Die Identität einer Menge manifestiert sich allein dadurch, welche Objekte sie enthält. Zwei Mengen sind nämlich genau dann gleich, wenn sie dieselben Elemente besitzen. Diese beiden Mengen sind dann ein- und dasselbe Objekt. So gibt es beispielsweise nur eine Menge, welche genau die Zahlen $1$ und $2$ enthält. Mehrere Mengen mit denselben Elementen kann es nicht geben.

Wenn es auch nur ein Objekt gibt, welches Element der einen Menge, aber nicht der anderen ist, dann sind beide Mengen verschieden. Diese Eigenschaft von Mengen wird Extensionalitätsprinzip oder auch Extensionalitätsaxiom genannt. Sie lässt sich wie folgt formalisieren:

Definition (Extensionalitätsprinzip)

Für zwei beliebige Mengen $A$ und $B$ gilt:

A=B:\iff \forall x:(x\in A\iff x\in B)

Übersetzt bedeutet obige Formel:

{\begin{array}{c}\underbrace {A=B} _{A{\text{ ist identisch zu }}B}\\[2em]\underbrace {:\iff } _{\text{ nach Definition genau dann, wenn }}\\[2em]\underbrace {\forall x:(x\in A\iff x\in B)} _{{\text{für alle }}x{\text{ gilt: }}x{\text{ ist genau dann Element von }}A{\text{, wenn es Element von }}B{\text{ ist und umgekehrt.}}}\end{array}}

Würden wir Mengen, die über unterschiedliche Eigenschaften definiert sind, als unterschiedlich betrachten (eine solche Mengenlehre wäre intensional), wäre sie für die Mathematik nicht brauchbar. Wie aber aus dem obigen Extensionalitätsprinzip hervorgeht, ist es für die Identität einer Menge egal, wie sie gebildet wurde. Es ist nur wichtig zu wissen, welche Elemente sie umfasst.

Beispiel

In unserer Mengenlehre ist die Menge aller Lösungen der Gleichung $x^{2}=1$ identisch mit der Menge aller Lösungen der Gleichung $|x|=1$ . Dies ist die Menge bestehend aus den Zahlen $1$ und $-1$ . In einer intensionalen Mengenlehre wäre dies nicht zwangsläufig der Fall, da beide Mengen durch unterschiedliche Eigenschaften definiert sind.

Wozu braucht man Mengen in der Mathematik?

Mengen werden dir in allen Teilgebieten der Mathematik begegnen. Sie sind ein praktisches Hilfsmittel und mit ihnen können komplexe Sachverhalte kurz und prägnant ausgedrückt werden. Auch können mit Mengen neue Objekte konstruiert oder Konzepte modelliert werden. Beispielsweise nutzt die Topologie Mengen, um Nachbarschaftsbeziehungen auszudrücken und auch die in der Algebra studierten Strukturen wie Gruppen oder Körper werden als Mengen definiert.

Daneben ist die Mengenlehre selbst ein etabliertes Teilgebiet der Mathematik. Hier haben Mathematiker gezeigt, dass alle wesentlichen Konzepte der Mathematik allein mit Mengen modelliert werden können. Trotz des simplen Charakters ist der Mengenbegriff also sehr mächtig. So kann beispielsweise jede Zahl als ein komplexes Mengengebilde dargestellt werden^[9]. Über die Mengenlehre können so Grundfragen der Mathematik beantwortet werden (eben weil man sich auf den Standpunkt stellen kann, alles in der Mathematik sei Menge)^[10]. Beispielsweise besitzt die Mengenlehre Mittel, um für eine Aussage zu beweisen, dass sie innerhalb eines gegebenen Axiomensystems weder beweisbar noch widerlegbar ist^[11].

Wenn man sich die Einfachheit und die Bedeutung der Mengenlehre vor Augen hält, dann wundert es schon ein wenig, dass die Mengenlehre eine für die Mathematik recht junge Theorie ist.

Teilmenge und echte Teilmenge

Beziehungen zwischen Mengen

Stelle dir zwei Mengen $A$ und $B$ in einem Mengendiagramm vor. Es gibt mehrere Möglichkeiten, wie diese beiden Mengen zueinander liegen können. $A$ und $B$ könnten sich überlappen, $A$ könnte komplett in $B$ liegen oder es gibt eine andere Lage zueinander. Einige dieser Zusammenhänge treten so häufig in der Mathematik auf, dass sie eigene Bezeichnungen bekommen haben. Diese sind:

Mengendiagramm	Bezeichnung
	$A$ ist eine Teilmenge von $B$
	$A$ und $B$ sind disjunkte Mengen.

Teilmenge

Definition und Beispiele

Teilmenge: Definition und Beispiele (Video vom Podcast The Wicked Mu)

Erklärungen zur Ober- und Untermenge (Youtube-Video der Khan Academy Deutsch)

Wenn alle Elemente einer Menge $A$ auch Elemente einer Menge $B$ sind, so wird $A$ eine Teilmenge der Menge $B$ genannt. Hierfür schreibt man $A\subseteq B$ . Es ist also $A$ genau dann eine Teilmenge von $B$ , wenn sie einen Teil der Menge von $B$ umfasst. Betrachte hierzu die folgenden zwei Mengen:

{\begin{aligned}A&=\{x\,|\,x{\text{ ist ein Streichinstrument}}\}\\&=\{{\text{Geige, Viola, Cello}},\ldots \}\\[0.2em]B&=\{x\,|\,x{\text{ ist ein Instrument}}\}\\&=\{{\text{Trommel, Geige, Viola, Gitarre, Cello, Klavier}},\ldots \}\end{aligned}}

Da alle Streichinstrumente auch Instrumente sind, sind alle Elemente von $A$ auch Elemente von $B$ . Damit ist $A$ eine Teilmenge von $B$ . Weitere Sprechweisen für $A\subseteq B$ sind:

$A$ ist eine Untermenge von $B$

und

$B$ ist eine Obermenge von $A$

Erläutern wir diese Sprechweise noch einmal an dem Beispiel von gerade eben. Zweifellos wird man erkennen, dass die Menge der Instrumente $B$ alle Streichinstrumente aus $A$ umfasst und darüber hinaus noch weitere Elemente enthält. Ordnen wir die Mengen $A$ und $B$ nun nach der Allgemeinheit ihrer Bezeichnung an (absteigend von allgemein nach spezifisch):

Menge $B$ : Instrumente
Menge $A$ : Streichinstrumente

„Instrument“ ist ein Oberbegriff für „Streichinstrumente“. Dementsprechend muss $B$ eine Obermenge von $A$ sein. Analog ist „Streichinstrumente“ ein Unterbegriff von „Instrumente“, weswegen $A$ auch eine Untermenge von $B$ ist. Du kannst es dir auch räumlich vorstellen: die Menge $B$ steht über $A$ und ist daher eine Obermenge von $A$ , während $A$ als Untermenge unter $B$ steht. Bei unterschiedlichen Mengen umfasst also die größere Obermenge die kleinere Untermenge.

Auch die gegenteilige Beziehung von zwei Mengen ist mathematisch darstellbar. Möchtest du etwa betonen, dass $A$ keine Teilmenge der Menge $B$ ist, so kannst du $A\nsubseteq B$ schreiben. Beispiel:

\{{\text{Geige, Viola, Cello, Klavier}}\}\nsubseteq \{{\text{Viola, Cello, Klavier}}\}

Fassen wir das bereits Gesagte in einer Definition zusammen:

Definition (Teilmenge)

Die Menge $A$ ist eine Teilmenge der Menge $B$ genau dann, wenn alle Elemente der Menge $A$ auch Elemente der Menge $B$ sind. Man schreibt $A\subseteq B$ , wenn $A$ eine Teilmenge von $B$ ist.

Es ist also:

A\subseteq B\iff \forall x:(x\in A\Rightarrow x\in B)

Mit Erklärung:

{\begin{array}{c}\underbrace {A\subseteq B} _{A{\text{ ist Teilmenge von }}B}\\[2em]\underbrace {\iff } _{\text{ genau dann, wenn }}\\[2em]\underbrace {\forall x:(x\in A\Rightarrow x\in B)} _{{\text{Für alle }}x{\text{ gilt: Wenn }}x{\text{ ein Element von }}A{\text{ ist, dann ist es auch ein Element von }}B}\end{array}}

Einige Beispiele:

Beispiel (Teilmenge)

$\{5,\,\pi \}\subseteq \{4,\,\pi ,\,-1,\,5\}$
$\{5,\,\pi \}\nsubseteq \{4,\,\pi ,\,-1\}$
$\mathbb {N} \subseteq \mathbb {Z}$
$\{5,\,-1\}\nsubseteq \{z\in \mathbb {Z} \,|\,z<0\}$
$\{\pi ,\,3,\,0\}\subseteq \{\pi ,\,3,\,0\}$

Anmerkungen zu den Beispielen:

Beispiel 3: $\mathbb {N}$ ist die Menge der natürlichen Zahlen und $\mathbb {Z}$ die Menge der ganzen Zahlen. Da jede natürliche Zahl auch eine ganze Zahl ist, ist $\mathbb {N}$ eine Teilmenge von $\mathbb {Z}$ .

Beispiel 4: $\{z\in \mathbb {Z} \,|\,z<0\}$ ist die Menge aller negativen, ganzen Zahlen. Da $5$ nicht negativ ist, ist $5\notin \{z\in \mathbb {Z} \,|\,z<0\}$ und damit $\{5,\,-1\}$ keine Teilmenge von $\{z\in \mathbb {Z} \,|\,z<0\}$ .

Beispiel 5: Jede Menge ist Teilmenge von sich selbst (siehe spätere Verständnisfrage).

Das fünfte Beispiel zeigt exemplarisch, dass jede Menge Teilmenge von sich selbst ist. Es ist also $M\subseteq M$ für alle Mengen $M$ . Folglich:

\{x\,|\,x{\text{ ist ein Instrument}}\}\subseteq \{x\,|\,x{\text{ ist ein Instrument}}\}

Instrumente sind somit eine Teilmenge von Instrumente. Im ersten Moment mag dies ungewohnt klingen. Für die Mathematik hat sich diese Konvention aber als sinnvoll erwiesen, weil so unnötige Fallunterscheidungen, ob zwei Mengen gleich sind oder nicht, vermieden werden. Mit dem Begriff der echten Teilmenge (siehe unten) gibt es einen Begriff, der die Gleichheit der beiden Mengen ausschließt.

Verständnisfrage: Warum ist jede Menge Teilmenge von sich selbst?

Damit $M\subseteq M$ ist, muss nach Definition gelten:

Jedes Element aus $M$ ist auch Element aus $M$

Dies ist aber für alle Mengen $M$ erfüllt.

Identität von Mengen zeigen

Um die Identität zweier Mengen $A$ und $B$ zu zeigen, geht man häufig in zwei Schritten vor. Man zeigt zunächst, dass $A$ eine Teilmenge von $B$ ist, und später im zweiten Schritt, dass $B$ eine Teilmenge von $A$ ist. Für zwei Mengen $A$ und $B$ gilt nämlich folgende Äquivalenz:

A=B\ \Leftrightarrow A\subseteq B\land B\subseteq A

Satz (Identität von Mengen)

Zwei Mengen $A$ und $B$ sind genau dann identisch, wenn $A$ eine Teilmenge von $B$ und $B$ eine Teilmenge von $A$ ist.

Verdeutlichen wir uns diese Tatsache erneut an einem Beispiel. Nehme hierzu die beiden Mengen:

{\begin{aligned}A&=\{{\text{Geige, Viola, Cello, Klavier}}\}\\B&=\{{\text{Viola, Klavier, Cello, Geige, Klavier}}\}\end{aligned}}

Damit $A$ eine Teilmenge von $B$ ist, müssen alle Instrumente aus der ersten Menge auch in der zweiten enthalten sein. Analog müssen alle Instrumente der zweiten Menge auch in der ersten Menge enthalten sein, damit die zweite Menge eine Teilmenge der ersten Menge ist. Dies ist genau dann und nur dann möglich, wenn beide Mengen identisch sind.

Beweis (Identität von Mengen)

Nach dem Extensionalitätsprinzip für Mengen gilt:

{\begin{aligned}A=B&\Leftrightarrow \forall x(x\in A\Leftrightarrow x\in B)\\&\quad {\color {Gray}\left\downarrow \ X\Leftrightarrow Y{\text{ ist nach Definition }}X\Rightarrow Y\land Y\Rightarrow X\right.}\\&\Leftrightarrow \forall x((x\in A\Rightarrow x\in B)\land (x\in B\Rightarrow x\in A))\\&\quad {\color {Gray}\left\downarrow \ \forall x(C(x)\land D(x)){\text{ ist äquivalent zu }}\forall x:C(X)\land \forall x:D(x)\right.}\\&\Leftrightarrow \forall x(x\in A\Rightarrow x\in B)\land \forall x(x\in B\Rightarrow x\in A)\\&\quad {\color {Gray}\left\downarrow \ \forall x(x\in X\Rightarrow x\in Y){\text{ bedeutet }}X\subseteq Y\right.}\\&\Leftrightarrow A\subseteq B\land B\subseteq A\end{aligned}}

Transitivität der Teilmengenbeziehung

Transitivität der Teilmengenbeziehung (Video vom Podcast The Wicked Mu)

Es ist auch möglich, mehrere Teilmengenbeziehungen hintereinander aufzuführen:

\{{\text{Geige, Viola}}\}\subseteq \{{\text{Geige, Viola, Cello}}\}\subseteq \{{\text{Geige, Viola, Cello, Klavier}}\}

Diese Schreibweise ergibt Sinn, weil aus $A\subseteq B$ und $B\subseteq C$ folgt, dass $A\subseteq C$ ist. Obige Teilmengenkette impliziert also:

\{{\text{Geige, Viola}}\}\subseteq \{{\text{Geige, Viola, Cello, Klavier}}\}

Dieser Zusammenhang ist in allgemeiner Form auch im Bild rechts dargestellt. Die beschriebene Eigenschaft nennt man „Transitivität der Teilmengenbeziehung“:

Satz (Transitivität der Teilmengenbeziehung)

Die Teilmengenbeziehung ist transitiv. Das bedeutet, dass wenn $A\subseteq B$ und $B\subseteq C$ ist, auch $A\subseteq C$ ist.

Beweis (Transitivität der Teilmengenbeziehung)

Sei $x\in A$ beliebig. Wegen $A\subseteq B$ ist $x\in B$ . Wegen $B\subseteq C$ ist $x\in C$ . Damit ist jedes Element aus $A$ auch Element aus $C$ , was zu beweisen war.

Echte Teilmenge

Definition und Erklärung

Erklärungen und Beispiele zur echten Teilmenge (Video vom Podcast The Wicked Mu)

Ist eine Menge $A$ eine Teilmenge der Menge $B$ und $A\neq B$ , so nennt man $A$ eine echte Teilmenge der Menge $B$ . Um deutlich zu machen, dass $A$ eine echte Teilmenge von $B$ ist, schreibt man $A\subsetneq B$ .

Definition (Echte Teilmenge)

Die Menge $A$ ist eine echte Teilmenge der Menge $B$ genau dann, wenn $A$ eine Teilmenge der Menge $B$ und $A$ nicht identisch mit $B$ ist. Die Schreibweise ist hierfür $A\subsetneq B$ .

Oben haben wir bereits gesehen, dass jede Menge Teilmenge von sich selbst ist. Beispielsweise ist:

\{{\text{Geige, Viola, Cello, Klavier}}\}\subseteq \{{\text{Geige, Viola, Cello, Klavier}}\}

Beide Mengen sind identisch, da die darin enthaltenen Elemente exakt übereinstimmen. Umgangssprachlich sollte aber ein „Teil“ nicht identisch mit dem Ganzen sein. Um bei Teilmengen die Gleichheit beider Mengen auszuschließen, gibt es den Begriff der echten Teilmenge. Im obigen Beispiel liegt demnach keine echte Teilmenge vor. Anders ist es dagegen im folgenden Beispiel:

\{{\text{Geige, Viola, Cello}}\}\subsetneq \{{\text{Geige, Viola, Cello, Klavier}}\}

Der Unterschied wird anhand der Schreibweise deutlich:

Schreibweise	Bedeutung	Bemerkung
$A\subseteq B$	$A$ ist eine Teilmenge von $B$	der Fall $A=B$ ist hier möglich
$A\subsetneq B$	$A$ ist eine echte Teilmenge von $B$	hier ist garantiert $A\neq B$ , es gibt also ein Element $b\in B$ mit $b\notin A$

Hinweis

In mathematischer Literatur findet man auch die Schreibweise $A\subset B$ . Jedoch wird diese Schreibweise nicht in einer einheitlichen Definition gebraucht. So verwenden einige Autoren diese Schreibweise in der Bedeutung „ $A$ ist eine Teilmenge von $B$ “ und andere in der Bedeutung „ $A$ ist eine echte Teilmenge von $B$ “. Wegen dieser Uneindeutigkeit werden wir in diesem Buch auf diese Schreibweise verzichten.

Satz (echte Teilmengenbeziehung)

Ist $A$ eine echte Teilmenge von $B$ , so hat $B$ wenigstens ein zusätzliches Element, formalisiert:

A\subsetneq B\implies \exists x\in B:x\notin A

Beweis (echte Teilmengenbeziehung)

Sei $A$ eine echte Teilmenge von $B$ . Dann ist insbesondere $A\subseteq B$ . Wäre $\forall x\in B:x\in A$ , gälte $B\subseteq A$ und somit $A=B$ , da bereits $A\subseteq B$ ist. Also gilt $\neg \forall x\in B:x\in A$ , und nach den Umformungsregeln zum Negieren folgt daraus: $\exists x\in B:x\notin A$ .

Beispiele

Betrachte zunächst folgende Beispiele:

Beispiel (echte Teilmenge)

$\{5,\,\pi \}\subsetneq \{4,\,\pi ,\,-1,\,5\}$
$\{5,\,\pi \}$ ist keine echte Teilmenge der Menge $\{4,\,\pi ,\,-1\}$
$\mathbb {N} \subsetneq \mathbb {Z} \subsetneq \mathbb {Q} \subsetneq \mathbb {R} \subsetneq \mathbb {C}$
$\{\pi ,\,3,\,0\}$ ist keine echte Teilmenge der Menge $\{\pi ,\,3,\,0\}$

Anmerkungen zu den Beispielen:

Beispiel 3: Der hier dargestellte Zusammenhang wird auch oben bei dem Abschnitt zu Venn-Diagrammen schön illustriert.

Beispiel 4: Entspricht dem eingangs erwähnten Instrumentenbeispiel, lediglich werden hier Zahlen statt Instrumente gebraucht.

Um den Unterschied der Begriffe „Teilmenge“ und „echte Teilmenge“ deutlich zu machen, kannst du folgende Mengen betrachten:

{\begin{aligned}A&=\{1,\,11,\,9\}\\B&=\{1,\,11,\,9,\,4,\,8\}\\C&=\{1,\,11,\,9,\,4,\,8\}\end{aligned}}

$A$ ist eine Teilmenge von $B$ und weil $B$ zusätzliche Elemente besitzt, ist $A$ auch eine echte Teilmenge von $B$ . Außerdem ist $C$ auch eine Teilmenge von $B$ . Weil aber $B$ und $C$ identisch sind, ist $C$ keine echte Teilmenge von $B$ :

A ist eine echte Teilmenge von B
C ist keine echte Teilmenge von B

Verständnisfragen zur Teilmenge

Verständnisfrage: Welche der folgenden Aussagen sind wahr?

$\mathbb {N} \subseteq \mathbb {Q}$
$\mathbb {R} \subseteq \mathbb {Q}$
$\{1,\,-2\}\subseteq \mathbb {Q} ^{+}$
$\{1,\,-2\}\subseteq \mathbb {Q} ^{-}$

Antwort:

wahr
falsch
falsch
falsch

Verständnisfrage: Es ist $\forall x\left(A(x)\Rightarrow B(x)\right)$ . Ist dann $\{x\,|\,A(x)\}\subseteq \{x\,|\,B(x)\}$ oder $\{x\,|\,B(x)\}\subseteq \{x\,|\,A(x)\}$ ?

Aus $\forall x\left(A(x)\Rightarrow B(x)\right)$ folgt, dass jedes Objekt $x$ , welches die Eigenschaft $A(x)$ erfüllt, auch die Eigenschaft $B(x)$ erfüllt. Damit ist $\{x\,|\,A(x)\}\subseteq \{x\,|\,B(x)\}$ die richtige Antwort.

Wenn du also mal zeigen möchtest, dass für zwei Mengen $\{x\,|\,A(x)\}$ und $\{x\,|\,B(x)\}$ die Beziehung $\{x\,|\,A(x)\}\subseteq \{x\,|\,B(x)\}$ erfüllt ist, so kannst du $\forall x\left(A(x)\Rightarrow B(x)\right)$ zeigen.

Verständnisfrage: Es seien $x$ und $y$ verschiedene Objekte. Welche der folgenden Aussagen ist wahr?

$\{x,y\}\in \{x,y\}$
$\{x,y\}\subseteq \{x,y\}$
$\{x,y\}\subsetneq \{x,y\}$
$\{x,y\}\in \{x,y,\{x,y\}\}$
$\{x,y\}\subseteq \{x,y,\{x,y\}\}$
$\{x,y\}\subsetneq \{x,y,\{x,y\}\}$

Zunächst sollte man sich vergegenwärtigen, was die einzelnen Mengen bedeuten:

$\{x,y\}$ – die Menge, die die Objekte $x$ und $y$ als Elemente besitzt.
$\{x,y,\{x,y\}\}$ – die Menge, die die Objekte $x$ und $y$ sowie die Menge $\{x,y\}$ als Elemente besitzt.

Nun kann der Wahrheitswert der einzelnen Aussagen bestimmt werden:

$\{x,y\}\in \{x,y\}$ – falsch, da die Menge $\{x,y\}$ kein Element von $\{x,y\}$ ist.
$\{x,y\}\subseteq \{x,y\}$ – wahr, weil alle Elemente von $\{x,y\}$ auch Elemente von $\{x,y\}$ sind.
$\{x,y\}\subsetneq \{x,y\}$ – falsch, weil $\{x,y\}$ gleich $\{x,y\}$ ist und damit ist $\{x,y\}$ keine echte Teilmenge von $\{x,y\}$ .
$\{x,y\}\in \{x,y,\{x,y\}\}$ – wahr, weil $\{x,y\}$ ein Element von $\{x,y,\{x,y\}\}$ ist.
$\{x,y\}\subseteq \{x,y,\{x,y\}\}$ – wahr, weil alle Elemente von $\{x,y\}$ , nämlich die Objekte $x$ und $y$ , auch Elemente von $\{x,y,\{x,y\}\}$ sind.
$\{x,y\}\subsetneq \{x,y,\{x,y\}\}$ – wahr, weil alle Elemente von $\{x,y\}$ , nämlich die Objekte $x$ und $y$ , auch Elemente von $\{x,y,\{x,y\}\}$ sind und weil $\{x,y\}$ ungleich $\{x,y,\{x,y\}\}$ ist.

Verständnisfrage: Lässt sich ein Beispiel für zwei Mengen $A$ und $B$ finden, für welche $A\in B$ und $A\subseteq B$ gilt?

Ja. Es ist $A\in B$ und $A\subseteq B$ für $A=\emptyset$ und $B=\left\{\emptyset \right\}$ .

Verständnisfrage: Gegeben sei die Menge $A=\{42\}$ . Welche der folgenden Aussagen ist wahr?

$\{42\}\subseteq A$
$\{42\}\subsetneq A$
$\emptyset \subseteq A$
$\emptyset \subsetneq A$

Antworten:

wahre Aussage: $42$ ist in $A$ enthalten und damit ist $\{42\}$ eine Teilmenge von $A$ . Alternativ kann man auch argumentieren, dass jede Menge eine Teilmenge von sich selbst ist.
falsche Aussage: Die Menge $\{42\}$ ist identisch zu $A$ und damit keine echte Teilmenge von $A$ .
wahre Aussage: Die leere Menge ist Teilmenge jeder Menge.
wahre Aussage: Die leere Menge ist Teilmenge von $A$ , aber nicht identisch mit $A$ . Damit ist die leere Menge eine echte Teilmenge von $A$ .

Verständnisfrage: Welche der folgenden Aussagen ist wahr?

$\emptyset \subseteq \emptyset$
$\emptyset \subsetneq \emptyset$

Antworten:

wahre Aussage: Die leere Menge ist Teilmenge jeder Menge und damit auch eine Teilmenge der leeren Menge.
falsche Aussage: Keine Menge ist eine echte Teilmenge von sich selbst. Dies gilt auch für die leere Menge.

Verständnisfrage: Ist die echte Teilmengenbeziehung transitiv?

Ja, wenn $A\subsetneq B$ und $B\subsetneq C$ gilt, dann auch $A\subsetneq C$ . Beweis: aus $A\subsetneq B$ folgt $A\subseteq B$ und aus $B\subsetneq C$ folgt $B\subseteq C$ . Mit der Transitivität von $\subseteq$ ergibt sich $A\subseteq C$ . Wegen $B\subsetneq C$ gibt es ein $c\in C$ mit $c\notin B$ . Da aber alle Elemente von $A$ in $B$ liegen, liegt $c\notin A$ . Also gilt: $A\subsetneq C$ .

Disjunkte Mengen und paarweise disjunkte Mengensysteme

Disjunkte Mengen

Erklärung und Beispiele

Disjunkte Mengen – Erklärung und Definition (Video vom Podcast The Wicked Mu)

Zwei Mengen $A$ und $B$ , die keine gemeinsamen Elemente besitzen, nennt man disjunkt. Für disjunkte Mengen gibt es auch die Bezeichnungen elementfremd oder durchschnittsfremd. Das Wort „disjunkt“ leitet sich dabei vom lateinischen Wort „disiunctum“ ab, was soviel wie „getrennt“ bedeutet. Nehme als Beispiel die folgenden zwei Mengen

{\begin{aligned}A&=\{{\text{Cello,  Klavier, Geige}}\}\\B&=\{{\text{Viola, Gitarre, Klavier}}\}\end{aligned}}

Diese beiden Mengen sind nicht disjunkt, weil sie das „Klavier“ als gemeinsames Objekt besitzen. Demgegenüber sind aber die folgenden beiden Mengen disjunkt, weil sie keine gemeinsamen Elemente besitzen:

{\begin{aligned}C&=\{{\text{Cello,  Trommel, Geige}}\}\\D&=\{{\text{Viola, Gitarre, Klavier}}\}\end{aligned}}

Weitere Beispiele:

Die Menge mit der Spielkarte und dem Buch ist disjunkt zur Menge mit der Gitarre und der Trommel.
Ein weiteres Beispiel für zwei disjunkte Mengen
Disjunkte Mengen im Mengendiagramm

Definition

Der Schnitt $A\cap B$ ist die Menge aller gemeinsamen Elemente von $A$ und $B$ . Zwei Mengen sind also genau dann disjunkt, wenn die Menge $A\cap B$ kein Element besitzt. Eine solche Menge ohne Elemente nennt man „leere Menge“, welche als $\varnothing$ notiert wird. Es ist also:

Definition (disjunkte Menge)

Zwei Mengen nennt man disjunkt, wenn sie keine gemeinsamen Elemente besitzen:

A{\text{ ist disjunkt zu }}B\iff A\cap B=\varnothing

Verständnisfragen

Verständnisfrage: Welche der folgenden Paare von Mengen sind disjunkt?

$\{1,\,\pi ,\,-1\}$ und $\{2,\,77,\,-1\}$
$\{1,\,\pi ,\,-1\}$ und $\{2,\,77\}$
$\mathbb {Z}$ und $\mathbb {Q}$
$\varnothing$ und $\varnothing$
$\{\varnothing \}$ und $\{\varnothing \}$

Antwort:

$\{1,\,\pi ,\,-1\}$ und $\{2,\,77,\,-1\}$ sind nicht disjunkt, weil sie beide $-1$ als Element besitzen.
$\{1,\,\pi ,\,-1\}$ und $\{2,\,77\}$ sind disjunkt, weil sie keine gemeinsamen Elemente besitzen.
$\mathbb {Z}$ und $\mathbb {Q}$ sind nicht disjunkt, weil sie zum Beispiel die Zahl $0$ als gemeinsames Element besitzen.
$\varnothing$ und $\varnothing$ sind disjunkt, weil $\varnothing \cap \varnothing =\varnothing$ ist.
$\{\varnothing \}$ und $\{\varnothing \}$ sind nicht disjunkt, weil sie $\varnothing$ als gemeinsames Element besitzen.

Folgende Fragen setzen voraus, dass du den Begriff der Schnittmenge und der leeren Menge schon kennst (siehe die nächsten Kapitel). Du kannst diese Fragen also gerne überspringen, wenn du diese Begriffe noch nicht kennen solltest.

Verständnisfrage: Mit welchen Mengen $M$ ist $\varnothing$ disjunkt?

$\varnothing$ ist mit jeder Menge $M$ disjunkt, weil $\varnothing \cap M=\varnothing$ ist.

Verständnisfrage: Wann ist eine Menge $A$ zu sich selbst disjunkt?

Eine Menge $A$ ist genau dann zu sich selbst disjunkt, wenn $A\cap A=\varnothing$ ist. Wegen $A\cap A=A$ ist dies genau dann der Fall, wenn $A=\varnothing$ ist:

A{\text{ ist zu sich selbst disjunkt}}\iff A=\varnothing

Verständnisfrage: Nehme die zwei Mengen $\{a\}$ und $B$ . Unter welchen Umständen sind diese beiden Mengen disjunkt?

Diese beiden Mengen sind genau dann disjunkt, wenn $a\notin B$ ist.

Paarweise disjunkte Mengensysteme

Paarweise disjunkte Mengensysteme (Video vom Podcast The Wicked Mu)

Ein Mengensystem $M$ , also eine Menge von Mengen, nennt man paarweise disjunkt, wenn jeweils zwei verschiedene Mengen $A,B\in M$ disjunkt sind. Egal welche zwei unterschiedlichen Mengen $A$ und $B$ aus $M$ ausgewählt werden, diese beiden Mengen besitzen keine gemeinsamen Elemente. Zum Beispiel ist folgendes Mengensystem paarweise disjunkt:

Demgegenüber ist das folgende Mengensystem nicht paarweise disjunkt, weil sich die Mengen $D$ und $E$ überschneiden:

Wir fassen zusammen:

Definition (paarweise disjunktes Mengensystem)

Ein Mengensystem $M$ ist paarweise disjunkt, wenn alle verschiedenen Mengen $A,B\in M$ disjunkt sind. Es gilt also:

M{\text{ ist paarweise disjunkt}}\iff \forall A,B\in M:(A\neq B\implies A\cap B=\varnothing )

Verständnisfrage: Sei $M=\{A\}$ ein Mengensystem besteht aus nur einer Menge $A$ . Ist $M$ paarweise disjunkt?

Ja, jedes Mengensystem bestehend aus nur einem Element ist paarweise disjunkt. Es gibt keine zwei verschiedenen Mengen $A,B\in M$ und damit muss für keine Mengenpaare geprüft werden, ob sie disjunkt sind, oder nicht.

Verständnisfrage: Sei $M=\varnothing$ das leere Mengensystem. Ist $M$ paarweise disjunkt?

Ja, auch das leere Mengensystem ist paarweise disjunkt. Die zu prüfende Aussage $\forall A,B\in \varnothing :(A\neq B\implies A\cap B=\varnothing )$ ist eine All-Aussage über die leere Menge und damit wahr.

Verständnisfrage: Sei $M$ ein paarweise disjunktes Mengensystem. Ist dann immer $\bigcap _{I\in M}I=\varnothing$ ?

Nein. Wir haben eben erfahren, dass jedes einelementige Mengensystem paarweise disjunkt ist. Es ist also $\{A\}$ für jede Menge $A$ paarweise disjunkt. Sei nun $A$ eine nicht leere Menge und $M=\{A\}$ . Es ist

\bigcap _{I\in M}I=A\neq \varnothing

Es gibt also paarweise disjunkte Mengensysteme, deren Schnitt nicht leer ist.

Potenzmenge

Definition

Erklärung und Beispiele zur Potenzmenge (Video vom Podcast The Wicked Mu)

Die Potenzmenge ${\mathcal {P}}(M)$ einer Menge $M$ ist die Menge aller Teilmengen der Menge $M$ . Es ist also ${\mathcal {P}}(M):=\{U\,|\,U\subseteq M\}$ . Neben ${\mathcal {P}}(M)$ sind noch die Schreibweisen $2^{M}$ und $\mathrm {Pot} (M)$ gebräuchlich.

Einfach ausgedrückt: Die Potenzmenge ist die Menge aller möglichen Kombinationen der einzelnen Elemente einer Menge. Im vorherigen Kapitel wurde bereits die Teilmenge erläutert. Die Potenzmenge umfasst alle möglichen Teilmengen, die sich aus den Elementen von $M$ bilden lassen. Dazu zählt auch die leere Menge $\varnothing$ .

Definition (Potenzmenge)

Die Potenzmenge ${\mathcal {P}}(M)$ einer Menge $M$ ist die Menge aller Teilmengen dieser Menge:

{\mathcal {P}}(M):=\{U\,|\,U\subseteq M\}

Hinweis

Es ist ${\mathcal {P}}(\varnothing )=\{\varnothing \}$ , was man nicht mit der leeren Menge $\varnothing$ verwechseln darf. $\{\varnothing \}$ ist die einelementige Menge, die die leere Menge als einziges Element enthält.

Beispiele

Wenden wir die Definition nun in einem Beispiel an. Gegeben sei die Menge $M$ folgender Instrumente:

M=\{{\text{Geige, Klavier}}\}

$M$ besitzt zwei Elemente. Damit kommen als Teilmengen von $M$ nur solche Mengen infrage, die entweder null, eins oder zwei Elemente enthalten. Insgesamt wirst du für $M$ folgende vier Teilmengen finden:

Die leere Menge ist die einzige Teilmenge von $M$ ohne Elemente: ${\color {RubineRed}\varnothing }\subseteq \{{\text{Geige, Klavier}}\}$ .
Die zwei einelementigen Teilmengen von $M$ $M$ sind $\{{\text{Geige}}\}$ $\{{\text{Geige}}\}$ und $\{{\text{Klavier}}\}$ $\{{\text{Klavier}}\}$ :
1. ${\color {Fuchsia}\{{\text{Geige}}\}}\subseteq \{{\text{Geige, Klavier}}\}$
2. ${\color {Blue}\{{\text{Klavier}}\}}\subseteq \{{\text{Geige, Klavier}}\}$
Als einzige zweielementige Teilmenge von $M$ kommt die Menge selbst infrage: ${\color {OliveGreen}\{{\text{Geige, Klavier}}\}}\subseteq \{{\text{Geige, Klavier}}\}$

Alle vier Teilmengen können wir nun in die Potenzmenge ${\mathcal {P}}(M)$ zusammenfassen:

{\mathcal {P}}(\{{\text{Geige, Klavier}}\})=\{\ {\color {RubineRed}\varnothing },\ {\color {Fuchsia}\{{\text{Geige}}\}},\ {\color {Blue}\{{\text{Klavier}}\}},\ {\color {OliveGreen}\{{\text{Geige, Klavier}}\}}\ \}

Weitere Beispiele sind:

Beispiel (Potenzmenge)

${\mathcal {P}}(\{1,\,2\})=\{\ \varnothing ,\ \{1\},\ \{2\},\ \{1,\,2\}\ \}$
${\mathcal {P}}(\{a\})=\{\ \varnothing ,\,\{a\}\ \}$
${\mathcal {P}}(\emptyset )=\{\,\varnothing \,\}$

In der folgenden Animation ist die Erstellung der Potenzmenge ${\mathcal {P}}(\{x,\,y,\,z\})$ dargestellt:

Eigenschaften und Verständnisfragen

Wenn du dir die obigen Beispiele anschaust, dann ist die Anzahl der Elemente der bisherigen Potenzmengen stets eine Potenz von $2$ . Dies ist nicht verwunderlich, denn es gilt allgemein:

Satz (Größe der Potenzmenge einer endlichen Menge)

Sei $M$ eine beliebige endliche Menge mit $m$ Elementen. Dann hat die Potenzmenge ${\mathcal {P}}(M)$ genau $2^{m}$ Elemente.

Beweis (Größe der Potenzmenge einer endlichen Menge)

Um eine Teilmenge $U\subseteq M$ zu bilden, ist für jedes der $m$ Elemente von $M$ zu entscheiden, ob es zur Teilmenge $U$ gehört oder nicht. Daher gibt es dafür genau $\underbrace {2\cdot 2\cdot \dotsc \cdot 2} _{insgesamt\,m\,Mal}=2^{m}$ Möglichkeiten.

Bei dem obigen Instrumentenbeispiel ist beispielsweise $m=2$ . Damit muss die Potenzmenge $2^{m}=2^{2}=4$ Elemente besitzen. Die Beispielmenge $\{x,y,z\}$ hat drei Elemente und acht Teilmengen (x, y und z seien alle verschieden).

Verständnisfrage: Wie sehen folgende Potenzmengen aus? Wie viele Elemente besitzen die Potenzmengen?

${\mathcal {P}}(\{1\})$
${\mathcal {P}}(\{a,b\})$
${\mathcal {P}}(\varnothing )$

Antwort:

${\mathcal {P}}(\{1\})=\{\,\varnothing ,\,\{1\}\,\}$ , die Potenzmenge besitzt zwei Elemente.
${\mathcal {P}}(\{a,b\})=\{\,\varnothing ,\,\{a\},\,\{b\},\,\{a,b\}\,\}$ , die Potenzmenge besitzt vier Elemente.
${\mathcal {P}}(\varnothing )=\{\,\varnothing \,\}$ , die Potenzmenge besitzt ein Element.

Verständnisfrage: Welche der folgenden Aussageformen sind für alle Mengen $M$ erfüllt?

$M\in {\mathcal {P}}(M)$
$M\subseteq {\mathcal {P}}(M)$
$\{M\}\in {\mathcal {P}}(M)$
$\{M\}\subseteq {\mathcal {P}}(M)$
$\varnothing \in {\mathcal {P}}(M)$
$\varnothing \subseteq {\mathcal {P}}(M)$

Antworten:

Allgemeingültige Aussageform
Nicht allgemeingültige Aussageform
Nicht allgemeingültige Aussageform
Allgemeingültige Aussageform
Allgemeingültige Aussageform
Allgemeingültige Aussageform

Begründungen für die Antworten:

Für jede Menge $M$ ist $M\subseteq M$ . Jede Menge $M$ ist also eine Teilmenge von sich selbst. Damit ist nach Definition auch stets $M\in {\mathcal {P}}(M)$ .
Nimm als Gegenbeispiel $M=\{1\}$ . Es ist ${\mathcal {P}}(\{1\})$ die zweielementige Menge $\{\varnothing ,\{1\}\}$ . Nun ist genau dann $\{1\}\subseteq {\mathcal {P}}(M)$ , wenn $1$ ein Element von ${\mathcal {P}}(M)$ ist. Es ist zwar $1\in M$ aber $1\notin \{\emptyset ,\{1\}\}$ . Die Potenzmenge ${\mathcal {P}}(M)$ besteht nämlich nur aus den beiden Mengen $\varnothing$ und $\{1\}$ , die beide ungleich $1$ sind (beachte $1\neq \{1\}$ . Also kann $\{1\}$ keine Teilmenge von ${\mathcal {P}}(\{1\})$ sein. Zwar ist jede Menge Teilmenge von sich selbst, aber nicht jede Menge ist Teilmenge seiner Potenzmenge.
Nimm als Gegenbeispiel $M=\varnothing$ . Es ist ${\mathcal {P}}(\varnothing )=\{\varnothing \}$ . Die leere Menge $\varnothing$ ist also das einzige Element von ${\mathcal {P}}(M)$ . Damit ist aber $\{\varnothing \}$ (die Menge der leeren Menge) kein Element von ${\mathcal {P}}(M)$ .
Es ist genau dann $\{M\}\subseteq {\mathcal {P}}(M)$ , wenn $M\in {\mathcal {P}}(M)$ ist. Wir haben bereits gesehen, dass $M$ stets Element von seiner Potenzmenge ${\mathcal {P}}(M)$ ist. Damit ist die Aussageform allgemeingültig.
Es ist $\varnothing \subseteq M$ für jede Menge $M$ . Demnach ist auch $\varnothing \in {\mathcal {P}}(M)$ für alle Mengen $M$ .
Die leere Menge ist Teilmenge von jeder Menge. Da auch ${\mathcal {P}}(M)$ eine Menge ist, ist auch $\varnothing \subseteq {\mathcal {P}}(M)$ .

Verständnisfrage: Wie sieht die Menge ${\mathcal {P}}({\mathcal {P}}(\varnothing ))$ aus?

Die leere Menge ist die einzige Teilmenge der leeren Menge und deswegen ist ${\mathcal {P}}(\varnothing )=\{\varnothing \}$ . Die einelementige Menge $\{\varnothing \}$ hat die zwei Teilmengen $\varnothing$ und $\{\varnothing \}$ . Also ist ${\mathcal {P}}({\mathcal {P}}(\varnothing ))=\{\,\varnothing ,\,\{\varnothing \}\,\}$ .

Verständnisfrage: Wie viele Elemente besitzt die Menge ${\mathcal {P}}({\mathcal {P}}({\mathcal {P}}(\varnothing )))$ ?

Um die Anzahl der Elemente zu bestehen, können wir schrittweise vorgehen:

$\varnothing$ besitzt null Elemente. Damit besitzt ${\mathcal {P}}(\varnothing )=2^{0}=1$ Element.
${\mathcal {P}}({\mathcal {P}}(\varnothing ))$ besitzt dann $2^{1}=2$ Elemente.
${\mathcal {P}}({\mathcal {P}}({\mathcal {P}}(\varnothing )))$ besitzt dann $2^{2}=4$ Elemente.

Die Menge besitzt also vier Elemente.

Leere Menge

Mathe für Nicht-Freaks: Leere Menge

Verknüpfungen zwischen Mengen

Was sind Mengenverknüpfungen? (Video vom Podcast The Wicked Mu)

Einleitendes Beispiel

Symmetrische Differenz

Stelle dir vor, du hast eine Grundmenge $M$ gegeben:

In dieser Grundmenge gibt es eine Menge $A$ :

Und eine Menge $B$ :

Beide Mengen haben teilweise gemeinsame Elemente, es gibt aber auch Objekte, die nur in einer der beiden Mengen enthalten sind. Insgesamt ergibt sich also folgendes Bild:

Stelle dir nun vor, wir möchten die Menge aller Objekte beschreiben, die Elemente genau einer der Mengen $A$ und $B$ sind:

Diese Menge wird symmetrische Differenz der Mengen $A$ und $B$ genannt. Man schreibt für diese symmetrische Differenz $A\,\triangle \,B$ . Hier ist $\triangle$ eine Verknüpfung zwischen zwei Mengen. Der Operator $\triangle$ verknüpft nämlich zwei Mengen $A$ und $B$ zu der neuen Menge $A\,\triangle \,B$ . Die neue Menge $A\,\triangle \,B$ enthält dabei alle Objekte, die Elemente genau einer der Mengen $A$ und $B$ sind. Dass $\triangle$ eine Verknüpfung ist, ist analog dazu, dass die Addition + eine Verknüpfung ist. So wie die Addition + zwei Zahlen $a$ und $b$ zu einer neuen Zahl $a+b$ verknüpft, genauso verknüpft auch die symmetrische Differenz $\triangle$ zwei Mengen $A$ und $B$ zu einer neuen Menge $A\,\triangle \,B$ . Beispiel:

Genauso wie die Addition aus den beiden Zahlen $4$ und $7$ die Summe $4+7=11$ macht, verknüpft die symmetrische Differenz $\triangle$ die beiden Mengen $\{1,4\}$ und $\{4,7\}$ zur neuen Menge $\{1,4\}\,\triangle \,\{4,7\}=\{1,7\}$ .

Komplement

Schauen wir uns noch ein weiteres Beispiel an: Stelle dir vor, wir wollen alle Objekte der Grundmenge beschreiben, die nicht in $A$ enthalten sind:

Diese Menge aller Objekte der Grundmenge, die nicht in $A$ enthalten sind, wird Komplement von $A$ genannt. Für diese Menge schreibt man $A^{\rm {C}}$ . Während im obigen Beispiel $\triangle$ der Operator war, ist hier $\cdot ^{\rm {C}}$ der Operator. Im Unterschied zu $\triangle$ wirkt $\cdot ^{\rm {C}}$ auf nur einer Menge. Während nämlich $\triangle$ zwei Mengen $A$ und $B$ zu einer neuen Menge $A\,\triangle \,B$ verknüpft, nimmt $\cdot ^{\rm {C}}$ nur eine Menge $A$ und macht daraus die neue Menge $A^{C}$ .

Überblick zu allen Mengenverknüpfungen

So wie die symmetrische Differenz und das Komplement gibt es mehrere auf Mengen definierten Verknüpfungen. In der nachfolgenden Übersicht geben wir zunächst eine Übersicht über die wichtigsten Mengenverknüpfungen. In den nächsten Kapiteln werden wir diese dann einzeln vorstellen.

Name der Verknüpfung	Schreibweise	Aussprache	Definition	Erklärung
Durchschnitt	$A\cap B$	„ $A$ geschnitten $B$ “	$A\cap B:=\{x\,\|\,x\in A\land x\in B\}$	Die Menge aller Objekte, die sowohl in der Menge $A$ als auch in der Menge $B$ enthalten sind
Vereinigung	$A\cup B$	„ $A$ vereinigt $B$ “	$A\cup B:=\{x\,\|\,x\in A\lor x\in B\}$	Die Menge aller Objekte, die in der Menge $A$ oder in der Menge $B$ enthalten sind (hier ist „oder“ als „und/oder“, also als einschließendes Oder, zu lesen)
Differenz	$A\setminus B$	„ $A$ ohne $B$ “	$A\setminus B:=\{x\,\|\,x\in A\land x\notin B\}$	Die Menge aller Objekte, die in der Menge $A$ enthalten sind und keine Elemente der Menge $B$ sind
Symmetrische Differenz	$A\,\triangle \,B$	„symmetrische Differenz von $A$ und $B$ “	$A\,\triangle \,B:=\{x\,\|\,x\in A\,{\dot {\lor }}\,x\in B\}$	Die Menge aller Objekte, die in genau einer der Mengen $A$ und $B$ enthalten sind, also entweder in A oder in B, aber nicht in beiden
Komplement	$A^{\rm {C}}$	„Komplement von $A$ “	$A^{\rm {C}}:=\{x\,\|\,x\notin A\}$	Die Menge aller Objekte (der Grundmenge), die keine Elemente von $A$ sind

Tupel und geordnetes Paar

Geordnetes Paar

Geordnete Paare begegnen uns bereits in der Schule: sie werden benötigt, um Koordinaten anzugeben, zum Beispiel beim "Schiffe versenken". Um ein Feld auf dem 10 mal 10 großen Spielfeld zu bestimmen, werden zwei Angaben benötigt: die Zeile und die Spalte. Zeilen sind hier mit einem großen Buchstaben $A,B,C,\dots$ benannt, Spalten haben Nummern $1,2,3,\dots$ . Wird vom Gegner das Feld $(H,10)$ aufgerufen, ist das Dreier-Schiff versenkt:

Ein anderes Beispiel ist das zweidimensionale Koordinatensystem für die reellen Zahlen, in dem die Punkte durch ein Paar reeller Zahlen $(x,y)$ angegeben werden. Dabei ist die Reihenfolge der Koordinaten wichtig! Der Punkt $(-3,1)$ ist ein anderer als der Punkt $(1,-3)$ . Es dürfen auch beide Koordinaten gleich sein, das ist beispielsweise beim Ursprung $(0,0)$ des Koordinatensystems der Fall.

Definition (Geordnetes Paar)

$(a,b)$ bezeichnet das geordnete Paar aus den Objekten $a$ und $b$ . Dabei ist $a$ die erste oder linke Komponente, $b$ die zweite oder rechte Komponente. Zwei geordnete Paare sind sind nur dann gleich, wenn beide Komponenten gleich sind:

(a,b)=(c,d)\iff a=c\land b=d

Für geordnete Paare werden oft auch spitze Klammern $\langle a,b\rangle$ oder andere besondere Klammern verwendet.

Warnung

Das geordnete Paar $(a,b)$ darf nicht mit der Zweiermenge $\{a,b\}$ verwechselt werden! Während bei geordneten Paaren die Reihenfolge relevant ist und beispielsweise $(1,2)\neq (2,1)$ , spielt die Reihenfolge in der Menge keine Rolle. Hier ist $\{1,2\}=\{2,1\}$ .

Verständnisfrage: Welche Bedingungen müssen für $x$ und $y$ gelten, damit folgende Paare gleich sind?

$(1,2)$ und $(x,y)$
$(x,y)$ und $(y,x)$
$(x,x)$ und $(1,2)$

Antwort:

Es ist $(1,2)=(x,y)$ genau dann, wenn $x=1$ und $y=2$ .
Es ist $(x,y)=(y,x)$ genau dann, wenn $x=y$ .
Es ist $(x,x)\neq (1,2)$ , da anderenfalls $x=1$ und $x=2$ gelten müsste.

n-Tupel

Der Begriff des geordneten Paares lässt sich verallgemeinern. Werden drei Komponenten betrachtet, erhält man Tripel, mit vier Komponenten Quadrupel, usw. Allgemein kann man zu jeder natürlichen Zahl $n\geq 2$ sogenannte $n$ -Tupel betrachten. Sie sollen die folgende Bedingung erfüllen:

Zwei $n$ -Tupel sind nur dann gleich, wenn sie komponentenweise gleich sind, formalisiert:

(x_{1},x_{2},\dots ,x_{n})=(y_{1},y_{2},\dots ,y_{n})\Leftrightarrow \forall k\leq n:x_{k}=y_{k}

n-Tupel lassen sich mit Hilfe von geordneten Paaren darstellen. Für 3-Tupel setzt man $(x_{1},x_{2},x_{3}):=((x_{1},x_{2}),x_{3})$ , für 4-Tupel $(x_{1},x_{2},x_{3},x_{4}):=(((x_{1},x_{2}),x_{3}),x_{4})$ , usw. So kann man schrittweise für alle natürlichen Zahlen n-Tupel erklären. Sind n-Tupel $(x_{1},x_{2},\dots ,x_{n})$ definiert, erzeugt man (n+1)-Tupel durch: $(x_{1},x_{2},\dots ,x_{n},x_{n+1}):=((x_{1},x_{2},\dots ,x_{n}),x_{n+1})$ . Diese Art der Definition wird rekursiv genannt:

Definition (Rekursive Definition der $n$ -Tupel ( $n\geq 2$ ))

Rekursionsanfang: Für $n=2$ sei das 2-Tupel $(x_{1},x_{2})$ das geordnete Paar.

Rekursionsschritt: Seien $n$ -Tupel bereits definiert. Dann definieren wir $(n+1)$ -Tupel durch:

$(x_{1},x_{2},\dots ,x_{n},x_{n+1}):=((x_{1},x_{2},\dots ,x_{n}),x_{n+1})$

Wir müssen nun nachweisen, dass diese Definition tatsächlich das leistet, was wir von $n$ -Tupeln erwarten. Nämlich das zwei $n$ -Tupel nur dann gleich sind, wenn alle Komponenten des Tupels gleich sind.

Satz

Für zwei $n$ -Tupel gilt:

(x_{1},x_{2},\dots ,x_{n})=(y_{1},y_{2},\dots ,y_{n})\Leftrightarrow \forall k\leq n:x_{k}=y_{k}

Beweis

Induktion über $n$ :

Induktionsanfang: Für $n=2$ folgt die Behauptung aus der Definition des geordneten Paares.

Induktionsschritt: Die Behauptung gelte für $n$ . Dann folgt für $n+1$ :

{\begin{aligned}&(x_{1},x_{2},\dots ,x_{n},x_{n+1})=(y_{1},y_{2},\dots ,y_{n},y_{n+1})\\[0.3em]&{\color {BurntOrange}\left\updownarrow \ {\mathsf {Definition\;des\;Tupels}}\right.}\\[0.3em]\Leftrightarrow \;&((x_{1},x_{2},\dots ,x_{n}),x_{n+1})=((y_{1},y_{2},\dots ,y_{n}),y_{n+1})\\[0.3em]&{\color {BurntOrange}\left\updownarrow \ {\mathsf {Gleichheit\;des\;geordneten\;Paares}}\right.}\\[0.3em]\Leftrightarrow \;&(x_{1},x_{2},\dots ,x_{n})=(y_{1},y_{2},\dots ,y_{n}){\mathsf {\;und\;}}x_{n+1}=y_{n+1}\\[0.3em]&{\color {BurntOrange}\left\updownarrow \ {\mathsf {Induktionsvoraussetzung}}\right.}\\[0.3em]\Leftrightarrow \;&\forall k\leq n:x_{k}=y_{k}{\mathsf {\;und\;}}x_{n+1}=y_{n+1}\\[0.3em]&{\color {BurntOrange}\left\updownarrow \ {\mathsf {logische\;Umformung}}\right.}\\[0.3em]\Leftrightarrow \;&\forall k\leq n+1:x_{k}=y_{k}\end{aligned}}

Beweisende ✔

Alternative Definition der Tupel

Die Definition der $n$ -Tupels mit Hilfe des geordneten Paares hat zur Folge, dass jedes $n$ -Tupel ein geordnetes Paar ist. Für die meisten Zwecke ist das nicht störend und die gesamte elementare Theorie der Relationen und Funktionen kann darauf aufgebaut werden. Es gibt aber auch eine schärfere Tupel-Definition, die eine zusätzliche Forderung an die Gleichheit von Tupeln stellt:

Definition (Alternative Definition der Gleichheit von Tupeln)

Zwei Tupel beliebiger Stellenzahl sind dann und nur dann gleich, wenn sie

dieselbe Stellenzahl haben und
komponentenweise gleich sind.

Formalisiert:

$(x_{1},x_{2},\dots ,x_{n})=(y_{1},y_{2},\dots ,x_{m})\Leftrightarrow n=m\land \forall k\leq n:x_{k}=y_{k}$

Kartesisches Produkt

Das kartesische Produkt ist eine besondere Verknüpfung zwischen zwei Mengen. Die Schreibweise für das kartesische Produkt zwischen den Mengen $A$ und $B$ ist $A\times B$ (ausgesprochen: „ $A$ kreuz $B$ “). Das kartesische Produkt $A\times B$ ist die Menge aller geordneten Paare $(a,b)$ mit $a\in A$ und $b\in B$ . So ist beispielsweise:

{\begin{aligned}\{1,\,2\}\times \{3,\,4,\,5\}=\{&(1,\,3),\,(1,\,4),\,(1,\,5),\,\\&(2,\,3),\,(2,\,4),\,(2,\,5)\}\end{aligned}}

Beispiele/Übungsaufgabe: Schreibe folgende kartesische Produkte aus.

$\{1,2,3\}\times \{1,2,3\}$
$\{x\}\times \{y\}$
$\varnothing \times \{1,2,3\}$

Antwort:

${\begin{aligned}\{1,2,3\}\times \{1,2,3\}=\{&(1,1),\,(1,2),\,(1,3),\,\\&(2,1),\,(2,2),\,(2,3),\,\\&(3,1),\,(3,2),\,(3,3)\}\end{aligned}}$
$\{x\}\times \{y\}=\{(x,y)\}$
$\varnothing \times \{1,2,3\}=\varnothing$

Definition (kartesisches Produkt)

Das kartesische Produkt $A\times B$ zweier Mengen $A$ und $B$ ist die Menge aller geordneten Paare $(a,b)$ wobei $a$ ein Element der Menge $A$ und $b$ ein Element der Menge $B$ ist:

A\times B:=\{(x,y)\,|\,x\in A\land y\in B\}

Verständnisfrage: Sei $A$ eine endliche Menge mit $a$ Elementen und $B$ eine endliche Menge mit $b$ Elementen. Wie viele Elemente enthält die Menge $A\times B$ ?

Seien $x_{1}$ bis $x_{a}$ die Elemente der Menge $A$ und $y_{1}$ bis $y_{b}$ die Elemente der Menge $B$ . Dann sieht $A\times B$ so aus:

{\begin{array}{lc}\underbrace {\{x_{1},\,x_{2},\,\ldots ,\,x_{a}\}} _{=\ A}\times \underbrace {\{y_{1},\,y_{2},\,\ldots ,\,y_{b}\}} _{=\ B}=\{&(x_{1},y_{1}),\,(x_{1},y_{2}),\,\dots ,\,(x_{1},y_{b}),\\&(x_{2},y_{1}),\,(x_{2},y_{2}),\,\dots ;\,(x_{2},y_{b}),\\&\vdots \\&(x_{a},y_{1}),\,(x_{a},y_{2}),\,\dots ,\,(x_{a},y_{b})\}\end{array}}

Man sieht, dass es für jedes $x\in A$ genau $b$ verschiedene $y\in B$ mit $(x,y)\in A\times B$ gibt. Damit enthält $A\times B$ genau $a\cdot b$ verschiedene geordnete Paare als Elemente.

Man kann auch das kartesische Produkt von mehr als zwei Mengen bilden. Analog zum Fall von zwei Mengen ist das kartesische Produkt $A\times B\times C$ der drei Mengen $A$ , $B$ und $C$ gleich der Menge aller 3-Tupel $(a,b,c)$ mit $a\in A$ , $b\in B$ und $c\in C$ :

A\times B\times C:=\{(a,b,c)\,|\,a\in A,\,b\in B,\,c\in C\}

Verständnisfrage: Was ist $\{1,\,2\}\times \{3,\,4\}\times \{5,\,6\}$ ?

${\begin{aligned}\{1,\,2\}\times \{3,\,4\}\times \{5,\,6\}=\{&(1,\,3,\,5);\,(1,\,3,\,6);\\[0.3em]&(1,\,4,\,5),\,(1,\,4,\,6),\\[0.3em]&(2,\,3,\,5),\,(2,\,3,\,6),\\[0.3em]&(2,\,4,\,5),\,(2,\,4,\,6)\}\end{aligned}}$

Allgemein ist das kartesische Produkt $A_{1}\times A_{2}\times \dots \times A_{n}$ der $n$ Mengen $A_{1}$ bis $A_{n}$ die Menge aller n-Tupel $(a_{1},\,a_{2},\,\dots ,\,a_{n})$ mit $a_{1}\in A_{1}$ , $a_{2}\in A_{2}$ und so weiter bis $a_{n}\in A_{n}$ :

A_{1}\times A_{2}\times \dots \times A_{n}:=\{(a_{1},\,a_{2},\,\dots ,\,a_{n})\,|\,a_{1}\in A_{1}\land a_{2}\in A_{2}\land \dots \land a_{n}\in A_{n}\}

Für kartesische Produkte von Mengen mit sich selber gibt es eine abkürzende Schreibweise: Es ist $M^{2}:=M\times M$ , $M^{3}:=M\times M\times M$ und so weiter. Allgemein ist

M^{n}:=\underbrace {M\times M\times \dots \times M} _{n{\text{-mal}}}

Verständnisfrage: Was ist $\{1,\,2\}^{3}$ ?

${\begin{aligned}\{1,\,2\}^{3}=\{1,\,2\}\times \{1,\,2\}\times \{1,\,2\}=\{&(1,\,1,\,1),\,(1,\,1,\,2),\\[0.3em]&(1,\,2,\,1),\,(1,\,2,\,2),\\[0.3em]&(2,\,1,\,1),\,(2,\,1,\,2),\\[0.3em]&(2,\,2,\,1),\,(2,\,2,\,2)\}\end{aligned}}$

Produktschreibweise

Für das kartesische Produkt $A_{1}\times A_{2}\times \dots \times A_{n}$ von mehreren Mengen, gibt es auch die kompaktere Schreibweise $\prod _{i=1}^{n}A_{i}$ . Diese ist definiert durch

\prod _{i=1}^{n}A_{i}:=A_{1}\times A_{2}\times \dots \times A_{n}

Du siehst, dass die obige Schreibweise ähnlich dem Produkt $\prod _{i=1}^{n}a_{i}$ reeller Zahlen ist, welches du vielleicht schon aus der Schule kennst. Der Unterschied ist der, dass hier anstatt Zahlen Mengen verknüpft werden und die Verknüpfung nicht die Multiplikation sondern das kartesische Produkt ist.

Relation

Wie können Eigenschaften und Beziehungen modelliert werden?

Im vorherigem Kapitel haben wir das Konzept der Menge kennengelernt, mit der Objekte zu einem Ganzen zusammengefasst werden können. In diesem Kapitel werden wir uns damit beschäftigen, wie Eigenschaften von und Beziehungen zwischen Objekten modelliert werden können. Diese Eigenschaften von bzw. Beziehungen zwischen Objekten werden Relationen genannt. Hierzu werden wir uns zunächst einige Beispiele anschauen, um dann das Konzept der Relationen einzuführen.

Modellierung von Eigenschaften

Sei $M$ die Menge aller zur Zeit lebenden Menschen. Wir wollen nun das (biologische) Geschlecht der Menschen beschreiben. Dabei soll angenommen werden, dass jeder Mensch entweder männlich oder weiblich aber nicht beides gleichzeitig ist. Wie können wir das Geschlecht eines Menschen mit Hilfe von Mengen beschreiben?

Eine in der Mathematik häufig benutzte Möglichkeit ist folgende: Wir definieren eine neue Menge $W$ , die genau all diejenigen Menschen enthält, die wir als weiblich bezeichnen wollen. Die Menge $W$ ist also definiert durch $W=\{x\in M:x{\text{ ist weiblich}}\}$ . Damit können wir $x\in W$ schreiben, um auszudrücken, dass $x$ weiblich ist.

Ein Vorteil dieser Modellierung ist der, dass wir Mengenverknüpfungen verwenden können, um neue Eigenschaften zu beschreiben. So ist $W^{\rm {C}}=M\setminus W$ die Menge aller männlichen Menschen, da wir davon ausgehen, dass jeder nicht weibliche Mensch männlich ist. Damit können wir $m\in W^{\rm {C}}$ für „ $m$ ist männlich“ schreiben.

Wir fassen zusammen: Wenn wir eine Grundmenge $G$ haben und in ihr eine Eigenschaft beschreiben wollen, so können wir eine neue Menge $E\subseteq G$ definieren, die genau all diejenigen Objekte aus $G$ enthält, die diese Eigenschaft besitzen.

Modellierung von zweistelligen Beziehungen

Sei wieder $M$ die Menge aller Menschen, die zur Zeit leben. Wie kann nun die Liebesbeziehung zwischen zwei Menschen beschrieben werden? Wie können wir also modellieren, dass ein Mensch $x$ einen anderen Menschen $y$ liebt?

Auch hierfür führen wir eine neue Menge ein: Die Menge $L$ soll genau all diejenigen Paare $(x,y)$ von Menschen enthalten, für die gilt, dass $x$ die Person $y$ liebt. Wir definieren damit $L=\{(x,y)\,|\,x{\text{ liebt }}y\}$ . So können wir $(m,n)\in L$ schreiben, um auszudrücken, dass $m$ den Menschen $n$ liebt. Damit haben wir eine Modellierung für die Liebesbeziehung gefunden.

Rechts siehst du ein Beispiel für eine solche Modellierung. Du siehst, dass Kristina und Max sowie Julia und Anna ein Liebespärchen sind. Hannes ist zwar in Max verliebt, jedoch wird seine Liebe nicht erwidert. Stefan liebt keine Person der Grundmenge und wird auch von keiner anderen Person geliebt.

Verständnisfrage: Wieso werden für die Beziehung „ $x$ liebt $y$ “ Paare $(x,y)$ und nicht Mengen $\{x,y\}$ verwendet?

Bekanntermaßen ist bei der aufzählenden Mengenschreibweise die Reihenfolge der Objekte irrelevant. So ist $\{x,y\}=\{y,x\}$ . Jedoch ist die Beziehung „ $x$ liebt $y$ “ zwischen den Personen $x$ und $y$ eine andere Beziehung als „ $y$ liebt $x$ “. Dementsprechend können Mengen der Form $\{x,y\}$ nicht zur Beschreibung der Liebesbeziehung herangezogen werden.

Im Gegensatz zu Mengen besitzen Paare $(x,y)$ die notwendige Eigenschaft, dass die Reihenfolge ihrer Komponenten für die Identitätsbeziehung relevant ist. So ist $(a,b)=(c,d)$ dann und nur dann, wenn $a=c$ und $b=d$ ist.

Zusammenfassung: Um eine zweistellige Beziehung in einer Grundmenge $G$ zu modellieren, können wir eine neue Menge $B$ definieren, die all diejenigen Paare $(x,y)$ der Objekte $x$ und $y$ aus $G$ enthält, die in Beziehung zueinander stehen. Damit ist $B\subseteq G\times G$ .

Mit der Liebesbeziehung haben wir ein Beispiel für eine Beziehung von Objekten innerhalb einer Menge kennen gelernt. Wie können wir Beziehungen von Objekten unterschiedlicher Mengen modellieren?

Nehmen wir hierzu die Beziehung „ $x$ studiert $y$ “. Dabei sei $M$ die Menge der Menschen und $F$ die Menge der Studienfächer. Um nun die Beziehung „ $x$ studiert $y$ “ zu beschreiben, definieren wir eine neue Menge $S$ derjenigen Paare $(x,y)$ mit $x\in M$ und $y\in F$ , so dass der Mensch $x$ das Fach $y$ studiert. So wird die Beziehung „ $x$ studiert $y$ “ modelliert durch die Menge $S=\{(x,y)\,|\,x{\text{ studiert }}y\}$ . Es ist damit $S\subseteq M\times F$ .

Auf der linken Seite siehst du ein konkretes Beispiel für diese Art der Modellierung. Hier sind Hannes, Anna und Julia Studenten, während Max nicht studiert. Hannes studiert Geografie und Anna und Julia studieren Mathematik. Das Studienfach Kommunikationswissenschaften wird in unserem Beispiel von niemandem studiert.

Hinweis

In unseren Beispielen gehen wir davon aus, dass immer eindeutig festgestellt werden kann, ob eine Person eine andere Person liebt beziehungsweise ob eine Person ein konkretes Fach studiert. In der Realität sind diese Fragen aber selten eindeutig beantwortbar. Auch haben wir nicht spezifiziert, welche Art von Liebe wir meinen. Zählt beispielsweise die Liebe von Eltern zu ihren Kindern auch dazu?

Obige Relationen stellen nur einführende Beispiele dar. Übersehe bitte die Unzulänglichkeiten, die diese Relationen haben.

Modellierung von dreistelligen Beziehungen

Zum Schluss schauen wir uns ein Beispiel für eine Beziehung an, in der drei Objekte involviert sind. Ein Beispiel für eine solche Beziehung ist die Relation „ $x$ lernt $y$ beim Lehrer $z$ “. Dabei sind $x$ und $z$ Menschen der Menge $M$ und $y$ ein Schulfach der Menge $F$ .

Diese Beziehung beschreiben wir über ein 3-Tupel. Wir definieren eine neue Menge $R$ von 3er-Tupeln $(x,y,z)$ mit $x,z\in M$ und $y\in F$ für die gilt, dass der Mensch $x$ beim Lehrer $z$ das Schulfach $y$ lernt. Es ist also $R=\{(x,y,z)\,|\,x{\text{ lernt }}y{\text{ beim Lehrer }}z\}$ .

Auf der rechten Seite siehst du eine Abbildung, die diese Modellierung veranschaulicht. Hier ist Anna Lehrerin der Fächer Mathematik und Geografie. Julia ist Schülerin im Mathematikunterricht und Hannes Schüler im Geografieunterricht bei Anna. Max ist weder Schüler noch Lehrer. Außerdem gibt es in unserem Beispiel weder Schüler noch Lehrer für das Fach Kunst.

Definitionen

Aus den obigen Beispielen lässt sich ein Prinzip ablesen, wie Relationen in der Mathematik modelliert werden. Sei dazu $R$ eine $n$ -stellige Relation zwischen den Mengen $A_{1}$ bis $A_{n}$ . Dies bedeutet, dass $R$ eine Relation ist, die zwischen $n$ Objekten $a_{1}$ bis $a_{n}$ besteht und dass $a_{1}\in A_{1}$ , $a_{2}\in A_{2}$ , …, $a_{n}\in A_{n}$ ist. Wie wird $R$ in der Mathematik modelliert?

$R$ wird modelliert als Menge von $n$ -Tupeln $(a_{1},a_{2},\ldots ,a_{n})$ der Objekte $a_{1}$ bis $a_{n}$ mit $a_{1}\in A_{1}$ , $a_{2}\in A_{2}$ , …, $a_{n}\in A_{n}$ . Dabei enthält $R$ genau diejenigen $n$ -Tupel von Objekten, die in Relation zueinander stehen. Somit ist $R$ eine Teilmenge des kartesischen Produkts $A_{1}\times A_{2}\times \dots \times A_{n}$ . Zur Erinnerung: $A_{1}\times A_{2}\times \dots \times A_{n}$ ist die Menge aller $n$ -Tupel $(a_{1},a_{2},\ldots ,a_{n})$ mit $a_{1}\in A_{1}$ , $a_{2}\in A_{2}$ , …, $a_{n}\in A_{n}$ . Die Relation $R$ ist daher eine Teilmenge von $A_{1}\times A_{2}\times \dots \times A_{n}$ .

Definition (Relation)

Eine $n$ -stellige Relation $R$ zwischen Objekten der Mengen $A_{1}$ bis $A_{n}$ ist eine Teilmenge des kartesischen Produkts $A_{1}\times A_{2}\times \dots \times A_{n}$ .

Diese Art der Relation kann nicht die Qualität einer Relation beschreiben. Entweder stehen bestimmte Objekte in Relation zueinander oder nicht, aber sie können nicht mehr oder weniger in Relation zueinander stehen. Im Beispiel der Liebesbeziehung bedeutet dies, dass entweder $x$ die Person $y$ liebt oder nicht. Jedoch können wir mit Hilfe der obigen Definition nicht beschreiben, dass $x$ die Person $y$ mehr liebt als die Person $z$ oder dass $x$ die Person $y$ mag, aber nicht liebt.

Die häufigste Art der Relation ist die binäre Relation:

Definition (binäre Relation)

Eine binäre Relation ist eine zweistellige Relation. Eine binäre Relation ist damit eine Beziehung, die zwischen Objekten zweier Mengen $A$ und $B$ existiert und damit eine Teilmenge des kartesischen Produkts $A\times B$ .

Für eine binäre Relation $R\subseteq A\times B$ gibt es eine eigene Schreibweise für die Relation zwischen zwei Objekten $a$ und $b$ . Um auszudrücken, dass $a$ mit $b$ in Relation steht, kann man neben $(a,b)\in R$ auch $a\;R\;b$ schreiben. Ein Beispiel hierfür ist die Relation ${<}:=\{(x,y)\in \mathbb {R} ^{2}\,|\,x{\text{ ist kleiner als }}y\}$ , die „ $x$ ist kleiner als $y$ “-Relation auf den reellen Zahlen (hier ist „ $<$ “ das Zeichen für die Relation). Anstatt nun $(2,3)\in {<}$ zu schreiben (was bedeutet, dass 2 kleiner als 3 ist), kann man auch $2<3$ schreiben, wie du es bereits aus der Schule kennst.

Frage: Sei $M=\{1,\,2,\,3,\,4\}$ . Wie sehen folgende Relationen als Mengen von Tupeln aus?

$R_{1}$ : „ $x$ ist eine gerade Zahl.“
$R_{2}$ : „ $x$ ist eine Quadratzahl.“
$R_{3}$ : „ $x$ ist kleiner als $y$ “
$R_{4}$ : „ $x$ ist ein Teiler von $y$ “ oder gleichwertig „die Division $y$ durch $x$ hinterlässt keinen Rest“
$R_{5}$ : „ $x^{2}+y^{2}=z^{2}$ “

Antwort:

${\begin{aligned}R_{1}&=\{x\in M\,|\,x{\text{ ist gerade}}\}\\&=\{2,\,4\}\end{aligned}}$
${\begin{aligned}R_{2}&=\{x\in M\,|\,x{\text{ ist eine Quadratzahl}}\}\\&=\{1,\,4\}\end{aligned}}$
${\begin{aligned}R_{3}&=\{(x,y)\in M\times M\,|\,x{\text{ ist kleiner als }}y\}\\&=\{(1,2);\,(1,3);\,(1,4);\,(2,3);\,(2,4);\,(3,4)\}\end{aligned}}$
${\begin{aligned}R_{4}&=\{(x,y)\in M\times M\,|\,x{\text{ ist ein Teiler von }}y\}\\&=\{(1,1);\,(1,2);\,(1,3);\,(1,4);\,(2,2);\,(2,4);\,(3,3);\,(4,4)\}\end{aligned}}$
${\begin{aligned}R_{5}&=\{(x,y,z)\in M\times M\times M\,|\,x^{2}+y^{2}=z^{2}\}\\&=\emptyset \end{aligned}}$

Binäre Relation

Binäre Relationen sind zweistellige Relationen, also Teilmengen des kartesischen Produkts $A\times B$ der Mengen $A$ und $B$ .

Homogene und heterogene Relationen

Eine binäre Relation $R\subseteq A\times B$ heißt homogen, wenn die Mengen $A$ und $B$ identisch sind. Im Fall $A\neq B$ nennt man die Relation $R\subseteq A\times B$ heterogen.

Homogene Relationen beschreiben damit Beziehungen innerhalb einer Menge und heterogene Relationen beschreiben Beziehungen von Objekten aus unterschiedlichen Mengen.

Verständnisfrage: Welche der folgenden Relationen ist homogen und welche sind heterogen?

„Die Person $x$ liebt die Person $y$ “
„Die natürliche Zahl $x$ ist kleiner als die rationale Zahl $y$ “
„Die natürliche Zahl $x$ teilt die natürliche Zahl $y$ “
„Die Personen $x$ und $y$ sind in derselben Klasse“
„Die Person $x$ studiert das Fach $y$ “

Antwort:

homogen
heterogen
homogen
homogen
heterogen

Darstellung endlicher binärer Relationen

Es gibt zwei wesentliche Möglichkeiten, binäre Relationen zwischen endlichen Mengen darzustellen: Pfeildiagramme und Relationsmatrizen. Diese möchten wir dir anhand der folgenden Relationen vorstellen:

heterogene Relation $R_{1}$ : „Der Fluss $x$ fließt im Land $y$ “, wobei $x$ ein Fluss der Menge $\{{\text{Nil, Elbe, Donau, Rhein}}\}$ und $y$ ein Land der Menge $\{{\text{Irland, Deutschland, Niederlande, Ukraine}}\}$ ist.
homogene Relation $R_{2}$ : „ $x$ ist ein Nachfolger von $y$ “ auf der Grundmenge $\{1,\,2,\,3,\,4\}$ .

Pfeildiagramm

Die erste Möglichkeit der Darstellung sind Pfeildiagramme. Hier werden alle Objekte, die in Relation zueinander stehen, durch Pfeile miteinander verbunden. So sieht die heterogene Relation $R_{1}$ „Der Fluss $x$ fließt im Land $y$ “ im Pfeildiagramm so aus:

Da die zweite Relation $R_{2}$ „ $x$ ist ein Nachfolger von $y$ “ homogen ist, kann hier auf die Darstellung zweier Mengen verzichtet werden:

Verständnisfrage: Erstelle die Pfeildiagramme für folgende binäre Relationen auf der Grundmenge $\{1,2,3,4\}$

$x$ ist größer als $y$
$x$ ist ein Teiler von $y$
$x$ ergibt bei Division mit 2 denselben Rest wie $y$

Relation „ $x$ ist größer als $y$ “
Relation „ $x$ ist ein Teiler von $y$ “
Relation „ $x$ ergibt bei Division mit 2 denselben Rest wie $y$ “

Relationsmatrix

Bei der Relationsmatrix wird eine Tabelle für die Relation aufgestellt. Hier wird in jeder Zelle eingetragen, ob das Objekt der aktuellen Spalte mit dem Objekt der aktuellen Zeile in Relation steht. Die Relation $R_{1}$ „Der Fluss $x$ fließt im Land $y$ “ sieht als Relationsmatrix so aus:

	Irland	Deutschland	Niederlande	Ukraine
Donau		X		X
Elbe		X
Nil
Rhein		X	X

Die Relationsmatrix der Relation $R_{2}$ „ $x$ ist ein Nachfolger von $y$ “ auf der Menge $\{1,2,3,4\}$ ist folgende:

	1	2	3	4
1
2	X
3		X
4			X

Die Hauptdiagonale in der Relationsmatrix zu einer homogenen Relation ist die Menge der Zellen, bei denen die Objekte der Spalte dieselben sind wie die Objekte der Zeile:

	1	2	3	$\dots$	n
1	Haupt-
2		dia-
3			gona-
$\vdots$				$\ddots$
n					le

Verständnisfrage: Erstelle die Relationsmatrizen für folgende binäre Relationen auf der Grundmenge $\{1,2,3,4\}$

$x$ ist größer als $y$
$x$ ist ein Teiler von $y$
$x$ ergibt bei Division mit 2 denselben Rest wie $y$

Relationsmatrix für die Relation „ $x$ ist größer als $y$ “ auf der Grundmenge $\{1,2,3,4\}$ :

	1	2	3	4
1
2	X
3	X	X
4	X	X	X

Relationsmatrix für die Relation „ $x$ ist ein Teiler von $y$ “ auf der Grundmenge $\{1,2,3,4\}$ :

	1	2	3	4
1	X	X	X	X
2		X		X
3			X
4				X

Relationsmatrix für die Relation „ $x$ ergibt bei Division mit 2 denselben Rest wie $y$ “ auf der Grundmenge $\{1,2,3,4\}$ :

	1	2	3	4
1	X		X
2		X		X
3	X		X
4		X		X

Wichtige Begriffe

Bildmenge

Wir betrachten nochmals die Relation $R_{1}$ „Der Fluss $x$ fließt im Land $y$ “. Wir möchten jetzt zu einem bestimmten Fluss alle Länder wissen, durch die er fließt. Für die Donau stellen wir beispielsweise fest, dass sie durch Deutschland und die Ukraine fließt. Anders ausgedrückt: Die Donau steht mit Deutschland und der Ukraine in Relation.

Wir können zu einem beliebigen Element $x$ aus der Grundmenge alle Elemente heraussuchen, die mit $x$ in Relation stehen. Diese Menge wird als Bildmenge oder als das Bild von $x$ bezeichnet. Für das Bild von $x$ unter der Relation $R$ schreibt man $xR$ . Der Ausdruck $xR$ bezeichnet also die Menge aller Elemente, die mit $x$ in Relation stehen. Er ist eigentlich recht intuitiv, denn $xR$ ist die Menge aller $y$ , die nach dem $xR$ stehen können, wo also $xRy$ eine wahre Aussage ist.

Du wirst vielleicht schon den Bildbegriff für Funktionen kennen, welcher die Menge aller Funktionswerte für eine gegebene Menge von Argumenten ist. Dies ist kein Zufall, denn Funktionen können als spezielle binäre Relationen aufgefasst werden (solche, bei dem es für jedes $x$ genau ein $y$ mit $xRy$ gibt). Der Begriff der Bildmenge für Relationen ist in diesem Fall mit der Bildmenge der Funktion identisch. Der Begriff des Bildes einer Relation ist damit eine Verallgemeinerung des Bildes von Funktionen.

Im Folgenden bezeichnet $R\subseteq A\times B$ eine binäre Relation zwischen den Mengen $A$ und $B$ .

Definition (Bildmenge eines Elements)

Zu einem $x\in A$ bezeichnet das Bild von $x$ unter $R$ die Menge aller $y\in B$ , die mit $x$ in Relation stehen:

xR:=\{y\in B\mid (x,y)\in R\}

Verständnisfrage: Was ist ${\text{Rhein}}\ R_{1}$ , also das Bild vom Rhein unter $R_{1}$

Es ist ${\text{Rhein}}\ R_{1}=\{{\text{Deutschland, Niederlande}}\}$ .

Verständnisfrage: Sei $xRy\Leftrightarrow x=y^{2}$ . Was ist $4R$ ?

Weil $4=2^{2}$ und $4=(-2)^{2}$ ist, ist $4R=\{2,\,-2\}$ .

Die obige Definition von Bild beschränkt sich auf einen einzigen Eingabewert. Es sollte auch möglich sein ein Bild für beliebig viele Elemente zu erhalten, also für eine Menge von Eingabewerten. Dazu suchen wir uns einfach alle Elemente heraus, die mindestens mit einem dieser Eingabewerten in Relation stehen. Wenn wir beispielsweise das Bild der Donau und des Rheins wissen wollen, dann ist dies die Menge $\{{\text{Deutschland, Ukraine, Niederlande}}\}$ . Deutschland steht sowohl mit der Donau und dem Rhein in Relation und gehört somit zur gesuchten Bildmenge. Die Ukraine steht mit der Donau in Relation, womit es auch Element der Bildmenge ist (es steht mit mindestens einem Eingabewert in Relation). Gleiches gilt für Niederlande, die mit dem Rhein in Relation steht.

Definition (Bildmenge einer Menge)

Zu $N\subseteq A$ bezeichnet das Bild von $N$ unter $R$ die Menge aller $y\in B$ , die mit mindestens einem Element aus $N$ in Relation stehen:

NR:=\{y\in B\mid \exists x\in N:(x,y)\in R\}

Urbild

Wenn wir für ein beliebiges Objekt die Objekte heraussuchen können, die mit diesem in Relation stehen, können wir das natürlich in „beide Richtungen“ tun. Stelle dir vor, wir suchen jetzt nicht mehr zu einem Fluss die dazugehörigen Länder, sondern wir haben ein Land und wollen die Flüsse wissen, die in diesem Land fließen. Dies entspricht der Suche nach dem Urbild. Beispielsweise ist das Urbild der Ukraine die Donau. Für das Urbild von $y$ schreibt man $Ry$ . Dabei ist $Ry$ die Menge aller Objekte die vor $Ry$ stehen können, also die Menge aller $x$ mit $xRy$ .

Definition (Urbildmenge)

Zu einem $y\in B$ bezeichnet das Urbild von $y$ unter $R\subset A\times B$ die Menge aller $x\in A$ , die mit $y$ in umgekehrter Relation stehen:

$Ry:=\{x\in A\mid (x,y)\in R\}$

Verständnisfrage: Was ist $R_{1}\ {\text{Deutschland}}$ ?

$R_{1}\ {\text{Deutschland}}=\{{\text{Donau, Elbe, Rhein}}\}$ .

Einschränkung einer Relation

Ist $R$ eine Relation auf $A\times B$ , so lässt sich diese auf eine Teilmenge $A'\times B'$ reduzieren. Die so entstehende Relation $R'$ enthält nur die Paare $(x,y)$ von $R$ , deren Elemente in $A'\times B'$ liegen. Die reduzierte Relation heißt Einschränkung:

Definition (Einschränkung einer Relation)

Ist $A'\subset A$ und $B'\subset B$ so heißt $R':=\{x,y\in A'\times B'\,|\,xRy\}$ die Einschränkung von $R$ auf $A'\times B'$ . Häufig wird die Einschränkung einer Relation $R$ ebenfalls mit $R$ bezeichnet.

Offensichtlich gilt $R'\subseteq R$ .

Beispiel (Einschränkung einer Relation)

$\leq$ sei die Kleiner-Gleich-Relation auf den reellen Zahlen $\mathbb {R}$ , also $\leq \subseteq \mathbb {R} ^{2}$ .

Dann ist $\{x,y\in \mathbb {N} \,|\,x\leq y\}$ die Kleiner-Gleich-Relation auf den natürlichen Zahlen $\mathbb {N}$ und $\{x,y\in \mathbb {Z} \,|\,x\leq y\}$ die Kleiner-Gleich-Relation auf den ganzen Zahlen $\mathbb {Z}$ .

Konverse Relation

Es ist auch möglich, eine Relation umzukehren. Eine solche umgekehrte Relation wird konverse oder auch inverse Relation genannt. Sie entsteht anschaulich dadurch, dass man alle Pfeile im Pfeildiagramm umdreht. Bezüglich der konversen Relation $R^{-1}$ steht $x$ genau dann in Relation zu $y$ , wenn $y$ bezüglich der ursprünglichen Relation $R$ mit $x$ in Beziehung steht.

Definition (Konverse Relation)

Sei $R\subseteq A\times B$ eine Relation. Die konverse Relation $R^{-1}\subseteq B\times A$ kehrt alle Tupel aus $R$ um. Es ist genau dann $(y,x)\in R^{-1}$ , wenn $(x,y)\in R$ ist.

Beispiel (Konverse Relationen)

Die Relation $W$ „ $x$ ist ein Nachfolger von $y$ “ hat die konverse Relation „ $x$ ist ein Vorgänger von $y$ “. Es ist beispielsweise $3W2$ (3 ist Nachfolger von 2). Damit ist $2W^{-1}3$ (2 ist Vorgänger von 3).

Ein weiteres Beispiel: Es gilt $2|8$ (2 teilt 8), also gilt für die Konverse $8|^{-1}2$ . Konkret heißt das: $8$ ist ein Vielfaches von $2$ .

Bei der Definition des Urbildes haben wir gesagt, dass wir alle Elemente suchen, die in umgekehrter Richtung in Relation stehen. Dies war wenig intuitiv. Allerdings kann man sich das jetzt mithilfe der konversen Relation klar machen. Denn das Urbild einer Relation ist einfach das Bild der konversen Relation. Beschrieben ist es aber schon fast schwerer zu sehen als wenn man einfach die Definitionen hinschreibt und umformt:

Das Bild der konversen Relation ist $xR^{-1}=\{y\in B\mid (x,y)\in R^{-1}\}$ . Das ist aber gemäß unserer bisherigen Definitionen die selbe Menge wie $\{y\in B|(y,x)\in R\}$ (hier haben wir die Definition der konversen Relation eingesetzt). Der letzte Ausdruck entspricht der Definition des Urbilds für $R$ .

Äquivalenzrelation

Einführendes Beispiel

Oftmals verhalten sich verschiedene Objekte in bestimmten Aspekten gleich oder besitzen gleiche, beziehungsweise sehr ähnliche Eigenschaften. So ist das Ergebnis einer Drehung von $90^{\circ }$ dasselbe wie bei einer Drehung von $450^{\circ }$ . Exemplare von Büchern derselben ISB-Nummer besitzen denselben Inhalt und Autor. In diesem Kapitel wirst du die mathematischen Werkzeuge kennen lernen, mit denen du solche Äquivalenzen zwischen Objekten einer Grundmenge sauber beschreiben kannst.

Eine Beziehung, die die Gleichwertigkeit zwischen Objekten unter bestimmten Aspekten ausdrückt, wird Äquivalenzrelation genannt. Wir werden sehen, dass folgende Relation auf der Grundmenge aller bisher gedruckter Buchexemplare eine Äquivalenzrelation ist:

$x$ und $y$ besitzen dieselbe ISB-Nummer.

Frage: Welche Eigenschaften besitzt diese Relation?

Die Relation ist

reflexiv: Für jedes Buchexemplar $x$ gilt: $x$ und $x$ besitzen dieselbe ISB-Nummer. Sprich: ein Buchexemplar hat immer dieselbe ISB-Nummer wie es selbst.
nicht irreflexiv: Weil die Grundmenge nicht leer ist, gibt es mindestens ein Buchexemplar $x$ . Dieses steht mit sich selbst in Relation, weil die Relation reflexiv ist, und damit ist die Relation nicht irreflexiv.
symmetrisch: Wenn $x$ und $y$ dieselbe ISB-Nummer besitzen, dann besitzen auch $y$ und $x$ dieselbe ISB-Nummer.
nicht antisymmetrisch: Es gibt mindestens zwei verschiedene Buchexemplare $x$ und $y$ , die dieselbe ISB-Nummer besitzen. Für diese beiden Exemplare steht zwar $x$ in Relation zu $y$ und $y$ in Relation zu $x$ , aber es ist $x\neq y$ .
transitiv: Wenn die Buchexemplare $x$ und $y$ dieselbe ISB-Nummer besitzen und die Buchexemplare $y$ und $z$ dieselbe ISB-Nummer besitzen, dann besitzen auch $x$ und $z$ dieselbe ISB-Nummer.
nicht linear: Nehme zwei verschiedene Buchexemplare $x$ und $y$ , so dass beide eine verschiedene ISB-Nummer haben. Dann steht weder $x$ mit $y$ noch $y$ mit $x$ in Relation. Damit ist die Relation nicht linear.

Wir werden sehen, dass die Eigenschaften der Reflexivität, Symmetrie und Transitivität der obigen Relation, genau diejenigen sind, die hinreichend und notwendig für eine Äquivalenzrelation sind.

Es gibt eine weitere Möglichkeit, Äquivalenzrelationen zu beschreiben: Die Möglichkeit, die Grundmenge in verschiedene disjunkte Teilmengen zu zerlegen. Nehmen wir wieder das obige Beispiel mit den Büchern. Stell dir vor, wir fassen alle Exemplare in eine Menge zusammen, die dieselbe ISB-Nummer besitzen. Es kommen also genau dann zwei Bücher $x$ und $y$ in dieselbe Menge, wenn sie dieselbe ISB-Nummer besitzen, wenn also $x$ in Relation zu $y$ steht. Eine so entstandene Teilmenge werden wir später Äquivalenzklasse nennen.

Das Ergebnis ist eine Zerlegung der Grundmenge aller gedruckter Buchexemplare in disjunkte Teilmengen. Jede dieser Teilmengen steht für ein konkretes Schriftwerk eines Autors. Denn jede ISB-Nummer bezeichnet eindeutig ein solches Schriftwerk und jede Teilmenge enthält genau diejenigen Exemplare, die dieselbe ISB-Nummer besitzen. Man kann diese Teilmengen nun als neue Objekte betrachten. Dadurch erhältst du die Menge aller Schriftwerke. Jedes Schriftwerk ist dabei als Menge, nämlich der Menge aller Exemplare dieses Schriftwerks, modelliert. Durch eine Zerlegung einer Menge mit Hilfe einer Äquivalenzrelation können also neue Objekte modelliert werden (dies ist eine gängige Vorgehensweise in der Mathematik).

Definitionen

Äquivalenzrelation

Eine Äquivalenzrelation ist folgendermaßen definiert:

Definition (Äquivalenzrelation)

Eine Äquivalenzrelation ist eine homogene, binäre Relation auf einer Grundmenge, die folgende Eigenschaften besitzt:

reflexiv: "Für jedes Element $x$ aus der Grundmenge gilt: $x\sim x$ "
symmetrisch: "Für je zwei Elemente $x,y$ aus der Grundmenge gilt: $x\sim y\implies y\sim x$ "
transitiv: "Für je drei Elemente $x,y,z$ aus der Grundmenge gilt: $x\sim y$ und $y\sim z\implies x\sim z$ "

Zwei Elemente, die bezüglich einer Äquivalenzrelation in Relation stehen, heißen äquivalent. Wenn zwei Elemente $x$ und $y$ äquivalent zueinander bezüglich einer Äquivalenzrelation $R$ sind, schreibt man oft $x\sim _{R}y$ oder einfach $x\sim y$ anstatt der sonst üblichen Schreibweise $x\,R\,y$ beziehungsweise $(x,y)\in R$ .

Verständnisfrage: Was musst du tun, wenn du entscheiden sollst, ob eine Relation eine Äquivalenzrelation ist oder nicht?

Um zu entscheiden, ob eine Relation eine Äquivalenzrelation ist, musst du folgende Fragen beantworten:

Verständnisfrage: Welche der folgenden Relationen ist eine Äquivalenzrelation?

„ $x$ und $y$ gehen in dieselbe Klasse“ auf der Menge aller Schüler einer Schule
„ $x\geq y$ “ auf der Menge $\mathbb {Z}$ der ganzen Zahlen
„ $x$ und $y$ sind ungerade“ auf der Menge $\mathbb {N} _{\geq 1}$
„ $x$ und $y$ besitzen denselben Rest bei der Division durch zwei“ auf der Menge $\mathbb {N} _{\geq 1}$
„ $x=y$ “ auf einer beliebigen, nicht leeren Grundmenge $M$

Antwort:

Äquivalenzrelation
keine Äquivalenzrelation (die Relation ist nicht symmetrisch – so ist zwar $-3\leq -1$ , aber nicht auch $-1\leq -3$ )
keine Äquivalenzrelation (die Relation ist nicht reflexiv – beispielsweise steht 2 nicht mit sich selbst in Relation)
Äquivalenzrelation
Äquivalenzrelation

Verständnisfrage: Wie viele totale Äquivalenzrelationen auf einer Grundmenge $M$ gibt es? (Eine Relation $R$ ist total, wenn für jeweils zwei Elemente $x$ und $y$ mindestens ein Element mit einem anderen in Relation steht. Sprich es gilt $xRy$ oder $yRx$ .)

Sei $R\subseteq M\times M$ eine Äquivalenzrelation auf der Grundmenge $M$ . Seien $x,y\in M$ beliebig. Da $R$ total ist, steht $x$ in Relation zu $y$ oder $y$ in Relation zu $x$ . Sei oBdA $x\,R\,y$ . Auf Grund der Symmetrie ist dann aber auch $y\,R\,x$ . Damit steht jedes Element mit jedem anderen Element in Relation.

Es gibt also genau eine totale Äquivalenzrelation auf einer Grundmenge $M$ , nämlich $R=M\times M$ , bei der jedes Element mit jedem anderen in Relation steht.

Äquivalenzklasse

Im obigen Beispiel haben wir durch die Äquivalenzrelation die Grundmenge in disjunkte Teilmengen zerlegt, indem wir alle Buchexemplare in einer Teilmenge zusammengefasst haben, die in Relation steht. Eine solche Teilmenge wird Äquivalenzklasse genannt und mit $[x]$ bezeichnet:

Definition (Äquivalenzklasse)

Eine Äquivalenzklasse $[x]$ ist die Menge aller Elemente der Grundmenge $M$ , die zum Element $x$ äquivalent sind:

[x]:=\{y\in M\,|\,y\sim x\}

Wenn du die Relation explizit angeben musst, kannst du auch $[x]_{R}$ schreiben. Es ist dann

[x]_{R}:=\{y\in M\,|\,y\sim _{R}x\}

Das Element $x$ in der Schreibweise $[x]$ nennt man Repräsentant oder Vertreter. Ist unsere obige Definition für Äquivalenzklassen korrekt im Sinne, dass $[x]=[y]$ wenn $x$ und $y$ äquivalent zueinander sind? Dies beantwortet der folgende Satz:

Satz

Ist $x\sim y$ , dann ist $[x]=[y]$ .

Beweis

Sei $x\sim y$ . Zu zeigen ist, dass $[x]\subseteq [y]$ und $[y]\subseteq [x]$ ist. Sei also $a\in [x]$ beliebig. Es gilt damit $a\sim x$ . Da außerdem $x\sim y$ ist, folgt aus der Transitivität der Äquivalenzrelation, dass auch $a\sim y$ ist. Dies bedeutet aber $a\in [y]$ . Da $a\in [x]$ beliebig war, ist $[x]\subseteq [y]$ .

Dass auch $[y]\subseteq [x]$ ist, kannst du analog beweisen.

Es gilt auch die Umkehrung des obigen Satzes:

Satz

Aus $[x]=[y]$ folgt $x\sim y$ .

Beweis

Sei $[x]=[y]$ . Damit ist $[x]\subseteq [y]$ , also $a\in [y]$ für alle $a\in [x]$ . Nun ist $x\in [x]$ , da $x\sim x$ aufgrund der Reflexivität der Äquivalenzrelation. Daraus folgt, dass $x\in [y]$ und somit nach Definition $x\sim y$ ist.

Zusammen ergeben die vorherigen beiden Sätze folgenden wichtigen Satz:

Satz (Zusammenhang zwischen Äquivalenz der Repräsentanten und der Äquivalenzklassen)

Für Äquivalenzklassen und deren Vertreter gilt folgender Zusammenhang:

[x]=[y]\iff x\sim y

Greift man aus jeder Äquivalenzklasse ein Element heraus, so erhält man ein Vertretersystem:

Definition (Vertretersystem, Repräsentantensystem)

Ist $\sim$ eine Äquivalenzrelation auf $M$ , so ist ein Vertretersystem (oder Repräsentantensystem) eine Teilmenge von $M$ , die aus jeder Äquivalenzklasse von $\sim$ genau ein Element enthält.

Verständnisfrage: Wie sehen die Äquivalenzklassen der folgenden Äquivalenzrelationen aus? Gib ein mögliches Vertretersystem an.

„ $x$ und $y$ gehen in dieselbe Klasse“ auf der Menge aller Schüler einer Schule
„ $x$ und $y$ besitzen denselben Rest bei der Division durch zwei“ auf der Menge $\mathbb {N} _{\geq 1}$
„ $x=y$ “ auf einer beliebigen, nicht leeren Grundmenge $M$

Antwort:

Die Menge der Äquivalenzklassen ist die Menge aller Klassen der Schule. Dabei ist jede Klasse als Menge aller Schüler modelliert, die diese Klasse besuchen. Ein mögliches Vertretersystem ist die Menge aller Klassensprecher.
Es gibt zwei Äquivalenzklassen: Die Menge $\{2,4,6,8,\ldots \}$ aller Zahlen, die restlos durch 2 geteilt werden können, und die Menge $\{1,3,5,7,\ldots \}$ aller Zahlen, die bei Division durch 2 den Rest 1 lassen. Damit zerfällt die Grundmenge $\mathbb {N} _{\geq 1}$ in die Menge der geraden und in die Menge der ungeraden Zahlen. Ein Vertretersystem ist z.B. $\{4,7\}$
Jede Äquivalenzklasse ist einelementig. Die Grundmenge zerfällt also in die Menge $\{\,\{x\}\,|\,x\in M\}$ (Beachte, dass dies eine Menge von einelementigen Mengen ist. Die Zerlegungsmenge ist ungleich der Grundmenge). Das einzige Vertretersystem ist $M$ selbst.

Zerlegung einer Menge

Oft haben wir bereits von der Zerlegung einer Menge gesprochen (welche in der Mengenlehre auch Partition genannt wird). Eine Zerlegung ist eine Aufteilung einer Grundmenge in verschiedene Teilmengen, so dass jedes Element aus der Grundmenge in genau einer Teilmenge enthalten ist. Eine Zerlegung kann man also als eine Menge von Teilmengen der Grundmenge auffassen. Damit garantiert ist, dass jedes Element der Grundmenge in genau einer Teilmenge enthalten ist, müssen zusätzliche Bedingungen erfüllt sein, die in der folgenden Definition zusammengefasst sind:

Definition (Zerlegung einer Menge)

Eine Zerlegung einer Menge $M$ ist eine Menge $P$ von Teilmengen von $M$ (also $P\subseteq {\mathcal {P}}(M)$ ), welche folgende Bedingungen erfüllt:

Die Vereinigung aller Mengen von $P$ ergibt die Menge $M$ :
$\bigcup _{A\in P}A=M$
Alle Mengen von $P$ sind paarweise disjunkt:
$\forall A,B\in P:A\neq B\implies A\cap B=\emptyset$
Alle Mengen von $P$ sind nicht leer:
$\forall A\in P:A\neq \emptyset$

Im nächsten Abschnitt werden wir den Zusammenhang zwischen Äquivalenzrelation und der durch ihr definierten Zerlegung genauer untersuchen. Alternativ kann die Zerlegung $P$ durch folgende Aussagen charakterisiert werden:

$\forall x\in M:\exists A\in P:x\in A$ ,
$\forall A,B\in P:\forall x\in M:x\in A\land x\in B\implies A=B$ ,
$\forall A\in P:\exists x\in M:x\in A$ .

Zusammenhang zwischen Äquivalenzrelationen und der Zerlegung einer Menge

Wollen wir nun den Zusammenhang zwischen Äquivalenzrelationen und der Zerlegung einer Menge untersuchen. Im einführenden Beispiel haben wir gesehen, dass eine Äquivalenzrelation eine Zerlegung der Grundmenge definiert, indem man alle äquivalenten Elemente in einer Teilmenge, der Äquivalenzklasse, zusammenfasst. Eine solche Zerlegung einer Menge durch eine Äquivalenzrelation wird mit ${M/{\sim }}$ bezeichnet und in bestimmten Kontexten der Mathematik Quotientenraum oder Faktorraum genannt. Die Zerlegung ${M/{\sim }}$ der Grundmenge $M$ ist also:

{M/{\sim }}:=\{[x]\,|\,x\in M\}

Doch ist dies wirklich eine Zerlegung im Sinne der obigen Definition? Beweisen wir es:

Satz (Äquivalenzrelationen induzieren eine Zerlegung)

Sei $R$ eine Äquivalenzrelation auf der Grundmenge $M$ . Dann ist die Menge aller Äquivalenzklassen ${M/{\sim _{R}}}:=\{[x]_{R}\,|\,x\in M\}$ eine Zerlegung der Grundmenge.

Beweis (Äquivalenzrelationen induzieren eine Zerlegung)

Um zu zeigen, dass ${M/{\sim }}:=\{[x]\,|\,x\in M\}$ eine Zerlegung von $M$ ist, müssen wir folgende Behauptungen beweisen:

Beweisschritt: $\bigcup _{A\in P}A=M$

Es ist genau dann $\bigcup _{A\in P}A=M$ , wenn $\bigcup _{A\in P}A\subseteq M$ und wenn $M\subseteq \bigcup _{A\in P}A$ ist.

Beweisschritt: $\bigcup _{A\in P}A\subseteq M$

Jede Äquivalenzklasse $A\in P$ ist nach Definition eine Teilmenge von $M$ . Damit ist auch die Vereinigung aller Äquivalenzklassen $\bigcup _{A\in P}A$ eine Teilmenge von $M$ .

Beweisschritt: $M\subseteq \bigcup _{A\in P}A$

Sei $x\in M$ beliebig. Da auf Grund der Reflexivität von $R$ das Element $x$ in Relation zu sich selbst steht, ist $x\in [x]$ . Nun ist $[x]\in P$ und damit

x\in [x]\subseteq \bigcup _{A\in P}A\implies x\in \bigcup _{A\in P}A

Da $x$ beliebig war, ist $M\subseteq \bigcup _{A\in P}A$ .

Beweisschritt: $\forall A,B\in P:A\neq B\implies A\cap B=\emptyset$

Seien $A,B\in P$ mit $A\neq B$ . Dann ist $A=[x]$ und $B=[y]$ für ein $x,y\in M$ .

Widerspruchsbeweis: Sei $A\cap B=[x]\cap [y]\neq \emptyset$ . Dann gibt es ein $a\in M$ mit $a\in [y]$ und $a\in [x]$ . Damit ist $a\sim x$ und $a\sim y$ . Aus der Transitivität folgt $x\sim y$ und damit $[x]=[y]$ aus dem Satz über den Zusammenhang zwischen Äquivalenzklassen und der Äquivalenz der Repräsentanten des vorherigem Abschnitts. Jedoch ist $A=[x]=[y]=B$ ein Widerspruch zu Annahme $A\neq B$ , so dass $A\cap B=\emptyset$ sein muss.

Beweisschritt: $\forall A\in P:A\neq \emptyset$

Sei $A\in P$ beliebig. Dann ist $A=[x]$ für ein $x\in M$ . Wegen der Reflexivität von der Äquivalenzrelation ist $x\sim x$ und damit $x\in [x]$ . Daraus folgt, dass insbesondere $A=[x]\neq \emptyset$ ist.

Doch wie sieht es umgekehrt aus? Kannst du aus einer vorgegebenen Partition $P$ einer Menge $M$ so eine Äquivalenzrelation definieren, dass ${M/{\sim }}=P$ ist?

Frage: Wie kann eine solche Äquivalenzrelation aussehen?

Damit die induzierte Menge der Äquivalenzrelation gleich der Partitionsmenge $P$ sein kann, muss für alle $x,y\in M$ gelten:

x{\text{ und }}y{\text{ gehören derselben Partitionsmenge an}}\implies x\sim y

Damit gibt es nur einen möglichen Kandidaten einer Äquivalenzrelation:

x\sim y:\iff \exists A\in P:x,y\in A

Satz (Jede Zerlegung induziert eine Äquivalenzrelation)

Sei $M$ eine Menge und $P$ eine Zerlegung dieser Menge. Dann gibt es genau eine Äquivalenzrelation $\sim$ , die diese Zerlegung induziert, für die also $M/{\sim }=P$ ist. Diese Äquivalenzrelation ist definiert durch:

x\sim y:\iff \exists A\in P:x,y\in A

Beweis (Jede Zerlegung induziert eine Äquivalenzrelation)

Sei $M$ eine Menge und $P$ eine Zerlegung dieser Menge.

Beweisschritt: Existenz einer Äquivalenzrelation, die diese Zerlegung induziert

Wir definieren die Relation $\sim$ über folgende Definition:

x\sim y:\iff \exists A\in P:x,y\in A

Beweisschritt: $\sim$ ist eine Äquivalenzrelation

Beweisschritt: $\sim$ ist reflexiv

Sei $x\in M$ beliebig. Da die Vereinigung aller Mengen von $P$ die Grundmenge ergibt, gibt es eine Menge $A\in P$ mit $x\in A$ . Damit ist

\left(\exists A\in P:x,x\in A\right)\implies x\sim x

Beweisschritt: $\sim$ ist symmetrisch

Sei $x,y\in M$ beliebig. Es ist

{\begin{aligned}x\sim y&\iff \exists A\in P:x,y\in A\\[0.3em]&\iff \exists A\in P:y,x\in A\\[0.3em]&\iff y\sim x\end{aligned}}

Beweisschritt: $\sim$ ist transitiv

Sei $x,y,z\in M$ mit $x\sim y$ und $y\sim z$ . Dann gibt es ein $A\in P$ und ein $B\in P$ mit $x,y\in A$ und $y,z\in B$ . Damit ist $A\cap B\neq \emptyset$ , da $y$ sowohl ein Element von $A$ als auch ein Element von $B$ ist. Da $P$ eine Partition ist, muss $A=B$ sein. Daraus folgt $x,z\in A=B$ und damit $x\sim z$ .

Beweisschritt: $\forall A\in P:\forall x\in A:[x]=A$

Sei $A\in P$ und $x\in A$ beliebig.

Beweisschritt: $[x]\subseteq A$

Sei $y\in [x]$ beliebig, also $x\sim y$ . Dann gibt es ein $B\in P$ mit $x,y\in B$ . Da $x\in A$ und $x\in B$ ist, ist $A\cap B\neq \emptyset$ . Daraus folgt $A=B$ , weil verschiedene Mengen von $P$ disjunkt sind. Damit ist $y\in B=A$ , was zu beweisen war.

Beweisschritt: $A\subseteq [x]$

Sei $y\in A$ beliebig. Damit ist sowohl $x$ als auch $y$ ein Element von $A$ und damit $y\sim x$ . Daraus folgt $y\in [x]$ . Da $y\in A$ beliebig war, ist $A\subseteq [x]$ .

Aus den Behauptungen (2.1) und (2.2) folgt, dass $[x]=A$ ist.

Beweisschritt: $M/{\sim }=P$

Beweisschritt: $M/{\sim }\subseteq P$

Sei $[x]\in M/{\sim }$ beliebig. Da $\bigcup _{A\in P}A=M$ ist, gibt es ein $A\in P$ mit $x\in A$ . Aus der Behauptung (2) folgt, dass $[x]=A$ und damit $[x]=A\in P$ ist.

Beweisschritt: $P\subseteq M/{\sim }$

Sei $A\in P$ beliebig. Da alle Mengen aus $P$ nach Definition nicht leer sind, gibt es ein $x\in M$ mit $x\in A$ . Aus Behauptung (2) folgt, dass $A=[x]$ und damit $A=[x]\in M/{\sim }$ ist.

Die Behauptung (3) folgt direkt aus Behauptung (3.1) und (3.2).

Beweisschritt: Eindeutigkeit dieser Äquivalenzrelation

Sei $\sim _{2}$ eine weitere Äquivalenzrelation mit $P=M/{\sim _{2}}$ . Sei $x,y\in M$ beliebig. Es gilt dann

{\begin{aligned}x\sim _{2}y&\iff \exists [a]\in M/{\sim _{2}}:x,y\in [a]\\[0.3em]&\ \left\downarrow \ P=M/{\sim _{2}}\right.\\[0.3em]&\iff \exists A\in P:x,y\in A\end{aligned}}

Induzierte Äquivalenzrelation

Hinweis

Wir benutzen hier den Begriff der Funktion, der erst später definiert wird.

Das Nachrechnen, dass eine gegebene Relation wirklich eine Äquivalenzrelation ist, benutzt oft ein Standardschema, was wir in diesem Satz zusammenfassen:

Satz

Seien $M,N$ nichtleere Mengen und $f:M\to N$ eine Abbildung.

Auf $N$ sei eine Äquivalenzrelation $\sim _{N}$ gegeben. Wir definieren für $x,y\in M$ die Relation $x\sim _{M}y:\iff f(x)\sim _{N}f(y)$ .

Dann ist $\sim _{M}$ eine Äquivalenzrelation. Diese nennen wir "die durch $f$ induzierte Äquivalenzrelation".

Beweis

Wir müssen die drei Eigenschaften einer Äquivalenzrelation nachprüfen. Seien also $x,y,z\in M$

Beweisschritt: Reflexivität

$f(x)\sim _{N}f(x)$ , da $\sim _{N}$ reflexiv ist. Das ist nach Definition von $\sim _{M}$ äquivalent zu $x\sim _{M}x$ , also ist $\sim _{M}$ reflexiv.

Beweisschritt: Symmetrie

Gelte $x\sim _{M}y$ für $x$ und $y\in M$ . Wir zeigen $y\sim _{M}x$ .

{\begin{aligned}&\ x\sim _{M}y\\[0.3em]&\ {\color {OliveGreen}\downarrow {\text{Definition von }}{\sim _{M}}}\\[0.3em]\implies &\ f(x)\sim _{N}f(y)\\[0.3em]&\ {\color {OliveGreen}\downarrow {\sim _{N}}{\text{ ist symmetrisch}}}\\[0.3em]\implies &\ f(y)\sim _{N}f(x)\\[0.3em]&\ {\color {OliveGreen}\downarrow {\text{Definition von }}{\sim _{M}}}\\[0.3em]\implies &\ y\sim _{M}x\end{aligned}}

Also ist $\sim _{M}$ symmetrisch.

Beweisschritt: Transitivität

Sei $x\sim _{M}y$ und $y\sim _{M}z$ . Wir zeigen, dass $x\sim _{M}z$ .

{\begin{aligned}&\ x\sim _{M}y{\text{ und }}y\sim _{M}z\\[0.3em]&\ {\color {OliveGreen}\downarrow {\text{nach Definition von }}{\sim _{M}}}\\[0.3em]\implies &\ f(x)\sim _{N}f(y){\text{ und }}f(y)\sim _{N}f(z)\\[0.3em]&\ {\color {OliveGreen}\downarrow {\sim _{N}}{\text{ ist transitiv}}}\\[0.3em]\implies &\ f(x)\sim _{N}f(z)\\[0.3em]&\ {\color {OliveGreen}\downarrow {\text{nach Definition von }}{\sim _{M}}}\\[0.3em]\implies &\ x\sim _{M}z\end{aligned}}

Also ist $\sim _{M}$ transitiv.

Damit ist $\sim _{M}$ eine Äquivalenzrelation auf $M$ .

Hinweis

Die häufigste Anwendung ist die, wo auf der Menge $N$ die Relation $\sim _{N}$ die Gleichheit " $=$ " ist. Ist $f$ dann noch surjektiv, so ist keine Urbildmenge $f^{-1}(\{n\})$ für $n\in N$ leer und die Äquivalenzklassen in $M$ sind gerade die Urbilder der Elemente von $N$ . In diesem Fall kann man den Beweis schneller führen, wenn man nachrechnet, dass die Urbilder der Elemente von $N$ eine Zerlegung der Menge $M$ erzeugen.

Beispiel (Induzierte Äquivalenzrelation in $\mathbb {N}$ )

Wähle $M=\mathbb {N}$ , $N=\{0,1,2\}$ und $f$ die Funktion, die jeder natürlichen Zahl den Rest bei der Division durch 3 zuordnet. Dann besteht $M$ aus den Äquivalenzklassen

$\{3,6,9,12,\ldots \}$ (Rest 0)

$\{1,4,7,10,\ldots \}$ (Rest 1)

$\{2,5,8,11,\ldots \}$ (Rest 2)

Beispiel (Induzierte Äquivalenzrelation im $\mathbb {R} ^{2}$ )

Seien $M=\mathbb {R} ^{2}$ und $N=\mathbb {R}$ . Außerdem definiere $f:\mathbb {R} ^{2}\to \mathbb {R}$ mit $f(x,y)=y-2x$ . Die Funktion $f$ ist wegen $f(0,y)=y$ sicher surjektiv. Die Äquivalenzklassen sind Geraden parallel zu der Urspungsgeraden $y=2x$ , auf denen $y-2x$ den konstanten Wert $c$ hat.

Warum sind Äquivalenzklassen interessant?

In vielen Fällen betrachtet man Äquivalenzklassen auf einer Menge mit einer durch einer oder mehrere Verknüpfungen definierten Struktur, wie Gruppe oder Vektorraum.

Dort betrachtet man Äquivalenzrelationen, wo man die Verknüpfungen der Grundmenge auf die Äquivalenzklassen "transportieren" kann. Als Teaser: wenn man in dem letzten Beispiel irgendeinen Vektor des $\mathbb {R} ^{2}$ mit $c=2$ zu einen beliebigen anderen Vektor mit $c=3$ addiert, erhält man immer einen Vektor der Klasse mit $c=5$ , egal, welche Vektoren man nimmt.

Genauso landet man immer in der Klasse mit $c=6$ , wenn man einen beliebigen Vektor der Klasse mit $c=2$ mit $3$ multipliziert.

Das wird später im Kapitel Faktorraum genauer untersucht.

Ordnungsrelation

Ordnungen sind eine besondere Klasse binärer, homogener Relationen. Sie sind eine Verallgemeinerung der Ordnungsrelationen wie $\leq$ oder $<$ , die du bereits für die Zahlbereiche $\mathbb {N}$ , $\mathbb {Z}$ und $\mathbb {R}$ kennst. Mit Hilfe von Ordnungsrelationen können Elemente einer Grundmenge ihrer Größe nach geordnet und miteinander verglichen werden.

Um eine Ordnung auf einer Menge zu definieren, reicht es, eine der beiden Relationen $\leq$ oder $<$ zu definieren. Die jeweils andere Relation lässt sich dann mit den folgenden Beziehungen darauf zurückführen:

$x<y$ genau dann, wenn $x\leq y$ und $x\neq y$ ,
$x\leq y$ genau dann, wenn $x<y$ oder $x=y$ .

Ordnungsrelationen lassen sich umdrehen: so wird aus der Kleiner-Gleich-Relation $\leq$ die Grösser-Gleich-Relation $\geq$ und aus der Echt-Kleiner-Relation $<$ wird die Echt-Größer-Relation $>$ . In Listen im Internet kann in der Regel gewählt werden, ob die Ergebnisse aufsteigend oder absteigend sortiert werden sollten.

Ordnungsrelationen gibt es auch außerhalb der Zahlen. So sind beispielsweise die Wörter im Lexikon alphabetisch geordnet.

Totalordnung

Totalordnungen sind direkte Verallgemeinerungen der Kleiner-Gleich-Relation auf den Zahlen. Genau wie andere binäre homogene Relationen wird die Totalordnung über ihre Eigenschaften bestimmt.

Frage: Welche Eigenschaft besitzt die Relation $\leq$ auf den Zahlbereichen $\mathbb {N}$ , $\mathbb {Z}$ und $\mathbb {R}$ ?

Eigenschaft der Relation $\leq$	Begründung
reflexiv	Für alle $x$ ist $x\leq x$ .
antisymmetrisch	Aus $x\leq y$ und $y\leq x$ folgt $x=y$
transitiv	Aus $x\leq y$ und $y\leq z$ folgt $x\leq z$
linear	Für alle reellen Zahlen $x$ und $y$ ist $x\leq y$ oder $y\leq x$
nicht irreflexiv	Diese Relation ist reflexiv und die Grundmenge ist nicht leer
nicht symmetrisch	Gegenbeispiel: Es ist $23\leq 42$ aber $42\not \leq 23$ und damit kann die Relation nicht symmetrisch sein

Eine Relation ist dann eine Totalordnung, wenn sie diejenigen vier Eigenschaften hat, die auch die Kleiner-Gleich-Relation für die Zahlen besitzt:

Definition (Totalordnung)

Eine Totalordnung $\leq$ auf $M$ ist eine binäre und homogene Relation auf der Grundmenge $M$ , die folgende Eigenschaften besitzt:

$\forall x\in M:x\leq x$ (Reflexivität)
$\forall x,y\in M:x\leq y\land y\leq x\Rightarrow x=y$ (Antisymmetrie)
$\forall x,y,z\in M:x\leq y\land y\leq z\Rightarrow x\leq z$ (Transitivität)
$\forall x,y\in M:x\leq y\lor y\leq x$ (Linearität)

Da eine Totalordnung die direkte Verallgemeinerung der Ordnung auf der Zahlengeraden ist, welche eine „Linie“ ist, wird eine Totalordnung auch lineare Ordnung genannt.

Hinweis

In der Mathematik wird das Adjektiv „linear“ mehrfach verwendet. So kennst du „lineare Funktionen“ aus der Schule und in der linearen Algebra gibt es den Begriff der „linearen Abbildung”. Diese Begriffe haben aber nichts mit dem Begriff der „linearen Ordnung“ zu tun!

Beispiel (Totalordnung)

Die $x\leq y$ Relation auf der Grundmenge $\mathbb {N}$ ist eine Totalordnung.
Die $x\leq y$ Relation auf der Grundmenge $\mathbb {Z}$ ist eine Totalordnung.
Die $x\leq y$ Relation auf der Grundmenge $\mathbb {R}$ ist eine Totalordnung.
Die alphabetische Ordnung der Wörter in einem Lexikon ist eine Totalordnung

Die Ordnungen $\leq$ auf den Zahlbereichen $\mathbb {N}$ , $\mathbb {Z}$ und $\mathbb {R}$ sind zwar alle Totalordnungen, aber sie unterscheiden sich auch! So hat $\mathbb {N}$ ein kleinstes Element, nämlich die $1$ , aber weder $\mathbb {Z}$ noch $\mathbb {R}$ haben ein kleinstes Element. In $\mathbb {R}$ gibt es zwischen zwei verschiedenen Elementen $x\neq y$ mit $x\leq y$ immer ein weiteres Element $z$ mit $z\neq x$ , $z\neq y$ und $x\leq z\leq y$ . Das gilt für $\mathbb {N}$ und $\mathbb {Z}$ nicht.

Satz

Sei $\leq$ eine Totalordnung auf der Menge $M$ und $A\subseteq M$ eine Teilmenge von $M$ . Dann ist die Einschränkung von $\leq$ auf $A$ eine Totalordnung auf $A$ .

Beweis

Die Einschränkung von $\leq$ auf $A$ ist $\{x,y\in A\,|\,x\leq y\}$ . Die vier Eigenschaften der Totalordnung auf $M$ gelten natürlich auch für die Teilmenge $A\subseteq M$ . Also ist $\{x,y\in A\,|\,x\leq y\}$ eine Totalordnung auf $A$ .

Wie bereits gesagt, ist auch die Umkehrung $\geq$ einer Totalordnung $\leq$ wieder eine Totalordnung:

Aufgabe: Sei $\leq$ eine Totalordnung. Beweise, dass dann auch die konverse Relation $\geq$ definiert durch $x\geq y:\Leftrightarrow y\leq x$ eine Totalordnung ist.

Beweisschritt: $\geq$ ist reflexiv

Wir müssen beweisen, dass für alle $x$ aus der Grundmenge $x\geq x$ gilt. Nun gilt $x\geq x$ nach Definition genau dann, wenn $x\leq x$ ist. Wir wissen aber bereits, dass $\leq$ reflexiv ist, und damit auch, dass $x\leq x$ für alle $x$ gilt. Es folgt die Reflexivität von $\geq$ .

Beweisschritt: $\geq$ ist antisymmetrisch

Auch dies folgt aus der Antisymmetrie von $\leq$ . Für $\leq$ gilt nämlich $x\leq y\land y\leq x\Rightarrow x=y$ . Setzen wir $x\geq y\Leftrightarrow y\leq x$ ein, folgt $y\geq x\land x\geq y\Rightarrow x=y$ für alle $x$ und $y$ der Grundmenge. Dies ist die Antisymmetrieeigenschaft von $\geq$ .

Beweisschritt: $\geq$ ist transitiv

Sei $x\geq y$ und $y\geq z$ . Nach Definition ist dann $y\leq x$ und $z\leq y$ . Es folgt $z\leq x$ aus der Transitivität von $\leq$ . Damit gilt aber auch $x\geq z$ nach der Definition von $\geq$ . Ingesamt haben wir so $x\geq y\land y\geq z\Rightarrow x\geq z$ gezeigt und damit die Transitivität von $\geq$ .

Beweisschritt: $\geq$ ist linear

Von $\leq$ wissen wir bereits, dass es linear ist. Also gilt für zwei $x$ und $y$ : $x\leq y$ oder $y\leq x$ . Nach Definition von $\geq$ gilt dann auch für alle $x$ und $y$ : $y\geq x$ oder $x\geq y$ . Dies ist die Linearitätseigenschaft von $\geq$ .

Definition (Weitere Ordnungsrelationen auf Grundlage der Totalordnung)

Sei $\leq$ eine Totalordnung auf der Grundmenge $M$ . Dann sind die weiteren Ordnungsrelationen $<$ und $>$ auf $M$ folgendermaßen definiert:

$x<y:\Leftrightarrow x\leq y\land x\neq y$
$x>y:\Leftrightarrow y<x$

Während $\geq$ ebenfalls eine Totalordnung ist, ist das bei $<$ und $>$ nicht der Fall. Diese beiden Relationen sind strikte Totalordnungen:

Strikte Totalordnung

Analog zur Totalordnung, soll auch die Relation $<$ die Kleiner-Relation der reellen Zahlen verallgemeinern. Wenn eine Relation das tut, nennt man sie strikte Totalordnung. Welche Eigenschaften muss nun aber $<$ besitzen, um als strikte Totalordnung zu gelten?

Frage: Welche Eigenschaften besitzt die Relation $<$ auf den Zahlbereichen $\mathbb {N}$ , $\mathbb {Z}$ und $\mathbb {R}$ ?

Eigenschaft der Relation $<$	Begründung
irreflexiv	Für alle $x$ ist $x\not <x$ .
antisymmetrisch	Ist $x<y$ , so folgt automatisch $y\not <x$ . Damit kann $x<y$ und $y<x$ nie gleichzeitig auftreten. Somit ist die Implikation $x<y\land y<x\Rightarrow x=y$ stets wahr, weil die Prämisse $x<y\land y<x$ stets falsch ist (siehe Abschnitt zur Implikation).
asymmetrisch	Die Kleiner-Relation ist antisymmetrisch und irreflexiv.
transitiv	Aus $x<y$ und $y<z$ folgt $x<z$ .
konnex	Für zwei verschiedene Zahlen $x$ und $y$ gilt entweder $x<y$ oder $y<x$ .
trichotom	Die Kleiner-Relation ist asymmetrisch und konnex.
nicht linear	Für die Zahlen $x=1$ und $y=1$ gilt weder $x<y$ noch $y<x$ .
nicht reflexiv	Es ist beispielsweise $1\not <1$ .
nicht symmetrisch	Es ist beispielsweise $23<42$ , aber nicht auch $42<23$ .

Aus dem Abschnitt zu den Eigenschaften binärer Relationen wissen wir, dass eine binäre Relation genau dann trichotom ist, wenn sie gleichzeitig irreflexiv, asymmetrisch, konnex und antisymmetrisch ist. Dementsprechend müssen wir von einer binären Relation nur die Trichotomie und die Transitivität fordern und es folgt dann bereits, dass diese Relation genau dieselben Eigenschaften wie die Echt-Kleiner-Relation besitzt. Deswegen wählen wir die Trichotomie und die Transitivität als die charakteristischen Eigenschaften einer strikten Totalordnung:

Definition (strikte Totalordnung)

Eine binäre und homogene Relation $<$ auf der Grundmenge $M$ heißt strikte Totalordnung, wenn $<$ folgende Eigenschaften besitzt:

$\forall x,y,z\in M:x<y\land y<z\Rightarrow x<z$ (Transitivität)
$\forall x,y\in M:x<y\ {\dot {\lor }}\ x=y\ {\dot {\lor }}\ y<x$ (Trichotomie)

Das Symbol ${\dot {\lor }}$ ist dabei die Kontravalenz, also die Entweder-Oder-Verknüpfung zwischen Aussagen. Wir zeigen nun, dass die mit Hilfe einer Totalordnung $\leq$ definierte Relation $<$ eine strikte Totalordnung ist.

Satz

Sei $\leq$ eine Totalordnung auf $M$ und die Relation $<$ wie folgt definiert: $x<y:\Leftrightarrow x\leq y\land x\neq y$ . Dann ist $<$ eine strikte Totalordnung auf $M$ .

Beweis

Zu zeigen ist, dass $<$ transitiv und trichotom ist.

Beweisschritt: $<$ ist transitiv

Gelte $x<y\land y<z$ . Nach Definition von $<$ gilt dann: $(x\leq y\land x\neq y)\land (y\leq z\land y\neq z)$ . Mit der Transitivität von $\leq$ folgt $x\leq z$ . Weiterhin folgt aus $x\neq y$ mit der Antisymmetrie von $\neg (x\leq y)\lor \neg (y\leq x)$ . Da $x\leq y$ gilt, muss $\neg (y\leq x)$ gelten. Wäre nun $x=z$ , würde daraus $\neg (y\leq z)$ folgen - Widerspruch! Also gilt $x\neq z$ . Insgesamt haben wir $x\leq z\land x\neq z$ gezeigt, was nach Definition von $<$ gerade $x<z$ ist.

Beweisschritt: $<$ ist trichotom

Gelte $x=y$ , dann gilt nach Definition von $<$ weder $x<y$ noch $y<x$ . Gelte nun $x\neq y$ . Mit der Linearität von $\leq$ gilt $x\leq y\lor y\leq x$ . Wegen der Antisymmetrie von $\leq$ kann aber wegen $x\neq y$ nicht beides gelten, also: $x\leq y\,{\dot {\lor }}\,y\leq x$ . Daraus folgt $x<y\,{\dot {\lor }}\,y<x$ . In beiden Fällen gilt also $x<y\,{\dot {\lor }}\,x=y\,{\dot {\lor }}\,y<x$ .

Aufgabe: Sei $\leq$ eine Totalordnung. Beweise, dass dann auch die Relation $>$ definiert durch $x>y:\Leftrightarrow y\leq x\land y\neq x$ eine strikte Totalordnung ist.

Sei $\leq$ eine Totalordnung auf $M$ . Wie im vorigen Abschitt gezeigt ist dann auch $\geq$ mit $x\geq y:\Leftrightarrow y\leq x$ eine Totalordnung auf $M$ . Die Definition von $>$ lässt sich wie folgt umschreiben: $x>y:\Leftrightarrow y\leq x\land x\neq y$ , also gilt $x>y\Leftrightarrow x\geq y\land x\neq y$ . Nunmehr folgt der Beweis genauso wie eben für $<$ gezeigt.

Sobald eine strikte Totalordnung $<$ definiert wurde, können ähnlich wie bei der Totalordnung weitere Ordnungsrelationen auf $<$ zurückgeführt werden:

Definition (Weitere Ordnungsrelationen auf Grundlage der strikten Totalordnung)

Sei $<$ eine strikte Totalordnung auf der Grundmenge $M$ . Dann sind die weiteren Ordnungsrelationen $\leq$ , $\geq$ und $>$ auf $M$ folgendermaßen definiert:

$x\leq y:\Leftrightarrow x<y\lor x=y$
$x\geq y:\Leftrightarrow y>x\lor x=y$
$x>y:\Leftrightarrow y<x$

Aufgabe: Sei $<$ eine strikte Totalordnung. Beweise, dass dann auch die Relation $\leq$ definiert durch $x\leq y:\Leftrightarrow y<x\lor y=x$ eine Totalordnung ist.

Zu zeigen ist, dass $\leq$ reflexiv, antisymmetrisch, transitiv und linear ist.

Beweisschritt: $\leq$ ist reflexiv

Es gilt $x=x$ , also auch $x\leq x$ .

Beweisschritt: $\leq$ ist antisymmetrisch

Gelte $x\leq y\land y\leq x$ . Nach Definition von $\leq$ gilt dann: $(x<y\lor x=y)\land (y<x\lor y=x)$ . Wegen der Trichotomie von $<$ können aber nicht $x<y$ und $y<x$ gemeinsam gelten oder eine der beiden Ungleichungen zusammen mit der Gleichung, also folgt $x=y$ .

Beweisschritt: $\leq$ ist transitiv

Gelte $x\leq y\land y\leq z$ . Dann gilt nach Definition von $\leq$ $(x<y\lor x=y)\land (y<z\lor y=z)$ . Ist $x=y$ folgt $x=z$ , also gilt $x\leq z$ . Ist $y=z$ , folgt ebenfalls $x=z$ und damit $x\leq z$ . Gelte also $x\neq y$ und $y\neq z$ . Dann gelten $x<y$ und $y<z$ und mit der Transitivität von $<$ folgt $x<z$ und somit auch $x\leq z$ .

Beweisschritt: $\leq$ ist linear

Mit der Trichotomie von $<$ gilt entweder $x<y$ oder $x=y$ oder $y<x$ . Im ersten Fall gilt $x\leq y$ , ebenso im zweiten Fall. Im zweiten Fall gilt zusätzlich $y\leq x$ . Im dritten Fall gilt $y\leq$ . Insgesamt gilt $x\leq y\lor y\leq x$ .

Die Beweis, dass $\geq$ eine Totalordnung ist verläuft analog.

Aufgabe: Sei $<$ eine strikte Totalordnung. Beweise, dass dann auch die Relation $>$ definiert durch $x>y:\Leftrightarrow y<x$ eine strikte Totalordnung ist.

Zu zeigen ist, dass $>$ transitiv und trichotom ist.

Beweisschritt: $>$ ist transitiv

Sei $x>y\land y>z$ . Nach Definition von $>$ gilt dann auch: $y<x\land z<y$ . Mit der Transitivität von $<$ folgt daraus $z<x$ , also gilt $x>z$ .

Beweisschritt: $>$ ist trichotom

Es gilt $x>y\,{\dot {\lor }}\,x=y\,{\dot {\lor }}\,y>x$ . Nach Definition von $>$ folgt daraus: $y>x\,{\dot {\lor }}\,x=y\,{\dot {\lor }}\,x>y$ , das ist die Trichotomie von $>$ .

Aufgabe: Sei $\leq$ eine Totalordnung auf der Menge $M$ und $<$ wie üblich definiert. Zeige:

\forall x,y\in M:(x<y\Leftrightarrow y\nleq x)

Beweis:

Gilt $x<y$ , so gilt nach Definition $x\leq y$ und $x\neq y$ . Aus $x\neq y$ folgt wegen der Antisymmetrie $x\nleq y\lor y\nleq x$ . Da $x\nleq y$ nicht gilt, muss $y\nleq x$ gelten. Gelte nun $y\nleq x$ . Dann folgt mit der Linearität $x\leq y$ . Gälte $x=y$ , dann folgte mit der Reflexivität $y\leq x$ ↯. Also gilt $x\neq y$ und insgesamt folgt $x<y$ .

Aufgabe: Sei $\leq$ eine transitive binäre Relation auf der Menge $M$ und $<$ wie üblich definiert. Zeige: Gilt $\forall x,y\in M:(x<y\Leftrightarrow y\nleq x)$ , so ist $\leq$ eine Totalordnung auf $M$ .

Beweis:

Mit der Definition von $<$ lautet die Voraussetzung:

(\ast )\quad x\leq y\land x\neq y\Leftrightarrow y\nleq x

Da $\leq$ transitiv ist, sind nur noch die drei anderen Eigenschaften zu zeigen.

Beweisschritt: Reflexivität

Für den Spezialfall $y=x$ ist die linke Seite von (*) immer falsch. Also ist auch die rechte Seite falsch und es gilt die Reflexivität: $x\leq x$ .

Beweisschritt: Antisymmetrie

Gelte $x\leq y\land y\leq x$ . Dann ist (*) nur wahr, wenn $x=y$ gilt. Das zeigt die Antisymmetrie.

Beweisschritt: Linearität

Gilt $y\leq x$ , dann gilt auch $x\leq y\lor y\leq x$ , also die Linearität. Gelte nun $y\nleq x$ . Dann liefert (*) $x\leq y\land x\neq y$ , also ebenfalls die Linearität.

Also ist $\leq$ eine Totalordnung. ✔

Zusammenhang von strikter Totalordnung zur Totalordnung

In den vorherigen beiden Abschnitten haben wir dargelegt, wie man aus einer Totalordnung und einer strikten Totalordnung einer Menge die jeweils andere Ordnung definieren kann. Es fehlt aber noch der Beweis, dass beide Wege gleichwertig sind, dass es also egal ist, welchen Weg man geht. Um dies zu zeigen, muss Zweierlei gezeigt werden:

Sei $\leq _{1}$ eine Totalordnung, von der man die strikte Totalordnung $<$ über $x<y:\Leftrightarrow x\leq _{1}y\land x\neq y$ bildet. Wenn man nun wieder die von $<$ induzierte Totalordnung $\leq _{2}$ über $x\leq _{2}y:\Leftrightarrow x<y\lor x=y$ bildet, dann müssen die beiden Relationen $\leq _{1}$ und $\leq _{2}$ identisch sein. Es muss also gelten $x\leq _{2}y\Leftrightarrow x\leq _{1}y$ .
Analoges muss gelten, wenn man bei einer strikten Totalordnung $<_{1}$ beginnt und über den Zwischenschritt der von $<_{1}$ induzierten Totalordnung $\leq$ die von $\leq$ induzierte strikte Totalordnung $<_{2}$ bildet: $x<_{2}y\Leftrightarrow x<_{1}y$ .

Beweis

Sei $\leq _{1}$ eine Totalordnung und $\leq _{2}$ definiert über $x\leq _{2}y:\Leftrightarrow x<y\lor x=y$ , wobei $<$ definiert ist über $x<y:\Leftrightarrow x\leq _{1}y\land x\neq y$ .

Beweisschritt: $x\leq _{2}y\Leftrightarrow x\leq _{1}y$

Es gilt:

{\begin{aligned}&\;x\leq _{2}y\\[0.3em]&\;{\color {Orange}\left\updownarrow \ {\mathsf {Definition\;von\;\leq _{2}}}\right.}\\[0.3em]\Leftrightarrow &\;x<y\lor x=y\\[0.3em]&\;{\color {Orange}\left\updownarrow \ x<y\Leftrightarrow x\leq _{1}y\land x\neq y\right.}\\[0.3em]\Leftrightarrow &\;(x\leq _{1}y\land x\neq y)\lor x=y\\[0.3em]&\;{\color {Orange}\left\updownarrow \ {\mathsf {Distributivgesetz:\;}}(A\land B)\lor C\Leftrightarrow (A\lor C)\land (B\lor C)\right.}\\[0.3em]\Leftrightarrow &\;(x\leq _{1}y\lor x=y)\land (x\neq y\lor x=y)\\[0.3em]&\;{\color {Orange}\left\updownarrow \ A\lor \neg A{\mathsf {\;ist\;eine\;Tautologie\;(immer\;wahr)}}\right.}\\[0.3em]\Leftrightarrow &\;(x\leq _{1}y\lor x=y)\land {\mathsf {W}}\\[0.3em]&\;{\color {Orange}\left\updownarrow \ A\land {\mathsf {W}}\Leftrightarrow A\right.}\\[0.3em]\Leftrightarrow &\;x\leq _{1}y\lor x=y\\[0.3em]&\;{\color {Orange}\left\updownarrow \ \leq _{1}{\mathsf {\;ist\;reflexiv}}\right.}\\[0.3em]\Leftrightarrow &\;x\leq _{1}y\end{aligned}}

Den letzten Beweisschritt wollen wir näher ausführen: Um die Äquivalenz $x\leq _{1}y\Leftrightarrow x\leq _{1}y\lor x=y$ zu zeigen, müssen wir die beiden Implikationen $x\leq _{1}y\Rightarrow x\leq _{1}y\lor x=y$ und $x\leq _{1}y\lor x=y\Rightarrow x\leq _{1}y$ beweisen. Die erste Implikation ist klar, weil $A\Rightarrow A\lor B$ unabhängig von der Aussage $B$ stets wahr ist. Wenn wir in der zweiten Implikation mit der Prämisse $x\leq _{1}y\lor x=y$ starten, dann ist einer der beiden Fälle $x\leq _{1}y$ und $x=y$ wahr. In beiden Fällen gilt $x\leq _{1}y$ , denn im ersten Fall gilt es sowieso und im zweiten Fall folgt es aus der Reflexivität von $\leq _{1}$ .

Sei nun $<_{1}$ eine strikte Totalordnung. Sei $\leq$ die von $<_{1}$ induzierte Totalordnung mit $x\leq y\Leftrightarrow x<_{1}y\lor x=y$ . Sei wiederum $<_{2}$ definiert über $x<_{2}y\Leftrightarrow x\leq y\land x\neq y$ .

Beweisschritt: $x<_{2}y\Leftrightarrow x<_{1}y$

Es gilt:

{\begin{aligned}&\;x<_{2}y\\[0.3em]&\;{\color {Orange}\left\updownarrow \ {\mathsf {Definition\;von\;<_{2}}}\right.}\\[0.3em]\Leftrightarrow &\;x\leq y\land x\neq y\\[0.3em]&\;{\color {Orange}\left\updownarrow \ x\leq y\Leftrightarrow x<_{1}y\lor x=y\right.}\\[0.3em]\Leftrightarrow &\;(x<_{1}y\lor x=y)\land x\neq y\\[0.3em]&\;{\color {Orange}\left\updownarrow \ {\mathsf {Distributivgesetz:\;}}(A\lor B)\land C\Leftrightarrow (A\land C)\lor (B\land C)\right.}\\[0.3em]\Leftrightarrow &\;(x<_{1}y\land x\neq y)\lor (x=y\land x\neq y)\\[0.3em]&\;{\color {Orange}\left\updownarrow \ A\land \neg A{\mathsf {\;ist\;immer\;falsch\;}}({\mathsf {F}})\right.}\\[0.3em]\Leftrightarrow &\;(x<_{1}y\land x\neq y)\lor {\mathsf {F}}\\[0.3em]&\;{\color {Orange}\left\updownarrow \ A\lor F\Leftrightarrow A{\mathsf {\;ist\;eine\;Tautologie}}\right.}\\[0.3em]\Leftrightarrow &\;(x<_{1}y\land x\neq y)\\[0.3em]&\;{\color {Orange}\left\updownarrow \ <_{1}{\mathsf {\;ist\;irreflexiv}}\right.}\\[0.3em]\Leftrightarrow &\;x<_{1}y\end{aligned}}

Halbordnung

Es gibt Relationen, die bis auf die Linearität alle Eigenschaften der Totalordnung erfüllen. Damit verhalten sie sich fast wie Totalordnungen. Jedoch können bei diesen Relationen nicht alle Paare von Elemente der Grundmenge miteinander verglichen werden. Diese Relationen werden Halbordnungen oder partielle Ordnungen genannt (eben weil diese Ordnungen nur „zur Hälfte“ Totalordnungen sind):

Definition (Halbordnung)

Eine Halbordnung $R\subseteq M\times M$ ist eine binäre und homogene Relation auf der Grundmenge $M$ , die folgende Eigenschaften besitzt:

reflexiv
antisymmetrisch
transitiv

Beispiel (Halbordnung)

Die Ist-Teiler-von-Beziehung auf $\mathbb {N}$ ist eine Halbordnung.
Die Teilmengenbeziehung auf jeder Menge von Mengen ist eine Halbordnung.

Aus der Definition folgt, dass jede Totalordnung eine Halbordnung ist. Aber nicht jede Halbordnung ist eine Totalordnung.

Aufgabe: Gib ein Beispiel für eine Halbordnung an, die keine Totalordnung ist.

Die Teilmengenbeziehung $\subseteq$ auf der Potenzmenge ${\mathcal {P}}(\{1,2\})=\{\varnothing ,\{1\},\{2\},\{1,2\}\}$ ist eine Halbordnung, aber keine Totalordnung. So gilt für die Mengen $\{1\}$ und $\{2\}$ weder $\{1\}\subseteq \{2\}$ noch $\{2\}\subseteq \{1\}$ und damit ist $\subseteq$ keine totale Relation.

Quasiordnung

Noch allgemeiner sind Quasiordnungen, auch Präordnungen genannt. Bei ihnen wird die Antisymmetrie nicht mehr verlangt.

Definition (Quasiordnung)

Eine Quasiordnung $R\subseteq M\times M$ ist eine binäre und homogene Relation auf der Grundmenge $M$ , die folgende Eigenschaften besitzt:

reflexiv
transitiv

Beispiel (Quasiordnung)

Die Ist-Teiler-von-Beziehung $x\mid y$ auf $\mathbb {Z}$ ist eine Quasiordnung.

Diese Relation ist nicht antisymmetrisch, denn es gilt beispielsweise $3\mid -3$ und $3\mid -3$ aber nicht $3=-3$ . Auf $\mathbb {N}$ dagegen ist die Relation $|$ eine Halbordnung.

Der Begriff der Quasiordnung verallgemeinert nicht nur den der Halbordnung, sondern zugleich auch den der Äquivalenzrelation.

Nachweis von Ordnungsrelationen

Wenn du die Aufgabe hast zu entscheiden, ob eine gegebene Relation eine Totalordnung bzw. eine Halbordnung ist, so musst du schauen, ob diese Relation alle notwendigen Eigenschaften für diese Art von Relation erfüllt. Der folgende Entscheidungsbaum demonstriert dir die Vorgehensweise:

Beispielaufgabe

Aufgabe

Ist die Relation „ $x$ ist eine Teilmenge von $y$ “ auf der Grundmenge ${\mathcal {P}}(\mathbb {R} )$ , der Menge aller Teilmengen von $\mathbb {R}$ , eine Halbordnung bzw. eine Totalordnung?

Lösung

Hier kannst du schrittweise vorgehen:

Beweisschritt: Ist die Relation reflexiv?

Ja, die Relation ist reflexiv, denn jede Menge ist nach Definition eine Teilmenge von sich selbst (Für alle Mengen $M$ gilt $M\subseteq M$ ).

Beweisschritt: Ist die Relation antisymmterisch?

Ja, die Relation ist antisymmetrisch, weil aus $A\subseteq B$ und $B\subseteq A$ die Gleichheit $A=B$ folgt.

Beweisschritt: Ist die Relation transitiv?

Ja, die Relation ist transitiv, weil aus $A\subseteq B$ und $B\subseteq C$ die Beziehung $A\subseteq C$ folgt.

Beweisschritt: Ist die Relation linear?

Nein, die Relation ist nicht linear. So ist weder $\{1,2,3\}\subseteq \{4,5,6\}$ noch ist $\{4,5,6\}\subseteq \{1,2,3\}$ .

Beweisschritt: Ist die Relation eine Halbordnung bzw. eine Totalordnung?

Da die Relation reflexiv, antisymmetrisch und transitiv ist, ist sie eine Halbordnung. Da die Relation aber nicht linear ist, ist sie keine Totalordnung.

Abbildung

Abbildung, Funktion

Einführung des Begriffs der Funktion. (YouTube-Video vom Kanal Quatematik)

Ein zentrales Konzept der Mathematik ist die Abbildung, die auch Funktion genannt wird. Abbildungen sind eindeutige Zuordnungen zwischen zwei Mengen $A$ und $B$ . Dies bedeutet, dass jedem Element $x\in A$ durch die Abbildung $f$ genau ein Element $f(x)\in B$ zugeordnet wird. Ein Beispiel hierfür ist die Quadratfunktion von der Menge $\mathbb {R}$ in die Menge $\mathbb {R}$ , die jeder reellen Zahl $x\in \mathbb {R}$ ihre Quadratzahl $x^{2}\in \mathbb {R}$ zuordnet. Die Schreibweise für Abbildungen von $A$ nach $B$ ist:

f:A\rightarrow B:x\mapsto f(x)

Ausgesprochen wird dieser Ausdruck so:

\underbrace {f{\color {white}|}} _{{\text{Abbildung }}f}:\underbrace {A\rightarrow B{\color {white}|}} _{{\text{aus }}A{\text{ nach }}B,}:\underbrace {x\mapsto f(x){\color {white}|}} _{{\text{die }}x{\text{ auf }}f(x){\text{ abbildet}}}

Die Menge $A$ heißt Definitionsbereich von $f$ und $B$ ist die Zielmenge der Abbildung. Die Elemente aus dem Definitionsbereich von $f$ werden Argument genannt und jedes durch die Abbildung getroffene Element $f(x)\in B$ heißt Funktionswert zum Argument $x$ .

f:\overbrace {A{\color {white}|}} ^{\text{Definitionsbereich}}\rightarrow \overbrace {B{\color {white}|}} ^{\text{Zielmenge}}:\overbrace {x{\color {white}|}} ^{\text{Argument}}\mapsto \overbrace {f(x){\color {white}|}} ^{\text{Funktionswert}}

Hinweis

Die Begriffe „Abbildung“ und „Funktion“ sind beide in der Mathematik üblich und bedeuten genau dasselbe.

In der Zielmenge $B$ müssen nicht alle Elemente Funktionswerte sein.

Beispiel (Rest bei Division mit 2)

f:\{1,2,3,4\}\rightarrow \{0,1,2\}:x\mapsto x{\bmod {2}}

Hier besteht der Definitionsbereich $A:=\{1,2,3,4\}$ aus vier Elementen. Die Zielmenge ist $B:=\{0,1,2\}$ . $0$ und $1$ sind Funktionswerte. Die Zahl $2$ dagegen nicht, denn keine Zahl ergibt bei Division durch $2$ den Rest $2$ . Also sind nicht alle Elemente in $B$ Funktionswerte.

Die Pfeile geben die Zuordnung wider: sie gehen vom Argument zum Funktionswert und verbinden so ein Paar. Wir können daher die Zuordnung $f$ als eine Menge von Paaren aus Argument und Funktionswert beschreiben: $f:=\{(1,1),(2,0),(3,1),(4,0)\}$ . Mengen von Paaren haben wir bereits im Kapitel Relation kennengelernt. Abbildungen sind also Relationen! Aber nicht jede Relation ist eine Abbildung. Damit eine Relation eine Abbildung ist, muss jedes Element in $A$ in Relation mit genau einem Element in $B$ sein

Fassen wir noch einmal zusammen, was eine Funktion ausmacht: Die Paare $(x,f(x))$ bilden eine Relation $\{(x,y)\in A\times B\,|\,f(x)=y\}\subseteq A\times B$ . Diese Relation hat eine spezielle Eigenschaft: zu jedem Element $x$ gibt es genau ein Element $y$ mit $(x,y)\in f$ . Im Pfeildiagramm erkennst du dies daran, dass von jedem Element des Definitionsbereichs $A$ genau ein Pfeil ausgeht. Im Koordinatensystem muss es zu jedem $x$ -Wert genau einen $y$ -Wert geben.

Die quadratische Funktion $f:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto x^{2}$

Wir definieren daher Abbildungen als eine Relationen mit der oben genannten Eigenschaft:

Definition (Abbildung, Funktion)

Eine Abbildung oder Funktion $f:A\rightarrow B$ aus der Menge $A$ in die Menge $B$ ist eine Relation $f\subseteq A\times B$ mit folgender Eigenschaft:

zu jedem Element $x\in A$ gibt es genau ein Element $y\in B$ mit $(x,y)\in f$ .

Dieses eindeutige Element wird mit $f(x)$ bezeichnet und Funktionswert von $x$ genannt. $A$ ist der Definitionsbereich, $B$ ist die Zielmenge der Funktion. Die Zuordnung $x\mapsto f(x)$ kann zusätzlich angegeben werden: $f:A\rightarrow B:x\mapsto f(x)$ oder auch so $f:A\mapsto B:f(x)=\dots$ .

Beispiel (Quadratfunktion)

Jeder reellen Zahl wird ihr Quadrat zugeordnet:

f:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto x^{2}

Funktionen werden häufig im Koordinatensystem veranschaulicht, wie in der Darstellung der Funktion rechts. Dabei werden die Paare $(x,f(x))$ als Koordinaten aufgefasst. Diese Punktemenge wird dann als Graph der Funktion bezeichnet.

Verständnisfrage: Welche der folgenden Pfeildiagramme stellen Abbildungen aus der Menge $X$ in die Menge $Y$ dar?

Pfeildiagramm 1
Pfeildiagramm 2
Pfeildiagramm 3
Pfeildiagramm 4

Antwort:

Pfeildiagramm 1: Abbildung
Pfeildiagramm 2: partielle Abbildung (dem Objekt $1\in X$ wird kein Element aus $Y$ zugeordnet)
Pfeildiagramm 3: keine Abbildung (dem Element $3\in X$ werden mehrere Elemente aus $Y$ zugeordnet und dem Objekt $4\in X$ wird kein Element aus $Y$ zugeordnet)
Pfeildiagramm 4: Abbildung

Definitions- und Wertebereich

Ist $f:A\rightarrow B$ eine Funktion von $A$ nach $B$ , so ist ${\mathsf {Db}}(f)=A$ der Definitionsbereich ${\mathsf {Db}}$ von $f$

Der Wertebereich ${\mathsf {Wb}}$ einer Funktion ist als die Menge der Funktionswerte definiert:

Definition (Wertebereich einer Funktion)

$f:A\rightarrow B$ sei eine Funktion. Dann ist der Wertebereich von $f$ die Menge aller Elemente für die es ein Argument gibt, formalisiert:

{\mathsf {Wb}}(f):=\{y\in B\,|\,\exists x\in A:f(x)=y\}

Es gilt ${\mathsf {Wb}}(f)\subseteq B$ .

Einschränkung einer Funktion

Definition (Einschränkung einer Funktion)

Sei $f:A\rightarrow B$ eine Funktion und $C\subseteq A$ eine Teilmenge von $A$ . Dann ist die Einschränkung von $f$ auf $C$ die Funktion, die auf $C$ mit $f$ übereinstimmt:

f\upharpoonright C:=\{(x,y)\in A\times B\,|\,x\in C\land y=f(x)\}

Für die eingeschränkte Funktion gilt: $f\upharpoonright C:C\rightarrow B$ .

$f\upharpoonright C:C\rightarrow B$ ist tatsächlich eine Funktion.

Gleichheit von Abbildungen

Es ist nicht sofort klar, wann zwei Abbildungen gleich sind. Ähnlich wie bei Mengen müssen wir definieren, wann zwei Abbildungen gleich sind.

Definition (Gleichheit von Abbildungen)

Zwei Abbildungen $f:A\to B$ und $g:C\to D$ sind gleich, wenn $A=C$ , $B=D$ und für alle $x\in A$ gilt $f(x)=g(x)$ .

Sind zwei Funktionen gleich, so sind auch die Definitionsbereiche und die Wertebereiche gleich. Bei der Gleichheit kommt es nicht darauf an, ob die Zuordnungsvorschriften $x\mapsto f(x)$ und $x\mapsto g(x)$ gleich formuliert sind!

Beispiel

Die folgenden Funktionen sind gleich:

$f:\mathbb {R} \to \mathbb {R} :x\mapsto x^{2}$
$g:\mathbb {R} \to \mathbb {R} :x\mapsto +{\sqrt {x^{4}}}$

Bild und Urbild

Zwei wesentliche Begriffe im Zusammenhang mit Abbildungen ist der Begriff des Bildes und der Begriff des Urbilds:

Definition (Bild)

Sei $f:A\rightarrow B$ eine Funktion und $C\subset A$ eine Teilmenge. Das Bild $f(C)$ ist die Menge aller Funktionswerte $f(x)$ mit $x\in C$ :

f(C):=\{f(x)\in B\,|\,x\in C\}=\{y\in B\,|\,\exists x\in C:y=f(x)\}

Notation: Es ist üblich, sowohl für den Funktionswert $f(x)$ eines Elementes $x\in D$ , als auch für das Bild $f(A)$ einer Teilmenge $A\subseteq D$ die gleiche Schreibweise zu verwenden, nämlich $f(\dotsc )$ mit runden Klammern. Aus dem Zusammenhang muss dann klar werden, was jeweils gemeint ist. Einige Autor*innen verwenden daher für das Bild einer Teilmenge $A\subseteq D$ eckige Klammern: $f[A]$ .

Beispiel (Bild)

Sei $f:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto x^{2}$ . Es ist

$f(\{1,2\})=\{1,4\}$
$f(\{-3,-6,2\})=\{9,36,4\}$
$f(\{-5,5\})=\{25\}$

Definition (Urbild)

Das Urbild $f^{-1}(D)$ einer Abbildung $f:A\to B$ und einer Menge $D\subseteq B$ ist die Menge aller Argumente $x\in A$ , die durch $f$ in die Menge $D$ abgebildet werden:

f^{-1}(D):=\{x\in A\,|\,f(x)\in D\}

Beachte, dass $B$ auch Elemente enthalten kann, die durch $f$ nicht getroffen werden. Betrachte dazu die Abbildung auf der rechten Skizze. Die Zahl $3$ wird nicht getroffen und die Zahl $4$ besitzt als Funktionswert nur das Argument $6$ . Dementsprechend gilt für das Urbild $f^{-1}(\{3,4\})=\{6\}$ .

Beispiel (Urbild)

Sei $f:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto x^{2}$ . Es ist

$f^{-1}(\{1,2,\,-4,\,-36\})=\{1,\,-1,\,{\sqrt {2}},\,-{\sqrt {2}}\}$
$f^{-1}(\{0,\,-1\})=\{0\}$
$f^{-1}(\{25\})=\{5,\,-5\}$

Warnung

Es besteht Verwechslungsgefahr zwischen dem Urbild $f^{-1}(B)$ , der Umkehrfunktion $f^{-1}$ und dem multiplikativen Inversen $f(x)^{-1}={\tfrac {1}{f(x)}}$ .

Aufgabe

Sei

$f:\mathbb {R} \setminus \{2\}\rightarrow \mathbb {R} :x\mapsto x^{2}$
$g:\{-1,\,0,\,1\}\rightarrow \mathbb {R} :x\mapsto |x|$
$h:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto |x|$

Bestimme folgende Bilder und Urbilder (beachte die unterschiedlichen Definitions- und Zielmengen der Abbildungen!):

$f\left(\mathbb {R} \setminus \{2\}\right)$
$g\left(\{-1,\,1\}\right)$
$h\left(\mathbb {Z} \right)$
$f\left(\emptyset \right)$
$f^{-1}\left(\{4,\,6\}\right)$
$g^{-1}\left([0,5]\right)$
$h^{-1}\left([0,5]\right)$
$f^{-1}(\emptyset )$

Lösung

Da $\mathbb {R} \setminus \{2\}$ der gesamte Definitionsbereich von $f$ ist, müssen hier alle Funktionswerte bestimmt werden, die durch $f$ getroffen werden. Generell ist das Ergebnis der (reellwertigen) Quadratfunktion stets nicht negativ. Also ist das Bild eine Teilmenge von $\mathbb {R} _{0}^{+}$ .

Nun kann man auch zeigen, dass alle nicht-negativen Zahlen durch $f$ getroffen werden.

Sei hierfür $y\in \mathbb {R} _{0}^{+}$ eine nicht negative Zahl. Es ist dann stets $x=-{\sqrt {y}}$ im Definitionsbereich $\mathbb {R} \setminus \{2\}$ von $f$ enthalten. Da $f(x)=\left(-{\sqrt {y}}\right)^{2}=y$ ist, gibt es ein Argument, welches von $f$ auf $y$ abgebildet wird. Also gilt $f\left(\mathbb {R} \setminus \{2\}\right)=\mathbb {R} _{0}^{+}$ .
Wir müssen nur die Funktionswerte von $1$ und $-1$ überprüfen. Es ist $g(1)=|1|=1$ und $g(-1)=|-1|=1$ .
Damit wird nur $1$ getroffen und es gilt $g\left(\{-1,\,1\}\right)=\{1\}$ .
Wenn wir alle Beträge der ganzen Zahlen bilden, erhalten wir die Menge der natürlichen Zahlen zusammen mit der Null, deshalb gilt: $h\left(\mathbb {Z} \right)=\mathbb {N} _{0}$
Wir nutzen die Definition des Bildes $f\left(\emptyset \right)=\{y\in \mathbb {R} \setminus \{2\}\,|\,\exists x\in \emptyset :y=f(x)\}$ . Da die Aussage $\exists x\in \emptyset :y=f(x)$ immer falsch ist, folgt $f(\emptyset )=\emptyset$ .
Bei der Quadratfunktion wird sowohl ${\sqrt {6}}$ als auch $-{\sqrt {6}}$ auf $6$ abgebildet. Es ist nämlich sowohl $f\left({\sqrt {6}}\right)=\left({\sqrt {6}}\right)^{2}=6$ sowie $f\left(-{\sqrt {6}}\right)=\left(-{\sqrt {6}}\right)^{2}=6$ . Da beide Zahlen ${\sqrt {6}}$ und $-{\sqrt {6}}$ im Defintionsbereich von $f$ sind, sind beide Zahlen im Urbild enthalten.

Nun suchen wir alle $x\in \mathbb {R} \setminus \{2\}$ mit $f(x)=4$ , also $x^{2}=4$ . Da $x$ nicht $2$ sein darf, bleibt nur die Möglichkeit $x=-2$ übrig.

Damit ist $f^{-1}\left(\{4,\,6\}\right)=\{-2,\,{\sqrt {6}},\,-{\sqrt {6}}\}$ das gesuchte Urbild.
Der Definitionsbereich von $g$ besteht nur aus der Menge $\{-1,\,0,\,1\}$ . Diese Zahlen werden durch den Betrag auf die Menge $\{0,1\}$ abgebildet. Da die Menge $\{0,1\}$ in $[0,5]$ enthalten, ist der komplette Definitionsbereich das gesuchte Urbild, also $g^{-1}\left([0,5]\right)=\{-1,\,0,\,1\}$
Bei der Betragsfunktion wird für ein beliebiges nicht-negatives $x\in \mathbb {R} _{0}^{+}$ sowohl $x$ als auch $-x$ auf $x$ abgebildet. Damit ist das Urbild von $h^{-1}\left([0,5]\right)=[-5,5]$ .
Wir benutzen die Definition des Urbilds: $f^{-1}\left(\emptyset \right)=\{x\in \mathbb {R} \setminus \{2\}\,|\,f(x)\in \emptyset \}$ . Die Aussage $f(x)\in \emptyset$ ist für alle $x\in \mathbb {R} \setminus \{2\}$ falsch. Somit folgt $f^{-1}(\emptyset )=\emptyset$ .

Eigenschaften von Abbildungen

$f$ sei eine Funktion von der Menge $X$ in die Menge $Y$ . Es gelte also: $f:X\rightarrow Y$ .

Injektiv

Erklärung von Injektivität bei Funktionen. (YouTube-Video vom Kanal Quatematik)

Wenn eine Funktion verschiedene Argumente stets auf verschiedene Funktionswerte abbildet, wird sie injektiv genannt. Im Pfeildiagramm injektiver Funktionen treffen niemals zwei Pfeilspitzen auf denselben Funktionswert.

Definition (Injektiv)

Eine Funktion ist injektiv, wenn sie verschiedene Argumente auf verschiedene Werte abbildet:

f{\text{ ist injektiv }}:\iff \forall x_{1},x_{2}\in X:x_{1}\neq x_{2}\Rightarrow f(x_{1})\neq f(x_{2})

Zum Nachweis der Injektivität wird häufig die Kontraposition verwendet: $\forall x_{1},x_{2}\in X:f(x_{1})=f(x_{2})\Rightarrow x_{1}=x_{2}$ .

Beispiel (Injektiv)

$f\colon \mathbb {R} \to \mathbb {R} ;x\mapsto x^{2}$ ist nicht injektiv, denn alle Werte bis auf $0$ werden zweimal getroffen. Es gilt ja beispielsweise $2^{2}=(-2)^{2}$ .
$g\colon \mathbb {R} \to \mathbb {R} ;x\mapsto x^{3}$ ist injektiv, denn aus $x^{3}=y^{3}$ folgt $x=y$ .

Surjektiv

Eine Funktion $f$ ist surjektiv, wenn alle Elemente von $Y$ von der Funktion getroffen werden. Anders ausgedrückt: zu jedem Element $y\in Y$ gibt es ein Argument $x\in X$ , mit $f(x)=y$ .

Definition (Surjektiv)

Eine Funktion ist surjektiv, wenn alle Elemente von $Y$ getroffen werden:

f{\text{ ist surjektiv}}:\iff \forall y\in Y\,\exists x\in X:y=f(x)

Erklärung von Surjektivität bei Funktionen. (YouTube-Video vom Kanal Quatematik)

Beispiel (Surjektiv)

$f\colon \mathbb {R} \to \mathbb {R} _{0}^{+};x\mapsto x^{2}$ ist surjektiv, denn für ein beliebiges $y\in \mathbb {R} _{0}^{+}$ ist $f({\sqrt {y}})=y$ .
$f\colon \mathbb {R} \to \mathbb {R} ;x\mapsto x^{2}$ ist nicht surjektiv, denn die Quadratfunktion auf $\mathbb {R}$ wird niemals negativ.

Verständnisaufgabe: Ist $f\colon \mathbb {Q} \to \mathbb {Q} _{0}^{+};x\mapsto x^{2}$ surjektiv?

Nein, da weder ${\sqrt {2}}$ noch $-{\sqrt {2}}$ in $\mathbb {Q}$ liegen. Das heißt $2$ liegt nicht im Bild von $f$ .

Satz (Surjektivität)

$f{\text{ ist surjektiv }}\iff Y={\mathsf {Wb}}(f)$ .

Beweis (Surjektivität)

Die Behauptung folgt mit der Definition des Wertebereichs: der umfasst alle Werte, die getroffen werden.

Bijektiv

Eine Funktion $f\colon X\to Y$ kann sowohl injektiv als auch surjektiv sein. Man nennt diese Eigenschaft bijektiv. Im Pfeildiagramm ist dann jedes Element von $X$ mit genau einem Element von $Y$ verbunden. Mit Hilfe von bijektiven Funktionen können Mengen hinsichtlich ihre Größe verglichen werden: gibt es eine Bijektion von $X$ auf $Y$ , so haben die beiden Mengen $X$ und $Y$ gleichviele Elemente. Wir werden den Größenvergleich zwischen Mengen im Kapitel Mächtigkeit von Mengen ausführlich behandeln.

Definition (Bijektiv)

Eine Funktion ist bijektiv von $X$ auf $Y$ , wenn sie injektiv und surjektiv ist. Das heißt, jedem Element von $X$ wird genau ein Element von $Y$ zugeordnet:

f\colon X\to Y{\text{ ist bijektiv }}:\iff \forall y\in Y\,\exists !x\in X:f(x)=y

Erklärung von Bijektivität bei Funktionen. (YouTube-Video vom Kanal Quatematik)

Beispiel (Bijektiv)

$f:\mathbb {R} \to \mathbb {R} ;x\mapsto 2x+1$ ist bijektiv.
$g:\mathbb {R} \to \mathbb {R} ;x\mapsto x^{3}$ ist bijektiv.
$h:\mathbb {R} \to [-1,1];x\mapsto \sin(x)$ ist nicht bijektiv.

f : Gerade
g : Parabel 3. Grades
h : Sinuskurve

Beweis

Im Koordinatenkreuz ist diese Funktion eine Gerade mit Steigung $2$ und um eine Einheit nach oben verschoben. Wir zeigen die Injektivität: aus $2x+1=2y+1$ folgt $2x=2y$ und daraus $x=y$ . Für die Surjektivität sei eine beliebige reelle Zahl $y$ gegeben. Dann definieren wir das Argument $x:={\frac {y}{2}}-{\frac {1}{2}}$ und rechnen nach: $f(x)=2x+1=2\left({\frac {y}{2}}-{\frac {1}{2}}\right)+1=y$ . Also werden alle reellen Zahlen getroffen.
In gleicher Weise zeigt man die Bijektivität von $g$ , das ist eine Parabel 3. Grades.
Der Graph von $h$ ist die Sinuskurve. Die nimmt bekanntlich alle Werte zwischen $-1$ und $1$ an. Also ist $h$ surjektiv auf dem Intervall $[-1,1]$ . $h$ ist aber nicht injektiv, denn $h$ ist periodisch, das heißt, diese Werte werden immer wieder angenommen.

Funktionskomposition

Seien zwei Abbildungen $f\colon A\to B$ und $g\colon B\to C$ gegeben. Dann können wir die beiden Funktionen nacheinander ausführen. Wir bilden zunächst ein $x\in A$ mit $f$ ab und erhalten $f(x)=y\in B$ . Dann können wir darauf $g$ anwenden und erhalten $g(y)=z\in C$ . Insgesamt ergibt sich $g(f(x))=z$ . Das führt zum Begriff der Komposition von Funktionen

Definition (Komposition von Abbildungen)

Die Komposition zweier Abbildungen $f\colon A\to B$ und $g\colon B\to C$ ist die Abbildung $g\circ f\colon A\to C;x\mapsto g(f(x))$ .

Gelesen wird $g\circ f$ so: erst $f$ , dann $g$ oder auch: $g$ nach $f$ .

Hinweis

Beachte, dass in der Schreibweise für die Funktionskomposition $g\circ f$ diejenige Funktion, die zuerst angewandt wird, rechts steht (Hier musst du also „von rechts nach links“ lesen). Die Schreibweise $(g\circ f)(x)$ meint also, dass auf $x$ erst $f$ und danach $g$ angewandt wird. Es ist also $(g\circ f)(x)=g(f(x))$ .

Verständnisfrage: Sei $f\colon \mathbb {R} \to \mathbb {R} :x\mapsto |x|$ und $g\colon \mathbb {R} \to \mathbb {R} :x\mapsto x-2$ . Berechne

$(f\circ g)(3)=?$
$(g\circ f)(3)=?$
$(f\circ g)(-3)=?$
$(g\circ f)(-3)=?$

Antwort:

$(f\circ g)(3)=|3-2|=1$
$(g\circ f)(3)=|3|-2=1$
$(f\circ g)(-3)=|-3-2|=5$
$(g\circ f)(-3)=|-3|-2=1$

Verständnisfrage: Seien $f$ und $g$ zwei Abbildungen von $\mathbb {R}$ nach $\mathbb {R}$ . Gilt dann $f\circ g=g\circ f$ ? Wieso?

Nein, dies ist nicht der Fall. Sei zum Beispiel $f:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto x^{2}$ und $g:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto x+1$ . Dann ist nämlich

f\circ g:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto (x+1)^{2}

und

g\circ f:\mathbb {R} \rightarrow \mathbb {R} :x\mapsto x^{2}+1

Hier sieht man, dass $f\circ g\neq g\circ f$ ist. Beispielsweise ist $(f\circ g)(1)=(1+1)^{2}=4\neq 2=1^{2}+1=(g\circ f)(1)$ .

Satz (Existenz der Umkehrfunktion)

Ist $f\colon A\to B$ bijektiv, so gibt es eine eindeutige Funktion $g\colon B\to A$ mit $g(f(x))=x$ für alle $x\in A$ und $f(g(y))=y$ für alle $y\in B$ .

Beweis (Existenz der Umkehrfunktion)

Beweisschritt: Existenz

Wir definieren $g(y)=x$ für das eindeutige $x\in A$ mit $f(x)=y$ . Die gewünschten Identitäten folgen unmittelbar.

Beweisschritt: Eindeutigkeit

Sind $g_{1},g_{2}\colon B\to A$ zwei solche Funktionen, so $g_{1}(y)=g_{1}(f(g_{2}(y)))=g_{2}(y)$ .

Definition (Umkehrfunktion)

Für eine bijektive Funktion $f\colon A\to B$ bezeichnen wir mit $f^{-1}$ die eindeutige Funktion $g$ aus obigem Satz. Diese Funktion nennen wir die Umkehrfunktion von $f$ .

Aufgaben

Aufgabe (Komposition surjektiver Abbildungen)

Seien $f\colon A\to B$ und $g\colon B\to C$ zwei Abbildungen. Seien $f$ und $g$ surjektiv. Zeige, dass $g\circ f$ surjektiv ist.

Wie kommt man auf den Beweis? (Komposition surjektiver Abbildungen)

Da $f:A\to B$ und $g:B\to C$ sind, dann ist $g\circ f:A\to C$ mit $(g\circ f)(a)=g(f(a))$ für alle $a\in A$ (Nach Definition von Funktionskomposition).

Wir müssen überprüfen, dass alle Elemente $c\in C$ durch $g\circ f$ getroffen werden:

Wir suchen für alle $c\in C$ ein Element $a\in A$ mit $c=(g\circ f)(a)$ .

Da $g$ surjektiv ist, gibt es für alle $c\in C$ ein Element $b\in B$ mit $c=g(b)$ .

Da $f$ surjektiv ist, gibt es für alle $b\in B$ ein Element $a\in A$ mit $f(a)=b$ .

Nun kann man zeigen, dass für alle $c\in C$ gilt: $c=g(b)=g(f(a))=(g\circ f)(a)$

Also ist die Funktion $g\circ f$ surjektiv.

Lösung (Komposition surjektiver Abbildungen)

$f:A\to B$ ist surjektiv $\iff (\forall b\in B\exists a\in A;f(a)=b)...(*)$

$g:B\to C$ ist surjektiv $\iff (\forall c\in C\exists b\in B;g(b)=c)...(**)$

Aus(*) und (**) gilt: $\forall c\in C:c=g(b)=g(f(a))=(g\circ f)(a);g\circ f:A\to C;a\mapsto g(f(a))$

Dann für alle $c\in C$ gibt es $a\in A$ mit $(g\circ f)(a)=c$ .Also ist $g\circ f$ surjektiv.

Aufgabe (Komposition injektiver Abbildungen)

Seien $f\colon A\to B$ und $g\colon B\to C$ zwei Abbildungen. Seien $f$ und $g$ injektiv. Zeige, dass $g\circ f$ injektiv ist.

Wie kommt man auf den Beweis? (Komposition injektiver Abbildungen)

Da $f:A\to B$ und $g:B\to C$ sind, dann ist $g\circ f:A\to C$ mit $(g\circ f)(a)=g(f(a))$ für alle $a\in A$ (Nach Definition von Funktionskomposition).

Wir müssen überprüfen, dass für alle zwei Elemente $a_{1},a_{2}\in A$ mit $(g\circ f)(a_{1})=(g\circ f)(a_{2})$ gilt $a_{1}=a_{2}$ :

$g$ ist injektiv, dann für alle zwei Elemente $b_{1},b_{2}\in B$ mit $g(b_{1})=g(b_{2})$ gilt $b_{1}=b_{2}$ .

$f$ ist injektiv, dann für alle zwei Elemente $a_{1},a_{2}\in A$ mit $f(a_{1})=f(a_{2})$ gilt $a_{1}=a_{2}$ .

Nun kann man zeigen, dass für alle zwei Elemente $a_{1},a_{2}\in A$ gilt: $(g\circ f)(a_{1})=(g\circ f)(a_{2})\implies g(f(a_{1}))=g(f(a_{2}))\implies f(a_{1})=f(a_{2})\implies a_{1}=a_{2}$

Also ist die Funktion $g\circ f$ injektiv.

Lösung (Komposition injektiver Abbildungen)

$f:A\to B$ ist injektiv $\iff (\forall a_{1},a_{2}\in A:f(a_{1})=f(a_{2})\implies a_{1}=a_{2}$ ) ...(*)

$g:B\to C$ ist injektiv $\iff (\forall b_{1},b_{2}\in B:g(b_{1})=g(b_{2})\implies b_{1}=b_{2}$ ) ...(**)

Aus(*) und (**) gilt: $\forall a_{1},a_{2}\in A:(g\circ f)(a_{1})=(g\circ f)(a_{2})\implies g(f(a_{1}))=g(f(a_{2}))\implies f(a_{1})=f(a_{2})\implies a_{1}=a_{2}$ .

Dann für alle $a_{1},a_{2}\in A$ gilt: $((g\circ f)(a_{1})=(g\circ f)(a_{2})\implies a_{1}=a_{2})$ .

Also ist die Funktion $g\circ f$ injektiv.

Aufgabe

Seien $f\colon A\to B$ und $g\colon B\to C$ zwei Abbildungen. Wenn $g$ und $g\circ f$ surjektiv sind, folgt daraus, dass $f$ surjektiv ist? Begründe deine Antwort.

Lösung

Wenn wir zeigen wollen, dass eine Funktion nicht surjektiv ist, reicht es ein einziges Gegenbeispiel zu finden. Seien die drei Mengen $A:=\{a\},B:=\{b,c\},C:=\{d\}$ mit $f(a)=b,g(b)=d,g(c)=d$ . Die formale Definition für Funktionskomposition $g\circ f$ lautet $g\circ f\colon A\to C$ mit $(g\circ f)(x)=g(f(x))$ für alle $x\in A$ . dann in unserem Gegenbeispiel haben wir $(g\circ f)(a)=d$ . Beachte, dass die Funktionen $g$ und $g\circ f$ surjektiv sind, weil alle Elemente von $C$ durch $g$ und $g\circ f$ getroffen werden. Aber die Funktion $f$ ist nicht surjektiv, denn es gibt eine Element $c\in B$ , die nicht Funktionswert durch $f$ ist. Es gilt, dass $f$ nicht unbedingt surjektiv ist.

Aufgabe

Seien $f\colon A\to B$ und $g\colon B\to C$ zwei Abbildungen. Wenn $g\circ f$ injektiv ist, folgt daraus, dass $f$ injektiv ist? Begründe deine Antwort.

Lösung

Die Antwort ist ja, was wir im Folgenden beweisen werden. Seien $x_{1},x_{2}\in A$ , wobei $f(x_{1})=f(x_{2})$ . Wir zeigen, dass $x_{1}=x_{2}$ . Weil $f(x_{1})=f(x_{2})$ , gilt

(g\circ f)(x_{1})=g(f(x_{1}))=g(f(x_{2}))=(g\circ f)(x_{2}).

Da $g\circ f$ injektiv ist, folgt aus der Definition, dass $x_{1}=x_{2}$ . Somit ist $f$ injektiv.

Verknüpfung

Definition der Verknüpfung

Verknüpfungen sind dir bereits aus der Schule bekannt. Beispiele hierfür sind Addition und Multiplikation. Diese Verknüpfungen können wir als spezielle Abbildungen betrachten. Schauen wir uns dazu als Beispiel die Verknüpfung der Addition auf den reellen Zahlen genauer an:

Die Addition verknüpft zwei Zahlen $x$ und $y$ zu einer neuen Zahl $x+y$ . Wir können somit die Addition als Abbildung vom $\mathbb {R} ^{2}$ nach $\mathbb {R}$ auffassen. (Wiederholung: $\mathbb {R} ^{2}=\mathbb {R} \times \mathbb {R}$ ist die Menge aller geordneter Paare $(x,y)$ mit $x\in \mathbb {R}$ und $y\in \mathbb {R}$ ). Der Definitionsbereich ist $\mathbb {R} ^{2}$ , weil bei der Addition zwei reelle Zahlen miteinander verknüpft werden. Die Zielmenge ist $\mathbb {R}$ , da das Ergebnis der Addition zweier reeller Zahlen wieder eine reelle Zahl ist. Damit ist die Addition eine Abbildung $+:\mathbb {R} ^{2}\rightarrow \mathbb {R} :(x,y)\mapsto x+y$ . Analog lässt sich auch die Multiplikation als Abbildung von $\mathbb {R} ^{2}$ nach $\mathbb {R}$ mit der Zuordnungsvorschrift $(x,y)\mapsto x\cdot y$ auffassen.

Das obige Beispiel können wir nun verallgemeinern. Statt $\mathbb {R}$ betrachten wir jetzt irgendeine Grundmenge $A$ . Die Addition ist eine Verknüpfung, die zwei Objekte zu einem neuen Objekt der Grundmenge verknüpft - wir wollen jetzt aber den allgemeineren Fall betrachten, dass eine Verknüpfung $n$ Objekte zu einem neuen Objekt verknüpft. Analog zu unserem Beispiel ist dann eine solche Verknüpfung eine Abbildung $A^{n}\rightarrow A$ , welche auch $n$ -stellige Verknüpfung genannt wird. Ein Synonym für das Wort „Verknüpfung“ ist der Begriff „Operation“

Definition (Verknüpfung)

Eine $n$ -stellige Verknüpfung auf einer Grundmenge $A$ ist eine Abbildung $A^{n}\rightarrow A$ .

Verständnisfrage: Zähle Beispiele für Verknüpfungen auf.

Addition $(x,y)\mapsto x+y$ , Multiplikation $(x,y)\mapsto x\cdot y$ und Potenzbildung $(x,y)\mapsto x^{y}$ sind zweistellige Verknüpfungen auf $\mathbb {R}$ .
Quadratfunktion $x\mapsto x^{2}$ , Betragsfunktion $x\mapsto |x|$ und Sinusfunktion $x\mapsto \sin(x)$ sind einstellige Verknüpfungen auf $\mathbb {R}$ .
Funktionskomposition von reellwertigen Funktionen ist eine binäre Verknüpfung auf der Menge aller Funktionen $\mathbb {R} \rightarrow \mathbb {R}$ .
Vereinigung, Differenz, Durchschnitt sind binäre Verknüpfungen auf der Potenzmenge einer gegebenen Grundmenge.
Komplementbildung ist eine einstellige Verknüpfungen auf der Potenzmenge einer gegebenen Grundmenge.

Binäre Verknüpfungen

Für zweistellige Verknüpfungen wird auch der Begriff binäre Verknüpfung gebraucht:

Definition (binäre Verknüpfung)

Eine binäre Verknüpfung ist eine zweistellige Verknüpfung. Eine binäre Verknüpfung auf einer Grundmenge $A$ ist damit eine Abbildung $A^{2}\rightarrow A$ .

Betrachten wir eine binäre Verknüpfung $\circ$ auf einer Grundmenge $A$ . Damit lässt sich $\circ$ als eine Abbildung $A^{2}\to A$ auffassen. Du kannst dir $\circ$ als eine Maschine vorstellen, die zwei Elemente $x$ und $y$ aus der Menge $A$ nimmt und daraus ein Element $x\circ y$ aus $A$ erzeugt:

Für binäre Verknüpfungen wird oft die Schreibweise $x\circ y$ verwendet. Hier steht $\circ$ stellvertretend für eine beliebige Verknüpfung wie die Addition $+$ oder die Multiplikation $\cdot$ . Diese Schreibweise sollte nicht mit der Funktionskomposition verwechselt werden, die auch das Symbol $\circ$ verwendet (Zwar ist die Funktionskomposition eine binäre Verknüpfung, aber nicht jede binäre Verknüpfung ist eine Funktionskomposition).

Eigenschaften binärer Verknüpfungen

Sei im Folgenden $\circ$ eine beliebige Verknüpfung auf einer Grundmenge $A$ . Wir betrachten nun die sogenannte Kommutativität beziehungsweise Assoziativität der binären Verknüpfung.

Kommutativität

Betrachten wir die Maschinenvorstellung einer binären Verknüpfung. Bei einer binären Verknüpfung besitzt die Maschine zwei Eingänge. In diese können wir zwei Objekte $x$ und $y$ aus der Grundmenge stecken. Ein Element stecken wir links in unsere Maschine und das andere rechts:

Ist die Reihenfolge, in der wir die Argumente in die Maschine stecken, egal? Kommt immer dasselbe raus, wenn wir $x$ und $y$ vertauschen?

Es gibt solche Verknüpfungen, bei dem die Reihenfolge der Argumente egal ist. Bei solchen Verknüpfungen ist stets $x\circ y=y\circ x$ unabhängig davon, welche Argumente $x$ und $y$ gewählt wurden. Ein Beispiel hierfür ist die Addition $+$ auf den reellen Zahlen. Für die Addition gilt nämlich stets $x+y=y+x$ .

Weil diese Eigenschaft praktisch ist, bekommt sie einen eigenen Namen. Wir sprechen hier von Kommutativität beziehungsweise nennen solche Verknüpfungen kommutative Verknüpfungen. Der Begriff kommt vom lateinischen Wort commutare, was „vertauschen“ bedeutet. Es ist also:

Definition (Kommutativität)

Eine binäre Verknüpfung $\circ :A^{2}\to A$ heißt kommutativ, wenn für alle $x,y\in A$ gilt: $x\circ y=y\circ x$ .

Beispiel (Beispiel und Nichtbeispiel für Kommutativität)

Die Addition $+$ auf den reellen Zahlen ist kommutativ. Für alle reellen Zahlen $x$ und $y$ ist nämlich $x+y=y+x$ .
Die Subtraktion $-$ auf den reellen Zahlen ist nicht kommutativ. So ist $3-1=2$ , aber $1-3=-2$ , also $3-1\neq 1-3$ .

Assoziativität

Was passiert, wenn wir mehr als zwei Objekte miteinander verknüpfen wollen? Nehmen wir die Addition als Verknüpfung und betrachten wir die Summe $4+42+23$ . Wie können wir diese Operation ausführen, wenn die Addition als zweistellige Verknüpfung definiert ist, also genau zwei Argumente zu einem Ergebnis zusammenfasst?

Hier haben wir zwei Möglichkeiten: Zum einen können wir zunächst die Summe von $4$ und $42$ bilden und dann $23$ hinzuaddieren. So berechnen wir $(4+42)+23$ . Zum anderen kann zunächst $42$ und $23$ miteinander addiert werden, um danach die Summe aus $4$ und dem Ergebnis der ersten Summe zu bilden. Hier wird $4+(42+23)$ gerechnet.

So haben wir bei jeder Verknüpfung $\circ$ zwei Möglichkeiten, um $x\circ y\circ z$ zu berechnen. Zum einen kann dieser Ausdruck als $(x\circ y)\circ z$ und zum anderen als $x\circ (y\circ z)$ berechnet werden. Im folgenden Diagramm sind beide Möglichkeiten mit dem Maschinenmodell dargestellt. Dabei stellt sich die Frage: Ist es egal, welche der beiden Methoden wir verwenden? Ist das Endergebnis gleich, egal in welcher Reihenfolge die einzelnen Verknüpfungen ausgerechnet werden?

Bei der Addition ist es egal, in welcher Reihenfolge die Verknüpfungen ausgerechnet werden. So ist $(x+y)+z=x+(y+z)$ für alle reellen Zahlen $x$ , $y$ und $z$ . Verknüpfungen wie die Addition, bei der die Reihenfolge der Verknüpfungsausrechnung egal ist, nennt man assoziativ. Das Wort kommt vom lateinischen associare und bedeutet „vereinigen“ beziehungsweise „verbinden“.

Definition (Assoziativität)

Eine binäre Verknüpfung $\circ :A^{2}\to A$ heißt assoziativ, wenn für alle $x,y,z\in A$ gilt: $x\circ (y\circ z)=(x\circ y)\circ z$ .

Beispiel (Beispiel und Gegenbeispiel für Assoziativität)

Die Addition $+$ auf den reellen Zahlen ist assoziativ. Die Aussage, dass $(x+y)+z=x+(y+z)$ für alle reellen Zahlen $x$ , $y$ und $z$ ist, nennt man auch Assoziativgesetz.
Die Subtraktion $-$ auf den reellen Zahlen ist nicht assoziativ. So ist $1-(1-1)=1$ , aber $(1-1)-1=-1$ . Es ist also $1-(1-1)\neq (1-1)-1$ .

Weil bei einer assoziativen Verknüpfung die Reihenfolge egal ist, in der die einzelnen Verknüpfungen ausgewertet werden, können wir Klammern weglassen. Dies gilt für drei und auch für mehr Operanden. Du kannst dann also statt $x\circ (y\circ z)$ oder $(x\circ y)\circ z$ auch einfach $x\circ y\circ z$ schreiben. Beachte, dass eine Schreibweise wie $x\circ y\circ z$ ohne Klammern nur dann sinnvoll ist, wenn die Verknüpfung assoziativ ist. Bei nicht assoziativen Verknüpfungen musst du immer die Klammern setzen.

Übungsaufgaben

Kommutativität und Assoziativität

Aufgabe

Welche der folgenden Verknüpfungen sind kommutativ und welche sind assoziativ?

Addition $(x,y)\mapsto x+y$ auf $\mathbb {R}$
Subtraktion $(x,y)\mapsto x-y$ auf $\mathbb {R}$
Multiplikation $(x,y)\mapsto x\cdot y$ auf $\mathbb {R}$
Potenzbildung $(x,y)\mapsto x^{y}$ auf $\mathbb {R}$ (x positiv, da sonst keine Verknüpfung)
Funktionskomposition
Durchschnitt auf der Potenzmenge einer Menge

Lösung

binäre Verknüpfung	assoziativ	kommutativ
Addition $(x,y)\mapsto x+y$ auf $\mathbb {R}$	X	X
Subtraktion $(x,y)\mapsto x-y$ auf $\mathbb {R}$
Multiplikation $(x,y)\mapsto x\cdot y$ auf $\mathbb {R}$	X	X
Potenzbildung $(x,y)\mapsto x^{y}$ auf $\mathbb {R}$
Funktionskomposition	X
Durchschnitt auf der Potenzmenge einer Menge	X	X

Eigenschaften von Verknüpfungen

Aufgabe (Einige Beispiele für Verknüpfungen)

Wir betrachten die folgenden drei Verknüpfungen:

$x\circ y=x+3xy+y$ auf $\mathbb {Z}$
$x\bullet y={\frac {2x+2y}{3}}$ auf $\mathbb {R}$
$x*y=yx^{2}+1$ auf $\mathbb {N}$

Entscheide, ob die folgenden Aussagen wahr oder falsch sind:

Die Verknüpfung $\circ$ ist auf $\mathbb {Z}$ kommutativ.
Die Verknüpfung $\circ$ ist auf $\mathbb {Z}$ assoziativ.
Es gibt eine ganze Zahl $e$ , sodass für alle $x\in \mathbb {Z}$ gilt: $x\circ e=x$ und $e\circ x=x$ .
Zu jedem $x\in \mathbb {Z}$ gibt es ein $y\in \mathbb {Z}$ , sodass gilt: $x\circ y=y\circ x=0$ .
Die Verknüpfung $\bullet$ ist auf $\mathbb {R}$ kommutativ.
Die Verknüpfung $\bullet$ ist auf $\mathbb {R}$ assoziativ.
Es gibt eine reelle Zahl $e$ , sodass für alle $x\in \mathbb {R}$ gilt: $x\bullet e=x$ und $e\bullet x=x$ .
Es gibt $x$ , $y$ , und $z\in \mathbb {R}$ , sodass gilt: $(x\bullet y)\bullet z=x\bullet (y\bullet z)$
Die Verknüpfung $*$ ist auf $\mathbb {N}$ kommutativ.
Die Verknüpfung $*$ ist auf $\mathbb {N}$ assoziativ.
Es gibt eine natürliche Zahl $e$ , sodass für alle $x\in \mathbb {N}$ gilt: $x*e=x$ und $e*x=x$ .

Lösung (Einige Beispiele für Verknüpfungen)

Wahr: Wir überprüfen, ob $x\circ y=y\circ x$ $x\circ y=y\circ x$ für alle $x,y\in \mathbb {Z}$ $x,y\in \mathbb {Z}$ gilt:
- Linke Seite: $x\circ y=x+3xy+y$
- Rechte Seite: $y\circ x=y+3yx+x$
Weil die Verknüpfungen $+$ $+$ und $\cdot$ $\cdot$ auf $\mathbb {Z}$ $\mathbb {Z}$ kommutativ sind, sind diese beiden Ergebnisse gleich. Also ist die Verknüpfung $\circ$ $\circ$ auf $\mathbb {Z}$ $\mathbb {Z}$ kommutativ.
Wahr: Wir überprüfen, ob für alle $x,y,z\in \mathbb {Z}$ gilt: $(x\circ y)\circ z=x\circ (y\circ z)$ . Die linke Seite ist:
${\begin{aligned}(x\circ y)\circ z&=(x+3xy+y)\circ z\\&=(x+3xy+y)+3((x+3xy+y)z)+z\\&=x+3xy+y+3xz+9yxz+3yz+z\end{aligned}}$

Und auf der rechten Seite erhalten wir:

${\begin{aligned}x\circ (y\circ z)&=x\circ (y+3yz+z)\\&=x+3(x(y+3yz+z))+(y+3yz+z)\\&=x+3xy+9xyz+3xz+y+3yz+z\end{aligned}}$

Da Addition und Multiplikation in $\mathbb {Z}$ kommutativ sind, können wir die Reihenfolge der Terme vertauschen. Wir sehen dann schnell, dass linke und rechte Seite übereinstimmen. Daher ist die Verknüpfung $\circ$ auf $\mathbb {Z}$ kommutativ.
Wahr: Wir überprüfen, ob es eine ganze Zahl $e$ gibt, sodass für jede ganze Zahl $x$ gilt: $x\circ e=x$ und $e\circ x=x$ . Erste Gleichung:
${\begin{aligned}&&x\circ e&=x\\&&&{\color {OliveGreen}\left\downarrow \ {\text{Verknüpfungsvorschrift einsetzen}}\right.}\\&\iff &x+3xe+e&=x\\&&&{\color {OliveGreen}\left\downarrow \ {\big \vert }-x\quad {\big \vert }-3xe\right.}\\&\iff &e&=-3xe\end{aligned}}$

Dies muss nun für alle $x\in \mathbb {Z}$ gelten. Also setzen wir 1 als Wert für $x$ ein, denn die Gleichung muss insbesondere auch dann gelten. Damit erhält man die Gleichung: $e=-3e$ . Also ist $e=0$ . Bisher haben wir nur ein Element $e$ gefunden, das die Gleichung $x\circ e=x$ für $x=1$ erfüllt. Deswegen prüfen wir jetzt, ob die Gleichung mit $e=0$ für alle ganzen Zahlen $x$ gilt. Wir setzen $e=0$ in die Verknüpfung ein und erhalten die allgemeingültige Aussageform $x+3\cdot x\cdot 0+0=x$ . Damit haben wir gezeigt, dass die erste Gleichung für alle ganzen Zahlen $x$ gilt.
Zweite Gleichung:

${\begin{aligned}&&e\circ x&=x\\&&&{\color {OliveGreen}\left\downarrow \ {\text{Verknüpfungsvorschrift einsetzen}}\right.}\\&\iff &e+3ex+x&=x\\&&&{\color {OliveGreen}\left\downarrow \ {\big \vert }-x\quad {\big \vert }-3ex\right.}\\&\iff &e&=-3ex\end{aligned}}$

Wir gehen vor wie bei der ersten Gleichung: Da auch die zweite Gleichung für alle $x\in \mathbb {Z}$ gelten muss, muss insbesondere auch für $x=1$ die folgende Gleichung richtig sein: $e=-3e$ . Daraus folgt unmittelbar $e=0$ . Umgekehrt erfüllt $e=0$ auch die Gleichung $e=-3ex$ für beliebige Werte $x\in \mathbb {Z}$ .
Falsch: Wir wollen herausfinden, ob es für jede ganze Zahl $x$ eine ganze Zahl $y$ gibt, sodass $x\circ y=0$ und $y\circ x=0$ ist. Betrachten wir zuerst die erste Gleichung:
${\begin{aligned}&&x\circ y&=0\\&&&{\color {OliveGreen}\left\downarrow \ {\text{Verknüpfungsvorschrift einsetzen}}\right.}\\&\iff &x+3xy+y&=0\\&&&{\color {OliveGreen}\left\downarrow \ y{\text{ aus }}3xy+y{\text{ ausklammern}}\right.}\\&\iff &x+y\cdot (3x+1)&=0\\&&&{\color {OliveGreen}\left\downarrow \ {\begin{array}{l}{\big \vert }-y\cdot (3x+1)\quad {\big \vert }:(3x+1)\\{\text{Die letzte Umformung ist nur erlaubt, weil für alle ganzen Zahlen }}x{\text{ gilt: }}3x+1\neq 0\end{array}}\right.}\\&\iff &{\frac {x}{3x+1}}&=-y\\\end{aligned}}$

Achtung: Auf den ersten Blick sieht die letzte Zeile dieser Gleichungsumformung so aus, als ob wir für jede Zahl $x$ auch eine Zahl $y$ berechnen könnten, die $x\circ y=0$ erfüllt. Aber die Zahl $y$ muss auch eine ganze Zahl sein. Das ist zum Beispiel für $x=1$ nicht der Fall, wie wir durch Einsetzen in $y=-{\frac {x}{3x+1}}$ sehen: Hier ist $y=-{\frac {1}{3\cdot 1+1}}=-{\frac {1}{4}}$ . Also haben wir ein Gegenbeispiel zu unserer Aussage gefunden, weil es zu $x=1$ kein ganzzahliges $y$ gibt, sodass $x\circ y=0$ gilt.
Wahr: Wir müssen überprüfen, ob $x\bullet y=y\bullet x$ $x\bullet y=y\bullet x$ für alle $x,y\in \mathbb {R}$ $x,y\in \mathbb {R}$ gilt:
- Linke Seite: $x\bullet y={\frac {2}{3}}(x+y)$
- Rechte Seite: $y\bullet x={\frac {2}{3}}(y+x)$
Da die Addition in $\mathbb {R}$ $\mathbb {R}$ kommutativ ist, stimmen rechte und linke Seite überein. Also ist die Verknüpfung $\bullet$ $\bullet$ kommutativ.
Falsch: Wir wollen überprüfen, ob die Verknüpfung assoziativ ist, also ob für alle $x,y,z\in \mathbb {R}$ $x,y,z\in \mathbb {R}$ gilt:
$x\bullet (y\bullet z)=(x\bullet y)\bullet z$
- Linke Seite: $x\bullet (y\bullet z)=x\bullet {\frac {2}{3}}(y+z)={\frac {2}{3}}{\Big (}x+{\frac {2}{3}}(y+z){\Big )}={\frac {2}{3}}x+{\frac {4}{9}}(y+z)$
- Rechte Seite: $(x\bullet y)\bullet z={\frac {2}{3}}(x+y)\bullet z={\frac {2}{3}}{\Big (}{\frac {2}{3}}(x+y)+z{\Big )}={\frac {2}{3}}z+{\frac {4}{9}}(x+y)$
Vergleichen wir diese Seiten, dann vermuten wir schnell, dass diese nicht übereinstimmen. Wir können konkrete Werte für $x,y,z$ einsetzen und sehen

$0\bullet (1\bullet 1)={\frac {2}{3}}\cdot {\frac {4}{3}}\neq {\frac {2}{3}}\cdot ({\frac {2}{3}}+1)=(0\bullet 1)\bullet 1$

Also ist die Verknüpfung $\bullet$ nicht assoziativ.
Falsch: Wir müssen untersuchen, ob es eine reelle Zahl $e$ gibt, sodass für alle $x\in \mathbb {R}$ gilt: $e\bullet x=x$ und $x\bullet e=x$ . Die beiden Gleichungen sind äquivalent, da wir ja schon gesehen haben, dass die Verknüpfung kommutativ ist. Wir kümmern uns also nur um die Gleichung $e\bullet x=x$ . Willst du ein solches $e$ finden oder seine Existenz widerlegen, gehst du immer gleich vor: Du nimmst die Gleichung und stellst sie um, damit du Dinge über $e$ erfahren kannst. Da die Gleichung für alle $x$ gelten muss, kannst du auch konkrete Werte für $x$ einsetzen und so etwas über $e$ erfahren. Probieren wir das einfach mal aus. Wir betrachten die Gleichung $e\bullet x=x$ und stellen sie um:
${\begin{aligned}e\bullet x&=x\\&{\color {OliveGreen}\left\downarrow \ {\text{Einsetzen der Definition von }}\bullet \right.}\\{\frac {2}{3}}(e+x)&=x\\&{\color {OliveGreen}\left\downarrow \ {\big \vert }-{\frac {2}{3}}x\right.}\\{\frac {2}{3}}e&={\frac {1}{3}}x\\&{\color {OliveGreen}\left\downarrow \ {\big \vert }\cdot {\frac {3}{2}}\right.}\\e&={\frac {1}{2}}x\end{aligned}}$

Diese Gleichung soll also für alle $x\in \mathbb {R}$ gelten. Du musst nur zwei verschiedene Werte von $x$ einsetzen und schon siehst du, dass das unmöglich ist. Wie sollte denn gleichzeitig $e=0$ (für $x=0$ ) und $e=1$ (für $x=2$ ) gelten? Also existiert kein $e$ mit der geforderten Eigenschaft.
Wahr: Zunächst solltest du erkennen, dass diese Aussage zwar sehr ähnlich zur Assoziativität aussieht, aber der Allquantor durch einen Existenzquantor ersetzt wurde. Wir müssen also nur ein Beispiel von Zahlen $x,y,z\in \mathbb {R}$ finden, das die altbekannte Eigenschaft $x\bullet (y\bullet z)=(x\bullet y)\bullet z$ erfüllt. Als wir gezeigt haben, dass $\bullet$ nicht assoziativ ist, haben wir die die beiden obigen Terme ausgerechnet:
${\begin{aligned}x\bullet (y\bullet z)&={\frac {2}{3}}x+{\frac {4}{9}}(y+z)\\(x\bullet y)\bullet z&={\frac {2}{3}}z+{\frac {4}{9}}(x+y)\end{aligned}}$

Wie kannst du jetzt $x,y$ und $z$ wählen, damit die beiden rechten Seiten gleich sind? Du könntest zum Beispiel $x=y=z=0$ wählen. Und schon hast du die Existenz der Zahlen bewiesen und bist fertig.
Falsch: Wir wollen untersuchen, ob die Gleichung $x*y=y*x$ $x*y=y*x$ für alle natürlichen Zahlen $x$ $x$ und $y$ $y$ erfüllt ist. Wie üblich setzen wir zunächst die Verknüpfungsvorschrift ein und erhalten:
- Linke Seite: $x*y=yx^{2}+1$
- Rechte Seite $y*x=xy^{2}+1$
Sicherlich siehst du, dass beiden Seiten für die meisten Werte von $x$ $x$ und $y$ $y$ nicht übereinstimmen. Wir setzen zum Beispiel $x=1$ $x=1$ und $y=2$ $y=2$ und sehen:
$1*2=2\cdot 1^{2}+1=3\neq 5=1\cdot 2^{2}+1=2*1$

Also ist die Verknüofung $*$ nicht kommutativ.
Falsch: Wir müssen wieder das Assoziativgesetz $x*(y*z)=(x*y)*z$ $x*(y*z)=(x*y)*z$ für beliebige $x,y,z\in \mathbb {N}$ $x,y,z\in \mathbb {N}$ nachrechnen.
- Linke Seite: $x*(y*z)=x*(zy^{2}+1)=(zy^{2}+1)x^{2}+1$
- Rechte Seite: $(x*y)*z=(yx^{2}+1)*z=z(yx^{2}+1)^{2}+1$
Auf der linken Seite kommt $x$ $x$ höchstens quadratisch vor, wohingegen $x$ $x$ auf der rechten Seite sogar in vierter Potenz vorkommt. Das ist ein ganz typisches Indiz dafür, dass die beiden Seiten im Allgemeinen nicht übereinstimmen können. Allerdings ist ein Indiz eben noch kein Beweis. Was wäre denn, wenn es irgendwelche anderen Terme gäbe, die diesen Unterschied in den Größenordnungen kompensieren könnten, die wir aber einfach nicht beachten würden? Um einen stichhaltigen Beweis für die Ungleichheit anzugeben, wollen wir Zahlen $x,y,z\in \mathbb {N}$ $x,y,z\in \mathbb {N}$ wählen, bei denen man die verschiedenen Werte der beiden Seiten konkret sieht. Wir wollen natürlich möglichst einfache Werte einsetzen. Wir wählen dafür $x=z=1$ $x=z=1$ . Dazu wählen wir $y=2$ $y=2$ , damit der Unterschied zwischen $y^{2}$ $y^{2}$ und $y^{4}$ $y^{4}$ zum Tragen kommt. Jetzt vergleichen wir wieder die beiden Seiten:
- Linke Seite: $x*(y*z)=(zy^{2}+1)x^{2}+1=(1\cdot 2^{2}+1)\cdot 1^{2}+1=6$
- Rechte Seite: $(x*y)*z=z(yx^{2}+1)^{2}+1=1\cdot (2\cdot 1^{2}+1)^{2}+1=10$
Da die beiden Seiten sich unterscheiden, kann die Verknüpfung $*$ $*$ nicht assoziativ sein.
Falsch: Wir müssen wieder prüfen, ob eine natürliche Zahl $e$ existiert, sodass $x*e=x=e*x$ für alle $x\in \mathbb {N}$ gilt. Wir betrachten zunächst nur die linke Gleichung und wollen einsehen, dass es kein $e$ gibt, das diese Gleichung im Allgemeinen erfüllt. Wie immer stellen wir die Gleichung dafür um:
${\begin{aligned}x*e&=x\\&{\color {OliveGreen}\left\downarrow \ {\text{Verknüpfungsvorschrift einsetzen}}\right.}\\ex^{2}+1&=x\\ex^{2}&=x-1\\e&={\frac {1-x}{x^{2}}}\end{aligned}}$

Nun sollen wir also einen festen Wert $e$ finden, der gleich ${\tfrac {1-x}{x^{2}}}$ ist – und zwar für alle natürlichen Zahlen $x$ . Wir müssen nur zwei verschiedene Werte $x$ einsetzen und sehen schon, dass das nicht funktionieren kann. Du solltest dir auch bewusst sein, dass die Zahl $e$ in jedem Fall eine natürliche Zahl sein müsste.

Hinweis

Das Element $e$ in 3. nennen wir neutrales Element bezüglich $\circ$ in $\mathbb {Z}$ . Neutrale Elemente spielen eine wichtige Rolle in der Algebra. Genauso ist $e$ in 7. das neutrale Element bezüglich $\bullet$ in $\mathbb {R}$ , in 11. bezüglich $*$ in $\mathbb {N}$ .

Mächtigkeit von Mengen

Warnung

Das folgende Kapitel enthält stark kontraintuitive Aussagen. Beim Lesen kann es zu Erstaunen und Verblüffung kommen. Ihr Geist wird sich mit der Zeit an diese Aussagen gewöhnen.

In diesem Kapitel werden wir uns mit der Frage beschäftigen, wann zwei Mengen gleich groß sind. Hier werden wir insbesondere „unendliche“ Mengen auf ihre Größe untersuchen. Dabei werden wir auf Ergebnisse stoßen, die scheinbar paradox sind und unserer Erwartung widersprechen. Dies ist auch der Grund, warum viele Mathematiker die Frage nach der Größe unendlicher Mengen vermieden haben oder ihre erste Beantwortung durch Georg Cantor (1845-1918) abgelehnt haben. So schrieb Carl Friedrich Gauß (1777-1855):

„Ich verabscheue es, wenn ein unendliches Objekt wie ein vollständig gegebenes Objekt verwendet wird. In der Mathematik ist diese Operation verboten; das Unendliche ist eine Redensart.“^[12]

Wir werden in diesem Kapitel sehr ausführlich das Unendliche untersuchen.

Bevor wir aber der Frage nach der Größe unendlicher Mengen nachgehen, beantworte bitte für dich folgende Fragen (du kannst auch „aus dem Bauch heraus“ antworten):

Beantworte intuitiv: Welche der folgenden Mengen ist größer? Welche der folgenden Mengen besitzt mehr Elemente?

Menge der natürlichen Zahlen $\mathbb {N}$ oder die Menge der Quadratzahlen $Q=\{n^{2}\,|\,n\in \mathbb {N} \}$
Menge der natürlichen Zahlen $\mathbb {N}$ oder die Menge der ganzen Zahlen $\mathbb {Z}$
Menge der natürlichen Zahlen $\mathbb {N}$ oder die Menge der rationalen Zahlen $\mathbb {Q}$
Menge der natürlichen Zahlen $\mathbb {N}$ oder die Menge der reellen Zahlen $\mathbb {R}$

Diese Fragen werden wir in diesem Kapitel beantworten.

Wann sind zwei Mengen gleich groß?

Wann besitzen zwei Mengen $A$ und $B$ gleich viele Elemente? Im Fall, dass $A$ und $B$ endliche Mengen sind, ist diese Frage einfach zu beantworten: Man zählt die Elemente beider Mengen und vergleicht diese Anzahl miteinander. Doch diese Methode kann nicht auf den Fall übertragen werden, dass eine der beiden Mengen unendlich ist.

Nun könnte man annehmen, dass alle unendlichen Mengen gleich groß sind. Schließlich bezeichnen wir die Größe dieser Menge in unserer Alltagssprache mit demselben Wort: „Unendlich“. Wir werden aber sehen, dass diese Annahme zu nicht sinnvollen Ergebnissen führen würde und dass es unterschiedliche Arten der Unendlichkeit gibt.

Da das Zählen der Elemente bei unendlichen Mengen fehlschlägt, müssen wir eine andere Methode finden, Mengen miteinander zu vergleichen. Schauen wir uns ein Beispiel aus der endlichen Welt an: Stell dir vor, dass du zwei Kisten mit unterschiedlich großen Steinen hast und wissen willst, in welcher Kiste mehr Steine sind. Leider hast du keinerlei Messgeräte und zählen kannst du auch nicht. Wie kannst du vorgehen?

Frage: Wie kannst du feststellen, in welcher Kiste mit unterschiedlich großen Steinen mehr Steine sind, ohne dass du zählst oder irgendwelche Hilfsmittel benutzt?

Eine Möglichkeit ist folgende: Du kannst die Steine beider Kisten so nebeneinander packen, dass jeweils ein Stein der einen Kiste neben einem Stein der anderen Kiste liegt. Ist eine Kiste leer und bleiben in der anderen Kiste Steine übrig, so besitzt die zweite Kiste mehr Steine als die erste. Werden beide Kisten gleichzeitig leer, so waren in den beiden Kisten dieselbe Anzahl von Steinen.

Was haben wir hier gemacht? Wir haben zwei endliche Mengen $A$ und $B$ , die wir vergleichen wollen. Nun haben wir nacheinander jeweils ein Element $a\in A$ und ein Element $b\in B$ einander zugeordnet. Dabei war diese Zuordnung eineindeutig. „Eineindeutig“ bedeutet, dass dem Element $a$ ein eindeutiges $b$ und dem Element $b$ ein eindeutiges Element $a$ zugeordnet wird. Waren wir damit in dem Sinn erfolgreich, dass wir jedem $a\in A$ ein eindeutiges $b\in B$ und jedem $b\in B$ ein eindeutiges $a\in A$ zuordnen konnten, dann sind beide Mengen gleich groß. Ist eine solche eineindeutige Zuordnung zwischen den Mengen $A$ und $B$ unmöglich, sind beide Mengen unterschiedlich groß.

Eine solche eineindeutige Zuordnung zwischen zwei Mengen ist aber nichts anderes als eine bijektive Abbildung zwischen diesen beiden Mengen. Dementsprechend sind zwei endliche Mengen genau dann gleich groß, wenn es zwischen ihnen eine bijektive Abbildung gibt. Dieses Merkmal gleich großer endlicher Mengen kann auch auf unendliche Mengen übertragen werden.

Bei der Übertragung auf unendliche Mengen müssen wir aber vorsichtig sein. Es tritt nämlich etwas auf, was bei endlichen Mengen nicht auftritt. Bei endlichen Mengen ist es egal, wie wir die Elemente der Mengen paarweise zuordnen. Bei unendlichen Mengen ist es nicht egal, wie die folgenden Beispiele zeigen:

Beispiel

Wir betrachten die Menge der natürlichen Zahlen $\mathbb {N} _{0}$ mit Null und $\mathbb {N} ^{+}$ ohne Null.

Die Funktion $f:\mathbb {N} _{0}\longmapsto \mathbb {N} _{0}:f(x)=x+1$ ist injektiv, aber nicht surjektiv.
Die Funktion $g:\mathbb {N} ^{+}\longmapsto \mathbb {N} _{0}:g(x)=x-1$ ist bijektiv.

Im Beispiel 1 ist die Zahl $0$ kein Bild der Funktion $f$ . Bei dieser Zuordnung bleibt die Zahl $0$ übrig. Im Beispiel 2 gilt $\mathbb {N} ^{+}\varsubsetneq \mathbb {N} _{0}$ , aber $g$ ist bijektiv und bei dieser Zuordnung bleiben keine Elemente übrig. Also ist eine echte Teilmenge zur gesamten Menge "gleich groß". Wir können daher nicht verlangen, dass alle injektiven Funktionen zwei gleichgroße unendliche Mengen bijektiv aufeinander abbilden. Es muss genügen, wenn wir eine bijektive Abbildung finden, damit zwei unendliche Mengen gleich groß sind.

Hinweis

Unendliche Mengen können injektiv in eine echte Teilmenge abgebildet werden.

Wir haben also eine Methode gefunden, zwei Mengen miteinander zu vergleichen: Zwei Mengen sind genau dann gleich groß, wenn eine bijektive Abbildung zwischen ihnen möglich ist. An dieser Stelle möchten wir noch darauf hinweisen, dass in der Mathematik eher von der Mächtigkeit als von der Größe von Mengen die Rede ist. So würde ein Mathematiker anstatt „zwei Mengen sind gleich groß“ eher „zwei Mengen sind gleichmächtig“ sagen.

Definition (Gleichmächtigkeit von Mengen)

Zwei Mengen $A$ und $B$ sind dann und nur dann gleichmächtig, wenn es zwischen ihnen eine bijektive Abbildung $f:A\longmapsto B$ gibt:

A\sim B:\iff {\text{ es gibt eine bijektive Abbildung }}f:A\longmapsto B

Sind zwei Mengen nicht gleichmächtig, dann bleiben beim Vergleich bei einer der beiden Mengen Elemente übrig. Wir erhalten dann keine bijektive Abbildung, sondern nur eine injektive. Ist $f:A\longmapsto B$ Injektiv, haben wir aber allen Elementen aus $A$ ein Element aus $B$ zugeordnet, so ist $A$ auf jeden Fall nicht mächtiger als $B$ . Wir definieren daher:

Definition (Mächtigkeit von Mengen)

Eine Mengen $B$ ist mächtiger als eine Menge $A$ , wenn es eine injektive Abbildung $f:A\longmapsto B$ gibt. $A$ wird dann schmächtiger als $B$ genannt:

A\precsim B:\iff {\text{ es gibt eine injektive Abbildung }}f:A\longmapsto B

Beachte, dass diese Definition den Fall der Gleichmächtigkeit einschließt! Den Zusammenhang zwischen den beiden Definitionen liefert der Äquivalenzsatz von Cantor-Bernstein-Schröder:

Satz (Äquivalenzsatz von Cantor-Bernstein-Schröder)

Ist $A$ schmächtiger als $B$ und $B$ schmächtiger als $A$ , dann sind $A$ und $B$ gleichmächtig:

A\precsim B\land B\precsim A\Longrightarrow A\sim B

Dieser Satz liefert ein weiteres Kriterium dafür, wie die Gleichmächtigkeit zweier Mengen bewiesen werden kann. Indem nämlich zwei Funktionen angegeben werden: $f:A\longmapsto B{\text{ injektiv}}$ und $g:B\longmapsto A{\text{ injektiv}}$ . Den Beweis des Äquivalenzsatzes führen wir hier.

Beispiele

Schauen wir uns nun die obigen Beispiele an, bei denen du dich intuitiv entscheiden solltest, welche Menge mehr Elemente enthält.

Menge der natürlichen Zahlen und Menge der Quadratzahlen

Welche Menge ist nun größer: Die Menge der natürlichen Zahlen $\mathbb {N}$ oder die Menge der Quadratzahlen $Q=\{n^{2}\,|\,n\in \mathbb {N} \}$ ? Ist es möglich, eine Bijektion zwischen $\mathbb {N}$ und $Q$ zu finden?

Ja, es gibt eine bijektive Abbildung zwischen $\mathbb {N}$ und $Q$ , nämlich die Abbildung $f:\mathbb {N} \rightarrow Q:n\mapsto n^{2}$ . Also die Abbildung

{\begin{array}{ccccccccc}1&2&3&4&5&6&7&8&\cdots \\[0.3em]\updownarrow &\updownarrow &\updownarrow &\updownarrow &\updownarrow &\updownarrow &\updownarrow &\updownarrow &\cdots \\[0.3em]1&4&9&16&25&36&49&64&\cdots \end{array}}

Es gibt also eine Abbildung, die jeder natürlichen Zahl eine eineindeutige Quadratzahl zuordnet. So sieht man, dass es genauso viele natürliche Zahlen gibt, wie es Quadratzahlen gibt. Dies ist ein erstes überraschendes Ergebnis: Denn aus der Tatsache, dass die Menge der Quadratzahlen eine echte Teilmenge der natürlichen Zahlen ist und dass es in den meisten endlichen Teilmengen der natürlichen Zahlen mehr natürliche Zahlen als Quadratzahlen gibt, könnte man vermuten, dass die Menge der natürlichen Zahlen mehr Elemente enthält als die Menge der Quadratzahlen. Dies ist aber, wie wir gerade gesehen haben, nicht der Fall.

Du siehst: Für unendliche Mengen ist der in der endlichen Welt gültige Satz „Ist $A$ eine echte Teilmenge der Menge $B$ , dann besitzt $B$ mehr Elemente als $A$ “ nicht mehr anwendbar.

Menge der natürlichen Zahlen und Menge der ganzen Zahlen

Kommen wir zum nächsten Beispiel:

Frage: Sind die Menge der natürlichen Zahlen $\mathbb {N}$ und die Menge der ganzen Zahlen $\mathbb {Z}$ gleich groß?

Auch diese beiden Mengen sind gleich groß. Eine bijektive Abbildung zwischen der Menge der natürlichen Zahlen $\mathbb {N}$ und der Menge der ganzen Zahlen $\mathbb {Z}$ ist die Abbildung

{\begin{array}{ccccccccc}1&2&3&4&5&6&7&8&\cdots \\[0.3em]\updownarrow &\updownarrow &\updownarrow &\updownarrow &\updownarrow &\updownarrow &\updownarrow &\updownarrow &\cdots \\[0.3em]0&-1&1&-2&2&-3&3&-4&\cdots \\\end{array}}

oder in einer Formel

f:\mathbb {N} \rightarrow \mathbb {Z} :n\mapsto {\begin{cases}{\tfrac {n-1}{2}}&n{\text{ ist ungerade}}\\-{\tfrac {n}{2}}&n{\text{ ist gerade}}\end{cases}}

Menge der natürlichen Zahlen und Menge der rationalen Zahlen

Auch die Menge der rationalen Zahlen ist gleich mächtig mit der Menge der natürlichen Zahlen. Hier ist es jedoch nicht so einfach, selbst auf den Beweis zu kommen. Zunächst musst du die rationalen Zahlen in eine geschickte zweidimensionale Anordnung bringen:

{\begin{array}{ccccccccccccccc}\cdots &-{\tfrac {1}{3}}&&-{\tfrac {1}{2}}&&-{\tfrac {1}{1}}&&0&&{\tfrac {1}{1}}&&{\tfrac {1}{2}}&&{\tfrac {1}{3}}&\cdots \\&&&&&&&&&&&&&&\\\cdots &-{\tfrac {2}{3}}&&-{\tfrac {2}{2}}&&-{\tfrac {2}{1}}&&&&{\tfrac {2}{1}}&&{\tfrac {2}{2}}&&{\tfrac {2}{3}}&\cdots \\&&&&&&&&&&&&&&\\\cdots &-{\tfrac {3}{3}}&&-{\tfrac {3}{2}}&&-{\tfrac {3}{1}}&&&&{\tfrac {3}{1}}&&{\tfrac {3}{2}}&&{\tfrac {3}{3}}&\\&\vdots &&\vdots &&\vdots &&&&\vdots &&\vdots &&\vdots &\\\end{array}}

Nun kannst du bei 0 beginnend die obige Anordnung der rationalen Zahlen so abzählen, dass jeder rationalen Zahl im Schema genau eine eindeutige natürliche Zahl zugeordnet wird:

{\begin{array}{clclclccclclclc}\cdots &-{\tfrac {1}{3}}&&-{\tfrac {1}{2}}\ _{\color {Blue}(6)}&{\color {MidnightBlue}\leftarrow }&-{\tfrac {1}{1}}\ _{\color {Blue}(5)}&&0\ _{\color {Blue}(1)}&{\color {MidnightBlue}\rightarrow }&{\tfrac {1}{1}}\ _{\color {Blue}(2)}&&{\tfrac {1}{2}}\ _{\color {Blue}(13)}&{\color {MidnightBlue}\rightarrow }&{\tfrac {1}{3}}\ _{\color {Blue}(14)}&\cdots \\[0.3em]&&&{\color {MidnightBlue}\downarrow }&&{\color {MidnightBlue}\uparrow }&&&&{\color {MidnightBlue}\downarrow }&&{\color {MidnightBlue}\uparrow }&&{\color {MidnightBlue}\downarrow }&\\[0.3em]\cdots &-{\tfrac {2}{3}}&&-{\tfrac {2}{2}}\ _{\color {Blue}(7)}&&-{\tfrac {2}{1}}\ _{\color {Blue}(4)}&{\color {MidnightBlue}\leftarrow }&{\color {MidnightBlue}-}&{\color {MidnightBlue}-}&{\tfrac {2}{1}}\ _{\color {Blue}(3)}&&{\tfrac {2}{2}}\ _{\color {Blue}(12)}&&{\tfrac {2}{3}}\ _{\color {Blue}(15)}&\cdots \\[0.3em]&&&{\color {MidnightBlue}\downarrow }&&&&&&&&{\color {MidnightBlue}\uparrow }&&{\color {MidnightBlue}\downarrow }&\\[0.3em]\cdots &-{\tfrac {3}{3}}&&-{\tfrac {3}{2}}\ _{\color {Blue}(8)}&{\color {MidnightBlue}\rightarrow }&-{\tfrac {3}{1}}\ _{\color {Blue}(9)}&{\color {MidnightBlue}-}&{\color {MidnightBlue}-}&{\color {MidnightBlue}\rightarrow }&{\tfrac {3}{1}}\ _{\color {Blue}(10)}&{\color {MidnightBlue}\rightarrow }&{\tfrac {3}{2}}\ _{\color {Blue}(11)}&&{\tfrac {3}{3}}\ _{\color {Blue}\cdots }&\cdots \\[0.3em]&\vdots &&\vdots &&\vdots &&&&\vdots &&\vdots &&{\color {MidnightBlue}\downarrow }&\\\end{array}}

So erhältst du folgende Abbildung der natürlichen Zahlen in die Menge der rationalen Zahlen:

{\begin{array}{ccccccccccc}{\color {Blue}1}&{\color {Blue}2}&{\color {Blue}3}&{\color {Blue}4}&{\color {Blue}5}&{\color {Blue}6}&{\color {Blue}7}&{\color {Blue}8}&{\color {Blue}9}&{\color {Blue}10}&{\color {Blue}\dotsb }\\[0.3em]{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }\\[0.3em]0&{\tfrac {1}{1}}&{\tfrac {2}{1}}&-{\tfrac {2}{1}}&-{\tfrac {1}{1}}&-{\tfrac {1}{2}}&-{\tfrac {2}{2}}&-{\tfrac {3}{2}}&-{\tfrac {3}{1}}&{\tfrac {3}{1}}&\dotsb \\\end{array}}

Durch diese Abbildung werden zwar alle rationalen Zahlen mindestens einmal getroffen (die Abbildung ist surjektiv), aber es gibt verschiedene natürliche Zahlen, die auf dieselbe rationale Zahl abgebildet werden (die Abbildung ist nicht injektiv). So wird der 5 und der 7 dieselbe rationale Zahl -1 zugeordnet. Um nun auch die Abbildung injektiv (und damit insgesamt bijektiv) zu machen, überspringen wir beim Abzählen diejenigen rationalen Zahlen, die nicht vollständig gekürzt sind:

{\begin{array}{clclclccclclclc}\cdots &-{\tfrac {1}{3}}&&-{\tfrac {1}{2}}\ _{\color {Blue}(6)}&{\color {MidnightBlue}\leftarrow }&-{\tfrac {1}{1}}\ _{\color {Blue}(5)}&&0\ _{\color {Blue}(1)}&{\color {MidnightBlue}\rightarrow }&{\tfrac {1}{1}}\ _{\color {Blue}(2)}&&{\tfrac {1}{2}}\ _{\color {Blue}(11)}&{\color {MidnightBlue}\rightarrow }&{\tfrac {1}{3}}\ _{\color {Blue}(12)}&\cdots \\[0.3em]&&&{\color {MidnightBlue}\downarrow }&&{\color {MidnightBlue}\uparrow }&&&&{\color {MidnightBlue}\downarrow }&&{\color {MidnightBlue}\uparrow }&&{\color {MidnightBlue}\downarrow }&\\[0.3em]\cdots &-{\tfrac {2}{3}}&&-{\tfrac {2}{2}}\ _{\color {Blue}(\cdot )}&&-{\tfrac {2}{1}}\ _{\color {Blue}(4)}&{\color {MidnightBlue}\leftarrow }&{\color {MidnightBlue}-}&{\color {MidnightBlue}-}&{\tfrac {2}{1}}\ _{\color {Blue}(3)}&&{\tfrac {2}{2}}\ _{\color {Blue}(\cdot )}&&{\tfrac {2}{3}}\ _{\color {Blue}(13)}&\cdots \\[0.3em]&&&{\color {MidnightBlue}\downarrow }&&&&&&&&{\color {MidnightBlue}\uparrow }&&{\color {MidnightBlue}\downarrow }&\\[0.3em]\cdots &-{\tfrac {3}{3}}&&-{\tfrac {3}{2}}\ _{\color {Blue}(7)}&{\color {MidnightBlue}\rightarrow }&-{\tfrac {3}{1}}\ _{\color {Blue}(8)}&{\color {MidnightBlue}-}&{\color {MidnightBlue}-}&{\color {MidnightBlue}\rightarrow }&{\tfrac {3}{1}}\ _{\color {Blue}(9)}&{\color {MidnightBlue}\rightarrow }&{\tfrac {3}{2}}\ _{\color {Blue}(10)}&&{\tfrac {3}{3}}\ _{\color {Blue}\cdots }&\cdots \\[0.3em]&\vdots &&\vdots &&\vdots &&&&\vdots &&\vdots &&{\color {MidnightBlue}\downarrow }&\\\end{array}}

So erhalten wir folgende bijektive Abbildung zwischen $\mathbb {N}$ und $\mathbb {Q}$ :

{\begin{array}{cccccccccccc}{\color {Blue}1}&{\color {Blue}2}&{\color {Blue}3}&{\color {Blue}4}&{\color {Blue}5}&{\color {Blue}6}&{\color {Blue}7}&{\color {Blue}8}&{\color {Blue}9}&{\color {Blue}10}&{\color {Blue}11}&{\color {Blue}\cdots }\\[0.3em]{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }\\[0.3em]0&{\tfrac {1}{1}}&{\tfrac {2}{1}}&-{\tfrac {2}{1}}&-{\tfrac {1}{1}}&-{\tfrac {1}{2}}&-{\tfrac {3}{2}}&-{\tfrac {3}{1}}&{\tfrac {3}{1}}&{\tfrac {3}{2}}&{\tfrac {1}{2}}&\cdots \\\end{array}}

Es ist also möglich, $\mathbb {N}$ bijektiv auf $\mathbb {Q}$ abzubilden. Dies beweist, dass $\mathbb {N}$ und $\mathbb {Q}$ gleich mächtig sind, also dieselbe Anzahl an Elementen besitzen. Auch dies ist eine stark kontraintuitive Feststellung, denn allein im Intervall $[0,1]$ gibt es unendlich viele rationale, aber nur zwei natürliche Zahlen.

Zur Übung kannst du nun folgende Aufgabe lösen:

Frage: Welche Menge ist größer: $\mathbb {N}$ oder $\mathbb {Q} ^{+}$ , die Menge der positiven rationalen Zahlen?

Auch die beiden Mengen $\mathbb {N}$ und $\mathbb {Q} ^{+}$ sind gleich mächtig. Um dies zu zeigen, wählen wir folgendes Schema zur Anordnung der positiven rationalen Zahlen:

{\begin{array}{cccccccccc}{\tfrac {1}{1}}&&{\tfrac {1}{2}}&&{\tfrac {1}{3}}&&{\tfrac {1}{4}}&&{\tfrac {1}{5}}&\cdots \\&&&&&&&&&\\{\tfrac {2}{1}}&&{\tfrac {2}{2}}&&{\tfrac {2}{3}}&&{\tfrac {2}{4}}&&{\tfrac {2}{5}}&\cdots \\&&&&&&&&&\\{\tfrac {3}{1}}&&{\tfrac {3}{2}}&&{\tfrac {3}{3}}&&{\tfrac {3}{4}}&&{\tfrac {3}{5}}&\cdots \\&&&&&&&&&\\{\tfrac {4}{1}}&&{\tfrac {4}{2}}&&{\tfrac {4}{3}}&&{\tfrac {4}{4}}&&{\tfrac {4}{5}}&\cdots \\&&&&&&&&&\\{\tfrac {5}{1}}&&{\tfrac {5}{2}}&&{\tfrac {5}{3}}&&{\tfrac {5}{4}}&&{\tfrac {5}{5}}&\cdots \\\vdots &&\vdots &&\vdots &&\vdots &&\vdots &\\\end{array}}

Um eine bijektive Abbildung von $\mathbb {N}$ nach $\mathbb {Q} ^{+}$ zu erhalten, zählen wir die rationalen Zahlen im Schema diagonal beginnend bei ${\tfrac {1}{1}}$ ab, wobei wir nicht vollständig gekürzte Brüche überspringen:

{\begin{array}{lclclclclc}{\tfrac {1}{1}}\ _{\color {Blue}(1)}&{\color {MidnightBlue}\rightarrow }&{\tfrac {1}{2}}\ _{\color {Blue}(2)}&&{\tfrac {1}{3}}\ _{\color {Blue}(5)}&{\color {MidnightBlue}\rightarrow }&{\tfrac {1}{4}}\ _{\color {Blue}(6)}&&{\tfrac {1}{5}}\ _{\color {Blue}(11)}&{\color {MidnightBlue}\rightarrow }\\&{\color {MidnightBlue}\swarrow }&&{\color {MidnightBlue}\nearrow }&&{\color {MidnightBlue}\swarrow }&&{\color {MidnightBlue}\nearrow }&&\\{\tfrac {2}{1}}\ _{\color {Blue}(3)}&&{\tfrac {2}{2}}\ _{\color {Blue}(\cdot )}&&{\tfrac {2}{3}}\ _{\color {Blue}(7)}&&{\tfrac {2}{4}}\ _{\color {Blue}(\cdot )}&&{\tfrac {2}{5}}&\cdots \\{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\nearrow }&&{\color {MidnightBlue}\swarrow }&&{\color {MidnightBlue}\nearrow }&&&&\\{\tfrac {3}{1}}\ _{\color {Blue}(4)}&&{\tfrac {3}{2}}\ _{\color {Blue}(8)}&&{\tfrac {3}{3}}\ _{\color {Blue}(\cdot )}&&{\tfrac {3}{4}}&&{\tfrac {3}{5}}&\cdots \\&{\color {MidnightBlue}\swarrow }&&{\color {MidnightBlue}\nearrow }&&&&&&\\{\tfrac {4}{1}}\ _{\color {Blue}(9)}&&{\tfrac {4}{2}}\ _{\color {Blue}(\cdot )}&&{\tfrac {4}{3}}&&{\tfrac {4}{4}}&&{\tfrac {4}{5}}&\cdots \\{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\nearrow }&&&&&&&&\\{\tfrac {5}{1}}\ _{\color {Blue}(10)}&&{\tfrac {5}{2}}&&{\tfrac {5}{3}}&&{\tfrac {5}{4}}&&{\tfrac {5}{5}}&\cdots \\&&\vdots &&\vdots &&\vdots &&\vdots &\\\end{array}}

So haben wir folgende bijektive Abbildung zwischen $\mathbb {N}$ und $\mathbb {Q} ^{+}$ gefunden, die beweist, dass beide Mengen gleich mächtig sind:

{\begin{array}{cccccccccccccccc}{\color {Blue}1}&{\color {Blue}2}&{\color {Blue}3}&{\color {Blue}4}&{\color {Blue}5}&{\color {Blue}6}&{\color {Blue}7}&{\color {Blue}8}&{\color {Blue}9}&{\color {Blue}10}&{\color {Blue}11}&{\color {Blue}\cdots }\\[0.3em]{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }&{\color {MidnightBlue}\downarrow }\\[0.3em]1&{\tfrac {1}{2}}&2&3&{\tfrac {1}{3}}&{\tfrac {1}{4}}&{\tfrac {2}{3}}&{\tfrac {3}{2}}&4&5&{\tfrac {1}{5}}&\cdots \\\end{array}}

Das hier vorgestellte Vefahren wird auch Cantors erstes Diagonalargument genannt.

Menge der natürlichen Zahlen und Menge der reellen Zahlen

Als letztes Beispiel vergleichen wir die Menge $\mathbb {N}$ der natürlichen Zahlen mit der Menge $\mathbb {R}$ der reellen Zahlen. Hier werden wir sehen, dass es mehr reelle als natürliche Zahlen gibt. Doch wie kann man beweisen, dass $\mathbb {N}$ und $\mathbb {R}$ nicht gleich mächtig sind?

Wir werden diesen Beweis in zwei Schritten führen: Zunächst zeigen wir, dass die Menge der reellen Zahlen $\mathbb {R}$ und das offene Intervall $(0,1)$ gleich mächtig sind. Danach zeigen wir, dass $\mathbb {N}$ und $(0,1)$ nicht gleich mächtig sind. So haben wir gezeigt, dass auch $\mathbb {N}$ und $\mathbb {R}$ nicht gleich mächtig sind (wären $\mathbb {N}$ und $\mathbb {R}$ gleich mächtig, so wären auch $\mathbb {N}$ und $(0,1)$ gleich mächtig, was wir aber widerlegt haben).

Frage: Wieso sind $\mathbb {R}$ und $(0,1)$ gleich mächtig? Wie sieht eine bijektive Abbildung zwischen $\mathbb {R}$ und $(0,1)$ aus?

Wir wissen, dass der Tangens eine bijektive Abbildung von $(-{\tfrac {\pi }{2}},\,{\tfrac {\pi }{2}})$ nach $\mathbb {R}$ ist. Diese Funktion können wir nutzen, um eine bijektive Abbildung $f:(0,1)\rightarrow \mathbb {R}$ zu basteln. Durch die Zuordnung $x\mapsto \pi \cdot x-{\tfrac {\pi }{2}}$ wird das Intervall $(0,1)$ bijektiv auf $(-{\tfrac {\pi }{2}},\,{\tfrac {\pi }{2}})$ verschoben. Wenn man nun noch den Tangens anwendet, entsteht eine bijektive Abbildung $f$ :

f:(0,1)\rightarrow \mathbb {R} :x\mapsto \tan \left(\pi \cdot x-{\tfrac {\pi }{2}}\right)

Alternativ können wir mit dem Arkustangens eine bijektive Abbildung $g:\mathbb {R} \rightarrow (0,1)$ konstruieren:

g:\mathbb {R} \rightarrow (0,1):x\mapsto {\frac {\arctan(x)}{\pi }}+{\frac {1}{2}}

Nun müssen wir beweisen, dass $\mathbb {N}$ und $(0,1)$ nicht gleich mächtig sein können, dass es also keine bijektive Abbildung $f:\mathbb {N} \rightarrow (0,1)$ gibt.

Sei dazu $f:\mathbb {N} \rightarrow (0,1)$ eine beliebige Abbildung. Wir können nun die einzelnen Funktionswerte dieser Funktion in ihrer Dezimalentwicklung in einer unendlich langen Liste untereinander schreiben:

{\begin{aligned}f(1)&=0,\ a_{11}\ a_{12}\ a_{13}\ a_{14}\dots \\[0.3em]f(2)&=0,\ a_{21}\ a_{22}\ a_{23}\ a_{24}\dots \\[0.3em]f(3)&=0,\ a_{31}\ a_{32}\ a_{33}\ a_{34}\dots \\[0.3em]f(4)&=0,\ a_{41}\ a_{42}\ a_{43}\ a_{44}\dots \\[0.3em]&\ \,\vdots \end{aligned}}

Dabei steht die Variable $a_{ij}$ für die Ziffer aus der Menge $\{1,2,3,\ldots ,9,0\}$ , die bei der Dezimalentwicklung der Zahl $f(i)$ an der $j$ -ten Nachkommastelle auftritt. Sollte eine Dezimalentwicklung einer reellen Zahl abbrechen, so füllen wir diese mit Nullen auf. So wird aus der Dezimalentwicklung 0,25 der Zahl ${\tfrac {1}{4}}$ die Dezimalentwicklung $0,2500000000\dots$

Wäre beispielsweise $f(1)={\tfrac {1}{2}}$ , $f(2)={\tfrac {3}{4}}$ , $f(3)={\tfrac {1}{3}}$ und $f(4)=\pi -3$ , so würden die ersten vier Zeilen unserer Liste so aussehen:

{\begin{aligned}f(1)&=0,\ 5\ 0\ 0\ 0\dots \\[0.3em]f(2)&=0,\ 7\ 5\ 0\ 0\dots \\[0.3em]f(3)&=0,\ 3\ 3\ 3\ 3\dots \\[0.3em]f(4)&=0,\ 1\ 4\ 1\ 5\dots \\[0.3em]&\ \,\vdots \end{aligned}}

Nun konstruieren wir mit Hilfe der Liste eine neue Zahl $x=0,x_{1}\,x_{2}\,x_{3}\,x_{4}\dots$ , welche im offenen Intervall $(0,1)$ liegt und nicht in der Liste enthalten ist. Dabei gehen wir nach folgendem Algorithmus vor:

Wir setzen $x_{1}=5$ , wenn $a_{11}\neq 5$ und $x_{1}=4$ , wenn $a_{11}=5$ ist. Damit ist $x\neq f(1)$ .
Wir setzen $x_{2}=5$ , wenn $a_{22}\neq 5$ und $x_{2}=4$ , wenn $a_{22}=5$ ist. Damit ist $x\neq f(2)$ .
Wir setzen $x_{3}=5$ , wenn $a_{33}\neq 5$ und $x_{3}=4$ , wenn $a_{33}=5$ ist. Damit ist $x\neq f(3)$ .
$\dots$

Die allgemeine Regel zur Konstruktion von $x$ lautet dabei:

Setze $x_{i}=5$ , wenn $a_{ii}\neq 5$ ist und setze ansonsten $x_{i}=4$ .

Diese Regel garantiert, dass $x$ sich von jedem $f(i)$ für $i\in \mathbb {N}$ unterscheidet, da sich $x$ in seiner Dezimalbruchentwicklung an der $i$ -ten Nachkommastelle von $f(i)$ unterscheidet.

Hinweis

Es gibt eine Möglichkeit, bei der zwei unterschiedliche Dezimalbruchentwicklungen dieselbe Zahl bezeichnen. Dies kann nämlich dann und nur dann auftreten, wenn eine der beiden Dezimalbruchentwicklungen mit lauter 9ern endet. So ist beispielsweise:

0,999999\ldots =3\cdot 0,333333\ldots =3\cdot {\tfrac {1}{3}}=1=1,000000\ldots

Da wir aber die Unterscheidung in $a_{ii}=5$ und $a_{ii}\neq 5$ machen und in der Dezimalbruchentwicklung von $x$ nur 5er und 4er nach dem Komma auftreten, kann dieser Fall in unserem Beweis nicht auftreten.

In unserem obigen Beispiel würden die ersten 4 Nachkommastellen von $x$ lauten:

{\begin{aligned}f(1)&=0,\ {\color {Red}5}\ 0\ 0\ 0\dots \\[0.3em]f(2)&=0,\ 7\ {\color {Blue}5}\ 0\ 0\dots \\[0.3em]f(3)&=0,\ 3\ 3\ {\color {OliveGreen}3}\ 3\dots \\[0.3em]f(4)&=0,\ 1\ 4\ 1\ {\color {RedOrange}5}\dots \\[0.3em]&\ \,\vdots \\\\x&=0,\ {\color {Red}4}\ {\color {Blue}4}\ {\color {OliveGreen}5}\ {\color {RedOrange}4}\dots \\\end{aligned}}

Außerdem ist $x$ eine reelle Zahl im Intervall $(0,1)$ , da als Nachkommastellen nur 4er und 5er auftreten und da $x$ keine Vorkommastellen ungleich Null besitzt. $x$ ist auch nicht in unserer Liste enthalten, was bedeutet, dass es nicht durch die Funktion $f$ getroffen wird. Dies bedeutet aber, dass $f$ nicht surjektiv ist. Also ist $f$ sicher nicht bijektiv.

Da dieser Beweis für jede Abbildung $f$ funktioniert, gibt es keine bijektive Abbildung zwischen der Menge der natürlichen Zahlen und der Menge der reellen Zahlen. Dies beweist, dass beide Mengen nicht gleich mächtig sind, dass es also unterschiedliche Arten der Unendlichkeit gibt. Es gibt natürlich eine injektive Abbildung von $\mathbb {N}$ in $\mathbb {R}$ , nämlich die Identität: $id:\mathbb {N} \longmapsto \mathbb {R} :id(x)=x$ . Also ist $\mathbb {R}$ echt mächtiger als $\mathbb {N}$ .

Der obige Beweis wurde von Georg Cantor 1877 entdeckt und wird Cantors zweites Diagonalargument genannt.

Abzählbarkeit und Überabzählbarkeit

Wir haben in den Beispielen zwei verschiedene Größen von unendlichen Mengen kennengelernt: die Abzählbarkeit und die Überabzählbarkeit. Eine Menge ist abzählbar unendlich, wenn sie gleichmächtig mit der Menge $\mathbb {N}$ ist. Dies bedeutet, dass alle Elemente dieser Menge in einer unendlichen Liste aufgeschrieben werden können. Dies ist gleichwertig damit, dass man alle Elemente dieser Menge abzählen kann (ihr also eine eineindeutige Indexnummer zuordnen kann).

Eine höchstens abzählbare Menge ist entweder endlich oder abzählbar unendlich. Eine überabzählbare Menge ist eine Menge, die nicht höchstens abzählbar, also mächtiger als die Menge der natürlichen Zahlen ist. Eine solche Menge kann nicht in einer unendlichen Liste aufgeschrieben werden. Dafür ist sie einfach zu groß.

Hinweis

In der Literatur wird der Begriff „abzählbar“ nicht eindeutig verwendet. Manchmal bedeutet dieser Begriff „abzählbar unendlich“ und manchmal „höchstens abzählbar“.

Die Begriffe dieses Abschnitts treten in der Mathematik oft und an verschiedenen Stellen auf. Deshalb ist es wichtig, dass du lernst, mit diesen Begriffen umzugehen.

Beispiel (abzählbar unendliche und überabzählbar unendliche Mengen)

Die Mengen $\mathbb {N}$ , $\mathbb {Z}$ und $\mathbb {Q}$ sind abzählbar unendlich.
Die Mengen $\mathbb {R}$ und $\mathbb {C}$ sind überabzählbar unendlich.

Äquivalenzsatz von Cantor-Bernstein-Schröder

Satz (Äquivalenzsatz von Cantor-Bernstein-Schröder)

Ist $A$ schmächtiger als $B$ und $B$ schmächtiger als $A$ , dann sind $A$ und $B$ gleichmächtig:

A\precsim B\land B\precsim A\Longrightarrow A\sim B

Wir beweisen den Satz in mehreren Schritten und zeigen zunächst die Äquivalenz mit dem Zwischenmengensatz.^[13]

Satz (Zwischenmengensatz)

Liegt eine Menge $B$ zwischen einer Menge $A$ und einem injektiven Bild von $A$ , so sind $A$ und $B$ gleichmächtig.

f:A\longmapsto A{\text{ injektiv }}\land A\supseteq B\supseteq f(A)\Longrightarrow A\sim B

Wir zeigen zunächst, dass der Äquivalenzsatz und der Zwischenmengensatz äquivalent sind:

Satz

{\text{Äquivalenzsatz von Cantor-Bernstein-Schröder }}\iff {\text{ Zwischenmengensatz}}

Beweis

" $\Rightarrow$ ": Es gelte der Äquivalenzsatz von Cantor-Bernstein-Schröder. Weiterhin sei $f:A\longmapsto A{\text{ injektiv }}$ und es gelte $A\supseteq B\supseteq f[A]$ . Setze $g:=f\upharpoonright B$ , dann bildet $g$ injektiv in $A$ ab. Mit $B\supseteq f[A]$ bildet $f$ auch injektiv in $B$ ab. Mit dem Satz von Cantor-Bernstein-Schröder folgt $A\sim B$ .

" $\Leftarrow$ ": Gelte nun der Zwischenmengensatz, sowie $f:A\longmapsto B$ injektiv und $g:B\longmapsto A$ Injektiv. Dann ist auch die Verkettung injektiv $(g\circ f):A\longmapsto A$ und es gilt: $A\supseteq g(B)\supseteq (g\circ f)(A)$ . Mit dem Zwischenmengensatz folgt $A\sim B$ . ✔

Für den Beweis des Zwischenmengensatzes definieren wir noch eine spezielle Halbordnung:

Definition (Spezielle Halbordnung)

Es sei $f:A\longmapsto A$ eine Funktion von $A$ in $A$ . Dann ist ${\mathsf {Fix}}(f):=\{x\in A\,|\,f(x)=x\}$ die Menge der Fixpunkte von $f$ . Für zwei beliebige Funktionen $f:A\longmapsto A$ und $g:A\longmapsto A$ ist die Relation $\sqsubseteq$ wie folgt definiert:

g\sqsubseteq f:\iff {\mathsf {Fix}}(g)\supseteq {\mathsf {Fix}}(f)\land \forall x:(x\neq g(x)\Rightarrow g(x)=f(x))

$g\sqsubseteq f$ besagt, dass $g$ mehr Fixpunkte als $f$ hat, aber ansonsten mit $f$ übereinstimmt.

Aufgabe: Zeige, dass $\sqsubseteq$ eine Halbordnung ist.

Zu zeigen ist, $\sqsubseteq$ ist reflexiv, transitiv und antisymmetrisch.

reflexiv: Es gilt ${\mathsf {Fix}}(g)={\mathsf {Fix}}(g)$ und $g(x)=g(x)$ , also auch $g\sqsubseteq g$ .

transitiv: Gelte $g\sqsubseteq f$ und $f\sqsubseteq h$ . Dann folgt ${\mathsf {Fix}}(g)\supseteq {\mathsf {Fix}}(f)$ und ${\mathsf {Fix}}(f)\supseteq {\mathsf {Fix}}(h)$ . Daraus ergibt sich ${\mathsf {Fix}}(g)\supseteq {\mathsf {Fix}}(h)$ . Für $x\neq g(x)$ ist $x$ kein Fixpunkt von $f$ und auch kein Fixpunkt von $h$ . Also folgt $g(x)=f(x)=h(x)$ und somit $g\sqsubseteq h$ .

antisymmetrisch: Gelte $g\sqsubseteq f$ und $f\sqsubseteq g$ . Dann gilt ${\mathsf {Fix}}(g)\supseteq {\mathsf {Fix}}(f)$ und ${\mathsf {Fix}}(f)\supseteq {\mathsf {Fix}}(g)$ also ${\mathsf {Fix}}(g)={\mathsf {Fix}}(f)$ . Daher stimmen beide Funktionen überein $g(x)=f(x)$ und es gilt: $g=f$ .

Die Beweisidee ist folgende: wir betrachten alle injektiven Funktionen $h:A\longmapsto B$ , die zwar mehr Fixpunkte haben als die gegebene Funktion $f:A\longmapsto B$ , aber ausserhalb dieser Fixpunkte mit $f$ übereinstimmen. Je mehr Fixpunkte diese Funktionen haben, desto weniger Funktionswerte stimmen mit $f$ überein. Unter diesen Funktionen gibt es (hoffentlich) welche, deren Bildbereich weitere Elemente von $B$ umfasst. Diese müssen Fixpunkte sein, denn ansonsten sind keine Abweichungen von $f$ erlaubt. Wenn es unter den betrachteten Funktionen eine gibt, in deren Bildbereich alle Elemente von $B$ liegen, haben wir eine Bijektion $A\longmapsto B$ gefunden.

Beweis (Zwischenmengensatz, Äquivalenzsatz)

Sei nun $f:A\longmapsto A{\text{ injektiv}}$ und gelte $A\supseteq B\supseteq f(A)$ . Sei weiterhin:

J:=\{h\,|\,h:A\longmapsto B{\text{ injektiv}}\land h\sqsubseteq f\}

$J$ ist die Menge aller injektiven Funktionen $A\longmapsto B$ , die mehr Fixpunkte als $f$ haben. Es gilt $f\in J$ , denn $f$ ist nach Voraussetzung Injektiv, $f(A)\subseteq B$ und es gilt $f\sqsubseteq f$ . Wir definieren:

F:=\bigcup _{h\in J}{\mathsf {Fix}}(h)

$F$ ist die Fixpunktmenge aller Funktionen aus $J$ . Es gilt $F\subseteq B$ , denn wenn $x\in F$ gibt es ein $h\in J$ dessen Fixpunkt $x$ ist und da $h:A\longmapsto B$ gilt $x=f(x)\in B$ . Wir definieren schliesslich die gesuchte Bijektion:

\color {red}g(x)={\begin{cases}x,&{\text{wenn }}x\in F\\f(x),&{\text{sonst}}\end{cases}}

$g:A\longmapsto B{\text{ injektiv}}$ , da $f$ injektiv ist, und es gilt nach Definition von $g$ :

(

\star

)

\forall h\in J:g\sqsubseteq h

Da ja $f\in J$ , wie oben gezeigt, gilt $g\sqsubseteq f$ . Wir zeigen nun: $g{\text{ ist injektiv}}$ . Seien $x,y\in A$ und gelte $x\neq y$ . Sind $x,y\in F$ , dann folgt $g(x)=x\neq y=g(y)$ . Sind $x,y\in A\setminus F$ folgt $g(x)=f(x)\neq f(y)=g(y)$ aus der Injektivität von $f$ . Bleibt als letzter Fall $x\in F$ und $y\in A\setminus F$ . Dann gibt es $h\in J$ mit $x\in {\mathsf {Fix}}(h)$ und es folgt: $g(x)=x=h(x)\neq h(y)=f(y)=g(y)$ mit der Injektivität von $h$ . Insgesamt haben wir gezeigt:

g\in J

Als letzten Schritt beweisen wir, dass $g$ surjektiv auf $B$ ist und zeigen dazu $B\subseteq g(A)$ . Wir definieren die Funktion $j:A\longmapsto B$ wie folgt:

j(x)={\begin{cases}x,&{\text{ wenn }}x\in B\setminus g(A)\\g(x),&{\text{ sonst}}\end{cases}}

$j$ ist injektiv wegen der Injektivität von $g$ . Weiterhin gilt $j\sqsubseteq g$ , denn $j$ hat allenfalls mehr Fixpunkte als $g$ und für $x\neq j(x)$ gilt $j(x)=g(x)$ . Mit $g\sqsubseteq f$ folgt daraus $j\sqsubseteq f$ wegen wegen der Transitivität von $\sqsubseteq$ . Insgesamt haben wir gezeigt: $j\in J$ . Daraus folgt mit ( $\star$ ) $g\sqsubseteq j$ und mit der Antisymmetrie von $\sqsubseteq$ ergibt sich $j=g$ . Nach Definition von $j$ gilt $B\setminus g(A)\subseteq j(A)$ und mit der Gleichheit $j=g$ folgt $B\setminus g(A)\subseteq g(A)$ . Das ist aber nur möglich, wenn $B\setminus g(A)=\varnothing$ gilt, also: $B\subseteq g(A)$ . Also:

\color {red}g:A\longmapsto B{\text{ bijektiv}}

, also:

A\sim B

Damit ist der Beweis des Zwischenmengensatzes und des Äquivalenzsatzes von Cantor-Bernstein-Schröder beendet. ✔

Beispiel

Wir verwenden die Bezeichnungen wie im Beweis des Zwischenmengensatzes.

Beispiel (Zwischenmengensatz)

Es sei $A:=\mathbb {N} _{0}$ die Menge der natürlichen Zahlen, $B:=\mathbb {N} ^{+}=\{x\in \mathbb {N} \,|\,x\geq 1\}$ die Menge der natürlichen Zahlen größer oder gleich $1$ und $f:A\longmapsto B:f(x)=x+2$ die Funktion, die jede Zahl um 2 erhöht. $f$ ist injektiv und es gilt:

A\supseteq B\supseteq f(A)

$B$ ist eine echte Obermenge von $f(A))$ , denn die $1$ ist kein Bild unter $f$ . Wir definieren $g$ folgendermassen:

g(x)={\begin{cases}x,&{\text{ wenn }}x{\text{ ungerade}}\\x+2,&{\text{ sonst}}\end{cases}}

$g:A\longmapsto B$ ist injektiv und alle ungeraden Zahlen sind Fixpunkte. Auf den geraden Zahlen stimmt $g$ mit $f$ überein. Da $f$ keine Fixpunkte hat, gilt also $g\sqsubseteq f$ . somit gilt $g\in J$ . Da $g(1)=1$ ist, ist $g$ eine Bijektion auf $B$ .

Mehr Fixpunkte als $g$ kann aber keine Funktion aus $J$ haben, denn die geraden Zahlen können keine Fixpunkte sein. Das folgt durch Induktion: $0$ ist kein Fixpunkt, denn $0\notin B$ , tritt also nicht als Bild auf. Sei nun $n$ gerade und nach Induktionsvoraussetzung kein Fixpunkt. Dann ist das Bild von $n$ aber $f(n)=n+2$ . Also kann $n+2$ auch kein Fixpunkt sein. Daher ist $g$ in diesem Beispiel tatsächlich die Funktion, deren Existenz im Beweis gezeigt wird.

Vertiefung zum Thema Mächtigkeit

Wir haben definiert, dass zwei Mengen $A$ und $B$ genau dann gleichmächtig sind, wenn es zwischen ihnen eine bijektive Abbildung gibt: $A\sim B$ . Die Relation $\sim$ ist eine Äquivalenzrelation auf der Klasse aller Mengen.

Hinweis

Die Klasse aller Mengen ist zu groß für eine Menge, sie ist eine echte Klasse, vgl. "Axiomatische Mengenlehre".

Aufgabe: Zeige dass $\sim$ eine Äquivalenzrelation ist.

Um zu zeigen, dass eine Relation eine Äquivalenzrelation ist, müssen wir zeigen, dass sie reflexiv, symmetrisch und transitiv ist. Im folgenden seien $A,B,C$ beliebige Mengen.

Reflexiv: Die Identitätsabbildung $f:A\longmapsto A:f(x)=x$ ist eine Bijektion der Menge $A$ auf sich. Also gilt $A\sim A$ .

Symmetrisch: Gelte $A\sim B$ . Dann gibt es eine bijektive Abbildung $f:A\longmapsto B$ . Daher ist die Umkehrfunktion $f^{-1}$ ebenfalls bijektiv und bildet die Menge $B$ auf die Menge $A$ ab: $f^{-1}:B\longmapsto A$ . Also gilt $B\sim A$ .

Transitiv: Gelte $A\sim B$ und $B\sim C$ . Dann gibt es bijektive Abbildungen $f:A\longmapsto B$ und $g:B\longmapsto C$ . Die Komposition dieser beiden Abbildungen $g\circ f$ ist als Komposition zweier bijektiven Abbildungen ebenfalls bijektiv und bildet $A$ auf $C$ ab: $g\circ f:A\longmapsto C$ . Also gilt $A\sim C$ . ✔

Da die Relation $\sim$ eine Äquivalenzrelation ist, zerfällt die Klasse aller Mengen unter dieser Relation in Äquivalenzklassen gleichmächtiger Mengen. Da diese Äquivalenzklassen ebenfalls echte Klassen sind, geht man zu einem Repräsentantensystem über, den sogenannten Kardinalzahlen:

Definition (Kardinalzahlen)

Die Kardinalzahlen sind Mengen und bilden ein Repräsentantensystem für die Äquivalenzklassen gleichmächtiger Mengen.^[14]

|A|

bezeichnet die Kardinalzahl, die zu der Äquivalenzklasse von

A

gehört.

Anmerkung: Die Schreibweise $|A|$ sollte nicht mit den mit den Betragsstrichen oder der Determinantenfunktion aus der Linearen Algebra verwechselt werden.

Definition (Ordnung der Kardinalzahlen)

Die folgende Definition ist repräsentantenunabhängig:

|A|\leq |B|:\iff A\precsim B

Es ist leicht zu zeigen, dass die Relation $\leq$ reflexiv und transitiv ist. Die Antisymmetrie folgt mit dem Äquivalenzsatz von Cantor-Bernstein-Schröder. $\leq$ ist also eine Halbordnung. Mit dem Auswahlaxiom kann man zeigen, dass $\leq$ eine Totalordnung ist:

Satz

$\leq$ ist eine Totalordnung auf den Kardinalzahlen.

Kardinalzahlen lassen sich also der Größe nach vergleichen. Sie sind verallgemeinerte natürliche Zahlen, die die Mächtigkeit einer Menge beschreiben. Im Fall einer endlichen Menge ist ihre Kardinalzahl nichts anderes als die Anzahl ihrer Elemente. Die endlichen Kardinalzahlen sind also die natürlichen Zahlen $0,1,2,3,\dots$ . Beispielsweise ist $|\varnothing |=0$ und $|\{2,3\}|=2$ .

$|\mathbb {N} |$ ist die kleinste Mächtigkeit, die eine unendliche Menge haben kann: man kann zeigen, dass jede unendliche Menge eine Mächtigkeit größer oder gleich $|\mathbb {N} |$ besitzt. Außerdem hat Cantor im Satz von Cantor gezeigt, dass jede Potenzmenge ${\mathcal {P}}(A)$ mächtiger als ihre zugrunde liegende Menge $A$ ist. Man kann zeigen, dass $|{\mathcal {P}}(\mathbb {N} )|=|\mathbb {R} |$ ist. Es gibt also unendlich viele unendliche Kardinalzahlen!

Die unendlichen Kardinalzahlen werden mit $\aleph _{0},\aleph _{1},\aleph _{2},\dots$ bezeichnet (der Buchstabe Aleph $\aleph$ ist der erste Buchstabe des hebräischen Alphabets). Es ist $\aleph _{0}=|\mathbb {N} |$ . Es stellt sich nun die Frage, ob $\aleph _{1}=|\mathbb {R} |$ ist. Oder – anders formuliert – ob es eine Menge gibt, die mächtiger als $\mathbb {N}$ , aber weniger mächtig als $\mathbb {R}$ ist. Cantor vermutete, dass dies nicht der Fall ist, konnte seine Vermutung aber nicht beweisen. Diese Vermutung wird Kontinuumshypothese genannt. Es stellte sich jedoch heraus, dass diese Hypothese in der Mengenlehre mit den Axiomen von Zermelo-Fraenkel einschliesslich Auswahlaxiom weder beweisbar noch widerlegbar ist.

Generell kann man sich fragen, ob zwischen der Kardinalzahl einer unendlichen Menge $|X|$ und der ihrer Potenzmenge $|{\mathcal {P}}(X)|$ noch weitere Kardinlzahlen liegen. Falls nicht, wäre $\aleph _{0},\aleph _{1},\aleph _{2},\dots$ gerade $|\mathbb {N} |,|{\mathcal {P}}(\mathbb {N} )|,|{\mathcal {P}}({\mathcal {P}}(\mathbb {N} ))|,\dots$ usw. Das ist die allgemeine Kontinuumshypothese (GCH, General Continuum Hypothesis). Aber da schon die einfache Kontinuumshypothese in ZFC nicht beweisbar ist, ist es die allgemeine auch nicht. Sie kann aber widerspruchsfrei zu den ZFC-Axiomen zugefügt werden, d. h. wenn ZFC widerspruchsfrei ist, dann ist es auch ZFC + GCH.

Terme

Terme sind mathematische Ausdrücke, die aus Zahlen, Funktionszeichen (wie $+$ , $\div$ usw.), Variablen und Klammern gebildet werden können. Terme können durch Termumformungen verändert werden.

Notwendige Termumformungen finden

Aufgabe

Finde die notwendigen Termumformungen, um den Term ${\frac {n\cdot (n+1)\cdot (4n-1)}{6}}+2n\cdot (n+1)+(n+1)$ in den Term ${\frac {(n+1)\cdot (n+2)\cdot (4n+3)}{6}}$ umzuwandeln.

Herangehensweise

Eine solche Problemstellung wird dir sicherlich häufig im Studium begegnen. Oftmals bekommst du, während du den Beweis für einen Satz suchst, einen Term α heraus und stehst vor dem Problem, zu beweisen, dass dieser gleich einem gewissen Term β ist (so wie ihn zum Beispiel die Aufgabe fordert). Du musst also eine Kette von Termumformungen finden, so dass

{\text{Term }}\alpha =\ldots =\ldots \ldots \ldots =\ldots ={\text{Term }}\beta

Um dieses Problem zu lösen, kannst du folgendermaßen vorgehen: Du schreibst beide Terme nebeneinander und versuchst beide durch Termumformungen auf die gleiche Gestalt zu bringen. Also in etwa so:

{\begin{array}{ccc}{\text{Term }}\alpha &&{\text{Term }}\beta \\\vdots &&\vdots \\{\color {Gray}{\text{Termumformungen}}}&&{\color {Gray}{\text{Termumfomungen}}}\\\vdots &&\vdots \\{\text{Zwischenterm}}&=&{\text{Zwischenterm}}\end{array}}

Die Lösung ergibt sich dann, indem du aufschreibst

{\begin{aligned}&{\text{Term }}\alpha \\=&\ldots \ {\color {Gray}{\text{(Termumformungen der linken Seite)}}}\\=&{\text{Zwischenterm}}\\=&\ldots \ {\color {Gray}{\text{(Termumformungen der rechten Seite)}}}\\=&{\text{Term }}\beta \end{aligned}}

Aufgabe: Finde die notwendigen Termumformungen für die obige Aufgabe heraus.

Mit der obigen Methode erhältst du folgende Lösung:

{\begin{array}{rcl}{\frac {n\cdot (n+1)\cdot (4n-1)}{6}}+2n\cdot (n+1)+(n+1)&&{\frac {(n+1)\cdot (n+2)\cdot (4n+3)}{6}}\\[0.5em]{\frac {n\cdot (n+1)\cdot (4n-1)}{6}}+(n+1)\cdot (2n+1)&&{\frac {(n+1)\cdot (n+2)\cdot (4n+3)}{6}}\\[0.5em]{\frac {n\cdot (n+1)\cdot (4n-1)+6\cdot (n+1)\cdot (2n+1)}{6}}&&{\frac {(n+1)\cdot (n+2)\cdot (4n+3)}{6}}\\[0.5em]{\frac {(n+1)\cdot (n\cdot (4n-1)+6\cdot (2n+1))}{6}}&&{\frac {(n+1)\cdot (n+2)\cdot (4n+3)}{6}}\\[0.5em]{\frac {(n+1)\cdot (4n^{2}-n+12n+6)}{6}}&&{\frac {(n+1)\cdot (4n^{2}+3n+8n+6)}{6}}\\[0.5em]{\frac {(n+1)\cdot (4n^{2}+11n+6)}{6}}&=&{\frac {(n+1)\cdot (4n^{2}+11n+6)}{6}}\end{array}}

Damit ergibt sich folgende Lösung:

{\begin{aligned}{\frac {n\cdot (n+1)\cdot (4n-1)}{6}}+2n\cdot (n+1)+(n+1)&={\frac {n\cdot (n+1)\cdot (4n-1)}{6}}+(n+1)\cdot (2n+1)\\[0.5em]&={\frac {n\cdot (n+1)\cdot (4n-1)+6\cdot (n+1)\cdot (2n+1)}{6}}\\[0.5em]&={\frac {(n+1)\cdot (n\cdot (4n-1)+6\cdot (2n+1))}{6}}\\[0.5em]&={\frac {(n+1)\cdot (4n^{2}-n+12n+6)}{6}}\\[0.5em]&={\frac {(n+1)\cdot (4n^{2}+3n+8n+6)}{6}}\\[0.5em]&={\frac {(n+1)\cdot (n+2)\cdot (4n+3)}{6}}\end{aligned}}

Gleichungen

Gleichungen sind Aussagen oder Aussageformen, die die Gleichheit zwischen zwei Termen ausdrücken. Die allgemeine Form von Gleichungen ist

T_{1}=T_{2}

wobei $T_{1}$ und $T_{2}$ Terme sind.

Ungleichungen machen vergleichende Aussagen über zwei Terme. Hier steht an der Stelle des Gleichheitszeichens $=$ eines der Ordnungsrelationen $\geq$ , $\leq$ , $<$ oder $>$ .

Umformungen

Durch Umformungen kann eine Gleichung $T_{1}=T_{2}$ in eine neue Gleichung $S_{1}=S_{2}$ umgeformt werden. Dabei muss gelten, dass immer dann, wenn $T_{1}=T_{2}$ erfüllt ist, zwangsläufig auch die Gleichung $S_{1}=S_{2}$ erfüllt sein muss. Man schließt also aus der Annahme der Gleichung $T_{1}=T_{2}$ auf die neue Gleichung $S_{1}=S_{2}$ .

Eine Gleichungsumformung von $T_{1}=T_{2}$ nach $S_{1}=S_{2}$ ist also nichts anderes als die Implikation $T_{1}=T_{2}\Rightarrow S_{1}=S_{2}$ , welche wahr sein muss (also eine Tautologie sein muss).

Ein Beispiel: Immer dann, wenn $2x=8$ ist, ist $(2x)^{2}=64$ (es ist $2x=8\Rightarrow (2x)^{2}=64$ ). Damit kann die Gleichung $(2x)^{2}=64$ aus der Gleichung $2x=8$ geschlossen werden beziehungsweise $2x=8$ in $(2x)^{2}=64$ umgeformt werden.

Ein häufiges Problem ist das Separieren/Isolieren („auf eine Seite bringen“) einer Variablen aus einer Ausgangsgleichung. Hier hat man eine Ausgangsgleichung mit mindestens einer Variablen gegeben, von der man weiß, dass sie erfüllt sein muss (Beispiel: $3s+t=s-t$ ). Nun möchte man wissen, welche Werte eine bestimmte Variable (in Abhängigkeit der anderen Variablen) annehmen kann, sodass die Ausgangsgleichung mit diesen Werten erfüllt ist (Welche Werte für $s$ erfüllen die Ausgangsgleichung $3s+t=s-t$ ?). Hier kann man schrittweise die Ausgangsgleichung in andere Gleichungen umformen, bis man eine Gleichung erhält, in der die gewünschte Variable auf einer Seite separiert ist. So können wir $3s+t=s-t$ folgendermaßen nach $s$ umformen:

{\begin{array}{lrll}&3s+t&=s-t&{\color {Gray}\left|\ -t{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Rightarrow \ &3s&=s-2t&{\color {Gray}\left|\ -s{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Rightarrow \ &2s&=-2t&{\color {Gray}\left|\ {}\cdot {\tfrac {1}{2}}{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Rightarrow \ &s&=-t\end{array}}

Insgesamt haben wir so die Implikation $3s+t=s-t\Rightarrow s=-t$ bewiesen. Wir wissen damit, dass immer dann, wenn $3s+t=s-t$ ist, auch die Gleichung $s=-t$ erfüllt sein muss. Doch haben wir damit auch bewiesen, dass unter der Annahme von $s=-t$ die ursprüngliche Ausgangsgleichung $3s+t=s-t$ erfüllt ist?

Nein, dies haben wir nicht. Genauso, wie Implikationen im Allgemeinen nicht umkehrbar sind, sind auch Gleichungsumformungen im Allgemeinen nicht umkehrbar. So ist $2x=8\Rightarrow (2x)^{2}=64$ eine nicht umkehrbare Gleichung. Es ist also $(2x)^{2}=64\nRightarrow 2x=8$ .

Frage: Wieso ist die Umformung $2x=8\Rightarrow (2x)^{2}=64$ nicht umkehrbar?

Nicht immer dann, wenn $(2x)^{2}=64$ gilt, gilt auch die Gleichung $2x=8$ . So ist für $x=-4$ zwar $(2x)^{2}=(2\cdot (-4))^{2}=64$ , aber $2x=2\cdot (-4)=-8\neq 8$ . Damit ist die Implikation $(2x)^{2}=64\Rightarrow 2x=8$ falsch, also $(2x)^{2}=64$ nicht in $2x=8$ umformbar.

Oben haben wir gezeigt, dass $3s+t=s-t$ in $s=-t$ umformbar ist, aber noch nicht, dass aus $s=-t$ auch immer die Gleichung $3s+t=s-t$ folgt. Dies müssen wir nachholen (obige Umformung in umgekehrter Reihenfolge, da jeder Einzelschritt umkehrbar ist):

{\begin{array}{lrll}&s&=-t&{\color {Gray}\left|\ {}\cdot 2{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Rightarrow \ &2s&=-2t&{\color {Gray}\left|\ +s{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Rightarrow \ &3s&=s-2t&{\color {Gray}\left|\ +t{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Rightarrow \ &3s+t&=s-t\end{array}}

Als Quintessenz dieses Abschnitts solltest du dir merken:

Hinweis

Gleichungsumformungen $T_{1}=T_{2}\Rightarrow S_{1}=S_{2}$ sind im Allgemeinen nicht umkehrbar.

Frage: Du hast die Ausgangsgleichung $T_{1}(x)=T_{2}(x)$ ( $T_{1}(x)$ und $T_{2}(x)$ sind Terme, bei denen in mindestens einem Term die Variable $x$ vorkommt). Aus ihr hast du die Lösungen $x=S_{1}$ , $x=S_{2}$ bis $x=S_{n}$ durch einfache Gleichungsumformungen gewonnen ( $S_{1},\ldots S_{n}$ sind Terme ohne Variable $x$ ). Du hast also gezeigt $T_{1}(x)=T_{2}(x)\Rightarrow x=S_{1}\lor x=S_{2}\lor \dots \lor x=S_{n}$ . Sind dann $S_{1}$ bis $S_{n}$ alle Lösungen der Ausgangsgleichung $T_{1}(x)=T_{2}(x)$ für die Variable $x$ ? Wieso?

Nein, dies ist nicht der Fall. Zwar folgt aus $T_{1}(x)=T_{2}(x)$ die Aussage $x=S_{1}\lor x=S_{2}\lor \dots \lor x=S_{n}$ , und damit sind $x=S_{1}$ bis $x=S_{n}$ mögliche Kandidaten für Lösungen. Jedoch müssen sie die Ausgangsgleichung nicht lösen.

Ein Beispiel: Du weißt, dass es keine reelle Zahl $x$ gibt, die die Gleichung $x^{2}=-1$ löst. Jedoch kannst aus der Ausgangsgleichung $x^{2}=-1$ Gleichungsumformungen durchführen, die dich auf die Pseudolösungen $x=1$ und $x=-1$ führen:

{\begin{array}{lrlcll}&x^{2}&=-1&&&{\color {Gray}\left|\ {\text{Quadrieren}}\right.}\\[0.3em]\Rightarrow \ &x^{4}&=1&&&{\color {Gray}\left|\ {\text{vierte Wurzel ziehen}}\right.}\\[0.3em]\Rightarrow \ &x&={\sqrt[{4}]{1}}&\lor &x=-{\sqrt[{4}]{1}}\\[0.3em]\Rightarrow \ &x&=1&\lor &x=-1\end{array}}

Wenn du nur einfache Gleichungsumformungen verwendest, musst du also immer überprüfen, ob deine gefunden Lösungen auch wirklich die Ausgangsgleichung lösen.

Äquivalenzumformungen

Oben hast du gesehen, dass nicht alle Gleichungsumformungen umkehrbar sind. Deswegen werden all diejenigen Umformungen, die umkehrbar sind, unter dem Begriff Äquivalenzumformung zusammengefasst. Äquivalenzumformungen sind also diejenigen Umformungen $T_{1}=T_{2}\Rightarrow S_{1}=S_{2}$ , bei denen auch die Umkehrung $S_{1}=S_{2}\Rightarrow T_{1}=T_{2}$ erfüllt ist. Es gilt so insgesamt die Äquivalenz $T_{1}=T_{2}\Leftrightarrow S_{1}=S_{2}$ (daher der Name „Äquivalenzumformung“).

Wir können die Lösungen für $s$ aus der Gleichung $3s+t=s-t$ direkt durch Äquivalenzumformung gewinnen (und sparen uns so den sonst notwendigen Rückweg):

{\begin{array}{lrll}&3s+t&=s-t&{\color {Gray}\left|\ -t{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Leftrightarrow \ &3s&=s-2t&{\color {Gray}\left|\ -s{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Leftrightarrow \ &2s&=-2t&{\color {Gray}\left|\ {}\cdot {\tfrac {1}{2}}{\text{ auf beiden Seiten}}\right.}\\[0.3em]\Leftrightarrow \ &s&=-t\end{array}}

Frage: Welche der folgenden Gleichungsumformungen sind Äquivalenzumformungen?

Addition mit einem beliebigen Term auf beiden Seiten
Subtraktion mit einem beliebigen Term auf beiden Seiten
Multiplikation mit einem beliebigen Term auf beiden Seiten
Division mit einem beliebigen Term ungleich Null auf beiden Seiten
beide Seiten quadrieren
beide Seiten hoch drei nehmen
auf beiden Seiten den Betrag nehmen

Umformung	Äquivalenzumformung	keine Äquivalenzumformung
Addition mit einem beliebigen Term auf beiden Seiten	✔
Subtraktion mit einem beliebigen Term auf beiden Seiten	✔
Multiplikation mit einem beliebigen Term auf beiden Seiten		✘
Division mit einem beliebigen Term ungleich Null auf beiden Seiten	✔
beide Seiten quadrieren		✘
beide Seiten hoch drei nehmen	✔
auf beiden Seiten den Betrag nehmen		✘

Frage: Wieso ist die Multiplikation mit einem Term keine Äquivalenzumformung?

Wenn man beide Seiten einer Gleichung mit Null multipliziert, so ist die resultierende Gleichung stets $0=0$ , also immer wahr. Dies ist auch dann der Fall, wenn die ursprüngliche Gleichung falsch ist bzw. nicht erfüllbar ist.

Beispiel: Es gibt keine reelle Zahl $x$ mit $x^{2}=-1$ . So ist $x^{2}=-1$ nicht aus $0=0$ herleitbar (aus einer wahren Aussage können keine falschen Aussagen hergeleitet werden). Jedoch ist $x^{2}=-1\Rightarrow 0\cdot x^{2}=0\cdot (-1)\Rightarrow 0=0$ eine gültige Gleichungsumformung. Diese ist aber nicht umkehrbar, da ihre Umkehrung $0=0\Rightarrow x^{2}=-1$ lauten würde, was aber für alle $x\in \mathbb {R}$ eine falsche Aussage ist.

Frage: Welche Eigenschaften muss eine Funktion $f$ erfüllen, damit

$T_{1}=T_{2}\Rightarrow f\left(T_{1}\right)=f\left(T_{2}\right)$ eine gültige Gleichungsumformung ist?
$T_{1}=T_{2}\Rightarrow f\left(T_{1}\right)=f\left(T_{2}\right)$ eine Äquivalenzumformung ist?

Für jede Funktion $f$ ist $T_{1}=T_{2}\Rightarrow f\left(T_{1}\right)=f\left(T_{2}\right)$ eine gültige Gleichungsumformung. Denn eine Funktion ordnet jedem Argument $x$ einen eindeutigen Funktionswert $f(x)$ zu. Dies bedeutet insbesondere, dass, wenn $T_{1}=T_{2}$ ist, auch $f\left(T_{1}\right)=f\left(T_{2}\right)$ sein muss, also $T_{1}=T_{2}\Rightarrow f\left(T_{1}\right)=f\left(T_{2}\right)$ erfüllt ist.

Für eine Funktion $f$ ist $T_{1}=T_{2}\Rightarrow f\left(T_{1}\right)=f\left(T_{2}\right)$ genau dann eine Äquivalenzumformung, wenn $f$ injektiv ist. Gerade haben wir gesehen, dass $T_{1}=T_{2}\Rightarrow f\left(T_{1}\right)=f\left(T_{2}\right)$ eine gültige Gleichungsumformung ist. Sie ist eine Äquivalenzumformung, wenn auch $f\left(T_{1}\right)=f\left(T_{2}\right)\Rightarrow T_{1}=T_{2}$ eine gültige Gleichungsumformung ist. Diese Forderung ist aber nichts anderes als die Definition der Injektivität für die Funktion $f$ .

Summe und Produkt

Motivation

Wenn eine Summe viele Summanden hat, ist es unpraktisch, alle Summanden aufzuschreiben. Hier brauchst du eine abkürzende Schreibweise. Analoges gilt auch für Produkte, die viele Faktoren besitzen. Möglichkeiten solcher verkürzenden Summen- und Produktschreibweisen werden dir in diesem Kapitel vorgestellt.

Um lange Summen und Produkte abzukürzen, kannst du einzelne Summanden bzw. Faktoren auslassen. Beispielsweise kannst du die Summe der Zahlen eins bis hundert so aufschreiben:

1+2+3+\ldots +100

Diese Schreibweise hat den Vorteil, dass sie intuitiv ist. Du kannst sie verwenden, ohne sie dem Leser extra erklären zu müssen. Auch der Umgang mit ihr ist im Regelfall nicht schwer. Das sind die Gründe, weshalb wir im Folgenden des Öfteren auf diese Schreibweise zurückgreifen werden. Jedoch hat sie einen entscheidenen Nachteil: Sie ist nicht eindeutig. Betrachte dazu folgendes Beispiel:

Beispiel: Wie lautet die Summe $1+2+\ldots +8$ ausgeschrieben?

Ein mögliches Ergebnis ist $1+2+3+4+5+6+7+8=36$ (Summe der ersten acht natürlichen Zahlen). Ein weiteres mögliches Ergebnis ist $1+2+4+8=2^{0}+2^{1}+2^{2}+2^{3}=15$ (Summe der ersten vier Potenzen von zwei).

Wie das obige Beispiel zeigt, ist die Schreibweise mit Auslassungen ungenau: Es ist nicht eindeutig definiert, welche Summanden oder Faktoren zu ergänzen sind. Deswegen ist sie in den Augen der Mathematik kein guter Kandidat, um sie als abkürzende Schreibweise für lange Summen und Produkte einzusetzen. Es gibt jedoch eine andere Schreibweise, die dieses Problem der Ungenauigkeit nicht hat. Diese werden wir dir in den nächsten Abschnitten vorstellen.

Die Summenschreibweise

Erklärung der Summenschreibweise (YouTube-Video vom YouTube-Kanal: MJ Maths)

Hier ein Beispiel einer Summenschreibweise mit Hilfe des Summenzeichens:

\sum _{k=1}^{5}k^{2}

Diese Schreibweise besteht aus dem großen griechischen Buchstaben Σ (Sigma). Dem Summenzeichen Σ folgt ein Funktionsterm (hier ist es $k^{2}$ ). Unter dem Summenzeichen steht eine neue, zuvor noch nicht benutzte Variable, die als Laufindex, Laufvariable oder Summationsvariable bezeichnet wird. Unter dem Summenzeichen steht außerdem der Startwert der Laufvariablen. Das ist der kleinste ganzzahlige Wert, den die Laufvariable annehmen kann. Über dem Summenzeichen steht der Endwert der Laufvariablen. Auch dieser ist eine ganze Zahl und steht für den größten Wert, den die Laufvariable annehmen kann. Der Laufindex läuft nun vom Start- zum Endwert und nimmt nacheinander jede ganze Zahl zwischen diesen beiden Werten an (daher der Name „Laufindex“ bzw. „Laufvariable“). Für jeden der Werte, den die Laufvariable annimmt, wird ein Summand geschrieben. Der Funktionsterm nach dem Summenzeichen gibt dabei an, welcher Wert für diesen Summanden aufgeschrieben werden soll. Dazu wird der aktuelle Wert der Laufvariablen in den Funktionsterm eingesetzt und das Ergebnis als Summand notiert.

In unserem Beispiel ist die Laufvariable $k$ . Diese läuft vom Startwert $1$ bis zum Endwert $5$ und nimmt dabei nacheinander die Werte $k=1$ , $k=2$ , $k=3$ , $k=4$ und $k=5$ an. Der Funktionsterm, der angibt, welcher Summand aufgeschrieben werden soll, ist $k^{2}$ . Wir erhalten für $k=1$ den Summanden $k^{2}=1^{2}=1$ , für $k=2$ den Summanden $k^{2}=2^{2}=4$ , für $k=3$ den Summanden $k^{2}=3^{2}=9$ und so weiter… Insgesamt erhalten wir so die Summe:

\sum _{k=1}^{5}k^{2}=1+4+9+16+25=55

In der folgenden Animation siehst du nochmals die Funktionsweise der Summenschreibweise $\sum _{k=1}^{5}k^{2}$ :

Damit ergibt sich folgende Definition der Summe:

Definition (Summenschreibweise)

$\sum _{k=n}^{m}a(k)$ ist eine Kurzschreibweise für die Summe $a(n)+a(n+1)+a(n+2)+\ldots +a(m-1)+a(m)$

Hinweis

In der Literatur findest du häufig die Schreibweise $\sum _{k=n}^{m}a_{k}$ anstelle von $\sum _{k=n}^{m}a(k)$ . Hier ist $a_{k}$ eine Kurzschreibweise für $a(k)$ . Die Schreibweise $a_{k}$ meint wie $a(k)$ eine Zuordnungsvorschrift, die der Laufvariablen $k$ den Wert $a_{k}$ für den aktuellen Summanden zuordnet.

Verständnisaufgabe: Schreibe folgende Summen in der Summenschreibweise

$1+2+3+4+5+6$
$23+23+23+23+23$
$1+8+27$

Antwort:

$\sum _{k=1}^{6}k$
$\sum _{k=1}^{5}23$ oder auch $\sum _{l=23}^{27}23$
$\sum _{k=1}^{3}k^{3}$

Verständnisaufgabe: Wie lauten folgende Summen ausgeschrieben?

$\sum _{s=20}^{25}s$
$\sum _{k=0}^{3}{\frac {k^{3}\cdot (k+1)}{2}}$
$\sum _{l=-3}^{0}2l$
$\sum _{n=-2}^{2}{\frac {n^{2}\cdot k}{p}}$
$\sum _{p=-10}^{-8}\lambda$

Wir erhalten folgende Summen:

$\sum _{s=20}^{25}s=20+21+22+23+24+25$
$\sum _{k=0}^{3}{\frac {k^{3}\cdot (k+1)}{2}}={\frac {0^{3}\cdot (0+1)}{2}}+{\frac {1^{3}\cdot (1+1)}{2}}+{\frac {2^{3}\cdot (2+1)}{2}}+{\frac {3^{3}\cdot (3+1)}{2}}$
$\sum _{l=-3}^{0}2l=2\cdot (-3)+2\cdot (-2)+2\cdot (-1)+2\cdot 0$
$\sum _{n=-2}^{2}{\frac {n^{2}\cdot k}{p}}={\frac {(-2)^{2}\cdot k}{p}}+{\frac {(-1)^{2}\cdot k}{p}}+{\frac {0^{2}\cdot k}{p}}+{\frac {1^{2}\cdot k}{p}}+{\frac {2^{2}\cdot k}{p}}$
$\sum _{p=-10}^{-8}\lambda =\lambda +\lambda +\lambda$

Die Produktschreibweise

Die Produktschreibweise funktioniert analog zur Summenschreibweise. Der Unterschied ist, dass anstatt summiert, multipliziert wird – insgesamt also anstatt einer Summe ein Produkt beschrieben wird. Anstelle des Sigmazeichens Σ wird ein großes Pi Π verwendet. In der Produktschreibweise ist zum Beispiel:

\prod _{k=1}^{5}k^{2}=1\cdot 4\cdot 9\cdot 16\cdot 25

In der folgenden Animation ist die Wirkungsweise der Produktschreibweise dargestellt, welche analog zur Summenschreibweise funktioniert:

Definition (Produktschreibweise)

$\prod _{k=n}^{m}a(k)$ ist eine Kurzschreibweise für das Produkt $a(n)\cdot a(n+1)\cdot a(n+2)\cdot \ldots \cdot a(m-1)\cdot a(m)$

Auch hier findest du in der Literatur häufig die Schreibweise $\prod _{k=n}^{m}a_{k}$ an Stelle von $\prod _{k=n}^{m}a(k)$ .

Verständnisaufgabe: Schreibe folgende Produkt in der Produktschreibweise:

$1\cdot 3\cdot 5\cdot 7\cdot 9\cdot 11$
$\lambda ^{n}=\underbrace {\lambda \cdot \lambda \cdot \ldots \cdot \lambda } _{n{\text{-mal}}}$

Antwort:

$\prod _{k=1}^{6}(2k-1)$
$\prod _{l=1}^{n}\lambda$

Verständnisaufgabe: Wie lauten folgende Produkte ausgeschrieben?

$\prod _{k=1}^{5}k$
$\prod _{l=-3}^{-1}l^{m}$
$\prod _{n=-2}^{2}(k+n)$

Wir erhalten folgende Produkte:

$\prod _{k=1}^{5}k=1\cdot 2\cdot 3\cdot 4\cdot 5$
$\prod _{l=-3}^{-1}l^{m}=(-3)^{m}\cdot (-2)^{m}\cdot (-1)^{m}$
$\prod _{n=-2}^{2}(k+n)=(k-2)\cdot (k-1)\cdot (k+0)\cdot (k+1)\cdot (k+2)$

Leere Summe/Leeres Produkt

Doch was passiert, wenn man die Summe bzw. das Produkt nicht auschreiben kann, weil der Startwert für die Laufvariable größer als der Endwert ist? Summen, die einen größeren Startwert als Endwert haben, nennt man leere Summe und Produkte mit einem größeren Start- als Endwert nennt man leeres Produkt, weil die Indexmenge, also die Menge der Werte, welche die Laufvariable durchläuft, „leer“ ist. Im Fall leerer Produkte und Summen gibt es in der Mathematik eine Konvention, die sich als sinnvoll erwiesen hat. Man ordnet einer Summe, bei der der Startwert größer dem Endwert ist, den Wert $0$ zu. Einem Produkt mit größerem Start- als Endwert wird der Wert $1$ zugeordnet. Du kannst dir hier als Eselsbrücke merken: Leeren Produkten/Summen wird eine solche Zahl zugeordnet, die das Ergebnis bei der entsprechenden Verknüpfung nicht verändert (wenn man $0$ zu einer Zahl addiert, ändert sich diese Zahl nicht und auch die Multiplikation mit $1$ verändert eine Zahl nicht).

Definition (Leere Summe)

Eine Summe, deren Startwert für die Laufvariable größer dem Endwert ist, nennt man leere Summe. Ihr wird der Wert Null zugeordnet.

Definition (Leeres Produkt)

Ein Produkt, dessen Startwert für die Laufvariable größer dem Endwert ist, nennt man leeres Produkt. Ihm wird der Wert Eins zugeordnet.

Beispiel

$\sum _{n=4}^{3}n^{3}=0$ und $\sum _{k=-2}^{-6}{\tfrac {k}{n}}=0$
$\prod _{l=0}^{-1}l=1$ und $\prod _{h=-10}^{-11}h^{2}=1$

Doppelsumme und Doppelprodukt

Doppelsummen und -produkte entstehen, wenn in der Summe oder dem Produkt wieder eine Summe oder ein Produkt definiert ist. Diese kannst du ausrechnen, indem du von außen nach innen die einzelnen Summen und Produkte auflöst:

{\begin{aligned}&\sum _{k=4}^{6}\sum _{l=4}^{k}l^{k}\\&\quad {\color {Black}\left\downarrow \ {\text{äußere Summe auflösen}}\right.}\\=&\sum _{l=4}^{4}l^{4}+\sum _{l=4}^{5}l^{5}+\sum _{l=4}^{6}l^{6}\\&\quad {\color {Black}\left\downarrow \ {\text{innere Summen auflösen}}\right.}\\=&4^{4}+\left(4^{5}+5^{5}\right)+\left(4^{6}+5^{6}+6^{6}\right)\\\end{aligned}}

Verständnisfrage: Schreibe folgende Doppelsummen und -produkte aus.

$\sum _{k=1}^{3}\prod _{l=1}^{3}a_{kl}$
$\prod _{k=1}^{3}\sum _{l=1}^{3}a_{kl}$
$\sum _{k=1}^{3}\sum _{l=0}^{k}a_{l}\cdot b_{k-l}$

Antwort:

${\begin{aligned}\sum _{k=1}^{3}\prod _{l=1}^{3}a_{kl}&=\prod _{l=1}^{3}a_{1l}+\prod _{l=1}^{3}a_{2l}+\prod _{l=1}^{3}a_{3l}\\&=a_{11}\cdot a_{12}\cdot a_{13}+a_{21}\cdot a_{22}\cdot a_{23}+a_{31}\cdot a_{32}\cdot a_{33}\end{aligned}}$
${\begin{aligned}\prod _{k=1}^{3}\sum _{l=1}^{3}a_{kl}&=\left(\sum _{l=1}^{3}a_{1l}\right)\cdot \left(\sum _{l=1}^{3}a_{2l}\right)\cdot \left(\sum _{l=1}^{3}a_{3l}\right)\\&=\left(a_{11}+a_{12}+a_{13}\right)\cdot \left(a_{21}+a_{22}+a_{23}\right)\cdot \left(a_{31}+a_{32}+a_{33}\right)\end{aligned}}$
${\begin{aligned}\sum _{k=1}^{3}\sum _{l=0}^{k}a_{l}\cdot b_{k-l}&=\sum _{l=0}^{1}a_{l}\cdot b_{1-l}+\sum _{l=0}^{2}a_{l}\cdot b_{2-l}+\sum _{l=0}^{3}a_{l}\cdot b_{3-l}\\&=\left(a_{0}\cdot b_{1}+a_{1}\cdot b_{0}\right)+\left(a_{0}\cdot b_{2}+a_{1}\cdot b_{1}+a_{2}\cdot b_{0}\right)\\&\quad +\left(a_{0}\cdot b_{3}+a_{1}\cdot b_{2}+a_{2}\cdot b_{1}+a_{3}\cdot b_{0}\right)\end{aligned}}$

Beachte, dass – wie in der zweiten Teilaufgabe – die in einem Produkt geschachtelte Summe Vorrang hat, und deswegen ausgeschrieben geklammert werden muss.

Rekursive Definition der Summe und des Produkts

Es gibt ein Problem mit den obigen Definitionen für Summen und Produkte, das wir dir nicht verschweigen möchten. Wie dir vielleicht bereits aufgefallen ist, haben wir zur Definition der Summen- und Produktschreibweise selbst Summanden und Faktoren ausgelassen, obwohl wir bereits festgestellt haben, dass das ungenau ist. Um uns nun von dieser Ungenauigkeit zu befreien, müssen wir eine Definition der Summen- und Produktschreibweise finden, die ohne Auslassungen auskommt.

Hier bietet sich eine rekursive Definition an. Solch eine Definition vollzieht sich in zwei Schritten: Dem Rekursionsschritt und dem Rekursionsanfang. Im Fall der Summe bzw. des Produkts lautet die rekursive Definition:

Definition (Rekursive Definition der Summe)

Die Summe $\sum _{k=m}^{n}a(k)$ ist definiert durch:

Rekursionsschritt: Für $n\geq m$ ist $\sum _{k=m}^{n}a(k)=\left(\sum _{k=m}^{n-1}a(k)\right)+a(n)$
Rekursionsanfang: Für $n<m$ ist $\sum _{k=m}^{n}a(k)=0$

Definition (Rekursive Definition des Produkts)

Das Produkt $\prod _{k=m}^{n}a(k)$ ist definiert durch:

Rekursionsschritt: Für $n\geq m$ ist $\prod _{k=m}^{n}a(k)=\left(\prod _{k=m}^{n-1}a(k)\right)\cdot a(n)$
Rekursionsanfang: Für $n<m$ ist $\prod _{k=m}^{n}a(k)=1$

Zunächst fällt auf, dass die Definition des Rekursionsanfangs bei Summe und Produkt der obigen Definition der leeren Summe bzw. des leeren Produkts entspricht. Du siehst hier also eine erste Anwendung dieser Definition.

Um die rekursive Definition einer Summe (und eines Produkts) zu verstehen, kann man sich anschauen, wie mit Hilfe dieser Definition eine konkrete Summe ausgerechnet wird. Betrachten wir hierzu die Summe $\sum _{k=1}^{3}k^{3}$ . Nach dem, was wir im Abschnitt zur Summenschreibweise gelernt haben, erwarten wir für diese Summe das Ergebnis

\sum _{k=1}^{3}k^{3}=1^{3}+2^{3}+3^{3}

Wie lässt sich diese Summe aus der rekursiven Definition der Summe gewinnen? Hierzu muss solange der Rekurionsschritt auf die Summe angewandt werden, bis der Rekursionsanfang verwendet werden kann. Dieses Vorgehen ist im Einzelnen in der folgenden Animation dargestellt:

Du siehst: Zunächst wird die Summe mit dem Endwert $3$ auf eine Summe mit dem Endwert $2$ zurückgeführt, indem die Definition $\sum _{k=1}^{n}a(k)=\left(\sum _{k=1}^{n-1}a(k)\right)+a(n)$ des Rekursionsschrittes angewandt wird (setze $n=3$ und $m=1$ ). Auf die verbleibende Summe mit Endwert $2$ wird nochmals der Rekursionsschritt angewandt und es entsteht eine Summe mit Endwert $1$ . Auf diese Summe wird nochmals der Rekursionsschritt angewandt. Die so entstandene Summe hat den Endwert $0$ , also einen kleineren Endwert als der Startwert $1$ . So ist die Bedingung für den Rekursionsanfang erfüllt und wir können die restliche Summe durch $0$ ersetzen. Die Rekursion bricht ab.

Analog funktioniert die rekursive Definition des Produkts: Wenn wir ein Produkt gegeben haben, so wird mit Hilfe des Rekursionschritts das Produkt schrittweise auf ein Produkt mit immer kleinerem Endwert zurückgeführt. Irgendwann ist der Endwert des verbleibenden Produkts kleiner als der Startwert. Es wird der Rekursionsanfang angewendet, womit die Rekursion abbricht.

Verständnisaufgabe: Wende die rekursive Definition auf folgende Summen/Produkte an:

$\prod _{l=-1}^{0}(l-1)$
$\sum _{n=1}^{-1}n^{2}$
$\prod _{m=5}^{5}(m-n)^{k}$

Beim ersten Produkt erhält man:

{\begin{aligned}&\prod _{l=-1}^{0}(l-1)\\[0.5em]&{\color {Gray}\left\downarrow \ {\text{Rekursionsschritt: }}\prod _{l=-1}^{0}(l-1)=\left(\prod _{l=-1}^{-1}(l-1)\right)\cdot (0-1)\right.}\\[0.5em]=\ &\left(\prod _{l=-1}^{-1}(l-1)\right)\cdot (0-1)\\[0.5em]&{\color {Gray}\left\downarrow \ {\text{Rekursionsschritt: }}\prod _{l=-1}^{-1}(l-1)=\left(\prod _{l=-1}^{-2}(l-1)\right)\cdot (-1-1)\right.}\\[0.5em]=\ &\left(\prod _{l=-1}^{-2}(l-1)\right)\cdot (-1-1)\cdot (0-1)\\[0.5em]&{\color {Gray}\left\downarrow \ {\text{Rekursionsanfang: }}\prod _{l=-1}^{-2}(l-1)=1\right.}\\[0.5em]=\ &1\cdot (-1-1)\cdot (0-1)\\=\ &1\cdot (-2)\cdot (-1)=2\end{aligned}}

Die zweite Summe ist bereits leer. Damit beginnt (und endet direkt) die Rekursion mit dem Rekursionsanfang:

\sum _{n=1}^{-1}n^{2}=0

Und beim letzten Produkt ist das Ergebnis:

{\begin{aligned}&\prod _{m=5}^{5}(m-n)^{k}\\[0.5em]&{\color {Gray}\left\downarrow \ {\text{Rekursionsschritt: }}\prod _{m=5}^{5}(m-n)^{k}=\left(\prod _{m=5}^{4}(m-n)^{k}\right)\cdot (5-n)^{k}\right.}\\[0.5em]=\ &\left(\prod _{m=5}^{4}(m-n)^{k}\right)\cdot (5-n)^{k}\\[0.5em]&{\color {Gray}\left\downarrow \ {\text{Rekursionsanfang: }}\prod _{m=5}^{4}(m-n)^{k}=1\right.}\\[0.5em]=\ &1\cdot (5-n)^{k}\\=\ &(5-n)^{k}\end{aligned}}

Alternative Summen-/Produktschreibweise

Es gibt auch eine alternative Schreibweise für Summen und Produkte, die mächtiger ist als die oben vorgestellte Schreibweise. Auf die Nennung des Start- und Endwertes wird bei dieser Schreibweise verzichtet. Stattdessen definiert man unter der Summe eine Bedingung, die als (mathematische) Aussage formuliert wird. Als Laufvariable dient in dieser Schreibweise diejenige Variable, die in der Bedingung neu eingeführt wird (demzufolge muss in der Bedingungsaussage genau eine Variable neu eingeführt werden). Die Laufvariable nimmt nun in einer beliebigen Reihenfolge alle ganzzahligen Werte an, die die gestellte Bedingung erfüllen. Wegen der Kommutativität der Addition und der Multiplikation ist es auch kein Problem, dass die Reihenfolge der Summanden bzw. der Faktoren nicht spezifiziert ist. Nun wird wie in der oben definierten Summen-/Produktschreibweise für jeden Wert der Laufvariablen ein Summand aufgeschrieben. Auch hier gibt der Funktionsterm bzw. die Zuordnungsvorschrift nach der Summe an, welcher Wert als Summand für welchen Wert der Laufvariable aufgeschrieben wird.

Es ist auch möglich, dass in der alternativen Summen-/Produktschreibweise über mehrere Variablen summiert wird. Betrachte hierzu das Beispiel

\sum _{k+l=3}k\cdot l

In dieser Summe wird über alle Paare $(k,l)$ natürlicher Zahlen summiert, für die die Aussage $k+l=3$ erfüllt ist. Das trifft genau auf die Paare $k=0$ und $l=3$ , $k=1$ und $l=2$ , $k=2$ und $l=1$ sowie $k=3$ und $l=0$ zu. Damit ergibt sich obige Summe zu

{\begin{aligned}\sum _{k+l=3}k\cdot l&=0\cdot 3+1\cdot 2+2\cdot 1+3\cdot 0\\&=0+2+2+0\\&=4\end{aligned}}

Verständnisfrage: Was ist $\sum _{i+j+k=4}i\cdot j+k$ ?

Die Variablen $(i,j,k)$ können bei der Bedingung $i+j+k=4$ folgende Werte annehmen:

{\begin{aligned}{\begin{array}{l}(0,0,4),(0,1,3),(0,2,2),(0,3,1),(0,4,0),\\(1,0,3),(1,1,2),(1,2,1),(1,3,0),\\(2,0,2),(2,1,1),(2,2,0),\\(3,0,1),(3,1,0),\\(4,0,0)\\\end{array}}\end{aligned}}

Damit erhält man für die Summe

{\begin{aligned}\sum _{i+j+k=4}i\cdot j+k&=\quad (0\cdot 0+4)+(0\cdot 1+3)+(0\cdot 2+2)+(0\cdot 3+1)+(0\cdot 4+0)\\&\quad +(1\cdot 0+3)+(1\cdot 1+2)+(1\cdot 2+1)+(1\cdot 3+0)\\&\quad +(2\cdot 0+2)+(2\cdot 1+1)+(2\cdot 2+0)\\&\quad +(3\cdot 0+1)+(3\cdot 1+0)\\&\quad +(4\cdot 0+0)\\&=4+3+2+1+0+3+3+3+3+2+3+4+1+3+0\\&=35\end{aligned}}

Verständnisfrage: Was ist $\sum _{1\leq \alpha <\beta \leq 3}\alpha \cdot \beta$ ?

Für die Bedingung $1\leq \alpha <\beta \leq 3$ müssen gleichzeitig folgende Ungleichungen erfüllt sein:

$1\leq \alpha$
$\alpha <\beta$
$\beta \leq 3$

Damit sind folgende Paare für $(\alpha ,\beta )$ möglich:

(1,2),\ (1,3),\ (2,3)

Das Ergebnis lautet damit:

{\begin{aligned}\sum _{1\leq \alpha <\beta \leq 3}\alpha \cdot \beta &=1\cdot 2+1\cdot 3+2\cdot 3\\&=2+3+6\\&=11\end{aligned}}

Fakultät

Die Fakultät $n!$ ist nichts anderes als eine Kurzschreibweise für das Produkt $1\cdot 2\cdot 3\cdot \ldots \cdot n$ . Die Fakultät ist insbesondere für die Kombinatorik wichtig, da sie die Anzahl der verschiedenen Anordnungen einer $n$ -elementigen Menge wiedergibt. So stößt man in der Wahrscheinlichkeitsrechnung, der Statistik und auch in anderen Bereichen der Mathematik immer wieder auf die Fakultät. Schauen wir uns aber zunächst ihre Definition an, bevor wir uns ihrer Anwendung zuwenden.

Herleitung

Nehmen wir eine beliebige Menge. Wie viele Möglichkeiten gibt es, diese anzuordnen? Eine solche Fragestellung ergibt sich, wenn uns zum Beispiel bei einer Menge von Läufern die Anzahl der möglichen Startverteilungen oder bei einem Gruppenfoto die Anzahl der Aufstellungen der Personen interessiert. Welche Objekte wir betrachten, hat keinen Einfluss auf ihre Anordnungsmöglichkeiten. Ausschlaggebend ist nur ihre Anzahl. Wir suchen also eine Funktion $f:\mathbb {N} \to \mathbb {N}$ , so dass $f(n)$ die Anzahl der unterschiedlichen Möglichkeiten ist, die Elemente einer $n$ -elementigen Menge anzuordnen.

Um diese Funktion zu finden, gehen wir induktiv vor. Zunächst beginnen wir bei der kleinsten Menge mit nur einem Element ( $n=1$ ) und versuchen durch sukzessives Einfügen neuer Elemente auf den Ergebnissen der vorherigen Schritte aufzubauen. Der Einfachheit halber betrachten wir nur Mengen der Form $\{1,2,\dots ,n\}$ , da nur die Anzahl an Elementen relevant ist.

Beginnen wir mit der einelementigen Menge $\{1\}$ . Diese kann man nur auf eine Art anordnen, da sie nur ein Element besitzt:

\color {green}1

Fügen wir der Menge ein Element hinzu und betrachten nun die Menge $\{1,2\}$ . Die neue Zahl $\color {green}2$ kann ich an zwei Orten platzieren – vor und nach der $1$ :

{\color {green}2}\,1\qquad 1\,{\color {green}2}

Beim Hinzufügen des dritten Elements gehen wir auf dieselbe Weise vor: Die neuen Anordnungsmöglichkeiten erzeugen wir durch Einfügen des neu hinzukommenden Elements (der $3$ ) an allen möglichen Stellen in den bereits bestehenden Anordnungen von zwei Elementen. Zunächst sieht man, dass man die Zahl $3$ an drei Stellen einfügen kann: links, mittig, rechts. Außerdem gibt es bereits zwei mögliche Anordnungen der Zahlen $\{1,2\}$ . Damit erhalten wir ingesamt $3\cdot 2=6$ neue Anordnungsmöglichkeiten:

{\color {green}3}\,1\,2\qquad 1\,{\color {green}3}\,2\qquad 1\,2\,{\color {green}3}\qquad \qquad {\color {green}3}\,2\,1\qquad 2\,{\color {green}3}\,1\qquad 2\,1\,{\color {green}3}

Für eine $n+1$ -elementige Menge lautet das Verfahren also: „Erzeuge alle Anordnungen der Menge, indem du das neue Element, $n+1$ , an allen möglichen Stellen in alle möglichen Permutationen der Menge ohne $n+1$ einfügst.“ Wir haben so induktiv alle Permutationen einer $n$ -elementigen Menge erzeugt. Wir wollen unserer Funktion nun einen Namen geben: Die von uns gesuchte Funktion wird Fakultät genannt und wird üblicherweise in der Postfix-Notation $n!$ geschrieben.

Kehren wir zurück zur Erzeugungsvorschrift: Es gibt $n+1$ Möglichkeiten die neue Zahl zu platzieren, wobei es bereits $n!$ Anordnungsmöglichkeiten der restlichen Zahlen gibt. So ergibt sich die Rekursionsformel:

(n+1)!=(n+1)\cdot n!

Mit $1!=1$ haben wir den Rekursionsanfang gefunden (es gibt eine Anordnungsmöglichkeit für eine einelementige Menge). Diese rekursive Berechnungsvorschrift können wir als Produkt auch explizit aufschreiben:

{\begin{aligned}n!&=n\cdot (n-1)!=n\cdot (n-1)\cdot (n-2)!=\ldots \\[0.5em]&=n\cdot (n-1)\cdot (n-2)\cdot \ldots \cdot 1\\[0.5em]&=\prod _{i=1}^{n}i\end{aligned}}

Unsere Baumdarstellung zeigt, dass die Fakultät schneller als jede Potenz wächst. Exponentieller Wachstum der Form $k^{n}$ entspricht der Anzahl der Blätter auf der $n$ -ten Ebene eines Baumes mit konstantem Verzweigungsgrad $k$ . Der Fakultätsbaum jedoch hat einen Verzweigungsgrad, der mit jeder neuen Ebene um $1$ zunimmt. Die Fakultät wächst also in der Großenordnung wie die Funktion $n^{n}$ .

Definition

Die Definition der Fakultät (Video vom Podcast The Wicked Mu)

Die Fakultät $n!$ ist definiert als

n!=1\cdot 2\cdot 3\cdot \ldots \cdot n

Das auftretende Produkt mit der Pünktchen-Schreibweise können wir exakter als endliches Produkt notieren:

n!=1\cdot 2\cdot 3\cdot \ldots \cdot n=\prod _{k=1}^{n}k

Es fehlt noch der Ausdruck $0!$ . Was soll hier das Ergebnis sein? In der Schreibweise mit dem endlichen Produkt ergibt sich ein leeres Produkt:

0!=\prod _{k=1}^{0}k

Dieses Produkt ist leer, weil der Startwert des Laufindex größer als dessen Endwert ist. Wir hatten bereits festgelegt, dass das leere Produkt immer $1$ ist. Wir können also definieren:

0!=\underbrace {\prod _{k=1}^{0}k} _{\text{leeres Produkt}}=1

Die letzte Gleichung können wir auch so interpretieren: Es gibt genau eine Möglichkeit eine leere Menge anzuordnen, nämlich mit der leeren Anordnung. Fassen wir das Gesagte zusammen:

Definition (Fakultät)

Für eine natürliche Zahl $n\geq 0$ ist ihre Fakultät $n!$ definiert durch:

n!:=1\cdot 2\cdot 3\cdot \ldots \cdot n=\prod _{k=1}^{n}k

Es ist $0!=1$ .

Schauen wir uns einige Beispiele an:

Beispiel (Beispiele zur Fakultät)

Es ist

{\begin{array}{rll}0!&=1&=1\\1!&=1&=1\\2!&=1\cdot 2&=2\\3!&=1\cdot 2\cdot 3&=6\\4!&=1\cdot 2\cdot 3\cdot 4&=24\\5!&=1\cdot 2\cdot 3\cdot 4\cdot 5&=120\\&\ \vdots \end{array}}

Die Fakultät wächst dabei sehr schnell. So ist $10!=3\,628\,800$ und $100!=9{,}3326\ldots \cdot 10^{157}$ , also eine Zahl mit 157 Ziffern im Dezimalsystem. Die Stirlingformel ist eine Möglichkeit, die Fakultät zu approximieren. Diese Approximation zeigt, dass die Fakultät schneller als exponentielle Funktionen wächst.

Rekursive Definition der Fakultät

Rekursive Definition der Fakultät (Video vom Podcast The Wicked Mu)

Die Fakultät kann auch rekursiv definiert werden. Hierfür benötigen wir einen Rekursionsschritt und -anfang. Beim Rekursionsschritt wird angegeben, wie $n!$ mit Hilfe von $(n-1)!$ berechnet werden kann:

Frage: Wie kann $n!$ mit Hilfe von $(n-1)!$ berechnet werden?

Es ist

{\begin{aligned}n!&=1\cdot 2\cdot 3\cdot \ldots \cdot n\\&=\underbrace {1\cdot 2\cdot 3\cdot \ldots \cdot (n-1)} _{=\ (n-1)!}\cdot n\\&=(n-1)!\cdot n\end{aligned}}

Der Rekursionsschritt lautet also $n!=(n-1)!\cdot n=n\cdot (n-1)!$

Mit Hilfe des obigen Rekursionsschritts kann $n!$ auf $(n-1)!$ zurückgeführt werden. Dieses wiederum kann durch $(n-2)!$ berechnet werden, weil $(n-1)!=(n-2)!\cdot (n-1)$ ist und so weiter. Es entsteht so eine Kette von Berechnungen, wobei in jedem Schritt die Fakultät einer Zahl mit Hilfe der Fakultät des Vorgängers berechnet wird.

Diese Berechnungskette muss aber irgendwann einmal abbrechen. Hierfür benötigen wir den Rekursionsanfang. Dabei müssen wir für die kleinste Zahl $m$ , für die die Fakultät sinnvoll definiert werden kann, den Ausdruck $m!$ angeben. Diese kleinste Zahl ist $m=0$ . Nun wissen wir aber bereits aus dem obigen Abschnitt, dass $0!=1$ ist. Damit ergibt sich folgende rekursive Definition der Fakultät:

Definition (Rekursive Definition der Fakultät)

Die Fakultät $n!$ ist rekursiv definiert durch:

n!={\begin{cases}1&{\text{falls }}n=0{\text{ (Rekursionsanfang)}}\\n\cdot (n-1)!&{\text{falls }}n>0{\text{ (Rekursionsschritt)}}\end{cases}}

Die Wirkungsweise der rekursiven Definition lässt sich gut an einem Beispiel nachvollziehen. Hier wird solange der Rekursionsschritt angewendet, bis der Rekursionsanfang benutzt werden kann:

Verständnisfrage: Warum ist $(n+1)!=n!\cdot (n+1)$ ?

Dies ergibt sich direkt aus dem Rekursionsschritt $n!=(n-1)!\cdot n$ . In dieser Gleichung setzt man anstelle von $n$ einfach $n+1$ ein. Dies ergibt

(n+1)!=(n+1-1)!\cdot (n+1)=n!\cdot (n+1)

Verständnisfrage: Vereinfache folgende Ausdrücke:

${\frac {(n+1)!}{n!}}$
${\frac {n!}{(n-2)!}}$
${\frac {k!\,(n-k)!}{(k+1)!\,(n-k-1)!}}$

Es ist

${\frac {(n+1)!}{n!}}={\frac {n!\cdot (n+1)}{n!}}=n+1$
${\frac {n!}{(n-2)!}}={\frac {(n-2)!\cdot (n-1)\cdot n}{(n-2)!}}=(n-1)\cdot n$
${\frac {k!\cdot (n-k)!}{(k+1)!\cdot (n-k-1)!}}={\frac {k!\cdot (n-k-1)!\cdot (n-k)}{k!\cdot (k+1)\cdot (n-k-1)!}}={\frac {n-k}{k+1}}$

Verständnisaufgabe: Beweise $n!\cdot (n^{2}-1)=(n+1)!\cdot (n-1)$ .

Aus der dritten binomischen Formel wissen wir $(n^{2}-1)=(n+1)\cdot (n-1)$ . Damit ist

{\begin{aligned}n!\cdot (n^{2}-1)&=n!\cdot (n+1)\cdot (n-1)\\&=(n+1)!\cdot (n-1)\end{aligned}}

Dabei haben wir ausgenutzt, dass nach der Definition der Fakultät $(n+1)!=n!\cdot (n+1)$ ist.

Anwendungen der Fakultät

Wie bereits erwähnt, tritt die Fakultät häufig bei Wahrscheinlichkeitsrechnungen und in der Statistik auf. Die Ursache dafür liegt an folgendem Satz aus der Kombinatorik (die Kombinatorik beschäftigt sich mit der Frage nach der Anzahl möglicher Anordnungen und bildet damit die Grundlage der Wahrscheinlichkeitsrechnung).

Satz (Anordnungen einer endlichen Menge)

Die Anzahl aller Anordnungen einer endlichen Menge mit $n$ Elementen ist $n!$ .

Dies bedeutet, dass die Anzahl der Permutationen einer Menge mit $n$ Elementen gleich $n!$ ist. Mit Hilfe dieses Satzes können nun folgende Fragen beantwortet werden: Wie viele mögliche Anordnungen von $52$ Spielkarten gibt es? Wenn ich $20$ Bierflaschen habe, wie viele Reihenfolgen gibt es, diese Bierflaschen zu trinken? Auf wie viele unterschiedliche Routen kann man elf Sehenswürdigkeiten besichtigen?

Wie kommt man auf den Beweis? (Anordnungen einer endlichen Menge)

Schauen wir uns zunächst einige Beispiele an. Betrachte dazu die Menge $A=\{1,\,2,\,3\}$ und $B=\{1,\,2,\,3,\,4\}$ .

Frage: Wie viele Anordnungen dieser beiden Mengen gibt es und welche sind das?

Die Anzahl der verschiedenen Anordnungen dieser beiden Mengen lässt sich am besten dadurch bestimmen, indem wir alle möglichen Anordnungen systematisch aufschreiben. Fangen wir mit der Menge $A$ an. Die Menge $\{1,\,2,\,3\}$ besitzt folgende mögliche Anordnungen:

{\begin{aligned}1\,2\,3&\quad 2\,1\,3\quad 3\,1\,2\\1\,3\,2&\quad 2\,3\,1\quad 3\,2\,1\end{aligned}}

Wir haben sechs mögliche Anordnungen gefunden (was $3!$ entspricht). Analog können wir alle möglichen Anordnungen der 4-elementigen Menge $\{1,\,2,\,3,\,4\}$ finden:

{\begin{aligned}1\,2\,3\,4\quad 2\,1\,3\,4\quad 3\,1\,2\,4\quad 4\,1\,2\,3\\1\,2\,4\,3\quad 2\,1\,4\,3\quad 3\,1\,4\,2\quad 4\,1\,3\,2\\1\,3\,2\,4\quad 2\,3\,1\,4\quad 3\,2\,1\,4\quad 4\,2\,1\,3\\1\,3\,4\,2\quad 2\,3\,4\,1\quad 3\,2\,4\,1\quad 4\,2\,3\,1\\1\,4\,2\,3\quad 2\,4\,1\,3\quad 3\,4\,1\,2\quad 4\,3\,1\,2\\1\,4\,3\,2\quad 2\,4\,3\,1\quad 3\,4\,2\,1\quad 4\,3\,2\,1\\\end{aligned}}

Wir haben $24$ verschiedene Möglichkeiten der Anordnung gefunden (was $4!$ entspricht). Wenn man sich nun die gefundene Systematik zum Notieren aller Anordnungen anschaut, kann man ein induktives Prinzip erkennen.

Schauen wir uns die Anordnungen der zweiten Menge $\{1,\,2,\,3,\,4\}$ an. Zunächst haben wir vier Möglichkeiten die erste Zahl zu bestimmen (jede Spalte). Danach haben wir in den Zeilen jeder Spalte alle Kombinationsmöglichkeiten der restlichen drei Zahlen systematisch aufgeschrieben. Da es für drei Zahlen genau sechs Möglichkeiten gibt (wie bei Menge $A$ bestimmt), kommen wir auf insgesamt $4\cdot 6=24$ Möglichkeiten. Diese Argumentation entspricht einem Beweis mit vollständiger Induktion.

Beweis (Anordnungen einer endlichen Menge)

Aussageform, deren Allgemeingültigkeit für $n\in \mathbb {N}$ bewiesen werden soll:

Es gibt $n!$ Möglichkeiten eine $n$ -elementige Menge anzuordnen.

1. Induktionsanfang:

Für eine einelementige Menge gibt es nur eine Anordnungsmöglichkeit. Da außerdem $1!=1$ ist, ist die Aussageform für $n=1$ wahr.

2. Induktionsschritt:

2a. Induktionsvoraussetzung:

Es gibt $n!$ Möglichkeiten eine $n$ -elementige Menge anzuordnen.

2b. Induktionsbehauptung:

Es gibt $(n+1)!$ Möglichkeiten eine $n+1$ -elementige Menge anzuordnen.

2c. Beweis des Induktionsschritts:

Für eine $(n+1)$ -elementige Menge gibt es $n+1$ Möglichkeiten die erste Position zu besetzen. Für jede dieser Möglichkeiten müssen die restlichen $n$ Positionen besetzt werden, wobei es nach Induktionsvoraussetzung dafür genau $n!$ Möglichkeiten gibt. Damit ist die Gesamtzahl aller möglichen Anordnungen einer $(n+1)$ -elementigen Menge genau $(n+1)\cdot n!=(n+1)!$ .

Jetzt können wir auch unsere obigen Fragen beantworten: Es gibt $52!\approx 8{,}07\cdot 10^{67}$ verschiedene Anordnungen von $52$ Spielkarten, $20!\approx 2{,}43\cdot 10^{18}$ verschiedene Reihenfolgen, $20$ Bierflaschen zu trinken und $11!=39\,916\,800$ verschiedene Routen, um $11$ Sehenswürdigkeiten zu besuchen.

Binomialkoeffizient

Herleitung und Definition

Frage: Was ist wahrscheinlicher: Beim Lotto zu gewinnen oder vom Blitz getroffen zu werden?

Das wirst du nach Lektüre dieses Kapitels beantworten können.

Damit du diese Frage beantworten kannst, musst du erst einmal die Wahrscheinlichkeit eines Lottogewinns wissen. Wie groß ist also die Wahrscheinlichkeit, 6 Richtige aus 49 Möglichkeiten zu raten? Zur Antwort dieser Frage benötigen wir die Anzahl der verschiedenen Möglichkeiten, 6 Zahlen aus 49 möglichen zu wählen. Hier kommt der Binomialkoeffizient ins Spiel. Er ist nämlich definiert als:

Definition (Binomialkoeffizient)

Der Binomialkoeffizient ${\binom {n}{k}}$ gibt für natürliche Zahlen $n$ und $k$ an, wie viele Möglichkeiten es gibt, $k$ Objekte aus $n$ Objekten auszuwählen. Damit gibt der Binomialkoeffizient ${\binom {n}{k}}$ an, wie viele $k$ -elementige Teilmengen aus einer $n$ -elementigen Menge gebildet werden können.

Man schreibt für den Binomialkoeffizienten ${\binom {n}{k}}$ . Dieser wird „n über k“ oder „k aus n“ ausgesprochen (Die deutsche Lotterie wird auch 6 aus 49 genannt). Der Binomialkoeffizient verdankt seinen Namen der Tatsache, dass er als Koeffizient im binomischen Lehrsatz auftritt. Aber dazu im nächsten Kapitel mehr.

Unsere Aufgabe ist es, den Binomialkoeffizienten ${\binom {49}{6}}$ zu bestimmen. Gehen wir dazu schrittweise vor: Zunächst ist es wichtig, dass du streng zwischen den Begriffen Anordnung und Kombination unterscheidest. Der Unterschied zwischen diesen zwei Begriffen ist der, dass bei einer Anordnung auf die Reihenfolge der Objekte geachtet wird, bei einer Kombination nicht. So sind zwar die Anordnungen ${\begin{pmatrix}3,\,48,\,23,\,12,\,35,\,42\end{pmatrix}}$ und ${\begin{pmatrix}12,\,42,\,35,\,23,\,48,\,3\end{pmatrix}}$ verschieden, die Kombinationen $\{3,\,48,\,23,\,12,\,35,\,42\}$ und $\{12,\,42,\,35,\,23,\,48,\,3\}$ aber gleich.

Frage: Wie viele Anordnungen von 6 Zahlen aus 49 Möglichkeiten gibt es?

An der ersten Stelle können 49 verschiedene Zahlen stehen. Wenn die erste Stelle besetzt ist, gibt es für jede dieser Besetzung 48 verschiedene Möglichkeiten, die zweite Stelle zu besetzen. Dementsprechend gibt es $49\cdot 48=2352$ verschiedene Möglichkeiten die ersten zwei Stellen zu belegen. Analog gibt es für die ersten drei Stellen $49\cdot 48\cdot 47$ verschiedene Möglichkeiten der Belegung und so weiter. Damit gibt es für sechs Stellen $49\cdot 48\cdot 47\cdot 46\cdot 45\cdot 44=10.068.347.520$ verschiedene Belegungen, also $10.068.347.520$ verschiedene Anordnungen.

Jedoch ist beim Lotto die Reihenfolge der gezogenen Zahlen irrelevant. In den oben gefundenen Anordnungen gibt es viele, die zur gleichen Kombination gehören. Dementsprechend die Frage:

Frage: Wie viele Kombinationen von 6 Zahlen aus 49 Möglichkeiten gibt es?

Nimm eine beliebige Kombination von 6 Zahlen aus 49 Möglichkeiten. Wir haben bereits gesehen, dass in der bereits beschriebenen Menge aller Anordnungen diese Kombination öfter vorkommt. Wie oft ist dies? Nehmen wir eine konkrete Kombination der 6 Zahlen. Jede Anordnung dieser 6 Zahlen kommt in der obigen Menge aller Zahlen genau einmal vor. Nun gibt es nach dem Satz über die Anzahl der Anordnungen einer endlichen Menge für eine Kombination mit 6 Elementen genau $6!=720$ verschiedene Anordnungen. Man muss also die obige Gesamtzahl aller Anordnungen durch 720 teilen und erhält das gewünschte Ergebnis. Es gibt damit ${\tfrac {10.068.347.520}{720}}=13.983.816$ verschiedene Kombinationen von 6 Zahlen aus 49.

Mit Hilfe des obigen Lösungswegs können wir auch eine allgemeine Formel für die Berechnung des Binomialkoeffizienten ${\binom {n}{k}}$ finden. Hierzu benötigen wir eine Fallunterscheidung in $k\leq n$ und $k>n$ . Betrachten wir zunächst den Fall, dass $k$ größer als $n$ ist:

Frage: Was ist der Binomialkoeffizient ${\binom {n}{k}}$ , wenn $k>n$ ist?

Nach obiger Definition entspricht der Binomialkoeffizient ${\binom {n}{k}}$ der Anzahl der verschiedenen Kombinationen von $k$ Objekten aus $n$ verschiedenen Objekten. Da $k$ größer als $n$ ist, gibt es keine Kombination von $k$ Objekten aus $n$ möglichen (So kannst du keine Kombination von 11 Elementen aus 4 dir zur Verfügung stehenden bilden). Damit ist für $k>n$ der Binomialkoeffizient ${\binom {n}{k}}=0$ .

Und nun zum Fall, dass $k\leq n$ und $k\neq 0$ ist:

Aufgabe: Berechne allgemein ${\binom {n}{k}}$ für $k\leq n$ und $k\neq 0$ , indem du analog zur obigen Herleitung für ${\binom {49}{6}}$ vorgehst.

Die Anzahl der verschiedenen Anordnungen von $k$ Elementen aus einer $n$ -elementigen Menge entspricht nach obiger Herleitung dem Produkt $n\cdot (n-1)\cdot (n-2)\cdot \ldots \cdot (n-k+1)$ . Dieses Produkt kann auch in der Produktschreibweise als $\prod _{j=1}^{k}n-j+1$ geschrieben werden. Dieses Produkt muss noch durch die Anzahl der verschiedenen Anordnungen einer Kombination geteilt werden, die $k!=\prod _{j=1}^{k}j$ ist (siehe Anordnungssatz aus dem Kapitel „Fakultät“). Damit erhalten wir:

{\binom {n}{k}}={{\prod _{j=1}^{k}n-j+1} \over {\prod _{j=1}^{k}j}}=\prod _{j=1}^{k}{{n-j+1} \over j}

Wenn wir dieses Ergebnis mit $(n-k)!$ erweitern, erhalten wir die in Lehrbüchern übliche Definition des Binomialkoeffizienten:

{\begin{aligned}{\binom {n}{k}}={{\prod _{j=1}^{k}n-j+1} \over {\prod _{j=1}^{k}j}}&={\frac {n\cdot (n-1)\cdot \ldots (n-k+1)}{1\cdot 2\cdot \ldots \cdot k}}\\&={\frac {\overbrace {n\cdot (n-1)\cdot \ldots (n-k+1)\cdot (n-k)!} ^{=\ n!}}{\underbrace {1\cdot 2\cdot \ldots \cdot k} _{=\ k!}\cdot (n-k)!}}\\&={\frac {n!}{k!\cdot (n-k)!}}\end{aligned}}

Frage: Der letzte Fall: Wie sieht es im Fall $k=0$ aus?

Es gibt nur eine 0-elementige Menge, die leere Menge $\{\}$ . Per Definition ist die leere Menge Teilmenge jeder Menge, insbesondere jeder $n$ -elementigen Menge. Damit ist Anzahl der 0-elementigen Kombinationen einer $n$ -elementigen Menge gleich 1 (es gibt nur die leere Kombination $\{\}$ ). Es ist also ${\binom {n}{0}}=1$ für alle $n\in \mathbb {N} _{0}$ . Dies erhält man auch, wenn man ${\binom {n}{0}}$ mit der obigen Definition ${\binom {n}{0}}={\frac {n!}{k!\cdot (n-k)!}}$ ausrechnet (siehe Binomialkoeffizient - Rechenregeln).

Zusammengefasst erhalten wir folgende alternative Definition des Binomialkoeffizienten:

Definition (Lehrbuchdefinition des Binomialkoeffizienten)

Für zwei natürliche Zahlen $n,k\geq 0$ mit $k\leq n$ ist der Binomialkoeffizient definiert durch:

{\binom {n}{k}}=\prod _{j=1}^{k}{\frac {n+1-j}{j}}={\frac {n!}{k!\cdot (n-k)!}}

Für $k>n$ ist ${\binom {n}{k}}=0$

Hier einige Beispiele:

Beispiel (Beispiele zum Binomialkoeffizienten)

${\binom {5}{3}}={\frac {5!}{3!\cdot (5-3)!}}={\frac {5!}{3!\cdot 2!}}=10$
${\binom {12}{4}}={\frac {12!}{4!\cdot (12-4)!}}={\frac {12!}{4!\cdot 8!}}=495$
${\binom {1}{0}}={\frac {1!}{0!\cdot (1-0)!}}={\frac {1!}{0!\cdot 1!}}=1$

Hinweis

Es gibt auch eine verallgemeinerte Definition des Binomialkoeffizienten. Mit diesem wirst du aber am Anfang des Studiums kaum in Berührung kommen, weswegen ich ihn weglasse.

Und was ist nun wahrscheinlicher: Blitzschlag oder Lottogewinn?

Wie oben berechnet, gibt es $13\,983\,816$ verschiedene Kombinationen von 6 Zahlen beim Lottospiel.

Frage: Wie hoch ist die Wahrscheinlichkeit beim Lottospielen 6 Richtige zu bekommen?

Die Wahrscheinlichkeit, beim Lotto zu gewinnen, ist ${\frac {1}{13\,983\,816}}=7{,}15\cdot 10^{-8}=0{,}000\,000\,0715=0{,}000\,007\,15\,\%$

Und wie hoch ist nun die Wahrscheinlichkeit vom Blitz getroffen zu werden? Um diese Frage zu beantworten, müssen wir sie konkretisieren: Wie hoch ist die Wahrscheinlichkeit in Deutschland innerhalb eines Jahres vom Blitz getroffen zu werden?. Nach dem Wikipedia-Artikel gibt es durchschnittlich 3 bis 7 Todesfälle durch Blitzschlag in Deutschland pro Jahr. In diesem Artikel ist die Rede von 4 bis 5 Todesfällen und Herr Krämer nennt so um die 10 Todesfälle jährlich (Leider konnte ich nur Angaben zu den jährlichen Todesfällen finden. Es wird sicherlich mehrere Menschen geben, die vom Blitz getroffen, aber nicht gestorben sind). Bei gut 82 Millionen Einwohner in Deutschland ergibt dies mit durchschnittlich 5 Todesfällen im Jahr eine Wahrscheinlichkeit von ${\frac {5}{82\,000\,000}}=6{,}09\cdot 10^{-8}$ , in Deutschland innerhalb eines Jahres vom Blitz tödlich getroffen zu werden, also ungefähr die Wahrscheinlichkeit im Lotto zu gewinnen. Wenn man noch annimmt, dass die Anzahl der nicht-tödlichen Blitzschläge auf Menschen mindestens genauso hoch ist wie die Anzahl der jährlichen Todesfälle, ergibt dies eine Wahrscheinlichkeit von mindestens ${\frac {10}{82\,000\,000}}=1{,}2\cdot 10^{-7}$ , im Jahr vom Blitz getroffen zu werden. Dementsprechend ist es wahrscheinlicher, in Deutschland innerhalb eines Jahres vom Blitz getroffen zu werden, als bei einem einzigen Tipp 6 Richtige im Lotto zu haben. Beachte, dass wir in der obigen Rechnung nur die Wahrscheinlichkeit eines einzigen Lottotipps berechnet haben. Wenn jemand im Jahr öfter Lotto spielt oder mehr Lottotipps bei einer Ziehung einreicht, dann ist seine Gesamtgewinnwahrscheinlichkeit, mit mindestens einem Tipp zu gewinnen, größer als $7{,}15\cdot 10^{-8}$ .

Binomischer Lehrsatz

Der binomische Lehrsatz

Sicherlich sind dir die binomischen Formeln noch aus der Schule bekannt. Ich kann mir gut vorstellen, dass dein Mathe-Lehrer sie in seinen Unterrichtsstunden hoch und runter gebetet hat. Nicht ohne Grund! Denn immer wieder helfen sie dir die binomischen Formeln geschickt umzuformen und Beweise einfach zu führen. Hier zur Wiederholung die drei binomischen Formeln, welche für alle $a,b\in \mathbb {R}$ gelten:

$(a+b)^{2}=a^{2}+2ab+b^{2}$
$(a-b)^{2}=a^{2}-2ab+b^{2}$
$(a+b)\cdot (a-b)=a^{2}-b^{2}$

Denk immer an diese Formeln. Wenn du zum Beispiel auf Terme wie $4-16x^{2}$ triffst, kannst du sie auch als $(2+4x)\cdot (2-4x)$ schreiben. Manchmal kannst du so schwierige Terme vereinfachen oder zusammenfassen. Doch nun zum Thema dieses Kapitels: Wie lauten die binomischen Formeln für größere Potenzen als der 2?. Wir wollen also eine allgemeine Lösungsformel für den Term $(x+y)^{n}$ für $n\in \mathbb {N}$ finden.

Hinweis

Denk daran, wenn wir wissen, was $(x+y)^{n}$ ist, wissen wir auch, was $(x-y)^{n}$ ist. Denn wir können $(x-y)^{n}$ als $(x+(-y))^{n}$ schreiben und für $(x+(-y))^{n}$ können wir die gefundene Formel anwenden. Dies gilt insbesondere auch für die obigen binomischen Formeln. So folgt wegen $(a-b)^{2}=(a+(-b))^{2}$ die zweite binomische Formel direkt aus der ersten.

Schauen wir uns ein Beispiel an: Wir wollen wissen, was $(x+y)^{3}$ ist. Hierzu müssen wir den Term $(x+y)\cdot (x+y)\cdot (x+y)$ ausmultiplizieren, wie es in der folgenden Animation gezeigt wird:

Wir erhalten so den Term $x^{3}+3x^{2}y+3xy^{2}+y^{3}$ . Es fällt auf, dass für jeden Summanden der Gesamtsumme die Summe der Exponenten von $x$ und $y$ gleich 3 ist. Dies leuchtet ein. Wir nehmen nämlich, wenn wir das Produkt $(x+y)\cdot (x+y)\cdot (x+y)$ ausmultiplizieren, aus jedem der Terme $(x+y)$ entweder ein $x$ oder ein $y$ (in jeden Summanden kommen insgesamt 3 Faktoren $x$ oder $y$ vor). Die Summe der Exponenten beider Variablen muss also gleich 3 sein. Es müssen so nur noch die Koeffizienten der einzelnen Summanden bestimmt werden.

Wir sind nun bereit für den allgemeinen Fall. Wir wollen wissen:

(x+y)^{n}=\underbrace {(x+y)\cdot (x+y)\cdot \ldots \cdot (x+y)} _{n{\text{-mal}}}={\text{?}}

Wir wissen, dass das Ergebnis eine Summe von Potenzen in $x$ und $y$ ist. Die Summe der Exponenten in jedem Summanden ist gleich $n$ . Alle Potenzen besitzen also die Form $x^{k}y^{n-k}$ , wobei $k\leq n$ eine natürliche Zahl ist (die 0 ist mit eingeschlossen). Wir müssen noch die Koeffizienten dieser Potenzen bestimmen. Betrachten wir einige Beispiele. Der Koeffizient von $x^{n}$ muss 1 sein. Denn wenn wir diese Potenz erhalten wollen, müssen wir aus allen Termen $(x+y)$ die Variable $x$ wählen:

\underbrace {({\color {Red}x}+y)\cdot ({\color {Red}x}+y)\cdot \ldots \cdot ({\color {Red}x}+y)} _{{\text{man erhält }}{\color {Red}x^{n}}}

Analog ist auch der Koeffizient für $y^{n}$ 1. Doch wie lautet allgemein der Koeffizient für den Term $x^{k}y^{n-k}$ ? Dazu müssen wir aus den $n$ Termen $(x+y)$ $k$ -mal die Variable $x$ und $(n-k)$ -mal die Variable $y$ wählen. Doch wie viele Möglichkeiten gibt es aus $n$ Termen $k$ -mal eine Variable auszuwählen? Fällt dir etwas auf? Genau, dies ist der im vorherigen Abschnitt diskutierte Binomialkoeffizient ${\binom {n}{k}}$ ! Dementsprechend ist der Koeffizient von $x^{k}y^{n-k}$ gleich ${\binom {n}{k}}$ (Deshalb auch der Name: Binomialkoeffizient!). Wir erhalten:

Satz (Der binomische Lehrsatz)

Für alle reellen Zahlen $x$ und $y$ und für alle natürlichen Zahlen $n$ gilt:

{\begin{aligned}(x+y)^{n}&={\binom {n}{0}}y^{n}+{\binom {n}{1}}xy^{n-1}+{\binom {n}{2}}x^{2}y^{n-2}+\ldots +{\binom {n}{n}}x^{n}\\&=\sum _{k=0}^{n}{\binom {n}{k}}x^{n-k}y^{k}\end{aligned}}

Folgerungen aus dem binomischen Lehrsatz

Mit Hilfe des binomischen Lehrsatzes kannst du nun weitere Antworten auf Fragen der Kombinatorik finden. Stell dir vor, du hast eine beliebige, endliche Menge $M$ gegeben. Wie viele Teilmengen kannst du aus dieser Menge bilden? Wir wissen bereits, dass die Anzahl der $k$ -elementigen Teilmengen von $M$ dem Binomialkoeffizienten ${\binom {|M|}{k}}$ entspricht ( $|M|$ ist die Anzahl der Elemente der Menge $M$ ). Um die Gesamtzahl aller Teilmengen der Menge $M$ zu finden, müssen wir die Summe über die Anzahl aller $k$ -elementigen Teilmengen von $M$ mit $0\leq k\leq |M|$ bilden. Wir erhalten (Anmerkung: ${\mathcal {P}}(M)$ ist Potenzmenge von $M$ , also die Menge aller Teilmengen von $M$ . Dementsprechend ist $|{\mathcal {P}}(M)|$ die Anzahl aller Teilmengen von $M$ .):

|{\mathcal {P}}(M)|={\binom {|M|}{0}}+{\binom {|M|}{1}}+{\binom {|M|}{2}}+\ldots +{\binom {|M|}{|M|}}=\sum _{k=0}^{|M|}{\binom {|M|}{k}}

Frage: Was ist das Ergebnis der obigen Summe? Vergleiche dazu die obige Summe mit dem binomischen Lehrsatz!

Die obige Summe entsteht aus dem binomischen Lehrsatz für $x=1$ und $y=1$ . Dementsprechend ist $|{\mathcal {P}}(M)|=\sum _{k=0}^{|M|}{\binom {|M|}{k}}=(1+1)^{|M|}=2^{|M|}$ .

Satz (Größe der Potenzmenge einer endlichen Menge)

Sei $M$ eine beliebige endliche Menge. Dann ist $|{\mathcal {P}}(M)|=2^{|M|}$ .

Und wie sieht es mit der folgenden Summe aus?

{\binom {n}{0}}-{\binom {n}{1}}+{\binom {n}{2}}-\ldots (+{\text{ oder }}-){\binom {n}{n}}=\sum _{k=0}^{n}(-1)^{k}\cdot {\binom {n}{k}}={\text{?}}

Frage: Wie lautet das Ergebnis der obigen Summe?

Die obige Summe entsteht aus dem binomischen Lehrsatz für $x=-1$ und $y=1$ . Das Ergebnis der Summe lautet dementsprechend:

\sum _{k=0}^{n}(-1)^{k}\cdot {\binom {n}{k}}=(-1+1)^{n}=0^{n}={\begin{cases}0,&{\text{wenn }}n\neq 0\\1,&{\text{wenn }}n=0\\\end{cases}}

Rechenregeln für den Binomialkoeffizienten

In diesem Kapitel stelle ich dir die wichtigsten Eigenschaften des Binomialkoeffizienten vor.

Rechenregeln in der Übersicht

Es sei im Folgendem $k$ und $n$ eine natürliche Zahl, wobei $k$ und $n$ hier auch Null sein dürfen. Außerdem sei $0\leq k\leq n$ . Es gelten nun folgende Regeln:

${\binom {n}{0}}=1$
${\binom {n}{n}}=1$
${\binom {n}{k}}={\binom {n}{n-k}}$
$k\cdot {\binom {n}{k}}=n\cdot {\binom {n-1}{k-1}}$
${\binom {n+1}{k+1}}={\binom {n}{k}}+{\binom {n}{k+1}}$ für $0\leq k<n$

Einige der obigen Gleichungen können gut aus der Anschauung des Binomialkoeffizienten erklärt werden, dass ${\binom {n}{k}}$ der Anzahl der $k$ -elementigen Teilmengen einer $n$ -elementigen Menge entspricht:

${\binom {n}{n}}=1$ weil eine $n$ -elementige Menge $M$ nur eine $n$ -elementige Teilmenge enthält (nämlich die Menge $M$ ).
${\binom {n}{k}}={\binom {n}{n-k}}$ . Zu jeder Teilmenge von $M$ mit $k$ Elementen existiert deren Komplement, welches $n-k$ Elemente enthält. Somit ist die Anzahl der unterschiedlichen Teilmengen gleich.
${\binom {n+1}{k+1}}={\binom {n}{k}}+{\binom {n}{k+1}}$ . Stellen wir uns Mengen $M,M':=M\cup \{e\}$ vor, wobei $|M|=n$ und $e$ ein zuvor nicht in $M$ enthaltenes Element ist. Dann ist der erste Summand die Anzahl der $k$ -elementigen Teilmengen von $M$ - fügt man aber jeder dieser Mengen das neue Element $e$ hinzu, sind diese nun $k+1$ -elementige Teilmengen von $M'$ . Zusammen mit den $k+1$ -elementigen Teilmengen ohne $e$ (der zweite Summand), erhalten wir das Ergebnis.

Andere Rechenregeln sind aber nicht so offensichtlich. Hier kann im Beweis auf die Fakultätsdefinition ${\binom {n}{k}}={\tfrac {n!}{k!(n-k)!}}$ des Binomialkoeffizienten zurückgegriffen werden.

Pascalsches Dreieck

Das pascalsche Dreieck ist eine grafische Anordnung der Binomialkoeffizienten in einem Dreieck:

{\begin{array}{c}{\binom {0}{0}}\\{\binom {1}{0}}\quad {\binom {1}{1}}\\{\binom {2}{0}}\quad {\binom {2}{1}}\quad {\binom {2}{2}}\\{\binom {3}{0}}\quad {\binom {3}{1}}\quad {\binom {3}{2}}\quad {\binom {3}{3}}\\\vdots \end{array}}

Wenn man die Binomialkoeffizienten ausrechnet, dann ergibt sich folgendes Dreieck:

{\begin{array}{c}1\\1\quad 1\\1\quad 2\quad 1\\1\quad 3\quad 3\quad 1\\\vdots \end{array}}

Die Regel ${\binom {n+1}{k+1}}={\binom {n}{k}}+{\binom {n}{k+1}}$ ermöglicht es, den Binomialkoeffizienten als Summe der beiden direkt oberhalb liegenden Binomialkoeffizienten zu berechnen:

Animation zur Erstellung des Pascalschem Dreieck

Das Besondere am pascalschen Dreieck ist, dass man an ihm direkt die Binomalkoeffizienten und damit die Vorfaktoren beim Ausklammern von Potenzen der Form $(x+y)^{n}$ ablesen kann. Beispielsweise lautet die Zeile für $n=3$ :

{\color {Red}1}\quad {\color {Orange}3}\quad {\color {OliveGreen}3}\quad {\color {Blue}1}

Dies ist die vierte Zeile, weil die erste Zeile im Dreieck zu $n=0$ gehört. Damit wissen wir ohne Nachrechnen:

(x+y)^{3}={\color {Red}1}\cdot x^{3}+{\color {Orange}3}\cdot x^{2}y+{\color {OliveGreen}3}\cdot xy^{2}+{\color {Blue}1}\cdot y^{3}

Der Sinn des pascalschen Dreiecks ist es also, die Vorfaktoren beim Ausklammern von Potenzen der Form $(x+y)^{n}$ einfach ablesen zu können. Das Dreieck wurde im Übrigen nach Blaise Pascal benannt, der es 1655 in einem seiner Bücher veröffentlichte. Es wurde aber bereits früher von anderen Mathematikern eingesetzt^[15].

Beweise zu den Rechenregeln

Regel 1 und 2

Satz

Es gelten die beiden Formeln ${\binom {n}{0}}=1$ und ${\binom {n}{n}}=1$ .

Beweis

Die obigen Gleichungen ergeben sich durch Ausnutzung der Fakultätsdefinition ${\binom {n}{k}}={\tfrac {n!}{k!(n-k)!}}$ des Binomialkoeffizienten:

{\binom {n}{0}}={\frac {n!}{0!\cdot (n-0)!}}={\frac {n!}{1\cdot n!}}=1

und

{\binom {n}{n}}={\frac {n!}{n!\cdot (n-n)!}}={\frac {n!}{n!\cdot 0!}}={\frac {n!}{n!\cdot 1}}=1

Regel 3

Satz

Es ist ${\binom {n}{k}}={\binom {n}{n-k}}$ .

Wie kommt man auf den Beweis?

Um die notwendigen Termumformungen zu finden, beginnen wir am besten mit dem Term ${\binom {n}{n-k}}$ (weil dieser komplizierter ist als ${\binom {n}{k}}$ und deswegen die Umformung von ${\binom {n}{n-k}}$ zu ${\binom {n}{k}}$ wahrscheinlich einfacher ist als umgekehrt):

{\binom {n}{n-k}}={\frac {n!}{(n-k)!\cdot (n-(n-k))!}}

Der Term $(n-(n-k))!$ kann nun vereinfacht werden:

{\frac {n!}{(n-k)!\cdot (n-(n-k))!}}={\frac {n!}{(n-k)!\cdot (n-n+k)!}}={\frac {n!}{(n-k)!\cdot k!}}

Der Term ${\tfrac {n!}{(n-k)!\cdot k!}}$ unterscheidet sich kaum von ${\binom {n}{k}}={\tfrac {n!}{k!(n-k)!}}$ . Im Nenner müssen nur noch die beiden Faktoren vertauscht werden:

{\frac {n!}{(n-k)!\cdot k!}}={\frac {n!}{k!\cdot (n-k)!}}={\binom {n}{k}}

Damit haben wir alle notwendigen Termumformungen für den Beweis gefunden .

Beweis

Die Formel kann folgendermaßen bewiesen werden:

{\begin{aligned}{\binom {n}{k}}&={\frac {n!}{k!\cdot (n-k)!}}\\&={\frac {n!}{(n-k)!\cdot k!}}\\&={\frac {n!}{(n-k)!\cdot (n-n+k)!}}\\&={\frac {n!}{(n-k)!\cdot (n-(n-k))!}}\\&={\binom {n}{n-k}}\end{aligned}}

Regel 4

Satz

Es ist $k\cdot {\binom {n}{k}}=n\cdot {\binom {n-1}{k-1}}$ .

Wie kommt man auf den Beweis?

Zunächst können wir beide Binomialkoeffizienten ausschreiben:

{\begin{aligned}k\cdot {\binom {n}{k}}&=k\cdot {\frac {n!}{k!\cdot (n-k)!}}\\n\cdot {\binom {n-1}{k-1}}&=n\cdot {\frac {(n-1)!}{(k-1)!\cdot (n-1-(k-1))!}}\end{aligned}}

Beide erhaltene Terme können soweit wie möglich vereinfacht werden:

{\begin{aligned}k\cdot {\frac {n!}{k!\cdot (n-k)!}}&={\frac {n!}{(k-1)!\cdot (n-k)!}}\\n\cdot {\frac {(n-1)!}{(k-1)!\cdot (n-1-(k-1))!}}&={\frac {n\cdot (n-1)!}{(k-1)!\cdot (n-k)!}}\\&={\frac {n!}{(k-1)!\cdot (n-k)!}}\end{aligned}}

Die vereinfachten Terme stimmen überein, also müssen auch $k\cdot {\binom {n}{k}}$ und $n\cdot {\binom {n-1}{k-1}}$ identisch sein. Im Beweis müssen wir nun die verwendeten Termumformungen aufschreiben, mit denen $k\cdot {\binom {n}{k}}$ in $n\cdot {\binom {n-1}{k-1}}$ umgeformt werden kann.

Beweis

Es ist

{\begin{aligned}k\cdot {\binom {n}{k}}&=k\cdot {\frac {n!}{k!\cdot (n-k)!}}\\&=n\cdot {\frac {(n-1)!}{(k-1)!\cdot (n-k)!}}\\&=n\cdot {\frac {(n-1)!}{(k-1)!\cdot (n-1-k+1)!}}\\&=n\cdot {\frac {(n-1)!}{(k-1)!\cdot (n-1-(k-1))!}}\\&=n\cdot {\binom {n-1}{k-1}}\end{aligned}}

Regel 5

Satz

Sei $k,n\in \mathbb {N}$ mit $0\leq k<n$ . Es ist dann ${\binom {n+1}{k+1}}={\binom {n}{k}}+{\binom {n}{k+1}}$ .

Wie kommt man auf den Beweis?

Zum Beweis der Gleichung ${\binom {n+1}{k+1}}={\binom {n}{k}}+{\binom {n}{k+1}}$ gehen wir schrittweise vor:

Frage: Wie lautet die zu beweisende Gleichung, nachdem man auf beiden Seiten die Definition ${\binom {n}{k}}={\tfrac {n!}{k!(n-k)!}}$ eingesetzt hat?

{\frac {(n+1)!}{(k+1)!\cdot (n-k)!}}={\frac {n!}{k!\cdot (n-k)!}}+{\frac {n!}{(k+1)!\cdot (n-k-1)!}}

Aufgabe: Versuche durch Termumformungen die gerade gefundene Gleichung zu beweisen.

${\begin{aligned}&{\frac {n!}{k!\cdot (n-k)!}}+{\frac {n!}{(k+1)!\cdot (n-k-1)!}}\\[0.5em]&\qquad {\color {Gray}\left\downarrow \ {\text{Brüche gleichnamig machen}}\right.}\\[0.5em]=\ &{\frac {n!\cdot (k+1)}{(k+1)!\cdot (n-k)!}}+{\frac {n!\cdot (n-k)}{(k+1)!\cdot (n-k)!}}\\[0.5em]=\ &{\frac {n!\cdot (k+1)+n!\cdot (n-k)}{(k+1)!\cdot (n-k)!}}\\[0.5em]&\qquad {\color {Gray}\left\downarrow \ {\text{Zähler zusammenfassen}}\right.}\\[0.5em]=\ &{\frac {n!\cdot (k+1+n-k)}{(k+1)!\cdot (n-k)!}}\\[0.5em]=\ &{\frac {n!\cdot (n+1)}{(k+1)!\cdot (n-k)!}}\\[0.5em]=\ &{\frac {(n+1)!}{(k+1)!\cdot (n-k)!}}\end{aligned}}$

Beweis

Es ist

{\begin{aligned}&{\binom {n}{k}}+{\binom {n}{k+1}}\\[0.5em]=\ &{\frac {n!}{k!\cdot (n-k)!}}+{\frac {n!}{(k+1)!\cdot (n-k-1)!}}\\[0.5em]&\qquad {\color {Gray}\left\downarrow \ {\text{Brüche gleichnamig machen}}\right.}\\[0.5em]=\ &{\frac {n!\cdot (k+1)}{(k+1)!\cdot (n-k)!}}+{\frac {n!\cdot (n-k)}{(k+1)!\cdot (n-k)!}}\\[0.5em]=\ &{\frac {n!\cdot (k+1)+n!\cdot (n-k)}{(k+1)!\cdot (n-k)!}}\\[0.5em]&\qquad {\color {Gray}\left\downarrow \ {\text{Zähler zusammenfassen}}\right.}\\[0.5em]=\ &{\frac {n!\cdot (k+1+n-k)}{(k+1)!\cdot (n-k)!}}\\[0.5em]=\ &{\frac {n!\cdot (n+1)}{(k+1)!\cdot (n-k)!}}\\[0.5em]=\ &{\frac {(n+1)!}{(k+1)!\cdot (n-k)!}}\\[0.5em]&\qquad {\color {Gray}\left\downarrow \ {\text{Im Nenner}}+1-1{\text{ einfügen}}\right.}\\[0.5em]=\ &{\frac {(n+1)!}{(k+1)!\cdot ((n+1)-(k+1))!}}\\[0.5em]=\ &{\binom {n+1}{k+1}}\end{aligned}}

↑ Mit der Frage "Sind die mathematischen Erkenntnisse erfunden oder werden sie gefunden?" beschäftigt sich auch der italienische Autor Mario Livio in seinem Buch "Ist Gott ein Mathematiker?" (ISBN: 9783423348003). Auch der erstaunliche Zusammenhang zwischen Natur und Mathematik wird von Livio ausführlich diskutiert und mit den Lebensgeschichten großer Denker wie Pythagoras, Platon, Newton und Einstein bereichert.
↑ Brockhaus.de, Teilgebiete der Mathematik im Überblick
↑ Siehe Wikipedia-Artikel „Schaltjahr“
↑ Siehe hierzu die Diskussion https://de.wikibooks.org/w/index.php?title=Benutzer_Diskussion:Stephan_Kulla&oldid=712748#Kontravalenz_Bindungsstaerke
↑ Siehe Abschnitt „Notation“ des englischsprachigen Wikipedia-Artikels „Quantifier (logic)“
↑ Siehe Abschnitt „Herkunft der Bezeichnung“ des Wikipedia-Artikels „Gaußsche Summenformel“.
↑ Georg Cantor: Beiträge zur Begründung der transfiniten Mengenlehre. In: Mathematische Annalen 46 (1895), S. 31.
↑ Siehe auch Wikipedia-Artikel zum „Elementzeichen“
↑ Siehe Von Neumanns Modell der natürlichen Zahlen und Dedekindsche Schnitte
↑ Siehe Abschnitt „Bedeutung“ im Wikipedia-Artikel zur Zermelo-Fraenkel-Mengenlehre
↑ So konnte gezeigt werden, dass die Kontinuumshypothese in ZFC weder beweis- noch widerlegbar ist.
↑ Spektrum der Wissenschaft Spezial: Das Unendliche (Mai 2001). Seite 14. ISSN 0943-7096
↑ Wolfgang Rautenberg, Uber den Cantor-Bernsteinschen Aquivalenzsatz, Berlin 2007,[PDF]
↑ Auf eine genaue Definition der Kardinalzahlen verzichten wir hier. Üblicherweise werden Kardinalzahlen als spezielle Ordinalzahlen definiert.
↑ Siehe hierzu den Wikipedia-Artikel „Pascalsches Dreieck“.

[1] Mit der Frage "Sind die mathematischen Erkenntnisse erfunden oder werden sie gefunden?" beschäftigt sich auch der italienische Autor Mario Livio in seinem Buch "Ist Gott ein Mathematiker?" (ISBN: 9783423348003). Auch der erstaunliche Zusammenhang zwischen Natur und Mathematik wird von Livio ausführlich diskutiert und mit den Lebensgeschichten großer Denker wie Pythagoras, Platon, Newton und Einstein bereichert.

[2] Brockhaus.de, Teilgebiete der Mathematik im Überblick

[3] Siehe Wikipedia-Artikel „Schaltjahr“

[4] Siehe hierzu die Diskussion https://de.wikibooks.org/w/index.php?title=Benutzer_Diskussion:Stephan_Kulla&oldid=712748#Kontravalenz_Bindungsstaerke

[5] Siehe Abschnitt „Notation“ des englischsprachigen Wikipedia-Artikels „Quantifier (logic)“

[6] Siehe Abschnitt „Herkunft der Bezeichnung“ des Wikipedia-Artikels „Gaußsche Summenformel“.

[7] Georg Cantor: Beiträge zur Begründung der transfiniten Mengenlehre. In: Mathematische Annalen 46 (1895), S. 31.

[8] Siehe auch Wikipedia-Artikel zum „Elementzeichen“

[9] Siehe Von Neumanns Modell der natürlichen Zahlen und Dedekindsche Schnitte

[10] Siehe Abschnitt „Bedeutung“ im Wikipedia-Artikel zur Zermelo-Fraenkel-Mengenlehre

[11] So konnte gezeigt werden, dass die Kontinuumshypothese in ZFC weder beweis- noch widerlegbar ist.

[12] Spektrum der Wissenschaft Spezial: Das Unendliche (Mai 2001). Seite 14. ISSN 0943-7096

[13] Wolfgang Rautenberg, Uber den Cantor-Bernsteinschen Aquivalenzsatz, Berlin 2007,[PDF]

[14] Auf eine genaue Definition der Kardinalzahlen verzichten wir hier. Üblicherweise werden Kardinalzahlen als spezielle Ordinalzahlen definiert.

[15] Siehe hierzu den Wikipedia-Artikel „Pascalsches Dreieck“.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]