Dies ist ein als lesenswert ausgezeichneter Artikel.

Rot-Schwarz-Baum

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Rot-Schwarz-Baum
Komplexität
bei Elementen
Platz
Operation im Mittel Worst Case
Suchen
Querschritt
Min, Max
Einfügen
Löschen
Platz- und Zeit-Komplexitäten

Ein Rot-Schwarz-Baum (englisch red–black tree oder englisch RB tree) ist eine Datenstruktur vom Typ binärer Suchbaum, die „sehr schnellen“ Zugriff auf die in ihr gespeicherten Werte garantiert. Rot-Schwarz-Bäume wurden zuerst 1972 von Rudolf Bayer beschrieben,[1] welcher sie symmetric binary B-trees nannte. Der heutige Name geht auf Leonidas J. Guibas und Robert Sedgewick zurück, die 1978 die rot-schwarze Farbkonvention einführten.[2] Die schnellen Zugriffszeiten auf die einzelnen im Rot-Schwarz-Baum gespeicherten Elemente werden durch drei Forderungen erreicht, die zusammen garantieren, dass ein Rot-Schwarz-Baum immer balanciert ist, wodurch die Höhe eines Rot-Schwarz-Baumes mit Schlüsseln (Elementen) nie größer als wird.[3] Somit können die wichtigsten Operationen in Suchbäumen – Suchen, Einfügen und Löschen – garantiert in (s. Landau-Symbole) ausgeführt werden.

Definition

Zusätzlich zu den Eigenschaften des binären Suchbaums hat jeder Knoten des Rot-Schwarz-Baums ein weiteres Attribut, genannt Farbe, mit zwei Werten, genannt rot (engl. RED) und schwarz (engl. BLACK). Diese Einfärbung hat die drei folgenden Forderungen zu erfüllen:[4]

Forderung N: Alle externen Blatt-Knoten (d. s. die #NIL-Knoten) sind schwarz.
Forderung R: Ist ein Knoten rot, so sind beide Kinder schwarz.
Forderung B: Jeder Pfad von einem gegebenen Knoten zu seinen Blattknoten enthält die gleiche Anzahl schwarzer Knoten.
Rot-Schwarz-Baum der Höhe 4 und der Schwarztiefe 2

Die auf allen Pfaden von Wurzel zu Blatt gleiche Anzahl schwarzer Knoten wird die Schwarztiefe[5] (auch Schwarzhöhe, engl. black-height) des Baums genannt. Dabei seien in diesem Artikel die die Pfade abschließenden und immer schwarzen NIL-Knoten nicht mitgezählt, auch nicht bei der Baumhöhe.

Durch diese drei Forderungen[6] wird die wichtigste Eigenschaft von Rot-Schwarz-Bäumen sichergestellt:

Wegen der Forderung R kann es auf keinem Pfad von der Wurzel zu einem Blatt mehr rote als schwarze Knoten geben, während auf dem kürzesten Pfad im Extremfall nur schwarze Knoten vorhanden sind. Da die Forderung B jedoch festlegt, dass die Anzahl der schwarzen Knoten auf allen Pfaden gleich sein muss, kann der Pfad, auf dem sich jeweils ein roter mit einem schwarzen Knoten abwechselt, maximal doppelt so lang sein wie ein Pfad, auf dem nur schwarze Knoten liegen. Hierdurch ist ein Rot-Schwarz-Baum immer gut genug balanciert – auf jeden Fall so gut, dass das Verhältnis zwischen der Höhe des Baums und dem Logarithmus der Knotenzahl beschränkt bleibt. Diese logarithmische Beschränkung, die im Abschnitt #Höhenbeweis formal bewiesen wird, ist aber gleichzeitig das informationstheoretische Optimum, d. h. es gibt keinen Binärbaum mit asymptotisch kleinerer maximaler Pfadlänge (= Höhe) .

Bei den herausgehobenen Operationen Suchen, Einfügen und Löschen ist der auf einer Ebene des Baums anfallende Aufwand konstant. Also ist die Laufzeit höchstens proportional zur Anzahl der Knoten in einem Pfad, die wieder durch die Höhe limitiert ist, welche ihrerseits durch den Logarithmus der Knotenzahl limitiert ist.

Anmerkung: Dieser Artikel nimmt die im Artikel Binärer Suchbaum in dessen Abb. 1B aufgezeigte und bei Rot-Schwarz-Bäumen außerordentlich verbreitete Sichtweise ein, bei der die internen Knoten die Schlüssel tragen („knotenorientierte Speicherung“) und die externen Blätter die (randlosen) Intervalle zwischen den Schlüsseln markieren. In dieser Sichtweise haben die Schlüssel tragenden Knoten immer genau zwei Kinder, und die schlüssellosen (externen) Blätter (die sog. „NIL-Knoten“ oder NIL-Blätter) tragen gemäß Forderung N die Farbe schwarz. (Im Vergleich dazu wäre der Knoten mit dem Schlüssel ein rotes internes Blatt und der mit ein schwarzes.) Diese Sichtweise präjudiziert aber die Implementierung nicht wirklich (bspw. von NIL-Knoten, die im unten stehenden C-Beispielcode als Nullzeiger implementiert sind).

Operationen

Navigieren

Die Navigationsoperationen, das sind die verschiedenen Suchoperationen, das Traversieren, Aufsuchen erstes oder letztes Element und ähnliche, lassen den Baum unverändert (nur lesender Zugriff) und funktionieren im Prinzip auf jedem binären Suchbaum. Die dortigen Algorithmen und Angaben zur Komplexität gelten genauso für Rot-Schwarz-Bäume – mit der Präzisierung, dass die Höhe des Rot-Schwarz-Baums sich immer logarithmisch zur Anzahl der Knoten verhält.

Das Suchen eines Elements anhand seines Schlüssels ist die wichtigste unter den Navigationsoperationen. Die Höhen-Balancierung des Rot-Schwarz-Baums versucht, auf diese Operation hin zu optimieren. Sie ermöglicht eine Art „direkten Zugriff“ (im Gegensatz zum sequentiellen Zugriff der Traversierung). Sie wird in der Regel als vorausgehende Operation bei den Modifikationsoperationen (Einfügen oder Löschen) eingesetzt.

Das Suchen setzt eine totale Quasiordnung auf der Menge der Schlüssel voraus, die am flexibelsten durch eine Vergleichsfunktion realisiert wird.

Einfügen

Die ersten Aktionen beim Einfügen eines neuen Elements in den Rot-Schwarz-Baum sind dieselben wie bei einem binären Suchbaum: Der neue Knoten ersetzt einen NIL-Knoten, der entweder die Wurzel ist, falls der Baum vorher leer war, oder linker bzw. rechter Kindknoten bei einem Schlüssel tragenden Knoten , der in dieser Richtung kein Kind hat. Im unten stehenden Beispielcode wird angenommen, dass diese Richtung – die das letzte Ungleichergebnis der Suchfunktion reflektiert – in einer Variablen d übergeben wird. Auf jeden Fall bringt zwei neue NIL-Knoten mit. wird zunächst rot gefärbt, damit die Schwarztiefe des Baumes erhalten bleibt.

Der neue Knoten werde (wie engl. node) genannt, sein Elter (wie engl. parent), der Großelter (wie engl. grandparent) und der Onkel mit (wie engl. uncle). ist beim ersten Iterationsschritt der gerade betrachtete „Problemknoten“.

Der Kopf der Funktion RBinsert1 zum Einfügen eines Knotens nach einer separat erfolgten und nicht erfolgreichen Suchoperation könnte wie folgt aussehen:

 void RBinsert1(
   RBtree* T, // Rot-Schwarz-Baum
   struct node* P, // Nachbarknoten (wird zum Elter von N)
           // oder NULL, wenn der Baum leer war
   byte d, // (Kindes-)Richtung der Einfügung  {LEFT, RIGHT}
           // oder UNDEFINED, wenn der Baum leer war
   struct node* N) // einzufügender Knoten
  {
   struct node* G, U;

   N->color = RED;
   N->left = NULL; // NIL-Knoten
   N->right = NULL; // NIL-Knoten
   if (P != NULL) // N ist nicht die neue Wurzel
    {
     P->child[d] = N; // neuer Knoten als d-Kind von P
     N->parent = P;
     // Es folgt die do-Schleife ...

Einfügen: Schleifeninvariante:

  • Zu Beginn jedes Iterationsschritts ist der Problemknoten rot. (Er hat im Diagramm des resp. Falles eine blaue Kontur.)
  • Die Forderung B »Die Anzahl der schwarzen Knoten von jedem beliebigen Knoten zu einem Blatt ist auf allen Pfaden gleich« gilt im ganzen Baum.
  • Die Forderung R »Kein roter Knoten hat ein rotes Kind« gilt im ganzen Baum – mit der einzigen möglichen Ausnahme beim Paar .
  • In den Diagrammen stellen die kleinen nummerierten Dreiecke (Rot-Schwarz-)Teilbäume dar. Diese Dreiecke haben alle dieselbe Schwarztiefe, es sei denn, ein Dreieck hat eine kleine schwarze Scheibe an der Spitze, womit eine um 1 höhere Schwarztiefe symbolisiert wird. Damit kommen alle Pfade im Diagramm (beim Einfügen) auf gleich viele (kleine oder große) schwarze Kreisflächen (und die Wurzeln der so markierten Dreiecke sind alle schwarz).
Bedingung Fall
Rota-
tion
Zuwei-
sung
Ergebnis
Test
x x
BlackRedNode.svg 0 BlackNode.svg
RedNode.svg BlackNode.svg 1 RedNode.svg BlackNode.svg
RedNode.svg RedNode.svg BlackNode.svg RedNode.svg 2 := RedNode.svg ? ? ? 0
RedNode.svg RedNode.svg BlackNode.svg BlackNode.svg i 3 := RedNode.svg RedNode.svg BlackNode.svg BlackNode.svg o 4
RedNode.svg RedNode.svg BlackNode.svg BlackNode.svg o 4 RedNode.svg BlackNode.svg RedNode.svg BlackNode.svg
Einfügen: Zusammenschau der Fälle

Einfügen: Zusammenschau der Fälle

Die möglichen Konstellationen lassen sich in fünf Fälle aufteilen, zu denen es Transformationen (enthaltend Rotation und/oder Umfärbung) gibt, die entweder auf der betrachteten Ebene oder über weitere Iterationsschritte auf höheren Ebenen zu einer Reparatur des Baumes führen.

In der nebenstehenden Tabelle wird ein Fall durch eine Zeile repräsentiert, die

  1. die Bedingung, d. i. die Konstellation, die den Fall definiert,
  2. die Fallnummer,
  3. die Konstellation nach Transformation und ggf. Zuweisung in der Spaltengruppe Ergebnis

enthält. Eine Konstellation besteht aus fünf Gegebenheiten, und zwar aus den vier Farben der Knoten und . Manche Fälle benötigen darüber hinaus eine fünfte Angabe x zur Kindesrichtung von , und zwar steht o (wie engl. outer) für eine Rechts-Rechts- oder Links-Links-Kindesrichtung von zu zu und i (wie engl. inner) für Rechts-Links oder Links-Rechts. Eine Zelle ist leer gelassen, wenn es bei dem Fall auf die entsprechende Angabe nicht ankommt.

Die Konstellationen in der Gruppe Bedingung genügen der Schleifeninvariante, und ihre logische Summe schöpft diese genau aus.

Die Transformation, deren Fallnummer in der Spalte Fall → verlinkt ist, transformiert die Eingabe in eine Konstellation, die normalerweise im Diagramm des Falles dargestellt ist. Steht ein „–“ in der Spalte → Test, dann reflektiert die Gruppe Ergebnis den Endstand, und die Einfügeoperation ist durch die Transformation abgeschlossen. Andernfalls steht dort die Fallnummer derjenigen Bedingung, auf die die transformierte und neu zugewiesene Konstellation zu testen ist, wobei die entsprechende Zuweisung, angegeben für den Problemknoten in der Spalte Zuweisung, auch die Knoten sowie die Angabe x zur Kindesrichtung von definiert. Die Gruppe Ergebnis zeigt dann die Konstellation nach der Zuweisung.

In der Spalte → Test kommt der Eintrag „0“ nur bei der Transformation_2 vor und bedeutet u. U. einen neuen Iterationsschritt. Dieser beginnt mit dem Test auf Bedingung_0 in der do while-Anweisung – zwei Ebenen höher. Da die Anzahl der Ebenen mit der Höhe übereinstimmt, können maximal Iterationen vorkommen. Nun ist der Aufwand für eine Iteration beschränkt (d. h. in ) und damit der für die gesamte Einfügeoperation in . Im Mittel ist der Aufwand gemäß Abschnitt #Durchschnittliche und amortisierte Laufzeit sogar konstant.

Bei einem Eintrag in der Spalte Rotation ist eine Rotation an der Transformation beteiligt. Man entnimmt der Tabelle sofort, dass bei einer Einfügung maximal 2 Rotationen vorkommen. Denn nach einer Rotation (Transformation_3 und Transformation_4) gibt es keine weitere Iteration – die Rotationen befinden sich endrekursiv am Ende der letzten Iteration.

Im folgenden Beispielcode entscheidet die Kindesrichtung von sowohl über die nachfolgenden Rotationsrichtungen wie über die Kindesrichtung des Elters . (Hat dieselbe Kindesrichtung wie , dann ist die Variable „x“ auf „o“ für „außen“, sonst auf „i“ für „innen“ zu setzen.) Eine andere Möglichkeit ist, das Innere der do-Schleife in zwei Versionen aufzuschreiben, in einer für die Kindesrichtung links und in einer für rechts.[7] Die Diagramme bei den Fällen zeigen allerdings nur eine Kindesrichtung, und zwar ist immer links von .

Jeder Fall wird unter seiner Nummer erläutert und einschließlich Test und Transformation durch ein Stück C-Code genau beschrieben.[8]

     do // Beginn der do-Schleife
      {
       // Hier ist in keiner Iteration P == NULL,
       // also auch N nicht die Wurzel des Baums T.
       if (N == P->left)
        {
         d = LEFT;     // Kindesrichtung von N
         S = P->right; // Geschwister von N
        }
       else
        {
         d = RIGHT;    // Kindesrichtung von N
         S = P->left;  // Geschwister von N
        }

Einfügen Fall 1: Der Elter des Problemknotens ist schwarz. (Damit gilt die Forderung R im ganzen Baum.)

Nach Voraussetzung (Schleifeninvariante) ist die Schwarztiefe auf allen Pfaden dieselbe. Alle Paare Elter→Knoten erfüllen die Forderung R. Damit ist der Baum (ohne weitere Aktion) schon in Rot-Schwarz-Form.

       // Bedingung_1
       if (P->color == BLACK)
         // Transformation_1:
         return; // Einfügung fertiggestellt

Anmerkung: In den nun folgenden Fällen ist angenommen, dass der einzufügende Knoten einen Großelter hat, da sein Elter rot ist und somit nicht die Wurzel sein kann.[6][9] Da es sich aber bei einem Rot-Schwarz-Baum um einen Binärbaum mit externen Blättern handelt, hat der Großelter auf jeden Fall noch ein (schwarzes) Kind – das ggf. auch ein NIL-Knoten sein kann.

Einfügen Fall 2: Sowohl der Onkel als auch der Elter des Problemknotens ist rot.

Einfügen Fall 2

Eine Umfärbung von und in schwarz und von in rot stellt die Forderung R im von gewurzelten Teilbaum wieder her. Auf keinem Pfad ändert sich die Schwarztiefe. Durch diese Aktion wird also das Problem um zwei Ebenen nach oben verschoben mit als dem neuen Problemknoten.

       G = P->parent; // Großelter von N
       U = G->child[LEFT+RIGHT-d]; // Onkel von N

       if (U != NULL && U->color == RED) // Bedingung_2
        {
         // Transformation_2:
         P->color = BLACK;
         U->color = BLACK;
         G->color = RED;
         N = G; // neuer Problemknoten (N kann die Wurzel sein)
         P = N->parent;
         continue; // Iteration zwei Ebenen höher
        }

Einfügen Fall 3: Der Problemknoten hat keinen oder einen schwarzen Onkel und hat eine Kindesrichtung entgegengesetzt zu der seines roten Elters , d. h., ist innerer Enkel.

Einfügen Fall 3

Eine entsprechende Rotation um vertauscht die Rollen von und , und zwar eine Linksrotation, wenn rechtes Kind ist, sonst eine Rechtsrotation. (Im Folgenden wird eine solche Rotation als (nicht-d)-Rotation bezeichnet mit d als der Kindesrichtung von .) Dadurch werden die Pfade des Teilbaums (s. Diagramm) so verändert, dass sie durch einen zusätzlichen, während die des Teilbaums durch einen Knoten weniger führen. Da jedoch in beiden Fällen rote Knoten den Unterschied ausmachen, ändert sich an der Schwarztiefe nichts, womit die Forderung B erfüllt bleibt.

Die Ergebniskonstellation entspricht der Eingangskonstellation des Falles 4 mit als dem neuen Problemknoten.

       if (P == G->child[LEFT+RIGHT-d]) // Bedingung_3
        {
         // N ist links an P und P rechts an G (==> N ist innerer Enkel)
         //   oder
         // N ist rechts an P und P links an G (==> N ist innerer Enkel)
         // Transformation_3:
         rotate(P,LEFT+RIGHT-d); // (nicht-d)-Rotation um P
         U = N; // aufbewahren
         N = P; // neuer Problemknoten (RED) und äußerer Enkel von G
                // (nicht die Wurzel)
         P = U; // neuer Elter von N (RED)
        }

Einfügen Fall 4: Der Problemknoten hat keinen oder einen schwarzen Onkel. Seine Kindesrichtung ist dieselbe wie die von , also ist äußerer Enkel.

Einfügen Fall 4

Eine (nicht-d)-Rotation um macht zum Elter sowohl von als auch von . Da rot war, muss wegen Forderung R schwarz sein. Vertauscht man nun die Farben von und , so ist in dem dadurch entstehenden Baum die Forderung R wieder erfüllt. Die Forderung B bleibt ebenfalls erfüllt, da alle Pfade, die durch einen dieser drei Knoten laufen, vorher durch liefen und nun alle durch laufen, der inzwischen – wie vor der Transformation – der einzige schwarze der drei Knoten ist.

       // Bedingung_4
       // N (RED) ist äußerer Enkel.
       // Transformation_4:
       rotate(G,LEFT+RIGHT-d); // (nicht-d)-Rotation um G
       P->color = BLACK;
       G->color = RED;
       return; // Einfügung fertiggestellt
      }
     while ((P = N->parent) != NULL); // nicht-Bedingung_0
     // Ende der (do while)-Schleife.
     // Sie wird verlassen per return; oder continue;
     // Bei letzterem kann P == NULL, also N die Wurzel sein.
    } // end_if (P != NULL)

Einfügen Fall 0: Der Problemknoten ist die (ggf. neue) Wurzel. Wie oben angemerkt, kann eine rote Wurzel ohne Schaden sofort von rot auf schwarz umgefärbt werden[6] – mit dem Vorteil einer Abfrage weniger vor der Transformation_2.

   if (P == NULL) // Bedingung_0: N ist die Wurzel des Baums T
    {
     // Transformation_0:
     T->root = N; // neue Wurzel (beim Einfügen != NIL)
     N->color = BLACK;
     N->parent = NULL; // Erkennungszeichen der Wurzel
     return; // Einfügung fertiggestellt
    }
  } // Ende RBinsert1

Löschen

Das Löschen eines Knotens, sein Name sei (wie engl. remove), aus einem Rot-Schwarz-Baum erfolgt wie bei einem binären Suchbaum. Hat ein oder gar kein Kind, dann bleibt er der Löschknoten. Hat aber zwei Kinder, dann nimmt man, ohne letztendlich die Sortierreihenfolge zu stören, als effektiven Löschknoten einen seiner Nachbarknoten – natürlich, nachdem man vorher die Benutzerdaten ausgetauscht hat.[10] Wir werden also die Löschung durch die Entfernung eines Knotens mit maximal einem Kind durchführen, eines Knotens, den wir weiterhin mit benennen.

Hat genau ein Kind, so sei dieses mit (wie engl. node) bezeichnet. Hat kein Kind, so stehe für einen seiner NIL-Knoten. In beiden Fällen sei (wie engl. parent) der Elter von und d (wie engl. direction) seine Kindesrichtung (rechtes oder linkes Kind von ).

Ist rot, so kann man durch den Knoten ersetzen, der wegen Forderung R schwarz sein muss. Da ebenfalls aufgrund von Forderung R schwarz gewesen sein muss, bleibt diese Forderung erfüllt. Da alle Pfade, die ursprünglich durch den gelöschten roten Knoten verliefen, nun durch einen roten Knoten weniger verlaufen, ändert sich an der Schwarztiefe nichts, womit die Forderung B erfüllt bleibt.

Ebenfalls einfach zu lösen ist der Fall, wenn schwarz ist und rot. Man färbt schwarz und macht ihn an der Kindesrichtung d zum Kind von . Damit ist aus dem Baum entfernt, und die Forderung R bleibt erfüllt. Ferner verlaufen nun alle Pfade, die durch den gelöschten schwarzen Knoten verliefen, durch sein schwarzes Kind, wodurch Forderung B erfüllt bleibt.

Schwieriger zu lösen ist der Fall, wenn beide, und schwarz sind. (Nach #Beobachtung 2 ist dann ein NIL-Knoten, also ohne echtes Kind.) Nach der Ersetzung von bei durch enthalten die durch führenden Pfade einen schwarzen Knoten weniger als vorher, also einen weniger als die nicht durch führenden Pfade.

Relativ zu sei sein neues Geschwister, d. i. das (nicht-d)-Kind von (und vormalige Geschwister von ), mit (wie engl. sibling) und dessen nahes Kind (der Kindesrichtung d) mit (wie engl. close nephew) resp. dessen fernes Kind mit (wie engl. distant nephew) bezeichnet. Da schwarz war und kein NIL-Knoten, kann (gemäß #Beobachtung 3) kein NIL-Knoten sein.

Beobachtungen zu Geschwisterknoten in einem Rot-Schwarz-Baum
  1. Ein echter Knoten ohne echtes Geschwister ist immer rot, es sei denn, es handelt sich um die Wurzel.
  2. Ein schwarzer Knoten ohne echtes Geschwister ist ein NIL-Knoten, es sei denn, es handelt sich um die Wurzel.
  3. Ein echter schwarzer Knoten hat immer ein echtes Geschwister.
  4. In einem nicht-leeren Rot-Schwarz-Baum hat ein NIL-Knoten immer ein Geschwister.

Der Kopf der Funktion RBdelete1 zum Löschen eines schwarzen Knotens ohne echtes Kind mit einem Kindknoten (der ein NIL-Knoten ist) könnte wie folgt aussehen:

 void RBdelete1(
   RBtree* T, // Rot-Schwarz-Baum
   struct node* R, // schwarzer zu löschender Knoten
   struct node* N) // Kind von R (NIL-Knoten)
  {
   struct node* P, S;
   byte d; // Richtung ∈ {LEFT, RIGHT}

   P = R->parent;   // Elter von R
   if (P != NULL)
    {
     // s.a. unten Bedingung_0
     // Ersetze R bei P durch N:
     if (R == P->left)
       P->left = N;
     else
       P->right = N;
     // Der NIL-Knoten N hat kein .parent.
     // Es folgt die do-Schleife ...

Löschen: Schleifeninvariante:

  • Zu Beginn jedes Iterationsschritts ist der gerade betrachtete Problemknoten schwarz. (In dem zum Fall gehörigen Diagramm hat er eine blaue Kontur.)
  • Die Forderung R »Kein roter Knoten hat ein rotes Kind« ist überall erfüllt.
  • Die Anzahl der schwarzen Knoten auf den Pfaden, die nicht durch führen, ist ungeändert, während die Pfade durch einen schwarzen Knoten weniger enthalten, so dass die Forderung B »Die Anzahl der schwarzen Knoten von jedem beliebigen Knoten zu einem Blatt ist auf allen Pfaden gleich« verletzt ist.
  • In den Diagrammen stellen die kleinen nummerierten Dreiecke Teilbäume dar, die alle dieselbe Schwarztiefe haben, es sei denn, das Dreieck hat eine kleine schwarze Scheibe an der Spitze, womit eine um 1 höhere Schwarztiefe symbolisiert wird. Damit kommen in den linken Hälften der Diagramme eines Löschen-Falls die durch führenden Pfade auf eine schwarze Kreisfläche (klein oder groß) weniger.
Bedingung Fall
Rota-
tion
Zuwei-
sung
Ergebnis
Test
BlackRedNode.svg 0 BlackNode.svg
MinusNode.svg BlackNode.svg BlackNode.svg RedNode.svg BlackNode.svg 1 := MinusNode.svg RedNode.svg ? BlackNode.svg ? 3
MinusNode.svg BlackNode.svg BlackNode.svg BlackNode.svg BlackNode.svg 2 := MinusNode.svg ? ? ? ? 0
MinusNode.svg RedNode.svg BlackNode.svg BlackNode.svg BlackNode.svg 3 BlackNode.svg BlackNode.svg BlackNode.svg RedNode.svg BlackNode.svg
MinusNode.svg BlackRedNode.svg RedNode.svg BlackNode.svg BlackNode.svg 4 := MinusNode.svg BlackRedNode.svg ? BlackNode.svg RedNode.svg 5
MinusNode.svg BlackRedNode.svg c BlackNode.svg RedNode.svg 5 BlackNode.svg BlackNode.svg c BlackRedNode.svg BlackNode.svg
Löschen: Zusammenschau der Fälle

Löschen: Zusammenschau der Fälle[11][12]

Die möglichen Farbkonstellationen lassen sich in sechs Fälle gruppieren, zu denen es Transformationen (enthaltend Rotation und/oder Umfärbung) gibt, die entweder auf der betrachteten Ebene oder über weitere Iterationsschritte auf höheren Ebenen zu einer Reparatur des Baumes führen.

In der nebenstehenden Tabelle wird ein Fall durch eine Zeile repräsentiert, die

  1. die Bedingung, d. i. die Konstellation, die den Fall definiert,
  2. die Fallnummer,
  3. die Konstellation nach Transformation und ggf. Zuweisung in der Spaltengruppe Ergebnis

enthält. Eine Konstellation (5 Spalten) besteht aus den 5 Farben der 5 Knoten . Das Zeichen MinusNode.svg zeigt die schwarze Farbe bei einem Knoten an und gleichzeitig, dass die Zahl der schwarzen Knoten auf den Pfaden durch ihn um 1 vermindert ist. In ein und derselben Zeile bedeuten die 2 Zeichen BlackRedNode.svg dieselbe Farbe, ebenso die 2 Buchstaben c. Eine Zelle ist leer gelassen, wenn es bei dem beschriebenen Fall auf die entsprechende Angabe nicht ankommt.

Die Konstellationen in der Gruppe Bedingung genügen der Schleifeninvariante, und ihre logische Summe schöpft diese genau aus.

Die Transformation, deren Fallnummer in der Spalte Fall → verlinkt ist, transformiert die Eingabe in eine Konstellation, die im Diagramm des Falles dargestellt ist. Steht ein „–“ in der Spalte → Test, dann reflektiert die Gruppe Ergebnis den Endstand, und die Löschoperation ist durch die Transformation abgeschlossen. Andernfalls steht dort die Fallnummer derjenigen Bedingung, auf die die transformierte und neu zugewiesene Konstellation zu testen ist, wobei die entsprechende Zuweisung, angegeben für den Problemknoten in der Spalte Zuweisung, auch die Knoten eindeutig bestimmt. Die Gruppe Ergebnis zeigt dann die Konstellation nach der Zuweisung.

Der Eintrag „0“ kommt nur bei der Transformation_2 vor und bedeutet u. U. einen neuen Iterationsschritt auf der um 1 höheren Ebene im Baum, beginnend mit dem Test auf die Bedingung_0. Die Anzahl der Ebenen stimmt mit der Höhe überein, so dass höchstens Iterationen vorkommen können. Nun ist der Aufwand für eine Iteration beschränkt (d. h. in ) und damit der für die gesamte Löschoperation in . Gemäß Abschnitt #Durchschnittliche und amortisierte Laufzeit ist der Aufwand im Mittel sogar konstant.

Bei einem Eintrag in der Spalte Rotation ist eine Rotation an der Transformation beteiligt. Und die Tabelle zeigt, dass bei einer Löschung maximal 3 Rotationen erforderlich sind. Denn nach einer Rotation (Transformation_1, Transformation_4 und Transformation_5) kommt kein neuer Iterationsschritt – die Rotationen befinden sich am Ende der letzten Iteration.

Im folgenden Beispielcode entscheidet die Kindesrichtung (im Beispielcode die Variable d) von sowohl über die nachfolgenden Rotationsrichtungen wie über die Kindesrichtung der Neffen von . (Der Neffe (wie engl. close) mit derselben Kindesrichtung ist der „nahe“, der andere, (wie engl. distant), der „ferne“ Neffe.) Eine andere Möglichkeit ist, das Innere der do-Schleife in zwei Versionen aufzuschreiben, in einer für die Kindesrichtung links und einer für rechts. Die Diagramme bei den Fällen zeigen allerdings nur eine Kindesrichtung, und zwar ist immer links von .

Jeder Fall wird unter seiner Nummer erläutert und einschließlich Test und Transformation durch ein Stück C-Code genau beschrieben.[8]

     do // Beginn der do-Schleife
      {
       // Hier ist in keiner Iteration P == NULL,
       // also auch N nicht die Wurzel des Baums T.
       if (N == P->left)
        {
         d = LEFT;     // Kindesrichtung von N
         S = P->right; // Geschwister von N
        }
       else
        {
         d = RIGHT;    // Kindesrichtung von N
         S = P->left;  // Geschwister von N
        }

Löschen Fall 1: Das Geschwister des Problemknotens ist rot.

Löschen Fall 1

Eine Rotation um macht zum Großelter von , und zwar eine Linksrotation, wenn linkes Kind ist, sonst eine Rechtsrotation. (Im Folgenden wird eine solche Rotation als d-Rotation bezeichnet mit d als der Kindesrichtung von .) Danach invertiert man die Farben von und . Alle Pfade haben weiterhin dieselbe Anzahl an schwarzen Knoten, aber hat nun ein schwarzes Geschwister () und einen roten Elter (), weswegen man nun zu Fall 3, 4 oder 5 weitergehen kann – mit als altem und neuem Problemknoten.

       if (S->color == RED)
        { // Bedingung_1: RED: S, also: BLACK: C && D
         // Transformation_1:
         S->color = BLACK;
         P->color = RED;
         rotate(P,d); // d-Rotation um Knoten P
         S = S->child[d]; // neues Geschwister von N (BLACK) (vorher C)
         if (S->child[d]->color == BLACK &&          // Farbe der Wurzel von /3\
             S->child[LEFT+RIGHT-d]->color == BLACK) // Farbe der Wurzel von /4\
             goto case_3;
         goto case_4;
        } // end_if (S->color == RED)

Löschen Fall 2: Der Elter des Problemknotens , sein Geschwister und die Kinder und von sind alle schwarz.

Löschen Fall 2

Eine Umfärbung von von schwarz in rot vermindert in allen Pfaden, die durch führen, die Zahl der schwarzen Knoten um 1. Das sind genau die Pfade im Teilbaum von , die nicht durch führen. Damit ist in diesem Teilbaum die Ungleichheit ausgeglichen. Aber alle Pfade, die durch laufen, haben nun einen schwarzen Knoten weniger als die Pfade, die nicht durch laufen, weshalb die Forderung B weiterhin überprüft werden muss. Durch diese Aktion wird das Problem also um eine Ebene nach oben verschoben mit als neuem Problemknoten.

       else
        { // S->color == BLACK
         if (S->child[d]->color == BLACK
             && S->child[LEFT+RIGHT-d]->color == BLACK)
          {
           if (P->color == BLACK)
            { // Bedingung_2: BLACK: P && C && S && D
             // Transformation_2
             S->color = RED;
             N = P; // neuer Problemknoten (N kann die Wurzel sein)
             continue; // Iteration eine Ebene höher
            }

Löschen Fall 3: Sowohl das Geschwister des Problemknotens als auch die Kinder und von sind schwarz, aber der Elter von ist rot.

Löschen Fall 3

Eine Vertauschung der Farben von und lässt die Anzahl der schwarzen Knoten auf den Pfaden, die durch laufen, unverändert, fügt aber auf allen Pfaden durch einen schwarzen Knoten hinzu und gleicht damit den fehlenden schwarzen Knoten auf diesen Pfaden aus.

 case_3:
           // Bedingung_3: RED: P, BLACK: C && S && D
           // Transformation_3:
           S->color = RED;
           P->color = BLACK;
           return; // Löschung fertiggestellt
          } // end_if (C->color == BLACK && D->color == BLACK)
        } // end_if (S->color)

Löschen Fall 4: Das Geschwister von und der ferne Neffe von ist schwarz, wogegen der nahe Neffe rot ist.

Löschen Fall 4

Eine (nicht-d)-Rotation um macht zum Elter von und zugleich zum Geschwister von . Danach vertauscht man die Farben von und . Nun haben alle Pfade immer noch die gleiche Anzahl an schwarzen Knoten, aber hat ein schwarzes Geschwister (), dessen fernes Kind () rot ist, womit man zum Fall 5 weitergehen kann. Weder noch noch die Schwarztiefe werden durch diese Transformation beeinflusst.

 case_4:
       // Ab hier: BLACK: S && wenigstens eines RED: C || D
       // Bedingung_4:
       if (S->child[LEFT+RIGHT-d]->color == BLACK) // ==> RED: S->child[d]
        {
         // Transformation_4:
         S->color = RED;
         S->child[d]->color = BLACK; // in der Graphik: S->child[d] = C
         rotate(S,LEFT+RIGHT-d); // (nicht-d)-Rotation
           // S wird zum fernen Neffen S->child[LEFT+RIGHT-d] von N
         S = S->child[d]; // naher Neffe wird neues Geschwister von N (BLACK)
        }

Löschen Fall 5: Das Geschwister von ist schwarz, und der ferne Neffe von ist rot. Die im Diagramm weiß dargestellten Knoten und haben dieselbe Farbe, rot oder schwarz.

Löschen Fall 5

Eine d-Rotation um macht zum Großelter von . Nun reicht es, die Farben von und zu vertauschen und schwarz zu färben. hat immer noch dieselbe Farbe, wodurch die Forderung R erfüllt bleibt. Aber hat nun einen zusätzlichen schwarzen Vorfahren: Falls vor der Transformation noch nicht schwarz war, so ist er nach der Transformation schwarz, und falls schon schwarz war, so hat nun als schwarzen Großelter, weswegen die Pfade, die durch führen, nun einen zusätzlichen schwarzen Knoten passieren.

Bei den Pfaden, die sich ändern und die nicht durch gehen, gibt es zwei Möglichkeiten:

  1. Der Pfad verläuft durch den beliebig eingefärbten Wurzelknoten des Teilbaums (s. Diagramm), der zum neuen Geschwister von wird. Dann muss der Pfad sowohl vor als auch nach der Transformation durch und laufen. Da die beiden Knoten aber nur ihre Farben vertauscht haben, ändert sich an der Schwarztiefe auf dem Pfad nichts.
  2. Der Pfad verläuft durch den neuen Onkel von , welcher das rechte Kind des Geschwisters ist. In diesem Fall ging der Pfad vorher durch und . Nach der Transformation geht er aber nur noch durch , der von Rot auf Schwarz (die vorige Farbe von ) umgefärbt wurde, und den Knoten , welcher die Farbe von angenommen hat. Somit ändert sich die Schwarztiefe eines solchen Pfades nicht.

Da die Anzahl der schwarzen Knoten in den Pfaden, die durch führen, sich um 1 erhöht, und in denen, die nicht durch gehen, sich nicht ändert, ist die Forderung B wiederhergestellt.

       // Bedingung_5: RED: ferner Neffe D von N
       // Transformation_5:
       S->color = P->color;
       P->color = BLACK;
       rotate(P,d);
       S->child[LEFT+RIGHT-d]->color = BLACK; // in der Graphik: D
       return; // Löschung fertiggestellt
      }
     while ((P = N->parent) != NULL); // nicht-Bedingung_0
     // Ende der (do while)-Schleife.
     // Sie wird verlassen per return; oder continue;
     // Bei letzterem kann P == NULL, also N die Wurzel sein.
    } // end_if (P != NULL)

Löschen Fall 0: Der Problemknoten ist die (ggf. neue) Wurzel.

In diesem Fall ist man fertig, da alle vergleichbaren Pfade durch gehen (und einen schwarzen Knoten weniger enthalten als vorher).

   // Bedingung_0: N ist die Wurzel des Baums T
   if (P == NULL)
    {
     // N ist die neue Wurzel.
     // (NIL, wenn der Baum jetzt leer ist.)
     T->root = N;
     if (N != NULL)
       N->parent = NULL; // Erkennungszeichen der echten Wurzel
       // (Ein NIL-Knoten hat kein .parent.)
    }
   return; // Löschung fertiggestellt
  } // Ende RBdelete1

Höhenbeweis

Wie schon in der Einleitung ausgeführt, ist die besondere Eigenschaft von Rot-Schwarz-Bäumen, dass sie in logarithmischer Zeit – genauer in mit als der Anzahl der Schlüssel – ein Element im Baum suchen, löschen oder einfügen können. Diese Operationen sind auf allen binären Suchbäumen von der Höhe des Baumes abhängig. Je niedriger die Höhe des Baumes ist, desto schneller laufen die Operationen. Kann man nun beweisen, dass ein binärer Suchbaum mit Elementen nie eine gewisse Höhe (im Falle des Rot-Schwarz-Baumes ) überschreitet, so hat man bewiesen, dass die oben genannten Operationen im schlechtesten Fall logarithmische Kosten haben, nämlich die genannten Kosten von für einen Baum, in dem Elemente gespeichert sind. Somit muss gezeigt werden, dass folgende Aussage gilt:

Für die Höhe eines Rot-Schwarz-Baumes, der Elemente speichert, gilt: .

Rot-Schwarz-Bäume mit kleinster Knotenzahl zu gegebener Höhe
Rot-Schwarz-Bäume RBh der Höhen h=1,2,3,4,5,
jeweils mit minimaler Knotenzahl 1,2,4,6 resp. 10.

Zu gibt es einen Rot-Schwarz-Baum der Höhe mit

internen Knoten, und keinen mit weniger ( steht für die Gauß-Klammer).[13]

Beweis

Damit ein Rot-Schwarz-Baum einer bestimmten Höhe eine minimale Knotenzahl besitzt, muss er genau einen längsten Pfad enthalten, und dieser eine größtmögliche Anzahl roter Knoten, um eine möglichst große Baumhöhe mit möglichst kleiner Schwarztiefe zu erreichen. Seine Einfärbung hat also unten beim internen Blatt mit Rot zu beginnen, und sich in der Folge nach oben bis zur Wurzel mit Schwarz und Rot streng abwechselnd fortzusetzen. Außerhalb dieses die Baumhöhe definierenden Pfades hat er nur schwarze Knoten.[14][15] Denn angenommen, es gäbe dort einen roten Knoten, dann beeinträchtigt das Entfernen desselben die Rot-Schwarz-Eigenschaften nicht, sofern einer von seinen zwei (schwarzen) Kindknoten an seine Stelle nachrückt und der andere gleichzeitig einschließlich seines Teilbaums entfernt wird. Alle Teilbäume außerhalb des längsten Pfades sind somit vollständige Binärbäume mit ausschließlich schwarzen Knoten.

Es gibt genau einen Rot-Schwarz-Baum der Höhe mit einem roten internen Blatt, welches gleichzeitig die Wurzel ist. Also ist in Übereinstimmung mit .

Bei einem Minimalbaum (RBh in der Abbildung) der Höhe sind die zwei Kindbäume der Wurzel von unterschiedlicher Höhe: der höhere enthält den die Höhe definierenden längsten Pfad und ist ein Minimalbaum der Höhe mit Knoten und der Schwarztiefe ; der niedrigere ist ein vollständiger Binärbaum mit Höhe = Schwarztiefe , hat also interne Knoten. Damit ist rekursiv

(großer Kindbaum) (Wurzel) (kleiner Kindbaum)
woraus man

ausrechnet.  ■

Der Graph der Funktion ist konvex nach unten und stückweise linear mit den Ecken an den Punkten mit . Ferner ist A027383(h–1) für mit der Folge A027383 in OEIS.

Zur Höhe gibt es Formen von Minimalbäumen, da die Position des längsten Pfades der Position eines externen Blattes des vollständigen Binärbaums der Höhe entspricht und dadurch auch die Lage der Knoten außerhalb dieses Pfades bestimmt ist. (Die Abbildung zeigt die äußerste linke Position.)

Umformung

Wegen (eine Folge von ) haben wir für ungerades die Ungleichung

so dass sich für alle (geraden wie ungeraden)

ergibt.

Da die kleinste Knotenzahl für alle Rot-Schwarz-Bäume der Höhe ist, gilt:

Bringt man nun noch den Summanden –2 auf die andere Seite und logarithmiert, so folgt:

Somit folgt die Behauptung, dass ein Rot-Schwarz-Baum eine maximale Höhe von hat und damit die Operationen suchen, einfügen und löschen in logarithmischer Zeit erledigen kann. Drückt man dieses Ergebnis in der O-Notation aus, so ergibt sich für die Kosten der oben genannten Operationen, dass sie alle in liegen mit als der Zahl der Schlüssel. [16]

Durchschnittliche und amortisierte Laufzeit

Der Rot-Schwarz-Baum bietet amortisiert konstante Modifikationskosten[17] und damit auch im Mittel konstante. Anwendungen von (binären) Suchbäumen, die nur Sequenzen von Einfügungen und Löschungen – ganz ohne jede Suchoperation – enthalten, gehen allerdings am Zweck des Suchbaums vorbei. Sieht man also von dieser Art Anwendungen ab, ist das Gesamtverhalten einer Mischung von Suchen und Modifikation amortisiert, im Mittel und im Worst Case logarithmisch in der Anzahl der Knoten.

Anzahlen von Rot-Schwarz-Bäumen

Die 3 RB-Bäume mit 3 Schlüsseln

Die Folge A001131 in OEIS gibt in Abhängigkeit von der Knotenzahl die Gesamtzahl der Rot-Schwarz-Bäume, Folge A001137 in OEIS derer mit schwarzer Wurzel und Folge A001138 in OEIS derer mit roter Wurzel.

In einem reinen Einfügeszenario wird bspw. von den 3 möglichen Bäumen mit 3 internen Knoten (Schlüsseln) nur der eine Baum mit schwarzer Wurzel und 2 roten Kindern (der linke in der Abbildung) gebildet.
Beim Suchen und Traversieren ist wegen der identischen Form (Gestalt) der 3 Bäume alles Verhalten einschließlich Laufzeit gleich. Unterschiede gibt es aber bei den Einfügungen: Bei den rechten 2 Bäumen sind alle Einfügungen vom Typ Transformation_2 und beim linken Baum alle vom Typ Transformation_3 gefolgt von Transformation_1.

Verwandtschaft mit 2-3-4-Bäumen

2 Kinder
3 Kinder
3 Kinder
4 Kinder

Die 4 kleinen Grafiken links und rechts zeigen, wie kleine Bausteine eines Rot-Schwarz-Baums (linke Hälften der Grafiken) mit einem (dicken) Knoten eines 2-3-4-Baums (rechte Hälften der Grafiken) zur Entsprechung gebracht werden können. Man erzeugt aus einem Rot-Schwarz-Baum einen 2-3-4-Baum, indem man rote Kinder entsprechend ihrer Kindesrichtung links oder rechts als Datenelemente in den schwarzen Elterknoten hereinholt.[18][19]

Der Rot-Schwarz-Baum des Beispiels dargestellt als 2-3-4-Baum

Umgekehrt kann man einen 2-3-4-Baum ganz einfach in einen Rot-Schwarz-Baum überführen: Aus einem Knoten mit 2 Datenelementen und 3 Kindzeigern (wie der Knoten [NIL,1,6] in der Abbildung) wird ein schwarzer Knoten (Datenelement) mit 1 Kindzeiger und einem roten Kindknoten (Datenelement), der noch 2 Kindzeiger enthält; aus einem Knoten mit 3 Datenelementen und 4 Kindzeigern (wie die Knoten [8,13,17] und [22,25,27] in der Abbildung) wird ein schwarzer Knoten (Datenelement) mit 2 roten Kindknoten (jeweils 1 Datenelement und 2 Kindzeiger).

Darüber hinaus gibt es Entsprechungen bei den Modifikationsoperationen (Einfügen, Löschen) zwischen Farbwechsel und Rotationen auf Seite der Rot-Schwarz-Bäume und den Aktionen Spalten (split) und Verschmelzen (fuse) bei den 2-3-4-Bäumen.

Im Gegensatz zu 2-3-4-Bäumen muss man bei Rot-Schwarz-Bäumen nicht den „Füllzustand“ (Speicherausnutzung, engl. fill factor) der Knoten beobachten und verwalten, weshalb letztere als sehr effiziente Art der Implementierung der 2-3-4-Bäume gelten.[20]

Vergleich mit AVL-Baum

Die Menge der AVL-Bäume ist eine echte Teilmenge in der Menge der Rot-Schwarz-Bäume. Denn jeder Binärbaum, der das AVL-Kriterium erfüllt, lässt sich in einer das Rot-Schwarz-Kriterium erfüllenden Weise einfärben.[21][22]

Rot-Schwarz-, aber nicht AVL-Baum

Es gibt aber Rot-Schwarz-Bäume, die das AVL-Kriterium nicht erfüllen. Die nebenstehende Abbildung zeigt zum Beispiel einen Rot-Schwarz-Baum mit 6 (internen) Knoten und der externen Pfadlängensumme 21, während 20 die größte externe Pfadlängensumme bei AVL-Bäumen (und zugleich die kleinstmögliche für alle Binärbäume) dieser Größe ist. Konsequenterweise ist auch die Worst-Case-Höhe des AVL-Baums kleiner als die des Rot-Schwarz-Baums, und zwar um den Faktor (2 log2 Φ)−1 ≈ 0,720. Allgemein werden AVL-Bäume als besser balanciert und ihr Suchverhalten als günstiger angesehen.

Die Laufzeiten für alle angeführten Operationen unterscheiden sich im Mittel und im Worst Case asymptotisch nur um einen konstanten Faktor, gehören also derselben Komplexitätsklasse an. Der Rot-Schwarz-Baum bietet allerdings amortisiert konstante Einfüge- und Löschkosten (jeweils ohne Navigation). Beim AVL-Baum sind nur die Einfügekosten amortisiert, die Löschkosten immerhin im Mittel konstant.

Realistische Anwendungssituationen mit Performancedaten und -vergleichen – auch mit weiteren Suchalgorithmen und Spielarten der Datenstrukturen – finden sich bei Ben Pfaff.[23] Seine Ergebnisse zeigen in 79 Messungen unter anderem die sehr große Ähnlichkeit von AVL-Bäumen (AVL) und Rot-Schwarz-Bäumen (RB) mit Laufzeitverhältnissen AVLRB zwischen 0,677 und 1,077 bei einem Median von ≈0,947 und einem geometrischen Mittelwert von ≈0,910.

Der Speicherplatzbedarf ist praktisch identisch: 1 Bit für die Rot-Schwarz-Farbe gegenüber 2 Bits[24] für den AVL-Balance-Faktor. Während die Balance-Faktoren eines AVL-Baums direkt von dessen Gestalt abhängen, sind bei Rot-Schwarz-Bäumen derselben Gestalt – außer bei den Minimalbäumen gerader Höhe – unterschiedliche Einfärbungen möglich (s. Abschnitt #Anzahlen von Rot-Schwarz-Bäumen). Dabei wirken sich die Unterschiede der Einfärbungen nur auf die Modifikations- und nicht auf die Navigationsoperationen aus. Des Weiteren kann jede mögliche Gestalt eines AVL-Baums durch gezielte Einfügungen auch hergestellt werden. Bezogen auf die Baumform gilt dies auch für Rot-Schwarz-Bäume; es gibt aber Baumformen, bei denen durchaus regeltreue Einfärbungen in einem reinen Einfügeszenario nicht bewirkt werden können.

Eine Folge dieser etwas größeren Freiheitsgrade ist, dass im Rot-Schwarz-Baum die für die Einfügung oder Löschung erforderlichen Farbänderungen und Rotationen schon während des Suchvorgangs – also beim Abstieg – vorgenommen werden können.[25] Diese „Top-Down-Strategie“[26] ist bspw. für persistente und nebenläufige Programmierung interessant.[27][28]

So bleibt beim Einfügen der frisch eingefügte Knoten rot (das sind die Fälle 1 bis 4). Das bedeutet, dass eine zugehörige Suchfunktion im Abstieg den Baum an der betreffenden Stelle (in logarithmischer Zeit) so vorbereiten kann, dass das endgültige Einfügen unmittelbar bei einem schwarzen Elter in Form eines roten Knotens geschehen oder eben auch unterbleiben kann. Genauso kann beim Löschen eine (andere) Suchfunktion den Baum im Abstieg so vorbereiten, dass der zu löschende Knoten rot ist und 2 NIL-Kinder hat. In beiden Fällen bleibt der Baum sowohl beim Durchführen wie beim Unterlassen der Modifikation ein gültiger Rot-Schwarz-Baum, einer Modifikation, die beim Einfügen nur aus dem Setzen eines einzigen Zeigers besteht und beim Löschen nur geringfügig komplizierter ist. Demgegenüber gibt es beim AVL-Baum Baumformen, bei denen die Entscheidung betreffend den Vollzug der Modifikation nicht mit derart geringer Implikation offen gehalten werden kann.

Verwendung von Rot-Schwarz-Bäumen

Im Java Development Kit sind die Klassen TreeSet[29] und TreeMap[30] als Rot-Schwarz-Bäume implementiert. Sie stellen geordnete Mengen bzw. geordnete Dictionarys zur Verfügung.

Weitere Bäume

Literatur

Einzelnachweise und Anmerkungen

  1. Rudolf Bayer: Symmetric Binary B-Trees. Data Structure and Maintenance Algorithms. In: Acta Informatica. 1, 1972, S. 290-306. doi:10.1007/BF00289509.
  2. Leo J. Guibas, Robert Sedgewick: A Dichromatic Framework for Balanced Trees. In: IEEE Computer Society (Hrsg.): Proceedings of the 19th Annual Symposium on Foundations of Computer Science. 1978, S. 8–21.
  3. Diese Abschätzung ist scharf (siehe #Höhenbeweis) und für wegen
    marginal genauer als
    .
  4. Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein: Introduction to Algorithms. 2. Auflage. MIT Press, Cambridge (Massachusetts) 2001, ISBN 0-262-03293-7, S. 273.
  5. Mehlhorn 2008 S. 154.
  6. a b c Einige Autoren fordern noch, dass die Wurzel des Baums schwarz zu färben sei. Nicht jedoch z. B. Mehlhorn 2008 und Sedgewick. Tatsächlich stört diese Forderung die Rekursivität und erübrigt sich. Denn ist die Wurzel rot, so müssen ihre Kinder nach Forderung R schwarz sein, und bei ihrer Umfärbung auf schwarz wird keine der anderen Forderungen verletzt. In den Algorithmen kann jedoch die Zahl der Fallunterscheidungen marginal geringer gehalten werden, wenn man bei einem roten Knoten immer einen Elter voraussetzen kann.
  7. Um der Kürze der Aufschreibung willen wird im Beispielcode zweimal goto verwendet. Es ist leicht, dies durch Verdoppelung des Codes zu vermeiden.
    Noch bessere Effizienz wird erreicht, wenn nach Feststellung der Fall-Bedingung auch der Code für die ggf. mehreren Rotationen aufgebrochen und Anweisung für Anweisung auf Einsparungen überprüft wird.
  8. a b Für die Vorteile der iterativen Programmierung hinsichtlich Platz und Zeit gegenüber einer rekursiven Programmierung s. a. Binärer Suchbaum#Iterative Programmierung. Darüber hinaus erzwingt erstere eine genauere Beachtung der Knoteneigenschaften.
  9. Wären jedoch rote Wurzeln zugelassen und wäre eine solche, dann könnte man in (nicht-d)-Richtung um rotieren und die neue Wurzel schwarz färben, und der Baum wäre fertiggestellt. Es wäre aber bspw. in der Transformation_2 eine zusätzliche Fallunterscheidung erforderlich.
  10. Diese Vorgehensweise wurde zum ersten Mal von T. Hibbard in 1962 vorgeschlagen, zitiert nach Robert Sedgewick, Kevin Wayne: Algorithms Fourth Edition. Pearson Education, 2011, ISBN 978-0-321-57351-3, p. 410 (englisch, abgerufen am 25. März 2018)
  11. entspricht Roger Whitney.
  12. Auf eine andere Aufteilung (der Bedingungen) der Fälle, aber im Ergebnis ebenfalls auf die Gesamtzahl 6, kommt University of Science and Technology of China (zitiert nach stackoverflow.com).
  13. Diese Minimalbäume spielen bei den Rot-Schwarz-Bäumen eine ähnliche Rolle wie die Fibonacci-Bäume bei den AVL-Bäumen.
  14. Sedgewick 2011 S. 444 Proof sketch
  15. s. a. die Überlegungen bei der Folge A027383 in OEIS
  16. Als eine Datenstruktur, die im homogenen Arbeitsspeicher (Hauptspeicher) untergebracht ist, ist der Rot-Schwarz-Baum durch dessen Größe beschränkt, also auch die Höhe des Baums und die Längen der Pfade von Blatt zu Wurzel. Gängig sind Hauptspeicher mit 32 Bit und 64 Bit breiten 8-Bit-Byte-Adressen. (Allerdings wird von den Betriebssystemen oft nur der halbe Adressbereich von 0 bis 231–1 bzw. 263–1 dem Benutzer zur Verfügung gestellt.) Der Entwickler wird Anwendern gegenüber typischerweise die Knotenzahl (also die Anzahl von Elementen) beschränken, da die Baumhöhe nur indirekt wahrnehmbar ist. Die folgende Tabelle stellt die maximale Höhe von Rot-Schwarz-Bäumen maximalen Elementanzahlen gegenüber.
    Umfang von Rot-Schwarz-Bäumen
    Anzahl Knoten Höhe
    100663293 50
    134217725 51
    201326589 52
    268435453 53
    402653181 54
    108086391056891901 110
    144115188075855869 111
    216172782113783805 112
    288230376151711741 113
    432345564227567613 114
    576460752303423485 115
    864691128455135229 116
    1152921504606846973 117

    Mit den Bezeichnungen im Text ist

    eine Maßgabe, die so knapp wie möglich unterhalb der Knotenzahl des nächstgrößeren Minimalbaums bleibt.

  17. Mehlhorn und Sanders widmen dem Thema in Mehlhorn 2008 das Kapitel „7.4 Amortized Analysis of Update Operations“ mit dem Theorem 7.3, S. 158:
    “Consider an (a,b)-tree with b ≥ 2a that is initially empty. For any sequence of n insert or remove operations, the total number of split or fuse operations is O(n).”
    In die Sprache der Rot-Schwarz-Bäume übersetzt heißt das:
    Für eine beliebige Folge von Einfüge- und Löschoperationen in einen anfänglich leeren Rot-Schwarz-Baum ist die Anzahl der Farbwechsel und Rotationen in .
    Im Beweis, der für (2,4)-Bäume geführt wird und bei dem die Account-Methode zum Zug kommt, werden nur die split- und fuse-Operationen abgerechnet – ein Aufsuchen der betroffenen Stelle im Baum wird überhaupt nicht erwähnt. Die Aussage bezieht sich also auf die reinen Update-Kosten.
    Das Kapitel „III.5.3.2. Amortisierung von Rebalancierungskosten und Sortieren vorsortierter Files“ in Mehlhorn 1998 berücksichtigt dagegen das Aufsuchen mit dem Ergebnis (Satz 10, S. 209):
    Eine Folge von Elementen mit Inversionen kann in Zeitkomplexität sortiert werden.
    Das Maß der Sortiertheit wird durch angegeben, und es ist mit an der Obergrenze für völlig unsortierte Files. Für das Wirksamwerden dieser Formel für kleinere ist allerdings eine spezielle Suchfunktion (bspw. Mehlhorn 1998 S. 208) erforderlich, die Nachbarschaften erkennt und ausnützt.
  18. Mehlhorn 1988 S. 193
  19. Wenn man die zwei Wahlmöglichkeiten bei 3 Kindern auf eine (bspw. auf die erste, die obere) einschränkt, kommt man zu den LLRB (Abkürzung für engl. left-leaning red–black) Bäumen, die im Wesentlichen dieselben informationstheoretischen Eigenschaften haben, bei deren Implementierung aber laut Sedgewick weniger Fälle zu unterscheiden sind (s. Robert Sedgewick. Left-leaning Red–Black Trees und PDF).
  20. Mehlhorn 1988 S. 187
  21. Paul E. Black: Red-black tree. In: Dictionary of Algorithms and Data Structures. National Institute of Standards and Technology, 13. April 2015, abgerufen am 2. Juli 2016 (englisch).
  22. s. „One should be able to color any AVL tree, without restructuring or rotation, to transform it into a Red-Black tree.“ Junghyun Chae in AVL Trees vs. Red-Black Trees? abgerufen am 14. Oktober 2015 und Beweis in AVL-Baum#VergleichRB.
  23. Ben Pfaff: Performance Analysis of BSTs in System Software. Stanford University 2004.
  24. oder auch nur 1 Bit (s. Implementierung)
  25. Red Black Trees. Abgerufen am 14. Oktober 2015.
  26. Mehlhorn 1988 S. 197–198.
  27. Die Sperren, die bei einem der Veränderung unterworfenen Baum der Erhaltung seiner Konsistenz dienen, können bei der Top-Down-Strategie von der Wurzel beginnend zu den Blättern fortschreitend gesetzt werden. Halten sich alle den Baum bearbeitenden Prozesse an solche (und ggf. weitere) Protokolle, kann ein Deadlock vermieden werden.
  28. s. a. Comparison of Binary Search Trees abgerufen am 14. Oktober 2015; oder Paul Callahan in AVL Trees vs. Red-Black Trees? abgerufen am 14. Oktober 2015
  29. docs.oracle.com
  30. docs.oracle.com

Weblinks

Dieser Artikel wurde am 5. November 2005 in dieser Version in die Liste der lesenswerten Artikel aufgenommen.