ProPra2024 > Debugging > Häufige-Defektarten > Logikdefekte

Logikdefekte

Idea

Ziel

Ich verstehe, welche Form logische Defekte in Code annehmen können und habe einen solchen Defekt in fremdem Code erfolgreich gefunden.

Detailed

Arbeitsschritte

Eine Heranführung an logische Defekte

Computer sind präzise in der Ausführung von Anweisungen, aber unfähig, Absichten zu antizipieren, was zu logischen Defekten führt, oft basierend auf schlechten Annahmen über Daten. Sehen Sie sich hierfür das folgende Code-Beispiel in Python an. Hier wird versucht, mittels Wissen über die Repräsentation von ASCII-Zeichen einen String in eine kleingeschriebene Variante umzuwandeln. ord() wandelt dabei ein Zeichen in seinen numerischen ASCII-Wert um, während chr() das Gegenteil macht.

s = "TESt"
lower = ""
for k in range(0, len(s)):
    lower += chr(ord(s[k]) - ord("A") + ord("a"))

Versuchen Sie für sich den Code mittels einer ASCII-Tabelle nachzuvollziehen. Der Code funktioniert, wenn s[k] ein Großbuchstabe ist. Bei Kleinbuchstaben, Satzzeichen und Leerzeichen liefert er aber nicht das gewünschte Resultat. Der Grund hierfür ist, dass man die Logik der ASCII-Tabelle ignoriert hat. Hier haben Klein- und Großbuchstaben verschiedene Codierungen.

Ein weiteres Beispiel findet man bei der Initialisierung von Schleifen. Pythons for-Schleife ist hier sehr robust, deshalb behelfen wir uns der Syntax einer for-Schleife in C. Vor allem bei der Überlegung, wie man die Schleife beendet, können Denkfehler auftreten. In C-Syntax besteht die Initialisierung einer for-Schleife aus drei Teilen:

Zuerst wird eine Laufvariable, auch Index genannt, initialisiert.
Danach wird eine Abbruchbedingung gestellt und die for-Schleife läuft, solange diese Bedingung nicht erfüllt ist. In der Regel benutzt man den Index zur Definition der Abbruchbedingung.
Letztlich wird noch definiert wie der Index innerhalb der Schleife inkrementiert wird.

Sehen Sie schon das Problem?

for (j = 1; j != 100; j = j + 2)

Hinweis (nur bei Bedarf): Der Index der Schleife…

…fängt bei 1 an, wird bei jeder Iteration um 2 erhöht (ist also immer ungerade) und die Schleife läuft, solange der Index den Wert 100 nicht annimmt. Das Abbruchkriterium kann also allenfalls erfüllt werden, wenn der Schleifenrumpf weitere Änderungen an j macht; andernfalls wird die Schleife niemals anhalten.

Hier wäre vermutlich die Bedingung j < 100 sinnvoller. Um genau diese Art von Fehler zu vermeiden, ist der idiomatische Weg in Python auch for j in range(1, 100, 2).

Genauso kann durch ein falsch gesetztes oder vergessenes break der richtige Zeitpunkt zum Austritt aus der Schleife verpasst werden, wie z. B. in diesem Python-Code.

def end_of_line():
    ... # some code defining the end of a line

def cleanup():
    ... # some code cleaning up the processing pipeline

while True:
    if end_of_line():
        cleanup()
        # probably missing a break statement here
    # some code processing

Am Ende der Zeile (end_of_line()) wird eine Aufräum-Funktion (cleanup()) aufgerufen. Es wird aber verpasst, danach aus der while-Schleife auszubrechen, wodurch es folgend zum Versagen kommen kann.

Die bisherigen Beispiele für Defekte sind durch kleine Änderungen behebbar gewesen. Dass das nicht immer der Fall sein muss, soll das folgende Beispiel zeigen. Im folgenden Python-Code wird versucht den Abstand zwischen den zwei Zahlen in der Liste a zu finden, die am weitesten voneinander entfernt sind. In der Liste a = [2, 1, 10, 100] sollte also das Ergebnis 99 lauten, denn die beiden am weitesten voneinander entfernten Zahlen lauten 1 und 100.

a = [2, 1, 10, 100] # list with unsorted ints
biggest = 0 
for k in range(len(a)-1):
    distance = abs(a[k] - a[k+1])
    if distance > biggest:
        biggest = distance

print(biggest) # 90

Dieser Code tut genau das, was der Programmierer vorhat und berechnet den Abstand zwischen zwei Zahlen aus der Liste a. Der Algorithmus ist aber falsch, da er davon ausgeht, dass die zwei am weitesten voneinander entfernten Zahlen nebeneinander liegen. Eine kleine Änderung wird bei diesem logischen Defekt nicht helfen; der gesamte Algorithmus muss überarbeitet werden.

Ihre Aufgabe

Im Folgenden sollen Sie eine Funktion debuggen, in der ein logischer Defekt vorliegt. Diese Funktion teilt Personen fürs Weihnachtswichteln ihren Partnern zu. Hierfür erhält die Funktion eine Liste von Namen und gibt ein Dictionary zurück, in dem die Schlüssel die Schenker und die Werte die Beschenkten darstellen. Das ist gar nicht so trivial: Die Funktion muss die Situation verhindern, in der die ersten N-1 Personen unter sich selbst Geschenke verteilen und die letzte Person nur noch sich selbst beschenken könnte. Im folgenden Python-Code kann in einigen Iterationen bei der Handhabung dieses Falls ein Defekt auftreten, durch den eine Person doppelt beschenkt wird:

import random


def secret_santa(input_list: list[str]) -> dict[str, str]:
    """ Returns a dictionary, the keys are giver's names, the values are receiver's names.

    input_list: A list of names
    """

    if len(input_list) < 2:
        return {}

    return_dict = {}

    """ Make a copy of the input list; 
        we remove people from this list as they are assigned givers.
    """

    receivers_list = input_list[:]

    for person in input_list:
        """ If there are only two receivers left, and one
            of them is the last person in the input_list, then
            assign the last person to the second-to-last
            person.
        """

        if len(receivers_list) == 2:
            if receivers_list.count(input_list[-1]) == 1:
                return_dict[person] = input_list[-1]
                return_dict[input_list[-1]] = person
                break

        """ The typical situation, just randomly pick
            someone out of receivers_list and give them to
            person. We don't want to assign someone to 
            themselves. If that happens, we assign them the
            next person in receivers_list.
        """

        if receivers_list.count(person) == 1:
            receiver_index = int((len(receivers_list) - 1) * random.random())
            if receivers_list.index(person) <= receiver_index:
                receiver_index += 1
        else:
            receiver_index = int(len(receivers_list) * random.random())

        return_dict[person] = receivers_list.pop(receiver_index)

    return return_dict


test_input = ["Tom", "Joe", "Donna", "Susan", "Paul"]

print(secret_santa(test_input))

Hier sind einige Vorschläge, um an den Code heranzutreten:

Es werden zwei Listen (input_list und receivers_list) und ein Dictionary (return_dict) benutzt.
Benennen Sie, was das Ziel dieser Datenstrukturen in diesem Code ist und notieren Sie, wo und wie diese verändert werden.
In Zeile 43 wird die Funktion index() benutzt, um eine Person in receivers_list zu finden. Das impliziert, dass diese Person in receivers_list sein muss.
Gibt es eine Garantie, dass das der Fall sein muss?
Es existiert eine Invariante zwischen return_dict und receivers_list, in welcher ein Element in einer der Listen ist, aber nicht in der anderen. Prüfen Sie, die entsprechenden Zeilen Code, die sicherstellen, dass diese Invariante immer wahr ist.
Was ist das Ziel des Codes in den Zeilen 41 bis 46?
Über wie viele Pfade kann man in diesen Code durchlaufen?

Hinweis (nur bei Bedarf): Lösungshinweis 1

Durchlaufen Sie eine Iteration des Codes mit der unter test_input angegebenen Liste.

Hinweis (nur bei Bedarf): Lösungshinweis 2

Nehmen Sie noch einmal die Eingabe aus test_input. Stellen Sie sich vor, dass die zweite Iteration läuft, also person gleich Joe ist und die receivers_list aus ["Tom", "Donna", "Susan", "Paul"] besteht.

Hinweis (nur bei Bedarf): Lösungshinweis 3

Bedenken Sie eine vierte Iteration, in der person aus "Susan" besteht und nehmen Sie an, dass die receivers_list jetzt aus ["Donna, "Paul"] besteht.
Welche Zuteilungen sind hier noch möglich?

Defekt gefunden? Prima. Dann jetzt bitte in Logikdefekte.py korrigieren.
Machen sie einen Commit Logikdefekte.py corrected, der nur genau diese modifizierte Datei enthält.
1 git -P show HEAD

Snippet

Abgabe

Geben Sie ein Kommandoprotokoll ab, das genau nur die Eingaben und Ausgaben der obigen Kommandos 1, 2, … enthält. Entfernen Sie vor Abgabe eventuelle Fehlversuche und sonstige zusätzliche Kommandos aus dem Protokoll.