Glanz und Elend der mathematischen Modellierung
Christoph Pöppe
Unter den Staaten, die unter der Gewaltkriminalität zu leiden haben, nimmt Mexiko einen traurigen Spitzenplatz ein. Im Jahr 2021 hatten offizielle Stellen 34000 Mordopfer zu melden, fast 27 pro 100000 Einwohner, und die Anzahl der jährlichen Todesopfer hat sich zwischen 2007 und 2021 mehr als vervierfacht. Es ist bekannt, dass bei diesen erschreckenden Zahlen das organisierte Verbrechen eine entscheidende Rolle spielt. Die kriminellen Vereinigungen werden allgemein als Kartelle bezeichnet, obgleich sie mit Kartellen im üblichen Wortsinn – von der gesetzwidrigen Zielsetzung abgesehen – nicht viel gemein haben. Ein wesentlicher, aber bei weitem nicht der einzige Geschäftszweig ist der Handel mit illegalen Drogen.
Der Einfluss der Kartelle ist zwar überall in der Gesellschaft zu spüren; aber die Einzelheiten ihrer Aktivität bleiben im Verborgenen. Naturgemäß ist so etwas wie die Liste der Mitglieder eines Kartells nicht verfügbar – höchstwahrscheinlich gibt es sie nicht – von Organisationsstrukturen oder Regeln des kriminellen Geschäftsverkehrs ganz zu schweigen. An die Oberfläche kommen nur die Anzahl der gewaltsamen Todesfälle und die der Festnahmen.
Da scheint eine mathematische Analyse ein geignetes Mittel, um Licht ins Dunkle zu bringen. Man stellt ein Modell der Gesamtsituation auf, passt dieses an die spärlich verfügbaren Daten an und erhält daraus Aufschlüsse über die Größen, die einen wirklich interessieren, wie zum Beispiel die Mitgliederzahlen und vielleicht sogar eine Zukunftsprognose. Das haben die drei Autoren Rafaelo Prieto-Curiel, Gian Maria Campedelli und Alejandro Hope in einer groß angelegten Untersuchung unternommen („Reducing cartel recruitment is the only way to lower violence in Mexico“, Science 381, 1312–136, 2023).
Wie erstellt man ein solches mathematisches Modell? Man orientiert sich an Systemen, in deren inneres Funktionieren man ebenfalls keinen Einblick nehmen kann – und auch nicht unbedingt muss, denn es kommt nicht auf das Verhalten eines einzelnen Elements an, sondern auf das eines Kollektivs, das wiederum so groß ist, dass sich individuelle Eigenheiten ausmitteln. Der Ansatz der Autoren zeigt frappante Ähnlichkeiten mit der Untersuchung derartiger Systeme:
– Chemische Reaktionen: Es kommt nicht darauf an, welches Molekül sich mit welchem zu einer neuen Verbindung zusammentut. Es genügt zu wissen, wie oft bei gegebener Konzentration der Stoffe A und B ein A-Molekül zufällig auf ein B-Molekül trifft und mit welcher Wahrscheinlichkeit daraus eine Verbindung hervorgeht.
– Epidemien: Es ist noch gar nicht lange her, da gab es zu COVID-19 allerlei mathematisch zu modellieren. Es stellte sich bald als aussichtslos heraus, nachzuvollziehen, wer wen angesteckt hat. Aber man konnte den Verlauf der Epidemie recht gut mit einem mathematischen Modell beschreiben, das sich nur mit Gesamtzahlen von Ansteckbaren, Erkrankten, Genesenen und Gestorbenen befasst und den Übergang von einer Gruppe in die andere als Zufallsereignis beschreibt, mit einigen Varianten, die den speziellen Eigenschaften dieser Erkrankung Rechnung tragen.
– Populationsgenetik: Man will wissen, wie sich gewisse Gene mit der Zeit im Erbgut einer Population von Tieren oder auch Menschen ausbreiten. Welches Tier mit welchem Nachkommen zeugt, wird als Zufallsereignis modelliert („random mating“). Als ich davon zum ersten Mal las, empfand ich die Vorstellung, die Mutter meiner Kinder und ich wären durch Zufall zusammengekomen, so als hätten wir beide dieselbe Losnummer gezogen, als arg realitätsfremd. Aber darum geht es nicht: Betrachtet man ein Kollektiv, dann ist es durchaus zulässig, ein solches Zusammentreffen, das in jedem Einzelfall verschiedene Gründe hat, die man nicht kennt und die voneinander unabhängig sind, als zufällig anzusehen. „Zufall“ ist in sehr vielen Fällen eine Umschreibung für „wir wissen es nicht, und wir finden keine Regelmäßigkeit“.
Na gut. Ein kriminelles Kartell verliert beständig Mitglieder durch Verhaftungen mit anschließender Gefängnisstrafe und durch Morde. Wenn da nichts nachwächst, müsste ein Kartell auf die Dauer aussterben – was offensichtlich nicht der Fall ist. Also findet jedes Kartell neue Mitglieder. Wie? Das wissen wir nicht, die Gründe sind in jedem Einzelfall verschieden, also bleibt uns nichts anderes übrig, als das als Zufallsprozess zu modellieren. Kartellmitglied trifft Normalmenschen und motiviert ihn mit einer gewissen Wahrscheinlichkeit zum Beitritt.
Das ist wie Ansteckung bei einer Epidemie: Zuwachs an Kranken pro Zeiteinheit ist gleich Anteil der Ansteckenden mal Anteil der noch Gesunden mal einem Proportionalitätsfaktor, in dem zwei Wahrscheinlichkeiten stecken: die, sich bei einer Begegnung anzustecken, und die, sich überhaupt zu begegnen. Wir erinnern uns: In Corona-Zeiten ging es vorrangig darum, diesen Proportionalitätsfaktor niederzudrücken – mit Masken und mit Kontaktverboten –, um damit die Epidemie in Grenzen zu halten.
Genau so modellieren die Autoren den Zuwachs bei den Kartellen. Anders als bei den Epidemiemodellen genehmigen sie sich allerdings eine Vereinfachung: Eine Epidemie begrenzt sich selbst dadurch, dass die Gesunden weniger werden, bis im Extremfall niemand zum Anstecken mehr übrig ist. Da jedoch selbst in Mexiko die Kartelle nur einen sehr kleinen Teil der Bevölkerung ausmachen, verzichten die Autoren darauf, die Abnahme der Normalbevölkerung durch Abwanderung ins kriminelle Milieu mit in Betracht zu ziehen. Es würde keinen nennenswerten Unterschied machen.
Also: Zuwachs pro Zeiteinheit ist zu jedem Zeitpunkt proportional der Anzahl der Mitglieder. Oder in Formeln ausgedrückt: Es gibt mehrere Kartelle, und mit \(C_i\) sei die Mitgliederzahl des \(i\)-ten Kartells bezeichnet. Dann lautet die Formel \[{d C_i \over dt} = p C_i\] mit einem Proportionalitätsfaktor \(p\), der vorläufig unbekannt ist. Das ist eine – sehr einfache – gewöhnliche Differentialgleichung für die Mitgliederzahl in Abhängigkeit von der Zeit. Na ja – die Variable einer Differentialgleichung muss alle reellen Werte annehmen dürfen, während Mitgliederzahlen ihrer Natur nach ganzzahlig sind; aber diese Diskrepanz muss uns nicht stören, jedenfalls nicht für große Mitgliederzahlen. Andere Ungenauigkeiten sind viel größer.
Entscheidender ist die Tatsache, dass diese Differentialgleichung das unbegrenzte exponentielle Wachstum beschreibt. Das widerspricht den Realitäten, kann also nicht die ganze Wahrheit sein. Vielmehr muss es einen Mechanismus geben, der die Größe eines Kartells in Grenzen hält, und zwar auch ohne Verfolgungsdruck.
Es ist nicht schwer, sich einen solchen Mechanismus vorzustellen: Der Chef eines Kartells kann nicht einfach davon ausgehen, dass seine Anweisungen befolgt werden, und im Konfliktfall das Arbeitsgericht bemühen. Vielmehr funktioniert die Befehlskette durch persönliche Beziehungen, seien es verwandtschaftliche oder freundschaftliche Bindungen, Zuckerbrot oder Peitsche, und die sind umso schwieriger aufrechtzuerhalten, je größer die Bande wird.
Wie diese Selbstbegrenzung im Einzelfall ihre Wirkungen entfaltet, wissen wir nicht. Also wählen die Autoren den mathematisch einfachsten Weg, um diesen Effekt zu erzeugen. Obige Differentialgleichung wird ergänzt durch einen Term, der negativ und dem Quadrat der Mitgliederzahl proportional ist: \[{d C_i \over dt} = p C_i-\omega C_i^2\] Für kleine Werte von \(C_i\) macht der sich kaum bemerkbar, aber wenn die Mitgliederzahl über einen gewissen Gleichgewichtswert hinaus anwächst, dominieren die destruktiven Kräfte. Genau so modelliert man Sättigungseffekte in der Populationsdynamik. Wieder ist der Proportionalitätsfaktor \(\omega\) vorläufig unbekannt.
Und so geht das mit dem Modellieren weiter. Wenn Mitglieder zweier Kartelle in Konflikt geraten – sagen wir, es gibt Differenzen über die regionale Aufteilung der Geschäftsbereiche –, bleibt einer der Beteiligten auf der Strecke. Die Häufigkeit solcher tödlichen Begegnungen ist proportional dem Produkt der beiden Mitgliederzahlen. Das ist wie beim Massenwirkungsgesetz aus der Chemie: Da treffen sich zwei verschiedene Moleküle rein per Zufall umso häufiger, je zahlreicher sie sind.
Die Polizei fischt nach diesem Modell im Trüben. Die Anzahl der Fische, die ihr ins Netz gehen, ist proportional der Anzahl der Fische, die überhaupt in der Brühe schwimmen. Und in dem Fang kommen die Mitglieder verschiedener Kartelle in denselben Proportionen vor wie in der Freiheit – es ist halt alles ein Zufallsprozess.
Ein paar spärliche Daten sind dann doch ans Licht gekommen und gehen in die Modellierung ein. So weiß man ungefähr, in welchen Bundesstaaten Mexikos welche Kartelle aktiv sind, welche miteinander verbündet und welche verfeindet sind und daher überhaupt in Konflikt geraten können. Nicht jeder gewaltsame Todesfall ist auf Aktivitäten der Kartelle oder der Polizei zurückzuführen; an dieser Stelle ist man auf grobe Schätzungen angewiesen.
Mit diesem immer noch sehr dünnen Material macht man ein übliches Parameterschätzverfahren. Man lässt das Modell laufen, das heißt, man löst das System von Differentialgleichungen mit gewissen Werten der Parameter – Proportionalitätskonstanten, geschätzen Anfangsgrößen der Kartelle und einigen mehr. Dabei ergeben sich Werte für die beobachtbaren Größen, das sind im Wesentlichen Festnahmen, gewaltsame Todesfälle und Vermisste, die nicht wieder auftauchen. Die modellierten Werte weichen zunächst stark von den beobachteten ab; aber man kann die Parameter systematisch so nachbessern, bis das Modell die echten Werte korrekt vorhersagt – oder wenigstens einigermaßen. Man findet diejenigen Werte der Parameter, für die der Unterschied zwischen den modellierten und den beobachteten Werten minimal wird. Damit hat man konkrete Werte für \(p, \omega\) und etliche andere Zahlen, die ich nicht ausdrücklich erwähnt habe.
Mit dem so kalibrierten Modell könnte man allerlei anstellen: Schätzwerte für die Mitgliederzahlen der Kartelle finden, die Entwicklung für die Zukunft vorhersagen und verschiedene Szenarien durchspielen. Was würde passieren, wenn man die Zuwachsrate \(p\) halbierte? Oder die Erfolgsquote der Polizei verdoppelte?
Die Autoren kommen zu einem eindeutigen Ergebnis: Nur das Vermindern von \(p\) hilft; und selbst diese Maßnahme – wie immer sie zu bewerkstelligen wäre – entfaltet erst nach mehreren Jahren ihre Wirkung.
Hm. Das ist das Ergebnis, das jedem Menschenfreund das Herz aufgehen lässt: Viel besser als die Verbrecher einzusperren ist es, Bedingungen zu schaffen, die Verbrechen gar nicht erst entstehen lassen. Wahrscheinlich stimmt das sogar. Nur: Das kann man auch ohne den ganzen Modellieraufwand einsehen. Und das mathematische Modell gibt das Ergebnis nicht her. Dazu ist es einfach zu dünn.
Haben die Autoren handwerkliche Fehler gemacht? Nicht wirklich. Die Methoden entsprechen dem, was man im Hauptstudium lernt, und wurden korrekt angewandt. Wo man keine Daten hat, kann und soll man keine aus dem Hut zaubern. Das, was man nicht weiß, als Zufallsprozess zu modellieren ist gängige Praxis. Unter mehreren denkbaren Mechanismen, die ähnliche Datenverläufe erzeugen, den mathematisch einfachsten zu wählen entspricht dem Prinzip der Sparsamkeit.
Aber in diesem Fall haben die Autoren es mit der Sparsamkeit krass übertrieben. So wie das Modell gebaut ist, erklärt es das drastische Anwachsen der Kartellaktivität als Folge eines quasi-natürlichen Prozesses. Die Kartelle haben eine – na gut, durchschnittliche – Wachstumsrate \(p\), nur gebremst durch kartellinterne Auseinandersetzungen und die Aktivitäten der Polizei. Was für ein Unfug! Man stelle sich nur vor, eine gewöhnliche Firma würde aus denselben Gründen größer werden wie eine Karnickelherde.
Nein. Auch eine kriminelle Firma kann ihr Personal nur vergrößern, wenn sie ihren Absatz vergrößert. Es gibt gute Gründe anzunehmen, dass das gerade im Drogengeschäft in den letzten zehn Jahren der Fall war. Externe Einflüsse wie zum Beispiel die Nachfrage nach Drogen kommen aber im Modell nicht vor. Vielleicht haben die Autoren dazu keine belastbaren Daten gefunden, so dass sie sich außerstande sahen, solche Einflüsse in das Modell mit aufzunehmen.
Das ist der heimtückische Zug an den Parameterschätzverfahren: Sie finden eigentlich immer etwas, einerlei wie mangelhaft das Konzept ist. Führe hinreichend viele Parameter in ein Modell ein, und du kannst jeden Datensatz durch eine überzeugende Kurve wiedergeben. Nur taugen dann die Ergebnisse der ganzen Rechnung nichts.
Vorsicht beim Modellieren! Da kann die ganze Mathematik richtig sein, und trotzdem ist es unmöglich, die Ergebnisse in einem vernünftigen Sinn zu interpretieren.
The post Glanz und Elend der mathematischen Modellierung originally appeared on the HLFF SciLogs blog.