Weiterlesen: Kapitel 4.2
© ProLitteris, Josef Estermann
4 Quantitative Analysen
4.1 Methodologische Grundlagen der Gruppengrößenschätzung
Der Umfang von Drogenszenen mit den wesentlichen soziostrukturellen Parametern kann nicht auf herkömmliche Weise geschätzt werden. Die Gründe liegen in dem doch kleinen Anteil der Drogenkonsumierenden an der Gesamtbevölkerung der Schweiz von unter einem Prozent und in dem stigmatisierenden Charakter von Drogensucht.
Systematische Auswahlverfahren etwa von Schülern, Soldaten oder Gefängnisinsassen verbieten sich als alleinige Grundlage, weil die notwendigen Schätzfunktionen zu deren Umrechnung auf die Normalbevölkerung nicht bekannt sind. Jede systematische Auswahl würde im Hinblick auf eine unverzerrte Schätzung ihr angestrebtes Ergebnis bereits als Voraussetzung benötigen, ein Umstand, der erst nach einer Reihe sorgfältiger Untersuchungen über eine bestimmte Region aufgehoben werden könnte.
Um die Darstellung der Verfahren zu systematisieren, hier als erstes eine Übersicht der verwendeten Bezeichnungen. In diesem Kapitel erscheinen folgende Notationen:
wx Wahrscheinlichkeit eines Individuums der Population x, in einer bestimmten Stichprobe oder Subpopulation zu erscheinen.
mi Anzahl der bereits bekannten im Zeitraum i identifizierten Personen.
zi Anzahl der im Zeitraum i registrierten Vorgänge.
mij Anzahl der im Zeitraum i identifizierten Personen, die bereits im Zeitraum j identifiziert wurden.
Mij Anzahl der Personen im Zeitraum i, die im Zeitraum j identifiziert wurden.
ri Anzahl der im Zeitraum i identifizierten Personen, die in die Population zurückgeführt werden.
bi Proportion der Population im Zeitraum i+1, der zwischen dem Zeitraum i und dem Zeitraum i+1 hinzugefügt wurde (Wachstumsrate beziehungsweise Zugangsrate oder proportionale Inzidenz).
i Proportion der Population im Zeitraum i, die bis zum Zeitraum i+1 nicht aus der Population ausscheidet (Überlebensrate, Survivalrate beziehungsweise Verbleibsrate). Der Ausdruck 1-i stellt die Remissions- beziehungsweise Sterbe- oder Abgangsrate dar.
ni Anzahl der im Zeitraum i oder in der Stichprobe i identifizierten Personen.
Geschätzte Anzahl Personen in der Population insgesamt.
Ni Anzahl der Personen im Zeitraum i oder in der Gesamtpopulation i.
Geschätzte Anzahl der neu zur Population gestoßenen Personen (Inzidenz).
Viele Gruppengrößenschätzungen beruhen im wesentlichen auf capture-recapture Verfahren (Rückfangmethoden)1, also auf der numerischen Analyse von Wiederholungen, von Auffälligkeiten räumlicher (Auffälligkeiten in verschiedenen Gebietseinheiten), sozialer (Auffälligkeiten in verschiedenen Institutionen oder sozialen Räumen) und diachroner Art (Auffälligkeiten im selben Raum und in derselben Institution zu unterschiedlichen Zeitpunkten). Bevor solche Verfahren verwendet werden, müssen die einzelnen Personen in ihren sozialen Räumen identifiziert werden (Fallidentifizierung oder Fallsuche). Das heißt, daß der Schätzung eine Zählung oder eine Recherche von Datenbeständen vorausgehen muß und daß die gezählten Personen in einem anderen Datenbestand reidentifizierbar sein müssen. Dazu ist nicht unbedingt die Kenntnis des Namens erforderlich. Die Vergabe eines möglichst eindeutigen Codes reicht aus. Eindeutigkeit ist nie absolut gegeben, auch nicht bei Kenntnis des Namens und des Geburtsdatums. Für die spätere Durchführung der Rückfangmethode ist es von großem Vorteil, die bei der Fallsuche gefundenen Populationen nach ihren zentralen soziodemographischen Variablen zu beschreiben, also diese Variablen wo immer möglich zu erheben. Bei den von uns verwendeten Daten, den Daten des Repressionssystems und der Drogentodesfälle, war die Erhebung von Alter und Geschlecht möglich.
Die im qualitativen Material abgeschätzten Übergangswahrscheinlichkeiten wq können in direkte Verbindung mit der Größe der gefundenen Populationen n gesetzt werden, wobei n die Gesamtgröße dieser gefundenen Population, beispielsweise alle polizeilich verzeigten Personen oder alle Methadonempfänger und -empfängerinnen darstellt. Die Gruppengröße ist dann zu schätzen mit
Im Idealfall würde die so geschätzte Gruppengröße mit derjenigen der rein numerischen Verfahren genau übereinstimmen. Da aber, wie sich in Kapitel 3 ergibt, die Variabilität von wq außerordentlich groß ist, kann diese Schätzung bloß eine heuristische Funktion haben. Sie darf keinesfalls als bestätigte Schätzung der Anzahl Drogenkonsumierender bezeichnet werden. Ähnliches gilt für analoge Schätzungen aufgrund der bloßen Drogentodesfallzahlen. Zentral ist sie jedoch bei der Bestimmung der Subpopulationen, des Grades der Immunität und der Suszeptibilität. Je stärker wq variiert, desto größer ist die Heterogenität der zugrundeliegenden Population.
4.1.1 Geschlossene Populationen: capture – recapture Modelle und deren Modifikationen
capture-recapture Verfahren wurden in der Biologie zur Schätzung des Umfangs von Tierpopulationen entwickelt. Sie basieren auf zwei oder mehr (multicapture) Stichproben (Fänge) aus der betrachteten Population. Die Individuen des ersten Fangs werden geeignet markiert und können so im nächsten Fang wiedererkannt werden. Der Anteil der in der zweiten Stichprobe gefundenen Individuen, die schon in der ersten markiert wurden, liefert ein Maß für die Größe der Population insgesamt. Sofern beide Stichproben eines capture-recapture als reine Zufallsstichproben aus der interessierenden Gesamtheit realisiert werden können, sollte der Anteil der markierten Individuen in der gesamten Population etwa gleich dem Anteil in der zweiten Stichprobe sein. In diesem Fall gilt also näherungsweise
woraus für den Schätzer2 des Umfangs der Population folgt:
Für dessen Standardabweichung ergibt sich3
Dabei bezeichnet M die Anzahl der nach der ersten Stichprobe markierten Individuen, n die Anzahl der Individuen der zweiten Stichprobe und m die Anzahl der in der zweiten Stichprobe gefundenen markierten Individuen. Offenbar spielt die erste Stichprobe stochastisch keine Rolle. Der einfache Petersen-Schätzer unterstellt lediglich, daß die Anteile der markierten Individuen in Population und Stichprobe übereinstimmen. Man kann also auch M Markierungen beliebig vornehmen beziehungsweise M markierte Elemente neu hinzufügen und nach deren Durchmischung mit der Population in einer Stichprobe m/n bestimmen.
Das einfache capture-recapture unterstellt eine Reihe von Bedingungen, die sich folgendermaßen zusammenfassen lassen:
Die Erfassungswahrscheinlichkeit ist für alle Elemente in jeder Stichprobe gleich.
Die Markierungen gehen nicht verloren.
Markierungen ändern die Erfassungswahrscheinlichkeit nicht.
Zwischen beiden Stichproben finden weder Ab- noch Zugänge statt.
Heterogenität der Erfassungswahrscheinlichkeiten führt in der Regel zu Unterschätzungen des Umfangs der Population.4 Kommen in einer Population Zugänge aber keine Abgänge vor, so führt dies beim Petersen-Schätzer tendenziell zu einer Überschätzung des Umfangs der Population. Im umgekehrten Fall, bei dem real Ab- aber keine Zugänge stattfinden, erhält man entsprechend Unterschätzungen. Ändert die Erfassung in der ersten Stichprobe die Erfassungswahrscheinlichkeit für weitere Stichproben, so führt dies zu schwer kalkulierbaren Verzerrungen, sofern diese Änderung nicht extern abgeschätzt werden kann.
Die Genauigkeit der Schätzung hängt von der Anzahl der Elemente ab, die in beiden Stichproben vorkommen. Deutlich wird auch, daß bei kleinen Stichprobenumfängen die Resultate ohne Aussagekraft bleiben.
Eine erste Verallgemeinerung des einfachen capture-recapture in geschlossenen Populationen besteht in der Einbeziehung von mehr als zwei Stichproben. Zu- oder Abgänge werden hier noch nicht modelliert. In der i-ten Stichprobe werden ni Individuen gefangen, von denen mi( £ ni) bereits über eine Markierung aus einer früheren Stichprobe (i‘ £ i) verfügen. Die noch nicht markierten Individuen werden nun markiert und zusammen mit den bereits markierten entlassen, das heißt in die Population zurückgegeben. Im Zuge der i-ten Stichprobe werden somit (ri – mi) neue Marken der Population hinzugefügt. Mit ri wird die Anzahl der wieder in die Population entlassenen, markierten Individuen bezeichnet. Offenbar gilt ni = ri genau dann, wenn durch die Markierung keine Individuen eliminiert werden. Unmittelbar vor der i-ten Stichprobe befinden sich somit
Mi : = r1 + (r2 – m2) + (r3 – m3) + … + (ri-1 – mi-1)
markierte Individuen in der Population. Die Anwendung des oben angeführten Schätzers liefert für den Umfang der Population zum «Zeitpunkt» der i-ten Stichprobe
Das mit mi gewichtete Mittel dieser Schätzer ergibt:
Die Standardabweichung dieses gewichteten Mittels beträgt
4.1.2 Offene Populationen: Verfahren nach Jolly und Seber
Eine andere Erweiterung des einfachen capture-recapture in Richtung auf ein multi-capture sampling mit der Möglichkeit der Schätzung von Zu- und Abgangsraten wurde unter anderen von Jolly (1965) und Seber (1973) entwickelt. Generell werden im multi-capture Verfahren sukzessiv Stichproben gezogen. Bei jeder Stichprobe werden die noch nicht markierten Individuen mit der Marke versehen und zusammen mit den bereits markierten Elementen wieder in die Population entlassen. In Analogie zum einfachen capture-recapture gilt hier für die i-te Stichprobe
und die für Anzahl der jeweils jüngsten Markierungen Mi erhält man
Hierbei bedeutet zi die Anzahl aller vor der i-ten Stichprobe bereits markierten Elemente, die nicht in der i-ten Stichprobe, wohl aber in einer der späteren Stichproben wieder gefunden werden, während ri die Anzahl der Elemente mit einer frischen Markierung aus der i-ten Stichprobe bezeichnet. Der Term yi( £ ri) bezeichnet die Anzahl der Individuen unter den ri, die nach der i-ten Stichprobe mindestens noch einmal gefunden werden. Durch die Parameter
und
kann die Dynamik der Zu- und Abwanderungen geschätzt werden.
4.1.3 Offene Populationen: Schätzer nach Jackson
Jackson’s positive beziehungsweise negative Methode5 stellen zwei Alternativen anderer Art zum eingangs skizzierten einfachen capture-recapture Modell dar. Jackson’s positive Methode ist für den Fall möglicher Zugänge zur Population geeignet, während Jackson’s negative Methode die Schätzung von Abgangsraten aus der Population ermöglicht. Nach der positiven Methode werden nach dem ersten Fang r0 markierte Individuen wieder in die Population entlassen. In den folgenden Fängen vom Umfang n1, n2, … wird – ohne weitere Markierungen – lediglich die Anzahl mi der markierten Individuen in der i-ten Stichprobe bestimmt. Hieraus ergibt sich der Anteil der markierten Individuen
Für den Umfang der Population zum Zeitpunkt der ersten Stichprobe gilt – mit unbekanntem q0
Bezeichnet schließlich b die über alle Stichproben konstante Zugangsrate, dann folgt mit der evidenten Beziehung
die lineare Regression
Hieraus lassen sich ln q0 und ln(1-b) als Kleinst-Quadrate Schätzer elementar bestimmen.
Im Gegensatz zu Jackson’s positiver Methode benötigt Jackson’s negative Methode eine Folge von Stichproben, wobei eine abschließenden Stichprobe die Anzahl der Individuen mit den Marken aus den jeweiligen Stichproben erfaßt. Analog zur Zugangsrate in Jackson’s positiver Methode kann Jackson’s negative Methode die Abgangs- beziehungsweise Survivalrate des Prozesses schätzen.
Betrachten wir beispielsweise fünf Stichproben, von denen die ersten vier bloß zur Markierung dienen. Sie produzieren r1, r2, r3 beziehungsweise r4 markierte Individuen, die in die Population entlassen und teilweise in der fünften Stichprobe wieder gefunden werden. Bezeichnet n5 den Umfang der fünften Stichprobe, m5 die Anzahl der Individuen mit einer Marke und N5 den Umfang der Population zur Zeit der fünften Stichprobe, so ergibt sich bei konstanter Survivalrate f mit der Unterstellung, daß das Verhältnis der markierten Individuen in der fünften Stichprobe dem entsprechenden Anteil in der gesamten Population entspricht
Unterstellt man ferner, daß die mittlere Verweildauer der Individuen in der fünften Stichprobe mit dem mittleren «Alter» aller markierten Individuen identisch ist, so ergibt sich zur Bestimmung der Survivalrate f
worin m5i die Anzahl der in der fünften Stichprobe gefunden Markierungen aus der i-ten Stichprobe und die Summe der Verweildauer aller markierten Individuen bezeichnen.
Mit der aus der ersten dieser Gleichungen geschätzten Survivalrate f kann und folglich geschätzt werden
Für die Standardabweichung des Populationsschätzers sowie des Schätzers der Survivalrate ergibt sich6
beziehungsweise
4.1.4 Offene Populationen: triple catch Verfahren
Mit dem sogenannten triple catch verfügen wir über eine weitere Alternative zum einfachen capture-recapture. Diese Methode7 benötigt drei Stichproben und gestattet eine Schätzung von Ab- und Zugangsraten. Sie ist geeignet, eine offene Population abzuschätzen. Dabei wird vorausgesetzt, daß zu drei unterschiedlichen Zeitpunkten mit gleichen Intervallen jeweils Individuen identifiziert und anschließend als markierte Individuen in die Population zurückgeführt werden. Dieses Modell ist für die Analyse von Daten des Repressionssystems bestens geeignet. Es ist von der Datenlage her möglich, die Anzahl der Personen, die während eines Jahres von der Polizei identifiziert wurden, die Anzahl der in zwei sukzessiven Jahren identifizierten und die Anzahl derjenigen, die bei der Identifizierung sich als bereits früher identifiziert erweisen, numerisch zu benennen.
Das Schätzverfahren setzt allerdings Überlebens- und Wachstumsraten zwischen t0 und t1 mit denjenigen zwischen t1 und t2 gleich und reagiert auf Veränderungen in der Verfolgungsintensität. Diese Voraussetzung kann bei Kenntnis mehrerer Triplets sukzessive aufgehoben werden.
Das Hauptproblem des Verfahrens besteht darin, daß die Voraussetzungen der Unabhängigkeit und der Zufälligkeit der Stichproben nicht immer erfüllt werden können. Die Bedingungen sind dadurch definiert, daß jedes Element i aus der Grundgesamtheit N die gleiche Wahrscheinlichkeit (Chance) p hat, in die Stichprobe zu kommen, also beispielsweise angezeigt zu werden oder in ein Methadonprogramm oder in ein sonstiges medizinisches Betreuungsangebot aufgenommen zu werden. Weiter soll die Wahrscheinlichkeit der Aufnahme in ein bestimmtes Programm unabhängig von der Wahrscheinlichkeit der Aufnahme in ein anderes Programm oder etwa von der Wahrscheinlichkeit einer polizeilichen Anzeige sein. Bei flächendeckenden Daten dürften die Unterschiede dieser Wahrscheinlichkeiten innerhalb der offenen Szene nicht einer bedeutenden systematischen Verzerrung unterliegen. Geht man davon aus, daß die Anzeigewahrscheinlichkeiten in der offenen Szene nicht wesentlich variieren, was bei der Intensivierung der polizeilichen Tätigkeit seit 1990 allerdings zunehmend der Fall sein dürfte, liefert etwa ein capture-recapture von flächendeckenden Anzeigedaten in zwei aufeinanderfolgenden Zeiträumen einen ersten Hinweis auf die Größe der Population. Zum einen handelt es sich dabei um ein Fallidentifizierungsverfahren, wobei n1+n2-m21 die Anzahl der in beiden Zeiträumen gefundenen Personen darstellt. Zum anderen würde eine Verzerrung, die darauf beruht, daß eine bereits angezeigte Person mit einer höheren Wahrscheinlichkeit ein wiederholtes Mal angezeigt wird, zu einem Schätzer führen, der unter dem wahren Wert liegt, mithin einen Minimalschätzer darstellt. Sollte jedoch die Migration der bereits angezeigten Personen sehr groß und die Überlappung klein sein, so daß bereits angezeigte Personen seltener wiederholt angezeigt werden, würde die Population tendenziell überschätzt. Dasselbe ist der Fall, wenn Inzidenz und Ausstieg (Remission oder Tod), also die Dynamik der Population, relativ sehr groß sind.
Eine Veränderung der zugrunde liegenden Gruppengröße während der Untersuchungszeit führt zu einer Überschätzung der Population. Diese Überschätzung liegt in der Größenordnung der Inzidenz, kann diese aber auch übertreffen.
Weitere Modellvoraussetzungen sind in Kapitel 4.1.5 diskutiert. Das Problem der Über- und Unterschätzung wegen Abhängigkeit der Stichproben, wie es von Korf et al.8 angesprochen wird, ist zwar durchaus ernst zu nehmen, doch werden in dieser Kritik den Versuchen der Parametrisierung der Abhängigkeiten und der Kontrolle der zeitlichen Ausdehnung der Stichprobenziehung keine Beachtung geschenkt. Mittels klarer Definition der Grundgesamtheit, mittels ausgeführter Hypothesen über eventuelle Abhängigkeit und Tests mit verschiedenen Stichproben können die angesprochenen Probleme eingegrenzt werden.
Nun zur Entwicklung der Schätzung aus drei zeitlich abfolgenden Stichproben. Mit mij bezeichnen wir die Anzahl der Individuen, die in der i-ten Stichprobe mit der Marke «j» gefunden werden. Analog bezeichne Mij die unmittelbar vor der i-ten Stichprobe in der Population insgesamt befindlichen Individuen mit der Marke «j».
Nach der ersten Stichprobe werden r1 Individuen mit der Marke «1» in die Population entlassen. Hiervon werden m21 Individuen in der zweiten Stichprobe gefunden. Die noch nicht markierten n2 – m21Individuen dieser zweiten Stichprobe werden nun mit einer «2» markiert und zusammen mit den anderen in die Population entlassen. Die Zahl der hier entlassenen Individuen bezeichnen wir mit r2. Dabei ist r2 £ n2, da die «Markierung» selbst beispielsweise durch Haft bei Drogenkonsumierenden die Zahl der wieder in die Population entlassenen verringern kann. Bezeichnet M21 (£ r1) die zum Zeitpunkt der zweiten Stichprobe in der Population befindlichen (noch lebenden) markierten Individuen, so ergibt sich zunächst mit den bekannten Argumenten für den Schätzer des Umfangs zum Zeitpunkt der zweiten Stichprobe
Mit der Survivalrate f1 für den Zeitraum zwischen erster und zweiter Stichprobe folgt
Zur Schätzung der Survivalrate f1 benötigt man eine unabhängige Schätzung von M21. Im Verlauf der zweiten Stichprobe und den entsprechenden Markierungen werden die m21 Individuen mit einer «1»-Marke entfernt, so daß sich hiernach M21 – m21 mit «1» markierte Individuen in der Population befinden. Nach Markierung der restlichen Elemente aus der zweiten Stichprobe werden r2 mit «2» markierte Individuen in die Population zurückgegeben.
Unter der Annahme, daß die M21 – m21 mit «1» markierten Individuen sowie die in der zweiten Stichprobe neu markierten Individuen über dieselbe Survivalrate bis zur dritten Stichprobe verfügen, ergibt sich
beziehungsweise
Bezeichnet ferner b2 die Zugangsrate in der gesamten Population zwischen der zweiten und dritten Stichprobe, wobei die m21 Individuen wieder voll berücksichtigt werden, gilt
Zusammen ergibt sich
und
Im Zuge der Datenanalyse hat sich jedoch gezeigt, daß diese direkte Schätzung von b2 außerordentlich anfällig ist gegenüber Veränderungen der Erfassungswahrscheinlichkeit: Wird aus Gründen stark erhöhter Anzeigeintensität n3 gegenüber n2 und stärker noch gegenüber n1 überproportional groß, wird m31.n2 klein und n3.m21 groß. In der Anwendung dieser Formel wird b2 mit Werten nahe eins überschätzt.
Stabilere Schätzwerte lassen sich angeben wenn
wobei m32 unabhängig von eventuellen Marken aus r1 erhoben wird, m31 hingegen keine Individuen enthält, die eine Marke aus r2 tragen, da diese in m21 enthalten sind. muß aus einer anderen Schätzung gewonnen werden. Im folgenden dienten dazu zeitlich verschobene Triplets oder extrapolierte Werte von b oder f. Die Varianz von ist gegeben durch
wobei die unbekannten Größen N2, M21 und B1 durch ihre Schätzungen ersetzt werden.
4.1.5 Veränderung der Erfassungswahrscheinlichkeit
Wolter stellt einen Schätzer vor, der die Annahme trifft, daß die Wahrscheinlichkeit der Erstregistrierung für die erste und die zweite Ziehung eines Fang- und Rückfangprozesses gleich ist.9 Auf eine Verletzung dieser Annahme, etwa bei einer Änderung der Verfolgungsintensität oder einer Änderung der Rückfangwahrscheinlichkeit durch den erfolgten ersten Fang, reagiert das Verfahren sehr empfindlich mit einer Abweichung des Schätzergebnisses von dem Ergebnis des einfachen Schätzers nach Petersen, . Das Verfahren bezieht sich auf eine geschlossene Population und benötigt zwei aufeinanderfolgende Stichproben:
Der Ausdruck n2 – m21 entspricht der Anzahl Personen, die sich in der zweiten, aber nicht in der ersten Stichprobe befinden. Die Kenntnis dieser Zahl und die Kenntnis der Größe der ersten Stichprobe genügen zur Berechnung von .
Es gilt wenn sich die Wahrscheinlichkeit des Rückfangs (recapture) in der zweiten Stichprobe für bereits in der ersten Stichprobe erfaßte Personen (capture) erhöht, was wachsende Suszeptibilität bedeutet, oder wenn die Verfolgungsintensität wächst.
Umgekehrt gilt natürlich bei sich vermindernder Suszeptibilität oder sich vermindernder Verfolgungsintensität.
Die Gruppengröße bei unterschiedlichen Registrierwahrscheinlichkeiten von bereits Registrierten in der zweiten Stichprobe ist mittels einer Modifikation der Petersen-Formel zu schätzen:
Der Veränderungskoeffizient ist mit V bezeichnet. Einer Verdopplung der Registrierwahrscheinlichkeit für Personen, die schon in der ersten Stichprobe registriert wurden, entspricht V=2, einer Halbierung entspricht V=0.5.
Der unkorrigierte Petersen-Schätzer reagiert sehr empfindlich auf eine Veränderung der Registrierwahrscheinlichkeit für bereits in der ersten Stichprobe registrierte Personen gegenüber in der ersten Stichprobe nicht registrierten Personen. Bei einer Verdopplung der Registrierwahrscheinlichkeit von 10% bei der ersten und 20% bei der zweiten Stichprobe für bereits Registrierte und bei einer tatsächlichen Gruppengröße von N=10’000 ergibt sich =5’500 und bei einer Halbierung von 10% auf 5% =19’000. Keine Reaktion hingegen zeigt der Petersen-Schätzer auf eine bloße Veränderung der Registrierwahrscheinlichkeit überhaupt, also auf eine Veränderung der Verfolgungsintensität, die «Erstmalige» und «bereits Bekannte» gleichermaßen trifft.
Um die Größenordnung solcher Verzerrungseffekte darstellen zu können, sind Modellrechnungen nützlich. Zu diesem Behufe nehmen wir nun an, daß bei einer ursprünglichen Gruppe von 10’000 Individuen eine Registrierwahrscheinlichkeit bei der ersten Stichprobe von 20% gegeben sei, sowie eine Remissionsrate und eine Inzidenzrate von je 20%, was 2’000 neu Eintretende und 2’000 die Population Verlassende bedeutet. Zusätzlich nehmen wir an, daß die Registrierwahrscheinlichkeit bei der zweiten Stichprobe 30% für noch nicht Registrierte und 40% für bereits Registrierte beträgt. Raten dieser Größenordnung erwarten wir tatsächlich für den Zeitraum 1990 bis 1992. In unserer Modellrechnung beträgt nun die reale zu schätzende Gruppengröße 12’000 Individuen; 10’000 ursprüngliche und 2’000 inzidente. Der Petersen-Schätzer hingegen liefert =9’875. Bei einer Korrektur mit V=4/3 für die um einen Drittel erhöhte Wahrscheinlichkeit, als bereits registriertes Individuum wieder registriert zu werden, ergibt sich =12’500 mit einem Vertrauensintervall von 11’600 bis 13’400. Die gleichen Werte liefert der Petersen-Schätzer, wenn die Wahrscheinlichkeit der Wiedererfassung für bereits registrierte und noch nicht registrierte Personen gleich bleibt.
Wenn nun aber eine Ausweitung der Verfolgung Gruppen trifft, die bisher von der Repression verschont geblieben sind, mit anderen Worten, wenn für bestimmte Gruppen die Immunität verloren geht, ist auch folgendes Szenario denkbar: Eine ursprünglich 10’000 Individuen große Gruppe mit einer ursprünglichen durchschnittlichen Erfassungsrate von 20%, deren einzelne Mitglieder eine sehr variable Erfassungswahrscheinlichkeit besitzen und mit einer Inzidenz- sowie Remissionsrate von ebenfalls je 20%, erfährt eine Ausweitung der Repressionsintensität, die unter anderem bisher nicht erfaßte Personen fokussiert. Die Erfassungswahrscheinlichkeit bisher nicht erfaßter Individuen erhöht sich auf 40%, diejenige der bereits Erfaßten auf 30%. Der Schätzer ergibt 16’000, wobei sich in der zweiten Stichprobe 3’360 noch nicht registrierte Individuen befinden, eine Zahl, welche die wahre Inzidenz der Basis des Modells um fast 70% übertrifft. Eine entsprechende Korrektur mit V=3/4 ergibt wiederum =12’500. Es zeigt sich, daß die wahre Inzidenz der Grundpopulation bei sich verschärfender Repressionsintensität um einiges unter der Zahl der tatsächlich erfaßten «Erstmaligen» liegen kann, auch wenn der Anteil der bereits Erfaßten weniger als 50% beträgt. Mit anderen Worten überschätzt unter solchen Bedingungen die Zahl der neu gefundenen, noch nicht identifizierten Personen die Zahl der tatsächlich neu zu der Population gestoßenen. Genau dieser Mechanismus scheint im übrigen tendenziell in der ersten Hälfte der neunziger Jahre gewirkt zu haben. Ein ähnliches Phänomen ließ sich Mitte der achtziger Jahre bei der Statistik der HIV-positiven Testergebnisse beobachten,10 welches in der Schweiz zu der massiven Überschätzung der HIV/AIDS-Epidemie in den späten achtziger und in den neunziger Jahren beitrug.11 Epidemiologische Erkenntnisse über die Rolle der injizierenden Drogenkonsumierenden bei der Verbreitung von HIV12 wurden als argumentative Unterstützung zur Durchsetzung einer verschärften Drogenrepression seit 1991 mißbraucht, obwohl gerade unter dem gesundheitspolitischen Primat der späten achtziger Jahren die Neuansteckungsraten in dieser Population sanken.
Da der Wolter-Schätzer sehr sensitiv auf Änderungen der Verfolgungsstrategien reagiert, kann aus der Division der geschätzten Populationsgröße nach Wolter durch die geschätzte Populationsgröße nach Petersen ein Indikator J für die Verfolgungsintensität gewonnen werden, der bei Werten größer eins eine Intensivierung der Verfolgung anzeigt:
Als zusätzliche Indikatoren für die Veränderung der Anzeigeintensität beziehungsweise der Repressionsintensität dienen die durchschnittlichen Anzeigenzahlen pro Person Y und deren jährliche Veränderung dY:
Eine weitere Maßzahl für die Verfolgungsintensität ist die polizeiliche Durchdringung der Konsumierenden PD. Sie ist definiert durch den Anteil der Erfaßten unter den Erfassbaren:
4.1.6 Die Erfassungsfrequenz und truncated poisson Verfahren
Ein weiteres Verfahren beruht auf der Ermittlung der jährlichen Erfassungswahrscheinlichkeit eines Individuums aus der Frequenz der Erfassungen eines Jahres. Dies kann unter Annahme und Prüfung einer Poissonverteilung für ein bestimmtes p erfolgen.
Im Gegensatz zum capture-recapture Modell werden im Rahmen des truncated poisson Modells die sukzessiven «Kontakte» der Elemente der zu schätzenden Population mit relevanten Stellen gezählt. Bei Drogenkonsumenten vergeben die helfenden Stellen sowie der repressive Apparat die entsprechenden Marken oder Signaturen. Für einen gegebenen Zeitraums wird so jedem Element der Population die Anzahl seiner Marken zugeordnet, die als sein «Zustand» bezeichnet wird. Unterstellt man, daß die Wahrscheinlichkeit eines Übergangs vom Zustand i in den Zustand i+1 unabhängig vom Zustand selbst und identisch für alle Elemente ist, dann ergibt sich für den Anteil der Elemente im Zustand i, das heißt mit i Kontakten oder Signaturen nach dem Poissonmodell
für (i = 0, 1, 2, …)
wobei l die Intensität des Prozesses bezeichnet, die für alle Individuen als gleich unterstellt wird. Die Anzahl beziehungsweise der Anteil der Individuen der Population ohne Kontakte (i = 0) ist nicht bekannt. Für die bei i = 0 abgeschnittene Poissonverteilung der Beobachtungen ergibt sich
für (i = 1, 2, …)
Während eines gegebenen Zeitintervalls erleben die Individuen der Population keines, eins, zwei oder mehr «Ereignisse» des bestimmten Typs, beispielsweise einer Anzeige durch die Ordnungsbehörden. Die Anzahl der Individuen der betrachteten Population ohne ein Ereignis der betrachteten Art (i = 0) wird nicht direkt empirisch erfaßt. Hierin verbirgt sich die Analogie zum capture-recapture. Dort ist zunächst auch die Zahl der Drogenabhängigen nicht bekannt, die noch in keiner der Stichproben gefunden wurden, was bei vorliegender Immunität beziehungsweise Resistenz naturgemäß zu einer Unterschätzung der Population führt.
Bezeichnen wir nun mit n0 die Anzahl der in einem bestimmten Zeitraum nicht beobachteten Individuen und mit n die Zahl der tatsächlich gefundenen Fälle, so ergibt sich für eine erste iterative Schätzung von n0 und l:
beziehungsweise
Unter Verwendung von ergibt sich für die iterierten Schätzer
beziehungsweise
Das Verfahren konvergiert in der Regel sehr schnell und liefert hier bereits nach etwa zehn Schritten stabile Ergebnisse.
4.1.7 Gepoolte Stichproben und loglineare Analysen
Skarabis und Patzak13 haben gezeigt, daß sich aus der Verbindung mehrerer Stichproben sehr exakte Schätzer für die Größe der Population gewinnen lassen. Der Schätzer bezieht sich auf suszeptible Personengruppen und liefert gute Ergebnisse, wenn Drogenberatungsstellen, medizinische Betreuung und Repression mit räumlicher Überlappung einzubeziehen sind. Die Methode beruht auf loglinearen Anpassungen multivariater Kontingenztabellen.
Ein aus loglinearen Modellen resultierender Schätzer für die nicht beobachteten unter Berücksichtigung von Abhängigkeiten der Stichproben eins und zwei sowie der Stichproben zwei und drei in einer geschlossenen Population kann beispielsweise angegeben werden mit:
wobei der Index «1» für das Vorhandensein des Elements in der Stichprobe, der Index «2» für das Fehlen des Elements in der Stichprobe steht.14 Das Verfahren liefert aufgrund der Mängel der bestehenden Datenlage Überschätzungen, da nicht genügend sich räumlich überlappende Stichproben zur Verfügung stehen. Nach Disaggregation der nationalen Repressionsdaten auf die einzelnen Kantone und Definition der Kantonsdaten als getrennte Stichproben und anschließender Aggregation in Gruppen finden sich Schätzer in der Größenordnung von =60’000 Individuen. Diese Überschätzung der repressionssuszeptiblen Population findet ihre Ursache darin, daß die zugrunde liegende Population zwar migriert, jedoch keine homogene Durchmischung erreicht. Drogenkonsumierende mögen zwar im selben Jahr auch in einem ihrem Wohnort benachbarten Kanton erfaßt werden, doch ist die Wahrscheinlichkeit, in einem entfernten und peripheren Kanton aufzutauchen und dort identifiziert zu werden, kleiner als unter der Normalverteilungsannahme zu erwarten wäre. Dieses Migrationsverhalten spiegelt sich in der Aussage eines in einer Kleinstadt wohnenden Drogenkonsumenten wieder:«Ich bin in Zug aufgewachsen und da läuft einfach nichts oder, und entweder bist du nach Zürich oder nach Luzern und ja, da bist du eher nach Zürich weil es einfach größer ist» (#14, 4/37-38). Solche Muster führen zu einer Reduktion der Wiederfangwahrscheinlichkeit und somit zu einer Überschätzung der Population im Vergleich der Gebietseinheiten, die sich auch im Petersen-Schätzer in ähnlich gelagerten Fällen widerspiegelt (vgl. Kapitel 4.4.3). Eine andere und für dieses Verfahren adäquate Situation hingegen liegt vor, wenn mehrere Stichproben in der gleichen Gebietseinheit gezogen werden können.
4.1.8 Problematik der Modellbildung und Datenlage
Die Übertragung der für die Biologie entwickelten Modelle auf Populationen von Drogenabhängigen ist bei aller Ähnlichkeit der Fragestellung dennoch nicht ohne Probleme. Die Vielzahl der in der Literatur vorgeschlagenen Versuche, diesem und weiteren Problemen bei der Gruppengrößenschätzung zu begegnen, können in dieser Arbeit nicht umfassend referiert werden.
Einige dieser Probleme seien im folgenden angedeutet: Die Population, deren Umfang geschätzt werden soll, muß geeignet definiert werden. Dies setzt voraus, daß der Begriff des Drogenkonsums oder auch der «Drogenabhängigkeit» klar festgelegt ist. Die lokale Zuordnung der betreffenden Personen zu der jeweils gemeinten Population muß erkennbar sein. Für die Gruppe der Drogenkonsumierenden – wie auch für Populationen in der Biologie – ist die Voraussetzung einer gleichen Erfassungswahrscheinlichkeit aller Individuen der Gesamtpopulation bei jeder Stichpobe – wie auch schon in der Biologie – problematisch und in der Regel nicht haltbar. Es ist vielmehr davon auszugehen, daß nicht alle Konsumierenden über dieselbe Wahrscheinlichkeit verfügen, dem helfenden oder dem repressiven Apparat im Umfeld einer Drogenszene bekannt zu werden, ganz abgesehen von sich verändernden Erfassungsintensitäten.
Einmal bekannt gewordene, im erwähnten Sinn «markierte» Drogenkonsumierende können möglicherweise allein durch diesen Kontakt oder aus anderen Gründen ihr Konsumverhalten (eventuell Verlust der Markierung) oder bei gleichem Konsumverhalten die Wahrscheinlichkeit einer späteren Wiedererkennung erheblich ändern.15
Die in dieser Arbeit verwendeten Verfahren tragen der Tatsache, daß Drogenabhängigkeit – abgesehen von den angeführten Definitionsproblemen – keine zeithomogene Erscheinung ist, nur bedingt Rechnung. Ausführliche Versuche, die Dynamik auch der individuellen Drogenkarrieren in ein Schätzmodell einzubeziehen, finden sich bei Simeone.16
Die Mehrzahl der in der Literatur genannten Modifikationen des capture-recapture beziehungsweise des truncated poisson-Modells benötigen Annahmen über die sozialen Interaktionen innerhalb einer regional begrenzten Drogenszene, Interaktionen zwischen verschiedenen benachbarten Gruppen und mit den relevanten helfenden, medizinischen oder repressiven, staatlichen oder privaten Institutionen.
Bei aller Plausibilität der Modellannahmen fehlt jedoch allen Publikationen die Verifikation der Modelle durch entsprechende Simulationen bei bekannter, fiktiver Populationsgröße. Überdies sind Modelle mit diversen Modifikationen insofern empirisch belastet, als die erforderlichen Parametrisierungen einen zusätzlichen Bedarf an Daten erzeugen, der in der Regel nicht gedeckt werden kann. Simeone hat daher für Drogenszenen in den USA neben der eigentlichen Modellierung einen Plan zur Bestimmung der relevanten Daten vorgeschlagen, der nicht unerhebliche Anforderungen an die mit dem Problem der Drogenabhängigkeit befaßten Institutionen darstellt.
1 capture-recapture Verfahren schätzen eine Population auf Grund der Zahl von Individuen, die nach Erfassung in einem Datenbestand markiert in die Population zurückgeführt werden und zu einem späteren Zeitpunkt oder in einem anderen Datenbestand erneut wieder auftreten.
2 Es handelt sich um den sogenannter Petersen-Schätzer.
3 N.T.J. Bailey: On estimating the size of mobile populations from capture-recapture data. Biometrika, 38/1951, S.294f. Diese Art der Berechnung ergibt größere Konfidenzintervalle als die durch Begon (1979, a.a.O.) vorgeschlagene.
4 Vgl. Woodward et al. (1985), Carothers (1973) und Gilbert (1973).
5 C.H.N. Jackson: The analysis of an animal population. J. Anim. Ecol., 8/1939, S. 238-246.
6 N.T.J. Bailey: On estimating the size of mobile populations from capture-recapture data. Biometrika, 38/1951, S.294f.
7 Vgl. Begon, Michael: Investigating Animal Abundance, Edward Arnold, Liverpool 1979, S. 19-23.
8 Korf, D.J.; Reijneveld, S.A.; Toet, J.: Estimating the number of Heroin Users: A Review of Methods and Empirical Findings from the Netherlands. The International Journal of the Addictions, 29(11), 1994, S. 1393-1417.
9 Wolter, K.M.: Some coverage error models for census data. J.Amer.Statist.Ass. 81, 338-346 (1986).
10 Estermann, J.; Sulliger, J.-M.; Skarabis, H.: Epidemiologie der HIV-Infektionen in der Schweiz und in der Bundesrepublik Deutschland – der Beitrag der amtlichen Erfassungssysteme, der anonymen Teststellen und des Blutspenderscreenings. Das Gesundheitswesen 54/1992, S. 123. Estermann, J.: Erhebung der in bundesdeutschen Laboratorien durchgeführten HIV-Teste. Labor-Medizin 10/1990, S. 526.
11 Vergleiche etwa die Arbeiten von Michael G. Koch, dem wissenschaftlichen Beirat der mit dem Verein für Psychologische Menschenkenntnis (VPM) verbundenen Aids-Aufklärung Schweiz, Gruppen, die hinter der radikal-prohibitiven Initiative «Jugend ohne Drogen» stehen.
12 Estermann, J.; Gebhardt, M.; Paget, J.: Die heterosexuelle Transmission von HIV und AIDS in der Schweiz. AIDS-Forschung (AIFO) 10/1992, S. 517-522.
13 Skarabis, H.; Patzak, M.: Die Berliner Heroinszene. Eine epidemiologische Untersuchung. Weinheim und Basel, 1981, S. 101f.
14 Bishop, Fienberg, Holland: Discrete Multivariate Analysis, The Massachusetts Institute of Technology, 1975, S. 241.
15 Diese Umstände werden in den Schätzverfahren, die in der Biologie verwendet werden mit „trap avoiding“ beziehungsweise „trap addiction“ bezeichnet.
16 Simeone, Nottingham, Holland: Estimating the size of a heroin-using population: An examination of the use of treatment admissions data, The International Journal of Addiction, 28(2), 1993, S. 107 – 128. ProLitteris