Lade Inhalt...

Validierung der deutschen Montgomery Asberg Depression Rating Scale (MADRS) für das Kindes- und Jugendalter

Diplomarbeit 2007 96 Seiten

Psychologie - Allgemeine Psychologie

Leseprobe

Inhaltsverzeichnis

Danksagung

Abstract

1. Einleitung
1.1 Problemstellung

2. Depressive Erkrankungen im Kindes- und Jugendalter
2.1 Klassifikation depressiver Erkrankungen
2.1.1 Klassifikation nach DSM-IV
2.1.2 Klassifikation nach ICD-10
2.1.3 Klassifikation nach den Leitlinien der Deutschen Gesellschaft für Kinder- und Jugendpsychiatrie und -psychotherapie
2.2 Epidemiologie
2.3 Verlauf und Prognose
2.3.1 Zusammenfassung

3. Diagnostische Verfahren
3.1 Selbstbeurteilungsverfahren
3.2 Fremdbeurteilungsverfahren
3.2.1 Ratingskalen
3.2.2 Interviewverfahren
3.3 Überblick über depressionsspezifische Verfahren für Kinder und Jugendliche
3.4 Schlussfolgerungen
3.5 Zusammenfassung

4. Entwicklung und Eigenschaften der MADRS
4.1 Entwicklung der MADRS
4.1.1 Die CPRS
4.1.2 Die Gewinnung der MADRS-Items
4.1.3 Die Validierung der englischen MADRS
4.1.4 Die deutsche MADRS
4.2 Die erste Untersuchung der deutschen MADRS
4.3 Gütekriterien der MADRS
4.3.1 Objektivität
4.3.2 Reliabilität
4.3.3 Validität
4.3.4 Normen
4.4 Vergleichsuntersuchung zwischen MADRS und CDRS-R
4.5 Neuere Entwicklungen bei der MADRS
4.6 Schlussfolgerungen
4.7 Zusammenfassung

5. Fragestellungen und Hypothesen

6. Methode
6.1 Objektivitätsuntersuchung
6.1.1 Charakterisierung des Untersuchungsdesigns
6.1.2 Beschreibung der Instrumente
6.1.3 Stichprobenkonstruktion
6.1.4 Untersuchungsdurchführung
6.1.5 Datenanalyse
6.2 Validitätsuntersuchung
6.2.1 Charakterisierung des Untersuchungsdesigns
6.2.2 Beschreibung der Instrumente
6.2.3 Stichprobenkonstruktion
6.2.4 Untersuchungsdurchführung
6.2.5 Datenanalyse
6.3 Änderungssensitivitätsuntersuchung
6.3.1 Charakterisierung des Untersuchungsdesigns
6.3.2 Beschreibung der Instrumente
6.3.3 Stichprobenkonstruktion
6.3.4 Untersuchungsdurchführung
6.3.5 Datenanalyse
6.4 Überblick über alle Untersuchungen
6.5 Rechtliches

7. Ergebnisse
7.1 Objektivitätsuntersuchung
7.2 Validierungsuntersuchung
7.3 Änderungssensitivitätsuntersuchung

8. Zusammenfassung und Diskussion
8.1 Erkenntnisse und Schlussfolgerungen der Objektivitäts-untersuchung
8.2 Ergebnisse und Schlussfolgerungen der Validitätsuntersuchung
8.3 Ergebnisse und Schlussfolgerungen der Änderungs-sensitivitätsuntersuchung
8.4 Methodische Einschränkungen
8.5 Erkenntnisse und Schlussfolgerungen aus der Anwendung der MADRS
8.6 Ausblick
8.7 Zusammenfassung und Fazit

Anhang

Abbildungsverzeichnis

Tabellenverzeichnis

Formelverzeichnis

Abkürzungsverzeichnis

Eidesstattliche Erklärung

Danksagung

Eine Diplomarbeit ist verbunden mit einem langwierigen Arbeitsprozess, in dem geplant, verworfen, geändert und überarbeitet wird. Während dieses Prozesses gab es eine Reihe von Menschen, die mir zur Seite standen und die auf ganz verschiedene Weise ihren Teil dazu beitrugen, dass diese Diplomarbeit entstanden ist. Dafür möchte ich ihnen hier meinen Dank aussprechen.

Herrn Prof. Dr. Huss danke ich für das Thema der Diplomarbeit und die wissenschaftliche Betreuung.

Ich danke Frau Dr. Luzi Beyer, die mir mit ihrer optimistischen Art und den hilfreichen Tipps zur statistischen Auswertung immer wieder voran brachte.

Den Patienten und Patientinnen der Klinik für Psychiatrie, Psychosomatik und Psychotherapie des Kindes- und Jugendalters der Charité sowie des Sozialpädiatrischen Zentrums und ihren Angehörigen danke ich, dass sie trotz der zahlreichen und schwerwiegenden persönlichen Probleme zur Teilnahme an dieser Untersuchung bereit waren.

Den Ärzten, Psychologen und Praktikantinnen der einzelnen Stationen und des SPZ möchte ich für ihre Hilfe und Zusammenarbeit bei der Patientenrekrutierung und der Datenerhebung danken.

Außerdem danke ich den Teilnehmern an der Untersuchung der Beobachterübereinstimmung und allen Mitgliedern der Arbeitsgruppe Affektive Störungen für ihre tatkräftige Unterstützung.

Mein besonderer Dank gilt Anna-Marfa Bloss und Arne Bürger für die Zusammenarbeit, ihre aufmunternden Worte und die Unterstützung.

Ich möchte außerdem allen fleißigen Korrekturlesern danken, dass sie sich für mich die Zeit genommen haben, nach Fehlern und Widersprüchen zu suchen sowie mir nützliche Hinweise mit auf den Weg zu geben.

Mein Dank gilt meinen Eltern, die mir mein Studium ermöglicht haben und stets mit Rat und Tat zur Seite standen.

Und nicht zuletzt danke ich jenen ganz besonderen Menschen, die mir emotional beigestanden haben, meinen Weg begleiteten und immer wieder die richtigen Worte fanden, um mich zu motivieren.

Abstract

Das Ziel meiner Diplomarbeit war es, zu überprüfen, ob die MADRS ein valides Verfahren der dimensionalen Depressionsdiagnostik für Kinder im Alter von sechs bis 18 Jahren ist.

Dazu wurden Untersuchungen der Beurteilerübereinstimmung, der Testgütekriterien und der Änderungssensitivität an insgesamt 76 Patienten zwischen sechs und 18 Jahren, die Symptome einer depressiven Episode gezeigt hatten, vorgenommen.

Die mittlere Beurteilerübereinstimmung war mit Abbildung in dieser Leseprobe nicht enthalten = .91 hoch. Dabei verfügen die Items über hohe Trennschärfen Abbildung in dieser Leseprobe nicht enthalten = .65 bei niedrigen bis mittleren Itemschwierigkeiten (Abbildung in dieser Leseprobe nicht enthalten = .31). Die Retest-Reliabilität nach zwei Wochen ist mit r = .71 niedrig, die interne Konsistenz nach Cronbachs a mit .86 mittelmäßig. Alle Items erfassen dieselbe Dimension (H = .41). Dabei ist die konvergente Validität mit dem DTK mittelhoch (r = .52) und mit der CDRS hoch (r = .87). Im Vergleich jüngerer mit älteren Patienten zeigen sich höhere Itemschwierigkeiten bei den älteren Patienten. Für die Trennschärfe ist das Bild beim Altersvergleich uneinheitlich. Im Mittelwertvergleich konnten signifikante Abnahmen der MADRS-Gesamtwerte und der Retest-Reliabilität nach acht Wochen nachgewiesen werden.

Die MADRS erlaubt eine objektive Erfassung der Symptomatik depressiver Kinder und Jugendlicher.

1. Einleitung

Im ersten Kapitel soll die Problemstellung, die zum Thema dieser Arbeit führte, erläutert werden. Ebenso soll die Zielstellung dargelegt werden und der inhaltliche Aufbau der gesamten Arbeit kurz skizziert werden.

1.1 Problemstellung

In der BELLA-Studie (Befragung „Seelisches Wohlbefinden und Verhalten“, Ravens-Sieberer et al., 2007) zur Untersuchung der psychischen Gesundheit von Kindern und Jugendlichen in Deutschland, die im Rahmen des Kinder- und Jugend-Gesundheitssurveys (KIGGS) des Robert-Koch-Instituts zwischen 2003 und 2006 an 2863 Kindern und Jugendlichen im Alter von sieben bis 17 Jahren sowie deren Eltern durchgeführt wurde, wiesen 5.4% der Kinder spezifische Anzeichen für eine Depression auf. In einer Untersuchung von Steinhausen et al. (1998) erkrankten 0.6% von 1964 Kindern und Jugendlichen im Alter von sieben bis 16 Jahren innerhalb eines halben Jahres an einer Major Depression. Depressive Erkrankungen, die im Kindes- und Jugendalter begonnen haben, setzen sich mit einem Risiko von 60-70% auch im Erwachsenenalter fort (Weller & Weller, 2000).

In Anbetracht der relativ hohen Prävalenz und des hohen Risikos einer Chronifizierung der Störung ist es umso wichtiger, optimale diagnostische Instrumente zur Verfügung zu haben, um einerseits die depressive Symptomatik klassifizieren zu können und sie andererseits hinsichtlich ihres Schweregrades zu beurteilen. Letzteres ist gerade während der Behandlung der Patienten[1] besonders relevant, um Symptomverbesserungen, aber auch Verschlechterungen schnell und präzise abzubilden und entsprechend mittels Veränderung der therapeutischen Maßnahmen darauf reagieren zu können.

Solche diagnostischen Verfahren für Depressionen bei Kindern werden auch deshalb gebraucht, weil es inzwischen immer mehr psychotherapeutische und pharmakologische Behandlungsmöglichkeiten für Kinder und Jugendliche gibt. Zur Beurteilung ihrer Wirksamkeit bei bestimmten Patientengruppen und auch bei jedem einzelnen Patienten ist die Anwendung ökonomischer, valider und änderungssensitiver Verfahren unerlässlich.

Im Bereich der Kinder- und Jugendpsychiatrie liegt für depressive Erkrankungen bislang kein ökonomisches diagnostisches Verfahren vor, das eine objektive und zuverlässige quantitative Erfassung der Symptomatik für den gesamten Altersbereich von etwa sechs bis 18 Jahren erlaubt. Die bisher validierten diagnostischen Verfahren beziehen sich entweder nur auf einen eng umschriebenen Altersbereich, setzen ein Leseverständnis voraus oder sind sehr zeitintensiv.

Im Bereich der Erwachsenenpsychiatrie konnte nachgewiesen werden, dass es sich bei der Montgomery Asberg Depression Rating Scale [Collegium Internationale Psychiatriae Scalarum (CIPS), 2005; im Folgenden als MADRS bezeichnet] um ein objektives und valides Instrument zur Beurteilung der quantitativen Ausprägung der aktuellen depressiven Symptomatik handelt, das gleichzeitig äußerst ökonomisch und änderungssensitiv ist (Schmidtke et al., 1988).

Daraus ergibt sich die Zielstellung meiner Diplomarbeit. Es soll geprüft werden, ob die MADRS ein valides Verfahren der dimensionalen Depressionsdiagnostik für Kinder im Alter von sechs bis 18 Jahren ist.

Das Ziel der MADRS für Kinder und Jugendliche soll es sein, unter einem möglichst geringen Zeitaufwand das aktuelle Befinden der Patienten auf einer empirisch gesicherten, depressionsrelevanten Dimension zu erfassen.

Die Diplomarbeit soll die folgenden Teilaspekte untersuchen: Erstens soll nachgewiesen werden, dass die MADRS ein objektives Verfahren zur Beurteilung der depressiven Symptomatik darstellt. Zweitens sollen die Testgütekriterien bestimmt werden und damit die Validität der MADRS für das Kindes- und Jugendalter bewiesen werden. Drittens soll die Änderungssensitivität der MADRS nachgewiesen werden.

Sollte sich die MADRS in meiner Untersuchung als objektives, valides und änderungssensitives Instrument für den Bereich der Kinder- und Jugendpsychiatrie erweisen, läge damit erstmals im deutschen Sprachraum ein Verfahren vor, das den hohen wissenschaftlichen und praktischen Ansprüchen gerecht wird und nicht nur für Kinder ab sechs Jahren sondern auch für Folgeuntersuchungen bis ins Erwachsenenalter hinein geeignet ist.

In den folgenden acht Kapiteln soll diese Zielstellung bearbeitet werden. Dazu werden zuerst depressive Erkrankungen des Kindes- und Jugendalters anhand der gängigen Diagnosekriterien charakterisiert (siehe Kapitel 2) und dann im 3. Kapitel Arten diagnostischer Verfahren näher dargestellt. Anschließend soll genauer auf die Entwicklung und Eigenschaften der MADRS eingegangen werden (Kapitel 4). Dann werden im Kapitel 5 die Fragestellungen und Hypothesen der Untersuchung vorgestellt. Darauf aufbauend enthält Kapitel 6 die Methoden für die Untersuchung der Fragestellungen. Im folgenden 7. Kapitel erfolgt die Darstellung der Untersuchungsergebnisse und im Kapitel 8 eine ausführliche kritische Auseinandersetzung mit den Ergebnissen.

2. Depressive Erkrankungen im Kindes- und Jugendalter

In diesem Kapitel wird die Klassifikation depressiver Erkrankungen nach den gängigen diagnostischen Standardwerken dargestellt. Neben den typischen Kernsymptomen soll dann auf die Besonderheiten in der Symptomatik der Störung bei bestimmten Altersgruppen eingegangen werden. Daran schließen sich Befunde zur Häufigkeit der Erkrankung an und es werden Schlussfolgerungen gezogen, die die Notwendigkeit der dimensionalen Diagnostik über eine große Alterspanne belegen sollen.

2.1 Klassifikation depressiver Erkrankungen

Im Folgenden geht es um die Klassifikation depressiver Symptome. Zur Klassifikation psychischer Störungen werden grundsätzlich zwei verschiedene Klassifikationssysteme herangezogen. Dies sind zum einen die Leitlinien zur Internationalen Klassifikation psychischer Störungen in der 10. Revision (kurz ICD-10; Dilling et al., 2005), die von der Weltgesundheitsorganisation (WHO) herausgegeben werden und zum Anderen das DSM-IV (Saß et al., 1998), das eine deutsche Übersetzung und Bearbeitung des Manuals der American Psychiatric Association (APA, 1994) darstellt.

2.1.1 Klassifikation nach DSM-IV

Neben den depressiven Störungen werden sog. bipolare Störungen im DSM-IV (Saß et al., 1998) zu den affektiven Störungen gezählt. Außerdem gehören auch affektive Störungen, die durch bestimmte Krankheiten (affektive Störungen aufgrund eines medizinischen Krankheitsfaktors) oder durch Substanzen (substanzinduzierte affektive Störung) hervorgerufen werden, dazu.

Die depressiven Störungen sind unterteilt in die Major Depression, Dysthyme Störu ng und nicht näher bezeichnete depressive Störung. Wenn außer den depressiven Symptomen auch manische Symptome auftreten, wird von einer bipolaren Störung gesprochen. Hierzu gehören die Bipolar I Störung, Bipolar II Störung, Zyklothyme Störung und nicht näher bezeichnete Bipolare Störung.

Im DSM-IV (Saß et al., 1998) werden folgende Kriterien für eine Episode einer Major Depression angegeben:

Es müssen mindestens fünf der folgenden Symptome während derselben, zwei Wochen andauernden Periode vorliegen. Diese Symptome sollen eine Veränderung gegenüber der zuvor vorhandenen Leistungsfähigkeit darstellen. Mindestens eines der Symptome muss entweder eine depressive Verstimmung oder der Verlust an Interesse oder Freude sein. Zu diesen Symptomen gehören eine selbst berichtete oder von anderen beobachtete depressive Verstimmung, ein deutlich vermindertes Interesse oder verminderte Freude an allen oder fast allen Aktivitäten, ein deutlicher Gewichtsverlust ohne Diät oder eine Gewichtszunahme (mehr als 5% des Körpergewichts in einem Monat) bzw. verminderter oder gesteigerter Appetit. Bei Kindern ist auch das Ausbleiben der zu erwartenden Gewichtszunahme zu berücksichtigen. Weiterhin kann Schlaflosigkeit oder vermehrter Schlaf auftreten. Die Patienten zeigen psychomotorische Unruhe oder Verlangsamung (verlangsamte Körperbewegungen), diese muss durch andere beobachtbar sein und darf nicht nur das subjektive Gefühl von Rastlosigkeit oder Verlangsamung beinhalten. Sie klagen über Müdigkeit oder Energieverlust und erleben Gefühle von Wertlosigkeit oder übermäßige oder unangemessene Schuldgefühle, die auch ein wahnhaftes Ausmaß annehmen können. Zusätzlich berichten die Patienten eine verminderte Fähigkeit zu denken oder sich zu konzentrieren oder eine verringerte Entscheidungsfähigkeit. Es werden wiederkehrende Gedanken an den Tod berichtet, die nicht nur Angst vor dem Sterben beinhalten. Oder die Patienten berichten wiederkehrende Suizidvorstellungen ohne einen genauen Plan für den Vollzug des Suizids zu haben, oder aber sie unternehmen einen tatsächlichen Suizidversuch oder planen einen Suizid genau.

Wichtig für die Diagnosestellung ist, dass keine Kriterien einer gemischten Episode erfüllt sind (also auch keine manischen Symptome vorhanden sind, Anm. der Verf.), dass die Symptome in klinisch bedeutsamer Weise Leiden verursachen oder zu Beeinträchtigungen in sozialen, beruflichen (bei Kindern und Jugendlichen schulischen) oder anderen wichtigen Funktionsbereichen führen. Weiterhin dürfen die Symptome nicht auf die direkte Wirkung einer Substanz (einer Droge oder eines Medikaments) oder eine Erkrankung (z.B. Schilddrüsenunterfunktion) zurückgehen. Außerdem muss eine einfache Trauerreaktion ausgeschlossen werden (vgl. Saß et al., 1998).

Diese Kernsymptome der Episode einer Major Depression gelten genauso für Kinder und Jugendliche. Im DSM-IV (Saß et al., 1998, S. 385) wird darauf hingewiesen, dass „…manche charakteristischen Symptome sich in Abhängigkeit vom Lebensalter verändern …“. Bei Kindern treten häufiger körperliche Beschwerden wie Bauchschmerzen, Kopfschmerzen oder Müdigkeit; Reizbarkeit und sozialer Rückzug auf und die Symptome kommen häufiger in Verbindung mit anderen psychischen Störungen (v.a. sozial störendes Verhalten, Aufmerksamkeitsdefizitstörungen und Angststörungen; vgl. Saß et al., 1998) vor. Im Jugendalter hingegen sind psychomotorische Verlangsamung, Hypersomnie (vermehrtes Schlafbedürfnis) und Wahnphänomene häufiger. Neben den schon genannten bei Kindern häufig gleichzeitig auftretenden Störungen sind Störungen im Zusammenhang mit psychotropen Substanzen (z.B. Alkohol- oder Drogenmissbrauch) und Essstörungen im Jugendalter oft komorbide[2] zur Episode einer Major Depression vorhanden. Tabelle 1 listet die Kernsymptome und die Zusatzsymptome einer Episode einer Major Depression auf.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Diagnosekriterien für die Episode einer Major Depression nach DSM-IV

2.1.2 Klassifikation nach ICD-10

Die Klassifikationskriterien der ICD-10 für eine depressive Episode (F 32; S. 139f) unterscheiden sich nicht wesentlich von denen des DSM-IV: „In den (…) depressiven Episoden leidet die betreffende Person gewöhnlich unter gedrückter Stimmung, Interessenverlust, Freudlosigkeit und einer Verminderung des Antriebs. Die Verminderung der Energie führt zu erhöhter Ermüdbarkeit und Aktivitätseinschränkung. Deutliche Müdigkeit tritt oft nach nur kleinen Anstrengungen auf.“ Andere häufige Symptome sind: verminderte Konzentration und Aufmerksamkeit, vermindertes Selbstwertgefühl und Selbstvertrauen, Schuldgefühle und Gefühle von Wertlosigkeit, negative und pessimistische Zukunftsperspektiven, Suizidgedanken, erfolgte Selbstverletzung oder Suizidhandlungen, Schlafstörungen, verminderter Appetit.

Es wird weiter beschrieben, dass sich die gedrückte Stimmung von Tag zu Tag wenig ändert und meist nicht auf die jeweiligen Lebensumstände reagiert. Allerdings kann sie charakteristische Tagesschwankungen aufweisen. Laut ICD-10 (S. 139f) ist ein untypisches Erscheinungsbild besonders in der Jugend häufig: „In einigen Fällen stehen zeitweilig Angst, Gequältsein und motorische Unruhe mehr im Vordergrund als die Depression. Die Stimmungsänderung kann durch zusätzliche Symptome wie Reizbarkeit, exzessiven Alkoholgenuss, histrionisches Verhalten, Verstärkung früher vorhandener phobischer oder zwanghafter Symptome oder durch hypochondrische Grübeleien verdeckt sein.“ Um die Diagnose einer depressiven Episode stellen zu können, wird eine Dauer von mindestens zwei Wochen verlangt. Auch hier ist für die Diagnosestellung erforderlich, dass die Symptome beim Betroffenen Leiden verursachen und zu Schwierigkeiten im Beruf oder bei sozialen Aktivitäten führen. Tabelle 2 fasst die wichtigsten Symptome der depressiven Episode nach ICD-10 zusammen.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2: Diagnosekriterien der depressiven Episode (F 32) nach ICD-10

In den Klassifikationskriterien des DSM und der ICD deutete sich bereits an, dass sich die Symptomatik in verschiedenen Altersgruppen unterschiedlich darstellt. Deshalb sollen als nächstes die Leitlinien der Deutschen Gesellschaft für Kinder- und Jugendpsychiatrie erläutert werden, die die Symptomatik für verschiedene Altersgruppen sehr viel deutlicher differenzieren.

2.1.3 Klassifikation nach den Leitlinien der Deutschen Gesellschaft für Kinder- und Jugendpsychiatrie und -psychotherapie

Die Leitlinien der Deutschen Gesellschaft für Kinder- und Jugendpsychiatrie und ‑psychotherapie (2003) beschreiben die Symptomatik in den verschiedenen Altersgruppen folgendermaßen:

Im Kleinkindalter (1-3 Jahre) wirkt das Kind traurig, hat ein ausdrucksarmes Gesicht, zeigt eine erhöhte Irritabilität[3], ein gestörtes Essverhalten und Schlafstörungen. Es kommt eher zu selbststimulierendem Verhalten wie Jactatio capitis[4], exzessivem Daumenlutschen oder genitalen Manipulationen. Häufig zeigen Kleinkinder ein auffälliges Spielverhalten, eine reduzierte Kreativität und Ausdauer oder Spielunlust und mangelnde Phantasie.

Im Vorschulalter (3-6 Jahre) zeigt das Kind oft einen traurigen Gesichtsausdruck, eine verminderte Gestik und Mimik, ist leicht irritierbar und äußerst stimmungslabil. Es hat eine mangelnde Fähigkeit, sich zu freuen, zeigt eher introvertiertes Verhalten, aber auch aggressives Verhalten oder hat ein vermindertes Interesse an motorischen Aktivitäten. Es kann zu Essstörungen bis hin zu Gewichtsverlust/-zunahme, zu Schlafstörungen, Alpträumen oder Ein- und Durchschlafstörungen kommen.

Schulkinder berichten von sich aus über Traurigkeit, suizidale Gedanken oder Befürchtungen, dass ihnen die Eltern nicht genügend Beachtung schenken. Außerdem kommt es häufig zu Schulleistungsstörungen.

Im Pubertäts- und Jugendalter zeigen die Patienten häufig ein vermindertes Selbstvertrauen, Apathie, Angst, Konzentrationsmangel oder Leistungsstörungen. Es kommt zu zirkadianen Schwankungen des Befindens, psychosomatischen Störungen und die Kriterien einer depressiven Episode werden erfüllt.

2.2 Epidemiologie

In der Literatur wird berichtet, dass die Punktprävalenz für eine Episode einer Major Depression zwischen 2.4% (Canals et al., 1997) und 3.6% (Cooper & Goodyer, 1993) liegt. Wie Steinhausen et al. (1998) schreiben, erkrankten 0.6% von 1964 Kindern und Jugendlichen im Alter von sieben bis 16 Jahren innerhalb eines halben Jahres an einer Major Depression (Sechsmonatsprävalenz). In der kürzlich veröffentlichten BELLA-Studie (Ravens-Sieberer et al., 2007) wiesen 5.4% der sieben- bis 17-jährigen Kinder und Jugendlichen zum Untersuchungszeitpunkt spezifische Anzeichen für eine Depression auf. Das Lebenszeitrisiko für eine Major Depression wird im DSM-IV (Saß et al., 1998) für die erwachsene Normalbevölkerung mit 10 bis 25% für Frauen und 5 bis 12% für Männer angegeben.

In der Great Smoky Mountains Study, einer Längsschnittuntersuchung von 1420 Kindern und Jugendlichen im Alter von neun bis 19 Jahren lag die Lebenszeitprävalenz für bipolare Störungen bei 3.3% (Brotman et al., 2006).

Eine Besonderheit stellt der Unterschied in der Erkrankungshäufigkeit dar. Während das Geschlechterverhältnis bei kindlichen Patienten mit einer depressiven Störung noch nahezu gleich ist, erkranken in der Altersgruppe der Zwölf- bis 17-Jährigen etwa doppelt so viele Mädchen wie Jungen (Essau, 2002). Dieses Geschlechterverhältnis von 2:1 bleibt im Erwachsenenalter bestehen.

2.3 Verlauf und Prognose

Depressive Ersterkrankungen erreichen einen Manifestationsgipfel zwischen dem 20. und dem 40. Lebensjahr (Eggers & Röpcke, 2004). Das mittlere Ersterkrankungsalter für eine Major Depression bei Jugendlichen liegt bei 14.3 Jahren (Lewinsohn et al., 1993). In epidemiologischen Studien konnte gezeigt werden, dass in westlichen Industrienationen depressive Störungen mit einer höheren Lebenszeitprävalenz und einem früheren Erstmanifestationsalter auftreten (vgl. zusammenfassend Esser, 2002). Weller & Weller (2000) berichten in ihrem Übersichtsartikel, dass sich depressive Erkrankungen im Kindes- und Jugendalter mit einem Risiko von 60-70% auch im Erwachsenenalter fortsetzen. McCauley et al. (1993) geben an, dass etwa 54% der Kinder und Jugendlichen innerhalb von drei Jahren erneut an einer Depression erkranken.

Der Verlauf der Störung ist sehr unterschiedlich. Je früher die Erkrankung zum ersten Mal auftritt, desto höher ist das Risiko für weitere Episoden einer Major Depression (Esser, 2002). Je mehr Episoden bereits aufgetreten sind, desto höher ist die Wahrscheinlichkeit einer weiteren Episode (Saß et al., 1998). Etwa zwei Drittel der depressiven Episoden remittieren vollständig, bei einem Drittel ändert sich die Schwere der Symptomatik nicht oder nur wenig (Saß et al., 1998).

2.3.1 Zusammenfassung

Im zweiten Abschnitt ging es um Klassifikation der Symptomatik nach DSM-IV und ICD-10. Außerdem wurden die Besonderheiten in der Symptomatik der Depression bei Kindern und Jugendlichen anhand der Leitlinien der Deutschen Gesellschaft für Kinder- und Jugendpsychiatrie und –psychotherapie dargestellt. Es wurden Erläuterungen zur Epidemiologie und zum Verlauf der Störung gemacht. Dabei sollte besonders deutlich werden, dass die Wahrscheinlichkeit für eine Chronifizierung der Störung und für das erneute Erkranken an einer Depression sehr hoch ist.

Folgende Schlussfolgerungen können aus den Erläuterungen gezogen werden:

- Um die Störung präzise erfassen zu können, muss ein diagnostisches Instrument die Kernsymptome einer Major Depression valide erfassen.
- Die Befunde zum Verlauf der Störung machen deutlich, wie wichtig es ist, möglichst früh festzustellen, ob sich die Symptomatik wieder verschlechtert, um mit entsprechenden therapeutischen Maßnahmen gegensteuern zu können.
- Aus dem Bedürfnis eine solche Verschlechterung der Symptomatik feststellen zu können, ergibt sich die Notwendigkeit diagnostischer Verfahren, die sehr sensitiv für kleine Schwankungen in der Symptomausprägung sind.
- V.a. für die Wissenschaft und die Forschung ist es wichtig, diagnostische Verfahren zur Verlaufsbeurteilung zu haben, die erstens sehr objektiv den Schweregrad der depressiven Störung erfassen und zweitens über eine möglichst große Altersspanne hinweg anwendbar sind und somit zu gut vergleichbaren Ergebnissen führen.
- Damit können bessere Aussagen zu Therapieerfolgen und Krankheitsverläufen ermöglicht werden.

Der nun folgende Abschnitt befasst sich ausführlich mit den verschiedenen Arten diagnostischer Verfahren.

3. Diagnostische Verfahren

Das dritte Kapitel befasst sich mit den verschiedenen Formen diagnostischer Verfahren. Dabei sollen besonders die Vor- und Nachteile der Verfahrenstypen dargelegt werden. Zum Abschluss des Kapitels sollen zusammenfassend die wichtigsten depressionsspezifischen diagnostischen Verfahren für Kinder und Jugendliche aufgelistet werden und Schlussfolgerungen gezogen werden, die die Wahl der MADRS begründen.

Grundsätzlich wird in der psychologischen Diagnostik zwischen Selbst- und Fremdbeurteilungsverfahren unterschieden. Feger & Graumann (1983, S. 70) grenzen die Begriffe folgendermaßen voneinander ab: „Wenn es derjenige selbst ist, der erlebt und sich verhält, der dies beobachtet und beschreibt, so können wir von Selbstberichten und Selbstbeschreibungen sprechen (self report, self recording). Geschieht Beobachtung und Beschreibung durch einen oder mehrere andere, so können wir das als Fremdbeobachtung bezeichnen.“

3.1 Selbstbeurteilungsverfahren

Diese Verfahren dienen z.B. der Schweregradbestimmung eines bestimmten Merkmals, der ein- oder mehrdimensionalen Erfassung von Symptomen, der Selektion von Personen oder Patienten, als Basis für therapeutische Entscheidungen und der Evaluation der Effektivität therapeutischer Interventionen (Stieglitz & Freyberger, 2001). Ferner wird unterteilt in störungsübergreifende Verfahren [z.B. der Youth Self Report (YSR, Arbeitsgruppe Deutsche CBCL, 1998b)] und störungsspezifische Verfahren wie z.B. der Angstfragebogen für Schüler [AFS (Wieczerkowski et al., 1981)] oder das Depressionsinventar für Kinder und Jugendliche (DIKJ) von Stiensmeier-Pelster et al. (2000). „Die Mehrzahl der Selbstbeurteilungsverfahren dient primär zur Schweregradbestimmung von Merkmalen/Syndromen.“ (Stieglitz & Freyberger, 2001, S. 86) Diagnosen sind hingegen aus Selbstbeurteilungsverfahren nur für die Erkrankungen ableitbar, wo keine klinischen Urteile oder Verhaltensbeobachtungen notwendig sind (vgl. Stieglitz & Freyberger, 2001).

Die Vorteile dieser Verfahrensgruppe sind erstens die ökonomische Durchführung und die gute teststatistische Absicherung der meisten gängigen Verfahren (vgl. Stieglitz & Freyberger, 2001). Möller (1990) hebt zudem die Möglichkeit hervor, Selbstbeurteilungsverfahren in eher kurzen Zeitintervallen einzusetzen, was bei Fremdbeuteilungen nicht der Fall sei. Ein weiterer Vorteil ist die Tatsache, dass gerade Stimmungen und Befindlichkeiten nur durch die Person selbst einschätzbar sind (vgl. Stieglitz & Freyberger, 2001).

Die Nachteile liegen einerseits in der mangelnden Objektivität der Personen. Es kann zu unwissentlichen Verfälschungen durch Erinnerungs- oder Selbstdarstellungsfehler, zur absichtlichen Verfälschung oder der Benutzung sog. Response-Sets (Antworttendenzen) kommen (Stieglitz & Freyberger, 2001). Die Personen wissen, dass sie anderen Menschen durch das Selbstbeurteilungsverfahren etwas über sich mitteilen und machen sich Gedanken darüber, was sie mitteilen und wie der Empfänger auf die Informationen reagieren könnte; es kommt zur sog. Selbstdarstellung (vgl. Bortz & Döring, 2006). Die Selbstbeurteilungen bedeuten gleichzeitig auch eine Konfrontation der Patienten mit sich selbst und können dazu führen, dass Personen die eigenen Äußerungen glätten oder so verändern, dass sie ins Selbstkonzept passen (vgl. Bortz & Döring, 2006). Eine spezielle Form der Selbstdarstellung ist nach Bortz & Döring (2006) die soziale Erwünschtheit, die dazu führt, dass Personen aus Furcht vor sozialer Verurteilung konformes Verhalten zeigen und sich in ihren Verhaltensäußerungen an verbreiteten Normen orientieren. Manche Patienten neigen zur Simulation, d.h., sie übertreiben ihre Symptome, oder zur Dissimulation, d.h., sie beurteilen ihre Symptome absichtlich weniger schwer (Bortz & Döring, 2006). Zu den oben genannten Response-Sets gehören bestimmte stereotype Reaktionsweisen auf die Fragen, wie die Jasage-Tendenz (Akquieszenz) oder die Neinsage-Tendenz sowie die Tendenz, immer mittlere Ausprägungen einer Skala zu wählen (vgl. Bortz & Döring, 2006).

Ein weiterer Nachteil nach Stieglitz & Freyberger (2001) ist, dass bei vielen Skalen keine theoretischen Konzeptionen vorliegen, sodass z.B. Depressionsskalen mit sehr unterschiedlichen Items das gleiche Merkmal zu erfassen versuchen. Auch die Items in Depressionsskalen für Kinder unterscheiden sich inhaltlich voneinander [vgl. DIKJ und Depressionstest für Kinder (DTK, Rossmann, 1993, 2005)]. Zusätzliche Nachteile sind die unterschiedliche Reliabilität der Selbstbeurteilungsverfahren in Abhängigkeit von der Schwere der Störung, ihre z.T. unbefriedigende Validität und die Auswirkung der Art der Itemabstufungen auf die Beantwortung (vgl. Stieglitz & Freyberger, 2001). Am günstigsten hat sich dabei nach Hippler et al. (1991) das sieben-stufige Antwortformat erwiesen. Die Autoren konnten außerdem zeigen, dass die Entscheidung der Einstufung von Häufigkeit, Dauer und Schwere eines Merkmals durch die Person zu Unterschieden in der Beantwortung führen kann.

Auch im praktischen Einsatz gibt es Einschränkungen: So setzen viele Selbstbeurteilungsverfahren ein allgemeines Sprach- (und Lese-; Anm. d. Verf.) verständnis voraus, sowie die patientenseitige Motivation und Bereitschaft zur Kooperation (Stieglitz & Freyberger, 2001). Stieglitz & Freyberger (2001) weisen außerdem darauf hin, dass die meisten Verfahren nur bei einem leichten bis mittleren Störungsgrad anwendbar sind.

3.2 Fremdbeurteilungsverfahren

Stieglitz, Baumann & Freyberger (2001) unterteilen die Fremdbeurteilungsverfahren generell in Ratingskalen und Interviewverfahren. Zuerst sollen hier die Eigenschaften sowie die Vor- und Nachteile der Ratingskalen beschrieben werden.

3.2.1 Ratingskalen

Ratingskalen werden folgendermaßen verwendet (Baumann & Seidenstücker, 1977, S. 168): „Ein Rater[5] ordnet (…) einer Person hinsichtlich eines gegenwärtigen oder vergangenen Reaktionsausschnittes (…) mithilfe von zumeist unspezifischen Codierungsregeln eine Beurteilungskategorie auf einer Skala zu, die zusammen mit weiteren ebenso generierten Skalenwerten der Person über Inferenzregeln zu klassifikatorischen, statusdiagnostischen oder veränderungsdiagnostischen Aussagen über die Person verändert wird.“ Ratingskalen gehören nach Stieglitz, Ahrens & Freyberger (2001) neben den Selbstbeurteilungsverfahren zur zahlenmäßig größten Gruppe in der klinisch-psychologischen Diagnostik. Die Autoren heben die Relevanz dieser Verfahrensklasse folgendermaßen hervor: Die Fremdbeurteilungsverfahren können eingesetzt werden, wenn die zu untersuchende Person nur unzureichende Auskunft geben kann oder will. Die Verfahren stellen eine eigene Informationsquelle dar und sie können bezüglich der Qualität der Beurteilung überprüft und verbessert werden (vgl. Stieglitz, Ahrens & Freyberger, 2001).

Stieglitz, Ahrens & Freyberger (2001) weisen darauf hin, dass die Unterscheidung in Selbst- und Fremdbeurteilung künstlich sei, denn Fremdbeurteilungsverfahren basierten zwar auf der Verhaltensbeobachtung während der Befragung, im Wesentlichen basierten sie jedoch auf berichtetem Erleben und berichtetem selbst beobachtetem Verhalten des Patienten, was heißt, dass in Fremdbeurteilungen Selbstbeobachtungen eingingen.

Auch Fremdbeurteilungsverfahren werden in mehrdimensionale bzw. störungsübergreifende und störungsspezifische Verfahren unterteilt (Stieglitz, Ahrens & Freyberger, 2001). Ein Beispiel für ein mehrdimensionales Verfahren ist die Child Behavior Checklist (CBCL, Arbeitsgruppe Deutsche Child Behavior Checklist, 1998a), ein Beispiel für ein spezifisches Verfahren ist die Beobachtungsskala für Autistische Störungen (ADOS, Rühl et al., 2004).

Im Vergleich zu Selbstbeurteilungsverfahren bieten Fremdbeurteilungsverfahren eine Reihe von Vorteilen. So erlauben nach Paykel & Norton (1986) Fremdbeurteilungsskalen ein differenziertes Bild über verschiedene Aspekte der Gestörtheit, während Selbstbeurteilungsverfahren eher globale Aussagen erlauben. Ein weiterer Unterschied ist die höhere Sensitivität für Veränderungen bei Fremdbeurteilungsverfahren und die höhere Reliabilität der Beurteilung (vgl. zusammenfassend Stieglitz, Ahrens & Freyberger, 2001). Außerdem konnten Stieglitz et al. (1998) in ihrer Untersuchung zeigen, dass die Behandler den psychopathologischen Status von depressiven Erwachsenen durch Fremdbeurteilungsverfahren als besser einschätzten als die Patienten selbst.

Nachteile der Fremdbeurteilung liegen im hohen Zeitaufwand für die Beurteilung und in der Tatsache, dass sie einer ausführlichen Ausbildung des Raters bedürfen (vgl. Stieglitz, Ahrens & Freyberger, 2001). Weiterhin seien manche klinisch bedeutsamen Bereiche nur der Selbstbeobachtung zugänglich (z.B. Stimmungen und Befindlichkeiten). Auch die mangelnde Beurteilerübereinstimmung zwischen verschiedenen Ratern sei problematisch. Showalter & Tyrer (1985, in Stieglitz, Ahrens & Freyberger, 2001) konnten zeigen, dass die Reliabilität bei sieben Skalenstufen am größten war. Zudem unterliegen nach Stieglitz, Ahrens & Freyberger (2001) Ratingskalen bestimmten Fehlerquellen. Dazu gehörten die Informationsvarianz (d.h., verschiedene Interviewer verwenden verschiedene Fragetechniken), die Interpretationsvarianz (d.h., die Interviewer gewichten Symptome unterschiedlich), die Beobachtungsvarianz (d.h., sie bewerten dieselbe Beobachtung unterschiedlich) und die Begriffsvarianz, (d.h., die Interviewer deuten Begriffe anders). Daher sei nach Stieglitz, Ahrens & Freyberger (2001) ein Training der Beurteiler von herausragender Bedeutung.

Die weiter oben beschriebenen Fehlerquellen in Selbstbeurteilungsverfahren gelten auch für Fremdbeurteilungsverfahren (Stieglitz, Ahrens & Freyberger, 2001). Eine weitere Fehlerquelle ist der sog. Mildefehler, der darin besteht, dass bekannte Personen milder eingeschätzt werden als fremde (vgl. Krauth, 1995). Der von Thorndike (1920, in Krauth, 1995) beschriebene Halo-Fehler bedeutet, dass der Beurteiler in seiner Einschätzung nicht objektiv ist, sondern andere Kriterien wie z.B. die äußere Erscheinung oder die Stimme des Patienten in die Beurteilung mit einfließen und somit in die eine oder die andere Richtung verzerren. Es kann auch sein, dass die Beantwortung eines vorangegangenen Items einen Einfluss auf die Beantwortung nachfolgender Items hat. Die Ursache könnte nach Krauth (1995) darin liegen, dass der Urteiler bemüht ist, möglichst gut zueinander passende, konsistente Antworten zu geben.

3.2.2 Interviewverfahren

Als nächstes soll auf die unterschiedlichen Formen von Interviewverfahren eingegangen werden. Diagnostische Interviewverfahren werden nach ihrem Strukturierungsgrad unterschieden in standardisierte, strukturierte, halbstrukturierte und klinische Interviews (Wittchen, Freyberger & Stieglitz, 2001).

Bei standardisierten Interviews ist der gesamte diagnostische Prozess einschließlich der Kodierung der Antworten der Befragten vorgegeben, sie stellen somit die höchste Stufe der Formalisierung des diagnostischen Prozesses dar (vgl. Wittchen, Freyberger & Stieglitz, 2001). Ein Beispiel für ein solches Verfahren ist das Diagnostische Expertensystem für Psychische Störungen (DIA-X, Wittchen & Pfister, 1997). Es ist eigentlich für den Erwachsenenbereich konzipiert, wird aber auch bei Jugendlichen eingesetzt.

Der Vorteil standardisierter Diagnoseverfahren liegt nach Wittchen, Freyberger & Stieglitz (2001) in ihrer vergleichsweise hohen Reliabilität, da sie keine eigenen klinischen Entscheidungen erfordern, sondern die jeweils am besten zutreffende Alternative kodiert wird. Deshalb können sie auch von geschulten Laien bzw. Personen mit geringer klinischer Erfahrung eingesetzt werden. Nachteilig sind jedoch die Notwendigkeit eines vorherigen Trainings und der hohe Zeitaufwand (vgl. Wittchen, Freyberger & Stieglitz, 2001).

Bei strukturierten Interviews sind Fragen, Ablauf und Auswertung vorgegeben. Die Bewertungen erfolgen jedoch nach klinischer Entscheidung, was eine gewisse klinische Erfahrung und ein ausführliches Training unbedingt erforderlich macht. Auch strukturierte Interviews zeichnen sich durch eine hohe psychometrische Güte aus und sollten deshalb laut Wittchen, Freyberger & Stieglitz (2001) bevorzugt werden. Zu den allgemeinen Verfahren gehören für den Bereich des Kindes- und Jugendalters als strukturierte Interviews das Mannheimer Elterninterview (MEI, Esser et al., 1989) sowie das Diagnostische Interview bei psychischen Störungen im Kindes- und Jugendalter (Kinder-DIPS, Unnewehr et al., 1995). International wird häufig das Schedule for Affective Disorders and Schizophrenia for school-age children – Present and Lifetime Version (K-SADS-PL, Delmo et al., 2000) angewandt.

Halbstrukturierte Interviews sind nach Wittchen, Freyberger & Stieglitz (2001) dadurch gekennzeichnet, dass die Fragen zwar vorgegeben sind, ihre Reihenfolge jedoch variabel ist und auch Zusatzfragen, Erläuterungen und Ergänzungen erlaubt sind. Die Auswertung ist nicht festgelegt. Auch der Wortlaut der Fragen muss nicht unbedingt eingehalten werden. Halbstrukturierte Interviews sind eher für den klinischen Alltag geeignet als für Forschungsprojekte, da sie eben aufgrund der weniger starken Strukturierung leider auch weniger objektiv sind (vgl. zusammenfassend Wittchen, Freyberger & Stieglitz, 2001). Auch bei der MADRS handelt es sich um ein halbstrukturiertes Interview (vgl. CIPS, 2005).

Im klinischen Interview werden Symptome und Probleme des Patienten frei exploriert (Wittchen, Freyberger & Stieglitz, 2001). Es handelt sich also um ein freies Gespräch mit einer bestimmten Zielsetzung. Der Ablauf dieses Gespräches wird vom Interviewer individuell gestaltet, was als Vorteil anzusehen ist. Auch die Auswertung ist nicht festgelegt (vgl. Wittchen, Freyberger & Stieglitz, 2001). Die Nachteile freier Interviews liegen einerseits in der Informationsvarianz und andererseits in der Interpretations- oder Beurteilervarianz, d.h., der Befund ist allein vom Urteil des Interviewers abhängig. Somit bestehen hier Fehlerquellen, die zu falschen Diagnosen führen können (vgl. Wittchen, Freyberger & Stieglitz, 2001).

3.3 Überblick über depressionsspezifische Verfahren für Kinder und Jugendliche

An dieser Stelle erfolgt eine kurze tabellarische Zusammenstellung der gängigen diagnostischen Verfahren bei Depressionen im Kindes- und Jugendalter.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3: Überblick über diagnostische Verfahren für depressive Kinder und Jugendliche (Min = Minuten)

Wie aus der Übersicht schnell deutlich wird, gibt es für den Bereich der Verlaufsbeurteilung depressiver Störungen kein Verfahren, dass die gesamte Alterspanne von sechs bis 18 Jahren abdeckt und dabei ökonomisch ist.

3.4 Schlussfolgerungen

Bei der Diagnostik im Kindes- und Jugendalter spielt die Frage danach, wem bei der Gewinnung der diagnostischen Informationen stärker Beachtung geschenkt werden soll, eine besondere Rolle. Schneider (2000) empfiehlt, für die zeitliche Einordnung von Symptomen und bei der Diagnostik von früheren Störungen Elterninformationen stärker zu gewichten. Bei emotionalen Störungen (z.B. Angststörungen, depressive Störungen) sollten die Informationen der Kinder stärker gewichtet werden und bei verhaltensbetonten Störungen (z.B. Aufmerksamkeits- und Hyperaktivitätsstörung, Störung mit oppositionellem Trotzverhalten) sollten wiederum die Elterninformationen stärker gewichtet werden.

Aus den oben beschriebenen Vor- und Nachteilen der diagnostischen Verfahrenstypen lassen sich die folgenden Schlussfolgerungen über das „ideale diagnostische Verfahren“ ableiten:

- Bei der Beurteilung der Befindlichkeit von Kindern sollte den Informationen der Kinder mehr Aufmerksamkeit geschenkt werden, während bei verhaltensbetonten Symptomen die Informationen anderer Personen, wie z.B. der Eltern, stärker gewichtet werden.
- Ein diagnostisches Verfahren sollte 7-stufige Items besitzen, deren Objektivität und Reliabilität durch genaue Itembeschreibungen gewährleistet werden.
- Die theoretische Konzeption des Verfahrens sollte klar sein, d.h., dass es die Kernsymptome der Störung erfassen muss.
- Da Kinder mit depressiven Störungen häufig eine ausgeprägte Verleugnungstendenz aufweisen und große Schamgefühle haben können (vgl. Leitlinien der Deutschen Gesellschaft für Kinder- und Jugendpsychiatrie und ‑psycho-therapie, 2003), sollte die Einbeziehung anderer Urteiler wie Eltern oder Pfleger möglich sein.
- Das Verfahren muss sowohl bei leichter wie auch bei schwerer ausgeprägten Symptomen anwendbar sein.
- Es sollte, um in Wissenschaft und Forschung verwendet werden zu können, eine sehr große Alterspanne umfassen, möglichst sogar auch bis ins Erwachsenenalter hinein anwendbar sein.
- Das Verfahren sollte möglichst keine hohen Anforderungen an das Sprachverständnis stellen und kein Leseverständnis voraussetzen.
- Es sollte sehr differenzierte Aussagen zur quantitativen Symptomausprägung machen können und sich damit als sensitiv für Veränderungen erweisen.
- Außerdem sollte es möglichst wenig zeitlichen Aufwand in der Durchführung und Auswertung verursachen.

Daraus leitet sich die Notwendigkeit für die Entwicklung eines neuen oder aber die Validierung eines bereits vorhandenen Verfahrens ab, das diesen Ansprüchen gerecht wird. In Anbetracht der Vielzahl der bereits bestehenden und in ihren Anwendungsgebieten schon bewährten Verfahren wurde in der Diplomarbeit letztere Option gewählt, nämlich einen bereits etablierten Fragebogen für das Kindes- und Jugendalter zu validieren.

3.5 Zusammenfassung

Im Kapitel 3 wurden die verschiedenen Formen von diagnostischen Verfahren einschließlich ihrer Vor- und Nachteile erläutert. Zuerst wurden Selbst- und dann Fremdbeurteilungsverfahren beschrieben. Anschließend erfolgte ein Überblick über die bereits vorliegenden Verfahren zur Depressionsdiagnostik bei Kindern und Jugendlichen. Aus diesen Ausführungen wurden Schlussfolgerungen darüber gezogen, welche Anforderungen an ein optimales diagnostisches Verfahren zu stellen sind.

4. Entwicklung und Eigenschaften der MADRS

Im Folgenden soll die Entwicklung der MADRS erläutert werden. Weiterhin werden Ergebnisse aus Untersuchungen mit der deutschen MADRS dargestellt und ihrer Gütekriterien angegeben. Neben einem Vergleich mit der CDRS-R soll abschließend auf neuere Entwicklungen eingegangen werden. Zuletzt werden Schlussfolgerungen gezogen, die begründen sollen, warum die MADRS als Instrument für die vorliegende Untersuchung ausgewählt wurde.

Die MADRS ist ein änderungssensitives Fremdbeurteilungsverfahren zur Erfassung depressiver Symptome bei Erwachsenen (vgl. CIPS, 2005). Sie ist nicht geeignet zur Diagnosestellung. Seit ihrer Entwicklung durch Montgomery & Asberg (1979) wird sie zunehmend zur Veränderungsmessung eingesetzt und auch in Richtlinien zur Evaluation von Antidepressiva als Outcome-Kriterium empfohlen (z.B. von der European Agency for the Evaluation of Medical Products; vgl. CIPS, 2005).

Die MADRS besteht aus den folgenden zehn Items, mit denen die Symptome durch den Interviewer beurteilt werden sollen (vgl. CIPS, 2005):

1. Sichtbare Traurigkeit
2. Mitgeteilte Traurigkeit
3. Innere Anspannung
4. Reduzierter Schlaf
5. Reduzierter Appetit
6. Konzentrationsschwierigkeiten
7. Antriebsmangel
8. Gefühl der Gefühllosigkeit
9. Pessimistische Gedanken
10. Suizidgedanken

Die Items werden nach einem eingehenden Interview mit dem Patienten anhand einer 7-stufigen Likert-Skala in den Abstufungen 0-6 beurteilt, wobei die geradzahligen Abstufungen (0, 2, 4, 6) jeweils sprachlich operationalisiert sind. Die einzelnen Items werden durch Symptombeschreibungen und Hinweise zur Exploration spezifiziert (vgl. CIPS, 2005). Nach eingehender Prüfung entschied die Ethikkommission der Charité, dass für jüngere Kinder der Fragebogen anders formuliert sein muss und diese Formulierung eindeutig festgelegt sein soll. Diese Forderung ist theoretisch ungerechtfertigt, da es sich bei der MADRS um ein halbstrukturiertes Verfahren handelt und die Fragen allgemein verändert, ergänzt oder erläutert werden dürfen, um sie den Voraussetzungen des Patienten anzupassen (siehe Kapitel 3.2.2). Dennoch wurde zur Vereinheitlichung und besseren Vergleichbarkeit der Ergebnisse einen „Formulierungsentwurf“ für Patienten zwischen sechs und zehn Jahren erstellt (siehe Anhang), der bei den Patienten aus dieser Altersgruppe auch für die Studie verwendet wurde.

4.1 Entwicklung der MADRS

In diesem Abschnitt wird die Entwicklung der MADRS aus der Comprehensive Psychopathological Rating Scale (CPRS, Asberg et al., 1978) sowie ihre Validierung und ihre spätere Übertragung ins Deutsche dargestellt.

4.1.1 Die CPRS

Die CPRS wurde als ein Instrument konstruiert, das die gesamte Psychopathologie des Patienten abdeckt und dabei sehr sensitiv für Veränderungen in der Symptomausprägung ist. Die Skala besteht aus 64 Items und zwei globalen Einschätzungen, die auf einer vierstufigen Likert-Skala beurteilt werden (vgl. Asberg et al., 1978). Die CPRS wurde so formuliert, dass sie auch von anderen Berufsgruppen des Gesundheitswesens angewandt werden kann. In einer Vergleichsstudie (Montgomery et al., 1978) zur Interrater-Reliabilität wurden die Einschätzungen derselben depressiven Patienten durch englische und schwedische Psychiater, Psychologen und Krankenschwestern miteinander verglichen und erreichten bis auf zwei Ausnahmen immer das Signifikanzniveau. Somit sei laut Montgomery et al. (1978) von einer guten Reliabilität und Robustheit der CPRS auszugehen.

4.1.2 Die Gewinnung der MADRS-Items

In einem zweiten Schritt entwickelten Montgomery & Asberg (1979) aus der CPRS eine Depressionsskala, die besonders sensitiv für die Veränderung der depressiven Symptomatik sein sollte. Dazu wurden 106 Patienten im Alter von 18 bis 69 Jahren aus England und Schweden, die an einer primär depressiven Störung litten, ausgewählt und vor sowie nach einer 4-wöchigen Therapie mit Antidepressiva (Mianserin, Amitriptylin, Maprotilin und Clomipramin) anhand der CPRS beurteilt. Bei 35 Patienten wurde gleichzeitig auch die Hamilton Rating Scale (HRS, Hamilton, 1967) angewandt. Alle Items der CPRS, bei denen mindestens 70% der Patienten über null bewertet wurden (insgesamt 17 Items), wurden zur vorläufigen Schweregradbeurteilung für den Zeitpunkt t1 (Beginn der Behandlung) ausgewählt. Der Summenwert dieser 17 Items wurde auch für den zweiten Zeitpunkt t2 zum Ende der vierwöchigen Behandlung gebildet. Die Summenwerte von t1 und t2 korrelierten signifikant mit dem jeweiligen HRS-Wert (rt1 = .61 und rt2 = .94).

Um die Items zu ermitteln, die besonders änderungssensitiv waren, wurde erstens die durchschnittliche Änderung im absoluten Wert jedes einzelnen Items berechnet und zweitens diese durchschnittliche Itemwertveränderung mit der Veränderung aller 17 Items zusammen (also dem Gesamtwert) korreliert. Idealerweise sollten änderungssensitive Items sich dadurch auszeichnen, dass sich ihr Wert nach der vierwöchigen Behandlung stark verändert und diese Veränderung auch hoch mit der Gesamtveränderung korreliert. Beispielsweise änderte sich der Wert im Item reduziertes sexuelles Interesse sehr stark, was aber nicht mit einer gleichzeitigen Verbesserung der depressiven Symptome insgesamt zusammenhing. Die Patienten waren also weiterhin depressiv, auch wenn ihr sexuelles Interesse wieder zunahm. Da dieses Item demnach nicht änderungssensitiv war, wurde es aus der Skala entfernt. Insgesamt wurden die zehn änderungssensitivsten Items für die neue Skala ausgewählt.

4.1.3 Die Validierung der englischen MADRS

Zur Berechnung der Interrater-Reliabilität führten bei 35 Patienten jeweils zwei Therapeuten gemeinsam das Interview durch. Die Therapeuten beurteilten die Patienten anhand der neuen Skala und der HRS. Die Korrelationen der Einschätzungen beider Beurteiler fielen mit r = .89 bis r = .97 befriedigend aus (vgl. Montgomery & Asberg, 1979).

Zur Überprüfung, ob auch tatsächlich depressive Symptome erfasst wurden, wurde von einem unabhängigen Experten eine Stichprobe von 18 Patienten, die auf die Antidepressiva-Therapie angesprochen hatten (sog. Responder) und 19 Non-Respondern untersucht. Der Experte sollte beurteilen, ob die Patienten geheilt oder nicht geheilt sind. Dieses Expertenurteil wurde per punktbiserialer Korrelation mit dem Änderungswert verglichen. Die Korrelationen waren signifikant.

Somit konnte statistisch nachgewiesen werden, dass die neu entwickelte Skala änderungssensitiv ist, ihre Durchführung objektiv ist und Veränderungen in der depressiven Symptomatik reliabel erfasst werden.

4.1.4 Die deutsche MADRS

Die erste Veröffentlichung einer deutschen Untersuchung der MADRS stammt von Maier & Philipp (1985). In ihrer Querschnittuntersuchung verglichen sie die HAMD mit der MADRS und der Bech Rafaelsen Melancholia Scale (BRMS, Rafaelsen et al., 1980).

Als Vorteile von MADRS und BRMS gegenüber dem HAMD wurden folgende Aspekte genannt (vgl. Maier & Philipp, 1985): Die Kategorien sind präziser beschrieben; die Items sind darauf reduziert, nur die wichtigsten Symptome des depressiven Syndroms zu erfassen; die Skalen sind kürzer (MADRS: 10 Items, BRMS: 11 Items); Items, die somatische Beschwerden erfassen, wurden reduziert.

Für ihre Untersuchung verglichen die Autoren die Werte im HAMD, BRMS und MADRS bei 151 Patienten zwischen 20 und 60 Jahren, die an einer Depression erkrankt waren. Die drei Fragebögen wurden anhand folgender Kriterien verglichen: Diskriminationsstärke, Verteilung der Summenwerte, interne Konsistenz, Inhaltsvalidität, Homogenität und Bedeutungsinvarianz. Bezüglich der internen Konsistenz (Cronbachs a), der Homogenität (Homogenitätskoeffizient von Loevinger) und der Diskriminationsstärke der Items waren MADRS und BRMS der HAMD überlegen, wobei die BRMS etwas besser abschnitt. Um eine bessere Anpassung an das Rasch-Modell zu erreichen, schlugen die Autoren vor, das Item 4 der MADRS (reduzierter Schlaf) zu entfernen.

4.2 Die erste Untersuchung der deutschen MADRS

Die erste Veröffentlichung der MADRS als deutsches Fragebogenverfahren erfolgte 1988 durch Schmidtke und Mitarbeiter. Ziel ihrer Untersuchung war herauszufinden, ob sich die deutsche MADRS für Verlaufstudien eignet, also genügend änderungssensitiv ist und von verschiedenen Berufsgruppen angewandt werden kann, ohne an Reliabilität und Validität einzubüßen.

Dazu wurden erstens in einer Querschnittuntersuchung 21 Patienten von verschiedenen Psychiatern, Psychologen und Psychiatriefachschwestern/-pflegern insgesamt 97-mal bezüglich ihrer depressiven Symptomatik beurteilt.

Außerdem wurde zweitens die Videoaufnahme eines MADRS-Interviews einer depressiven Patientin mehreren Psychiatern, Psychologen und Studenten sowie Psychiatriefachschwestern/-pflegern zur Beurteilung anhand der MADRS vorgelegt, um berufsgruppenspezifische Beurteilungsunterschiede zu erfassen.

Weiterhin wurde drittens die Interrater-Reliabilität zwischen verschiedenen Berufsgruppen über den Verlauf der Behandlung überprüft, indem bei 24 Patienten zu festgelegten Zeitpunkten durch den behandelnden Psychiater und eine Krankenschwester bzw. einen Krankenpfleger der MADRS-Wert erhoben wurde.

Viertens wurde die inhaltliche Validität überprüft, indem 57 Patienten sowohl mit der MADRS als auch mit der HAMD vor Behandlungsbeginn beurteilt wurden und die Korrelationen der Itemwerte per Hauptachsenfaktorenanalyse verglichen wurden. Außerdem wurde die Übereinstimmungsvalidität zwischen Ärzten und Pflegepersonal bei der Verlaufsbeurteilung berechnet (vgl. Schmidtke et al.,1988).

Die Übereinstimmungskoeffizienten der MADRS-Profile über verschiedene Berufsgruppen waren im Mittel sehr hoch. Die schlechtesten Werte erzielte das erste Item (sichtbare Traurigkeit). Beim Vergleich der berufsgruppenspezifischen Übereinstimmungen zeigte sich, dass das Pflegepersonal signifikant niedrigere MADRS-Werte vergab als die Ärzte. Dies zeigte sich besonders bei Item 9 (pessimistische Gedanken). Auch die geschlechtsspezifischen Beurteilungsunterschiede waren signifikant, aber nur sehr klein und damit nicht praktisch relevant. Bei der Verlaufsbeurteilung der depressiven Symptomatik waren MADRS und HAMD gleich gut. In der Faktorenanalyse zeigte sich, dass die MADRS keine einheitliche Skala darstellt, sondern aus vier Faktoren besteht, die die Autoren folgendermaßen benannten: 1) Traurigkeit/pessimistische Gedanken (Items 1, 2, 10); 2) innere Spannung (Item 3); 3) Gefühllosigkeit (Items 7 und 8) und 4) Appetitverlust (Item 5).

In ihrer Untersuchung konnten Schmidtke et al. (1988) also nachweisen, dass die MADRS nicht nur ökonomisch und praktikabel, sondern auch änderungssensitiv ist und eine genügend hohe Übereinstimmungsvalidität besitzt. Die Autoren geben jedoch zu bedenken, dass die MADRS anders als die HAMD vorrangig psychische Symptome erfasst und somit zumindest z.T. etwas anderes misst als die HAMD. Es wird außerdem betont, dass der Beurteilungszeitraum explizit festgelegt und dessen Einhaltung überprüft werden sollte. Um die berufsgruppenspezifischen Beurteilungsunterschiede zu minimieren, empfehlen die Autoren dringend ein Beurteilertraining.

4.3 Gütekriterien der MADRS

Die folgenden Angaben zu den Testgütekriterien der MADRS wurden der CIPS (2005) entnommen.

4.3.1 Objektivität

Die Durchführungsobjektivität der MADRS ist durch ihre klare Operationalisierung und die Erläuterungen sowohl zum Inhalt der Items als auch den sprachlichen Erläuterungen zu den einzelnen Antwort-Abstufungen gegeben.

Die Auswertungsobjektivität wird gewährleistet, weil lediglich ein Summenscore zu bilden ist. Für die Interpretation des Gesamtwertes liegen Cut-Off-Werte vor (CIPS, 2005); diese sind jedoch nicht vom Erwachsenenalter auf das Kindes- und Jugendalter übertragbar. Die Beurteilerübereinstimmung liegt zwischen rS = .82 bis rS = .87[6] bei Neumann & Schulte (1988, in CIPS, 2005) und bei Maier et al. (1988; in CIPS, 2005) zwischen ICC = .66 bis ICC = .82[7].

4.3.2 Reliabilität

Die interne Konsistenz (berechnet mit Cronbachs a) lag in der Studie von Maier & Philipp (1985) bei a = .86. Zur Retest-Reliabiliät liegen laut CIPS (2005) bisher keine Ergebnisse vor. Die Trennschärfekoeffizienten (Item-Gesamtwert-Korrelation) reichten von rit = .52[8] für das Item reduzierter Schlaf bis rit = .75 für die Items berichtete Traurigkeit und Gefühl der Gefühllosigkeit (Neumann & Schulte, 1988)

[...]


[1] Wenn in der Arbeit von „den Patienten“ gesprochen wird, sind selbstverständlich auch die Patientinnen gemeint.

[2] Gemeinsam auftretende Erkrankungen werden als „komorbide“ bezeichnet.

[3] Reizbarkeit

[4] rhythmische, monotone Kopfbewegungen wie etwa Schaukeln, Wiegen oder Wippen

[5] Engl.: Beurteiler, Anm. d. Verf.

[6] rS = Rangkorrelation nach Spearman

[7] ICC = Intraclass-Korrelation

[8] rit = Korrelation von Item und Test

Details

Seiten
96
Erscheinungsform
Originalausgabe
Jahr
2007
ISBN (eBook)
9783836619615
Dateigröße
658 KB
Sprache
Deutsch
Katalognummer
v226160
Institution / Hochschule
Humboldt-Universität zu Berlin – Mathematisch-Naturwissenschaftliche Fakultät, Institut für Psychologie
Note
1,0
Schlagworte
depression kindesalter jugendalter madrs validierung

Autor

Teilen

Zurück

Titel: Validierung der deutschen Montgomery Asberg Depression Rating Scale (MADRS) für das Kindes- und Jugendalter