Kommentar: Evidence-based oder eminence-based? Über Wissenschaft, Erfahrung und die Suche nach dem Gleichgewicht in der psychologischen Diagnostik

In der gegenwärtigen Psychologie, insbesondere in der psychologischen Diagnostik, begegnet uns immer häufiger der Begriff evidence-based – die Forderung, dass unsere Verfahren durch empirische Belege gestützt sein sollen. Diese Forderung ist legitim und wichtig. Zugleich existiert ein zweiter Pol, der bisweilen, nicht ohne Ironie, als eminence-based bezeichnet wird: eine Praxis, die auf der Autorität, der Erfahrung und der persönlichen Überzeugung anerkannter Fachleute beruht. Die Frage, die ich stellen möchte, lautet: Müssen diese beiden Ansätze zwangsläufig einander gegenüberstehen?

Was der evidence-based Ansatz bedeutet

Den Begriff evidence-based medicine (EBM) führte Anfang der 1990er-Jahre Gordon Guyatt ein; maßgeblich weiterentwickelt wurde er vor allem von David Sackett. In der ursprünglichen Definition beruht EBM nicht allein auf empirischen Daten – gemeint ist vielmehr die Integration dreier Komponenten: der besten verfügbaren Evidenz, der klinischen Expertise sowie der Werte und Präferenzen der Patientin oder des Patienten. Gerade diese Definition ist wichtig, weil sie zeigt, dass klinische Erfahrung aus dem evidence-based Ansatz nicht ausgeschlossen wird, sondern einen integralen Bestandteil bildet. In Debatten wird dieser Umstand jedoch häufig übergangen.

Im Kontext der psychologischen Diagnostik bedeutet der evidence-based Ansatz vor allem, Instrumente mit nachgewiesener Validität und Reliabilität einzusetzen, Ergebnisse auf der Grundlage normativer Daten und empirisch gesicherter Zusammenhänge zu interpretieren, Basisraten zu berücksichtigen und mit Konzepten wie inkrementeller Validität und klinischem Nutzen zu arbeiten. All das sind vernünftige und wünschenswerte Anforderungen.

Was der eminence-based Ansatz bedeutet

Die Bezeichnung eminence-based entstand als kritische Parodie auf eine traditionelle Praxis, in der über die Richtigkeit eines Vorgehens die Autorität erfahrener Fachleute entschied und nicht systematisch erhobene Daten. In der Medizin kursiert die sarkastische Definition, eminence-based practice bedeute, „dieselben Fehler mit wachsender Gewissheit über eine beeindruckende Zahl von Jahren hinweg zu machen“. Diese Formulierung ist pointiert, aber einseitig.

In der psychologischen Diagnostik sollten wir genauer differenzieren. Was als eminence-based Ansatz bezeichnet wird, kann zwei grundlegend verschiedene Formen annehmen. Auf der einen Seite stehen unbegründete Behauptungen von Autoritäten, die durch Tradition weitergegeben und für wahr gehalten werden, weil anerkannte Persönlichkeiten sie vertreten – das ist tatsächlich problematisch und verdient Kritik. Auf der anderen Seite steht jedoch etwas grundsätzlich anderes: authentische klinische Erfahrung, systematisch aufgebaut und fortlaufend korrigiert, die eine Form der Erkenntnis darstellt, die sich in standardisierten Forschungsdesigns nicht vollständig abbilden lässt.

Was Wissenschaft ist und wo ihre Grenzen liegen

Um sinnvoll über den evidence-based Ansatz sprechen zu können, müssen wir zunächst fragen, was „Evidenz“ eigentlich bedeutet. In den Naturwissenschaften, in denen das Konzept des evidence-based Ansatzes entstanden ist, hat der Evidenzbegriff relativ klare Konturen: ein beobachtbares und messbares Phänomen, ein wiederholbares Experiment, eine falsifizierbare Hypothese. Wissenschaft schreitet in dieser Auffassung, wie Karl Popper sie formulierte, durch systematische Versuche zur Widerlegung von Hypothesen voran; was sich nicht widerlegen lässt, wird vorläufig als gültig akzeptiert.

Die Psychologie befindet sich jedoch in einer anderen epistemologischen Situation. Ihr Gegenstand – die menschliche Psyche – ist nicht direkt beobachtbar, nicht stabil messbar und nicht vollständig reproduzierbar. Psychische Phänomene sind kontextgebunden, werden durch den Akt der Beobachtung selbst beeinflusst, und ihr Verständnis bedient sich anderer kognitiver Operationen als die Erkenntnis materieller Objekte. Bereits Wilhelm Dilthey unterschied Ende des 19. Jahrhunderts zwischen Erklären, das den Naturwissenschaften eigen ist, und Verstehen, das den Geisteswissenschaften zugehört. Die psychologische Diagnostik bewegt sich an der Schnittstelle beider: Sie verwendet standardisierte Instrumente und statistische Verfahren (Erklären), verlangt aber zugleich die Fähigkeit, die einzigartige Geschichte eines konkreten Menschen zu verstehen (Verstehen).

Die gegenwärtige Wissenschaftsphilosophie weiß zudem, dass auch die Naturwissenschaften nicht so „hart“ sind, wie einst angenommen. Thomas Kuhn hat gezeigt, dass wissenschaftlicher Fortschritt keine lineare Kumulation von Fakten ist, sondern sich in Paradigmenwechseln vollzieht, bei denen sich der Rahmen selbst verändert, innerhalb dessen Fakten ihre Bedeutung erhalten. Michael Polanyi führte den Begriff des impliziten Wissens (tacit knowledge) ein – wir wissen mehr, als wir sagen können – und zeigte, dass auch in den Naturwissenschaften die persönliche Erkenntnis des Wissenschaftlers, seine Intuition und seine Fähigkeit, Muster zu erkennen, die nicht explizit formuliert sind, eine wesentliche Rolle spielen. In der psychologischen Diagnostik ist implizites Wissen in noch stärkerem Maße präsent.

Darüber hinaus müssen die methodologischen Einschränkungen bedacht werden, die dem empirischen Forschen in der Psychologie inhärent sind. Experimentelle und korrelative Studien arbeiten mit Mittelwerten und Tendenzen in Populationen. Ergebnisse wie „Test X hat eine Validität von r = 0,45 gegenüber Kriterium Y“ sagen uns etwas Wichtiges über den statistischen Zusammenhang zweier Variablen, bestimmen aber für sich genommen nicht, wie das konkrete Profil eines einzelnen Menschen zu interpretieren ist. Psychologische Diagnostik arbeitet an der Schnittstelle von nomothetischem und idiographischem Ansatz: Sie nutzt allgemeine Gesetzmäßigkeiten, wendet sie aber auf den einzigartigen Einzelfall an. Und genau in diesem Schritt – im Übergang vom Allgemeinen zum Individuellen – kommt das klinische Urteil auf eine Weise zum Tragen, die sich nicht vollständig algorithmisieren lässt.

Warum diese Ansätze nicht gegeneinander stehen

Wenn wir uns vollständig und ausschließlich auf das beschränken, was unwiderlegbar empirisch belegt ist, stoßen wir in der Diagnostik an Grenzen. Diagnostik ist mehr als die mechanische Anwendung handwerklicher Verfahren. Das Erlernen eines Testmanuals – der Administrationsanweisungen, der Auswertungsregeln, der Normtabellen – ist eine unverzichtbare Grundlage, reicht aber allein nicht aus. Ebenso wenig wie die Kenntnis von Notenschrift und Harmonielehre jemanden zur Interpretin oder zum Interpreten macht, genügt die Kenntnis eines Manuals, um einem Test alle Informationen zu entlocken, die er bieten kann.

Im diagnostischen Prozess spielt die Persönlichkeit der Diagnostikerin oder des Diagnostikers eine wesentliche Rolle: die Fähigkeit, zur untersuchten Person Kontakt herzustellen, die Sensibilität für Nuancen ihres Verhaltens und die Fähigkeit, heterogene Informationen zu einem kohärenten Ganzen zu integrieren. Dieser Aspekt diagnostischer Arbeit ist weder weniger wissenschaftlich noch antiwissenschaftlich – es handelt sich um eine andere Form der Erkenntnis, die sich vor allem durch die Vermittlung erfahrener Kolleginnen und Kollegen, durch systematische Praxis unter Supervision und durch kontinuierliche Selbstreflexion herausbildet.

In der psychologischen Diagnostik gibt es ein umfangreiches nicht kodifiziertes Wissen – Erfahrungen und Haltungen, die nicht in Manualen festgehalten sind, aber im Rahmen von Ausbildung und Supervision weitergegeben werden. Dieses Wissen umfasst etwa die Fähigkeit zu erkennen, wann ein formales Testergebnis irreführend ist, die Kunst, während der Administration gezielte Fragen zu stellen, und das Gespür dafür, was qualitative Aspekte der Leistung zeigen. Es handelt sich um eben jenes implizite Wissen im Sinne Polanyis: Die Diagnostikerin weiß mehr, als sie explizit formulieren kann. Ohne diese Schicht bleibt Diagnostik verarmt.

Über Unsicherheit, Gewissheit und professionelle Entwicklung

Es muss noch ein weiteres Phänomen benannt werden, das mit dieser Thematik zusammenhängt. Ein gewisses Maß an Unsicherheit ist ein natürlicher Bestandteil diagnostischer Arbeit – und zwar auf allen Stufen professioneller Entwicklung. In den frühen Phasen der Berufslaufbahn ist diese Unsicherheit naturgemäß intensiver und kann das Bedürfnis wecken, Halt in etwas zu suchen, das ein Gefühl von Eindeutigkeit und Gewissheit vermittelt. Der evidence-based Ansatz kann dann nicht nur als methodologischer Rahmen attraktiv erscheinen – was völlig berechtigt wäre –, sondern auch als Versprechen, diagnostische Arbeit von Mehrdeutigkeit befreien zu können.

Diese Tendenz lässt sich mit Verständnis betrachten. In einer Situation, in der eine Diagnostikerin oder ein Diagnostiker noch nicht über ausreichende Rückmeldung aus der eigenen klinischen Praxis verfügt, ist es nur natürlich, Gewissheit in dem zu suchen, was als „belegt“ gilt. Problematisch wird es jedoch, wenn die Forderung nach Evidenz in eine Forderung nach absoluter Gewissheit umschlägt – wenn also keine Schlussfolgerung gezogen werden soll, die sich nicht durch unwiderlegbare Belege stützen lässt. Ein solcher Ansatz lähmt den diagnostischen Prozess, weil absolute Gewissheit in der Psychologie in der Regel nicht verfügbar ist.

Psychologie ist nicht Physik. Unsere Erkenntnisse sind häufig probabilistisch, kontextabhängig und kulturell mitbedingt. Die Reife einer Diagnostikerin zeigt sich nicht in der Abwesenheit von Unsicherheit, sondern in der Fähigkeit, mit ihr zu arbeiten: Hypothesen zu formulieren, sie zu überprüfen, alternative Erklärungen zuzulassen und dennoch zu klinisch nützlichen Schlussfolgerungen zu gelangen. Paradoxerweise spricht gerade die Fähigkeit, Unsicherheit auszuhalten, für professionelle Reife – nicht für unkontrollierte Subjektivität.

Zugleich muss auch das entgegengesetzte Risiko benannt werden: ein übermäßiges Vertrauen in den eigenen klinischen Eindruck, das die Grenze vom berechtigten klinischen Urteil zu dem überschreitet, was man als „Eindruckologie“ bezeichnen könnte – eine Diagnostik, die auf Eindrücken beruht, ohne Reflexion, ohne Überprüfung und ohne Bereitschaft, den eigenen Befund einer Kritik zu unterziehen. Wie bereits Paul Meehl hervorhob, ist das klinische Urteil anfällig für Bestätigungsfehler (confirmation bias): Wir neigen dazu, Informationen zu beachten, die unsere anfängliche Hypothese bestätigen, und jene zu übersehen, die ihr widersprechen. Klinische Erfahrung hat dann Wert, wenn sie systematisch aufgebaut, durch Rückmeldung korrigiert und in Kontakt mit dem aktuellen Wissensstand des Faches gehalten wird.

Beispiel: der Menschzeichentest

Die Spannung zwischen evidence-based und eminence-based Ansatz lässt sich gut am Menschzeichentest (Draw-a-Person Test, DAP) veranschaulichen. Dieses Verfahren hat in der Psychodiagnostik eine lange Tradition – seine Anfänge gehen auf die Arbeit von Florence Goodenough in den 1920er-Jahren zurück; später wurde es von Karen Machover als projektive Technik zur Persönlichkeitsbeurteilung weiterentwickelt.

Die empirische Forschung liefert zum Menschzeichentest gemischte Ergebnisse. Als Entwicklungstest des grafischen Ausdrucks, also als Instrument zur Beurteilung der kognitiven Reife von Kindern anhand des Vorhandenseins, der Proportionen und der Details der Körperteile in der Zeichnung, weist er eine gewisse Validität auf, allerdings mit Einschränkungen, etwa durch Deckeneffekte bei älteren Kindern oder durch den Einfluss des sozioökonomischen Hintergrunds und früherer Zeichenerfahrung. Als Persönlichkeitstest – also als projektive Technik in der Tradition Machovers – ist seine Validität dagegen unzureichend belegt. Die Forschung zeigt wiederholt, dass die Verknüpfung bestimmter Zeichenmerkmale mit Persönlichkeitseigenschaften nur auf einer schwachen empirischen Grundlage beruht und von illusorischen Korrelationen beeinflusst sein kann, wie Chapman und Chapman bereits in ihrer klassischen Arbeit gezeigt haben.

Und dennoch: Eine erfahrene Diagnostikerin kann aus einer Zeichnung Informationen gewinnen, die klinischen Wert haben – nicht als isolierte Beweise, sondern als Teil eines größeren Mosaiks diagnostischer Daten. Eine Zeichnung kann Hypothesen generieren, die anschließend mit anderen Instrumenten überprüft werden. Sie kann qualitative Aspekte offenbaren – die Herangehensweise der untersuchten Person an die Aufgabe, das Ausmaß der investierten Anstrengung, Anzeichen von Angst oder Desorganisation –, die standardisierte Fragebögen nicht erfassen. Ihr inkrementeller Wert, also ihr möglicher Mehrwert gegenüber Informationen aus anderen Quellen, kann beträchtlich sein – allerdings nur unter der Voraussetzung, dass die Diagnostikerin auf der Zeichnung keine grundlegenden Schlussfolgerungen aufbaut und nicht versucht, ihr mehr abzuringen, als sie tatsächlich bieten kann.

Gerade hier zeigt sich, warum die Dichotomie evidence-based versus eminence-based zu vereinfachend ist. Eine strikt evidence-based Position würde dazu führen, den Menschzeichentest als Instrument der Persönlichkeitsdiagnostik abzulehnen. Eine rein eminence-based Position würde es erlauben, der Zeichnung eine Aussagekraft zuzuschreiben, die sie empirisch nicht besitzt. Eine umsichtige Diagnostikerin bewegt sich zwischen beiden Polen: Sie kennt die Grenzen der Methode, verzichtet aber nicht auf die Informationen, die ihr die Methode in einem begrenzten, reflektierten Rahmen liefern kann.

Die Diagnostikerin als Instrument

Gute psychologische Diagnostik erfordert beides: Respekt vor empirischer Evidenz und eine ausgereifte klinische Kompetenz. Der evidence-based Ansatz sagt uns, welche Instrumente wir einsetzen und welche Schlussfolgerungen empirisch gestützt sind. Klinische Erfahrung sagt uns, wie wir diese Instrumente im Kontext eines lebendigen Menschen einsetzen – mit seiner Geschichte, seiner Motivation, seinen Abwehrmechanismen und seiner aktuellen Lebenssituation.

In der psychologischen Diagnostik ist das wichtigste Instrument die Diagnostikerin selbst – ihre professionelle Identität, ihre Persönlichkeit, ihre ethische Haltung und ihre Fähigkeit zur Selbstreflexion. Empirische Evidenz ist das unverzichtbare Korrektiv, das verhindert, dass das klinische Urteil in Eindruckologie umschlägt. Klinische Erfahrung ist das unverzichtbare Korrektiv, das verhindert, dass Diagnostik zur mechanischen Verarbeitung von Zahlen ohne Verständnis für den Menschen wird.

Eine wirklich gute Diagnostikerin ist nicht jemand, der sich starr an einen Pol klammert. Sie ist vielmehr jemand, der beide Ansätze zu integrieren vermag – der weiß, wo die Evidenz endet und das klinische Urteil beginnt, und der sich zugleich bewusst ist, wo das klinische Urteil endet und die Eindruckologie beginnt. Zwischen diesen Grenzen liegt der Raum, in dem sich die eigentliche diagnostische Arbeit vollzieht.

Die Angaben zum Menschzeichentest sind bewusst vereinfacht; für eine detailliertere Orientierung zu den psychometrischen Eigenschaften dieses Instruments sei auf die einschlägige Fachliteratur verwiesen.