Basler Fairness Fragebogen (BFF): Erlebte Fairness der Begutachtung

Timm Rosburg1, Regine Lohss1, Monica S. Bachmann1, Brigitte Walter Meyer1, Wout de Boer1, Katrin Fischer 2, Regina Kunz1

¹EbIM, Forschung & Bildung, Departement Klinische Forschung, Universitätsspital Basel

²Institut Mensch in Komplexen Systemen, Hochschule für Angewandte Psychologie Nordwestschweiz, Olten

Ein Mann füllt einen Fragebogen aus
Gesuchsteller erleben mitunter die Interaktion mit dem medizinischen Gutachter als nicht von Respekt und Vertrauen geprägt. Ob dies ein verbreitetes Phänomen ist oder nur einzelne Gutachter betrifft, ist offen. Bislang mangelte es an entsprechenden Erhebungsinstrumenten hierzu. Hier berichten wir über die Entwicklung des Basler Fairness Fragebogens (BFF). Dieser erhebt, wie Gesuchsteller die Interaktion mit dem Gutachter erleben. Der BFF kann in Begutachtungssituationen zur Qualitätssicherung beitragen.

Einleitung

In der Schweiz wird im Rahmen von Anträgen auf Leistungen der Invalidenversicherung (IV) die verbleibende Arbeitsfähigkeit der Antragssteller häufig durch medizinische Gutachter eingeschätzt. Dies ist notwendig, da sich die verbleibende Arbeitsfähigkeit nicht ohne Weiteres aus der medizinischen Aktenlage erschliesst. Die verbleibende Arbeitsfähigkeit ist aber eine wichtige Grösse, unter deren Zuhilfenahme die kantonalen IV-Stellen den Grad der Invalidität von Antragstellern bestimmen und die Höhe einer Rente ermitteln. Leider ist die Beurteilung der verbleibenden Arbeitsfähigkeit, insbesondere bei psychiatrischen Begutachtungen, stark von der Einschätzung des medizinischen Gutachters abhängig und Gutachter können bei gleicher Sachlage zu recht unterschiedlichen Beurteilungen kommen [1, 2]. Deutliche Unterschiede in der durchschnittlichen Einstufung der Arbeitsfähigkeit zwischen den medizinischen Abklärungsstellen liessen zudem eine Skepsis hinsichtlich der distributionalen Fairness der Begutachtung aufkommen [3].

Im Februar 2020 richtete Inclusion Handicap als Dachverband von Behindertenorganisationen eine Meldestelle für Gesuchsteller ein, die sich als Willkür-Opfer bei Gutachten empfinden [4]. Nach sieben Monaten hatten 256 Gesuchsteller die Meldestelle genutzt und Rückmeldung zu ihrer Begutachtung gegeben. Hierbei wurde auch Kritik an dem Verhalten der Gutachter gegenüber den Versicherten laut: So bemängelten zwei Drittel der Gesuchsteller ein schlechtes Gesprächsklima. Mehr als die Hälfte beklagte, der Gutachter hätte ihnen nicht richtig zugehört [5]. Aspekte der genannten Art werden der interaktiven Fairness zugerechnet [6].

Während die absoluten Beschwerdezahlen darauf hindeuten, dass es nicht vereinzelte Gesuchsteller sind, welche die Begutachtung als unfair wahrnehmen, bleibt bei dieser Art der Erhebung offen, wie hoch deren prozentualer Anteil ist. Es bleibt zudem offen, ob solche Missstände bei bestimmten Gutachtern, Fachdisziplinen oder Begutachtungsstellen vermehrt auftreten. Weiter mag man gegen die Daten einer solchen Meldestelle einwenden, dass das naturgemäss überwiegend negative Feedback insbesondere den Gutachtern gegenüber unfair ist, die sich nach bestem Wissen und Gewissen um eine faire Begutachtung bemühen. Reklamationszahlen bei den Versicherern könnten prinzipiell eine repräsentativere Datenbasis als die Daten einer solchen Meldestelle bereitstellen, jedoch werden diese Daten nicht veröffentlicht und zudem würden auch sie wiederum eine Negativauswahl darstellen.

Um interaktive Fairness in der Begutachtung, differenziert in Längs- oder Querschnittsuntersuchungen, bewerten zu können, braucht es zuallererst ein entsprechendes Erhebungsinstrument. Als wir 2014 anfingen, uns mit der Thematik erlebter Fairness auseinanderzusetzen, gab es keinen Fragebogen oder ein anderes Instrument, das geeignet gewesen wäre, Facetten erlebter Fairness in der Begutachtung zu erfassen. Es gab einen australischen Fragebogen, der darauf abzielte, die von Patienten erlebte Fairness mit unterschiedlichen Entschädigungssystemen nach Verletzungen zu bestimmen [6]. Ausserdem hatte der niederländische Leistungsträger für Arbeitnehmerversicherungen UWV einen Fragebogen zur Beurteilung der Gesprächsführung des Gutachters aus Patientensicht entwickelt, der jedoch stark auf Aspekte der niederländischen UWV referenzierte [7]. Letzterer diente uns als Vorlage für die Entwicklung eines eigenen Fragebogens. Der geplante Fragebogen sollte in der Lage sein, in handhabbarer Form unterschiedliche Facetten erlebter Fairness abzubilden, und testtheoretischen Gütekriterien genügen. Wir fassen hier die Entwicklung des Basler Fairness Fragebogens (BFF) einschliesslich seiner Validierung zusammen. Detailinformationen finden sich in der kürzlich hierzu veröffentlichten Originalpublikation [8]. In der Diskussion der Befunde werden wir auf ein weiteres wichtiges Thema eingehen. Um das Problem unfairer Begutachtungen quantitativ zu erfassen, zu spezifizieren, zuzuordnen und letztendlich durch geeignete Qualitätssicherungsmassnahmen zu reduzieren, braucht es neben geeigneten Erhebungsinstrumenten selbstverständlich auch repräsentative Datenerhebungen mittels solcher Erhebungsinstrumente. Obwohl solche systematischen Datenerhebungen prinzipiell leicht durchführbar wären, erfolgen sie aktuell nicht.

Methodik

Ausgangspunkt für die Entwicklung des BFF war der erwähnte Fragebogen der niederländischen UWV [7]. Dieser wurde ins Deutsche übersetzt und an das schweizerische System angepasst. Unter Einbezug einer Expertengruppe von sechs Gutachtern (einschliesslich zweier Autoren) wurden die Fragen anschliessend teilweise erheblich modifiziert, der Pool an Fragen gekürzt, aber auch durch andere Fragen ergänzt. Eine Fragebogenversion mit 29 Fragen wurde an über 40 Patienten in Hinblick auf Verständlichkeit und Akzeptanz pilotiert und anschliessend überarbeitet [9]. Entstanden ist so eine Version mit 30 Fragen. Diese Fragen ordneten vier Experten iterativ verschiedenen Themenbereichen zu, bis ein Konsens erreicht wurde. Diese vier Themen waren a) Respekt und Vertrauen, b) Interviewführung, c) Fallvertrautheit und d) Transparenz. Die einzelnen Fragen liessen durch einfaches Ankreuzen jeweils vier Antwortmöglichkeiten zu, wie beispielhaft in Abbildung 1 dargestellt, vereinzelt ergänzt durch eine fünfte Option („Kann ich nicht sagen“). Die vier Antwortmöglichkeiten wurden numerisch von 1 bis 4 erfasst. Hohe Werte spiegeln eine hohe Fairness wider, der Maximalwert im BFF beträgt 4.

Grafik_BFF_d.png, Artikel BFF für SuvaMedical
Abbildung 1: Beispiel für eine Frage des BFF

Die Validierungsstudie wurde von der Ethikkommission Nordwest- und Zentralschweiz genehmigt (EKNZ 2014-050). Im Rahmen dieser Studie wurde der BFF durch 11 an den Kontext der Begutachtung angepasste Fragen des "Kölner Patientenfragebogens" [10] ergänzt, darunter fünf Fragen zum Vertrauen der Gesuchsteller in die Gutachter und sechs Fragen zum inadäquaten Verhalten der Gutachter gegenüber den Gesuchstellern, sowie durch fünf Fragen zur generellen Lebenszufriedenheit, der "Satisfaction With Life Scale" (SWLS) entnommen [11]. Die Validierung des BFF erfolgte an vier Begutachtungsstellen, nämlich der asim (Basel), dem Zentrum für medizinische Begutachtung (Basel), dem BEGAZ (Binningen) und der MEDAS Zentralschweiz (Luzern). Hierbei wurde der Fragebogen von der jeweiligen Begutachtungsstelle an Gesuchsteller verschickt. Da der Fragebogen nur auf Deutsch vorlag, wurden nur Gesuchsteller mit hinreichenden Deutschkenntnissen eingeschlossen. Die Administration der Begutachtungsstellen informierte alle potentiellen Studienteilnehmer im Vorfelde der Begutachtung über die Studie. Im Anschluss an ihre Begutachtung hatten die Gesuchsteller die Möglichkeit den Fragebogen auszufüllen. Die Teilnahme an der Studie war freiwillig. Die Teilnehmer retournierten den anonymen Fragebogen an die Begutachtungsstelle oder direkt an die durchführende Studiengruppe der Universität Basel. Von Nicht-Teilnehmern wurden keine Daten erfasst.

Die Fragebogendaten wurden einer Faktorenanalyse unterzogen. Dieses Verfahren erlaubt es, aufgrund der Zusammenhänge im Antwortverhalten hinsichtlich der einzelnen Items auf zugrundeliegende Dimensionen (im Fachbegriff «latente Variablen») zu schliessen. Wenn also jeweils die Fragen A, B und C gemeinsam hohe oder gemeinsame niedrige Zustimmungen erfahren (nicht aber die Fragen D, E und F), so würde man annehmen, dass diese eine gemeinsame latente Variable abbilden. Zudem wurden über Korrelationsanalysen die Zusammenhänge zwischen dem Antwortverhalten im BFF und dem Antwortverhalten auf die angepassten Fragen des Kölner Fragebogens [10] und der SWLS [11] untersucht. Bei der Korrelationsanalyse wird, auch als Vorstufe zur Faktorenanalyse, bestimmt, ob zwei Fragen (oder Variablen) gemeinsam hohe oder gemeinsam niedrige Ausprägungen haben. Korrelationswerte (kurz r) bewegen sich zwischen -1 und +1. Ein Wert von 0 entspräche einem unsystematischen Zusammenhang. Je näher der Wert an 1 oder -1 ist, desto systematischer ist der Zusammenhang.

Resultate

Von April 2015 bis März 2017 wurden 305 von 538 verschickten Fragebögen an die Forschergruppe retourniert, was einer Rücklaufquote von 56,7 % entspricht. Der mittlere Wert über alle 30 Fragen war 3,41 (s = 0,51). Lediglich bei 12 Gesuchstellern lag der mittlere Wert unterhalb der mittleren Antwort der Skala (< 2,5). Rund 4 % der teilnehmenden Gesuchsteller fühlten sich demnach deutlich unfair behandelt.

Durch die Faktorenanalyse wurden vier Dimensionen (latente Variablen) festgestellt. Die in der Tabelle 1 dargestellten Faktorenladungen geben Aufschluss darüber, wie diese Dimensionen konzeptuell zu verstehen sind. Die Tabelle beschränkt sich aus Platzgründen auf die vier Fragen mit den höchsten Faktorenladungen (je Faktor). Zur besseren Übersicht sind die BFF-Fragen gemäss der höchsten Faktorenladung je Faktor sortiert. Die vier Faktoren erklärten rund 63,5 % der Gesamtvarianz. Insgesamt entsprach die durch die Faktorenanalyse festgestellte Struktur der von den Experten angenommenen Struktur, mit a) Respekt und Vertrauen, b) Interviewführung, c) Fallvertrautheit und d) Transparenz als Dimensionen, wobei der Faktor Interviewführung zur besseren Klarheit auch als Faktor Partizipation verstanden und bezeichnet werden könnte.

Tabelle 1: Dimensionen des BFF

Der mittlere Wert des BFF zeigte einen starken korrelativen Zusammenhang mit den Antworten im Kölner Patientenfragebogen. Der mittlere Wert des BFF korrelierte mit r = 0,814 mit der Skala Vertrauen und mit r = -0,556 mit der Skala Mobbing des Kölner Fragebogens. Verhalten, was als Mobbing empfunden wurde, wurde von sechs Teilnehmern durch entsprechende Antworten angezeigt (eine Frage lautete hier „Ich wurde wie Luft behandelt.“). Der mittlere Wert des BFF zeigte hingegen einen nur sehr schwachen korrelativen Zusammenhang mit den Antworten zur Lebenszufriedenheit. Der mittlere Wert des BFF korrelierte mit r = 0,238 mit den Werten der SWLS‑Lebenszufriedenheitsskala.

Diskussion

Die hier durchgeführte Validierungsstudie erbrachte Evidenz für eine konvergente Validität des BFF. Die im Kölner Patientenfragebogen abgefragten Dimensionen Vertrauen und Abwesenheit von Mobbing sollten sich im mittleren Wert des BFF bzw. Werten seiner Dimensionen (insbesondere Respekt und Vertrauen und Partizipation) widerspiegeln, was sie auch taten (vergl. [8]). Der Abgleich zu den Daten des SWLS (Lebenszufriedenheit) erbrachte auch Evidenz für eine divergente Validität des BFF. Die geringe Korrelation mit dem SWLS zeigt, dass negative Einschätzungen im BFF nicht im Wesentlichen Lebensunzufriedenheit (also etwas anderes als einen erlebten Mangel an Fairness) widerspiegeln. Lebenszufriedenheit und erlebte Fairness scheinen aber auch nicht gänzlich unabhängig zu sein. Es ist prinzipiell sowohl denkbar, dass Lebensunzufriedenheit zur Unzufriedenheit mit der Begutachtung beiträgt, wie auch, dass Unzufriedenheit mit der Begutachtung zu einer negativeren Einschätzung der Lebenszufriedenheit führte.

Durch die Validierungsstudie konnte der BFF selbst optimiert werden. Es wurden zwei Fragen identifiziert, die auf keinem der Faktoren eine hohe Ladung aufweisen. Ausserdem wurde bei drei weiteren Fragen festgestellt, dass diese aufgrund der Ähnlichkeit zu anderen Fragen entfallen könnten. Der BFF könnte somit von 30 auf 25 Fragen gekürzt werden. Allerdings werden aktuell von unserer Seite Überlegungen angestellt, eine weitere Dimension, nämlich Funktionsorientierte Fragen, zu ergänzen. Hintergrund dieser Überlegung ist, dass sich bei jüngeren Untersuchungen unserer Arbeitsgruppe zeigte, dass der funktionsorientierten Befragung von Gesuchstellern eine besondere Bedeutung zukommt und zumindest reliablere, wenn nicht gar validere Aussagen zur verbleibenden Arbeitsfähigkeit zulässt [2, 12].

Während es bei den Entscheidungsträgern eigentlich unstrittig ist, dass es wichtig ist, Feedback von Gesuchstellern einzuholen, wie beispielsweise bei einer Anfrage im Nationalrat deutlich wurde [13], so besteht zum Umfang einer solchen Befragung noch kein Konsens und zur Umsetzung aktuell noch kein Konzept. Für eine Befragung mit nur wenigen Fragen (6 bis 8 Fragen) wird ins Feld geführt, dass diese eine niedrige Hürde für eine Teilnahme an der Befragung darstellte und damit die Rücklaufquote erhöht würde (Gerhard Ebner, Präsident der SIM, persönliche Mitteilung). Wir vertreten hingegen die Auffassung, dass eine längere Befragung zuverlässigere Informationen erhebt, die Erfragung eines detaillierteren Feedbacks auch eine Wertschätzung gegenüber Antragsstellern ausdrückt und die Hürde einer Teilnahme weitgehend in anderen Faktoren begründet liegt als der Länge des Fragebogens (z.B. in der Befürchtung, negatives Feedback könnte sanktioniert werden).

Der BFF ist bisher das einzige Instrument, das die Erfassung erlebter Fairness im Kontext der Begutachtung erlaubt. Die Studie lieferte Belege zur Konstruktvalidität des Verfahrens. Der BFF erlaubt es, unterschiedliche Aspekte der erlebten Fairness aus Sicht der Gesuchsteller abzubilden, was aus unserer Sicht extrem wichtig ist, weil es nicht allein darum geht festzustellen, ob eine Begutachtung als fair oder unfair empfunden wurde. Hierfür würde eine einzige Frage genügen. Es geht darum, bei einer als unfair empfundenen Begutachtung zu spezifizieren, welcher Aspekt der interaktiven Fairness betroffen ist. Nur so kommt man zu einer differenzierten Bestandsaufnahme, nur so können auch geeignete Qualitätssicherungsmassnahmen ergriffen werden, die einer erlebten Unfairness entgegenwirken, nur so (nämlich durch differenziertes Feedback) kann ein Gutachter im Bedarfsfall sein Verhalten anpassen. Es sollte beachtet werden, dass der erlebte Mangel an Fairness nicht notwendigerweise einer Absicht des Gutachters entspringen muss. Zudem kann es seitens des Gesuchstellers selbstredend auch zu Fehlwahrnehmungen oder Fehlinterpretationen des Gutachterverhaltens kommen. Man sollte daher von einer Negativbeurteilung zu keinen Schlüssen über den Einzelfall gelangen. Erst wiederholte Einschätzungen mittels des BFF spiegeln das allgemeine Interaktionsverhalten des Gutachters wider. 

Im Gegensatz zum Meldeportal von Inclusion Handicap zeichnen die hier vorgestellten Daten ein relativ positives Bild der interaktiven Fairness von Begutachtungen. Diese Daten sind jedoch wenig repräsentativ. So nahmen nur 4 von insgesamt 30 Begutachtungszentren der Schweiz an der Studie teil, alle in der Deutschschweiz gelegen, es nahmen nur deutschsprachige Gesuchsteller teil, und schliesslich neigen eher zufriedene als unzufriedene Patienten zu einer Beantwortung von Zufriedenheitsfragen [14]. Es braucht systematische, repräsentative Erhebungen, um hier ein realistisches Bild der erlebten Fairness zu erhalten. Die Entscheidungsträger müssen sich den Vorwurf gefallen lassen, dass in der Vergangenheit zu wenig getan wurde, die Sicht der Versicherten in der Begutachtung zu erfragen und zu berücksichtigen. Umso wichtiger erscheint es uns, dass eine solche Befragung nun mit einer gewissen Sorgfalt und Tiefe erfolgt.

Danksagung

Die Autoren danken dem niederländischen Leistungsträger für Arbeitsnehmerversicherungen UMV für die Bereitstellung des Fragebogens zur Beurteilung der Gesprächsführung des Gutachters. Sie danken weiter den vier Begutachtungszentren asim, Zentrum für medizinische Begutachtung (Basel), BEGAZ (Binningen) und MEDAS Zentralschweiz (Luzern) für die Rekrutierung der Studienteilnehmer. Weiterer Dank gebührt der Expertengruppe für die Entwicklung des BFF. Dies waren: Dr. Ulrike Hoffmann-Richter, Dr. Jörg Jeger, Dr. Renato Marelli und Dr. Gregor Risi. Weiterhin danken wir Anna-Chiara Schaub für ihre Mitwirkung beim Editieren dieses Artikels.

Förderung

Die Autoren danken dem Suva-Forschungsfonds (Suva Luzern) für die finanzielle Unterstützung der Studie.

Verfügbarkeit des BFF

Der BFF unterliegt dem Urheberrecht. Die Autoren stellen den Fragebogen nach Rücksprache gerne für Forschungs- und Anwendungsfragen zur Verfügung.

Verwendete Abkürzungen

BFF: Basler Fairness Fragebogen
IV: Invalidenversicherung
SWLS: Satisfaction With Life Scale

Literaturverzeichnis

  1. Dickmann JRM, Broocks A. Das psychiatrische Gutachten im Rentenverfahren - wie reliabel? Fortschr Neurol Psychiatr. 2007;75(07):397-401.
  2. Kunz R, von Allmen DY, Marelli R, Hoffmann-Richter U, Jeger J, Mager R, Colomb E, Schaad HJ, Bachmann M, Vogel N, Busse JW, Eichhorn M, Bänziger O, Zumbrunn T, de Boer WEL, Fischer K. The reproducibility of psychiatric evaluations of work disability: two reliability and agreement studies. BMC Psychiatry. 2019;19(1):205.
  3. Mueller R, Basler P. IV-Rente als «Lotterie»: Grosse Unterschiede je nach Gutachter. SRF 25.10.2016. [Internet] Abgerufen am 01.02.2021: https://www.srf.ch/news/schweiz/iv-rente-als-lotterie-grosse-unterschiede-je-nach-gutachter.
  4. Inclusion Handicap. Meldestelle zu den IV-Gutachten. [Internet] Abgerufen am 01.02.2021: https://www.inclusion-handicap.ch/de/themen/invalidenversicherung-(iv)/meldestelle-484.html.
  5. Inclusion Handicap. Meldestelle zu den IV-Gutachten. Zwischenbericht vom 30.09.2020. [Internet] Abgerufen am 01.02.2021: https://www.inclusion-handicap.ch/admin/data/files/asset/file_de/600/dok_zwischenanalyse_1_0_02102020.pdf?lm=1601393609.
  6. Elbers NA, Collie A, Hogg-Johnson S, Lippel K, Lockwood K, Cameron ID. Differences in perceived fairness and health outcomes in two injury compensation systems: a comparative study. BMC Public Health. 2016;16(1):658.
  7. Van der Burg C. Clientenmonitor betreffende klantgerichtheid van de verzekeringsarts en arbeidsdeskundige tijdens de claimbeoordeling (intern rapport). Amsterdam: UWV. 2007.
  8. Lohss R, Rosburg T, Bachmann M, Meyer BW, de Boer W, Fischer K, Kunz R. Perceived fairness of claimants undergoing a work disability evaluation: Development and validation of the Basel Fairness Questionnaire. PLOS ONE. 2020;15(9):e0238930.
  9. Brigger B. Mitbeteiligung beim Erstellen eines „Fragebogens zur Zufriedenheit mit der Begutachtung“ für Exploranden. Prüfung des Fragebogens mittels Pilotierung. [Master's Thesis]: University of Basel; 2014.
  10. Pfaff H, Steffen P, Brinkmann A, Lütticke J, Nitzsche A. Der Kölner Patientenfragebogen (KPF): Kennzahlenhandbuch. Köln: Inst. und Poliklinik für Arbeitsmedizin, Sozialmedizin und Sozialhygiene. 2004.
  11. Diener E, Emmons RA, Larsen RJ, Griffin S. The Satisfaction With Life Scale. J Pers Assess. 1985;49(1):71-5.
  12. von Allmen DY, Kedzia S, Dettwiler R, Vogel N, Kunz R, de Boer WEL. Functional Interviewing Was Associated With Improved Agreement Among Expert Psychiatrists in Estimating Claimant Work Capacity: A Secondary Data Analysis of Real-Life Work Disability Evaluations. Front Psychiatry. 2020;11:621.
  13. Berset A. Fragestunde. Frage Lohr Christian zum Bericht "Analyse der Aufsicht über die IV-Stellen" des BSV. Perspektive der Versicherten. 07.12.2020. [Internet] Abgerufen am 01.02.2021: https://www.parlament.ch/de/ratsbetrieb/amtliches-bulletin/amtliches-bulletin-die-verhandlungen?SubjectId=50927.
  14. Nguyen TD, Attkisson CC, Stegner BL. Assessment of patient satisfaction: development and refinement of a service evaluation questionnaire. Eval Program Plann. 1983;6(3-4):299-313.

Originalpublikation

Lohss R, Rosburg T, Bachmann M, Meyer BW, de Boer W, Fischer K, Kunz R. Perceived fairness of claimants undergoing a work disability evaluation: Development and validation of the Basel Fairness Questionnaire. PLoS One. 2020;15(9):e0238930.

Copyright

PloS One operiert unter dem Creative Commons Attribution (CC BY) license

Korrespondenzadresse

PD Dr. Timm Rosburg | EbIM Forschung & Bildung
Departement Klinische Forschung
Universitätsspital Basel | Spitalstr. 8 + 12 | CH-4031 Basel

timm.rosburg@usb.ch