Methodik der computerunterstützten Inhaltsanalyse (CUI) und automatisierten Klassifikation von Therapiezielen |
Journal/Book: DRV-Schriften Band 11/98 Seite 207-209 Interdisziplinarität und Vernetzung 7. Rehabilitationswissenschaftliches Kolloquium vom 10. bis 12 März 1997 in HamburgTagungsband. 1998;
Abstract: Hochrhein-Institut für Rehabilitationsforschung Bad Säckingen Einleitung / Problematik Im Rahmen des Qualitätssicherungsprogramms der Rentenversicherungsträger werden die Festlegung von individuellen Therapiezielen sowie die Messung des Zielerreichungsgrads als wichtige Maßnahmen angesehen. Probleme erwachsen aus der gewaltigen Zahl verschiedener Therapiezieldefinitionen die in geeigneter Weise aggregiert werden müssen um sie einer statistischen Analyse zugänglich zu machen. Es bietet sich eine Aggregation nach inhaltlichen Kriterien auf einem möglichst niedrigen Abstraktionsniveau an. Die qualitative Sozialforschung bedient sich in diesem Fall der semantischen Struktur- und Inhaltsanalyse (Hoffmeyer-Zlotnik 1992). Für kleine Fallzahlen eignet sich ein manuelles Vorgehen für größere Fallzahlen ist ein computergestütztes Verfahren unabdingbar. Gängige Programmpakete (z.B. TEXTPACK) lassen eine computerunterstützte Inhaltsanalyse zu. aber keine automatisierte Klassifikation; sie sind somit für den Routinebetrieb nicht geeignet. Zielsetzung Mittels eines computergestützten Verfahrens sollten aus einem umfangreichen Datenmaterial (über 31.000 Zieldefinitionen) Kategorien von Therapiezielen erstellt und ihre Häufigkeitsverteilung berechnet werden. Ferner sollte es möglich sein bei minimalem Zeitaufwand ein ähnliches Datenmaterial derselben Klassifizierungsroutine zu unterziehen Methodik Als Engine diente eine konventionelle Datenbank mit einer ausgereiften objektorientierten Programmiersprache (PARADOX / ObjektPAL). Grundlage der computerunterstützten Inhaltsanalyse ist die Exploration der Daten mittels quantitativer Methoden. Die computerisierte Klassifizierung erfolgt nach einem Algorithmus der definierte Zeichenketten ein- und/oder ausschließt. Der Algorithmus wurde interaktiv erstellt und iterativ präzisiert. Die Analyse gliederte sich neben der Vorbereitung in drei weitere Stufen: die Explorationsphase die Trainingsphase und die Praxisphase. Exploration Die numerische und alphabetische Häufigkeitsliste gaben einen quantitativen und qualitativen Hinweis auf die Inhalte der Zielformulierungen. Anhand der numerischen Liste wurden Schlüsselworte identifiziert die auf häufige Zielinhalte hinweisen. Die alphabetische Liste ergab Hinweise auf die Wortstämme und Synonyme die geeignet sind um möglichst umfassend Inhalte der Zielformulierung zu identifizieren. Ergänzt wurde die Suche durch eine Programmroutine die Wortstämme innerhalb eines Wortes findet. Trainingsphase Die vorläufigen Algorithmen waren nun auf ihre Validität zu prüfen. Dazu wurden die einzelnen Algorithmen nacheinander probeweise auf die Zielformulierungen angewendet. Das Programm selektierte diejenigen Datensätze die den Suchalgorithmus erfüllen. Diese Datensätze mußten nun manuell auf Plausibilität geprüft werden. Bei eventuellen Fehlklassifikationen mußte der Algorithmus durch weitere Ein- oder Ausschlußkriterien verfeinert werden. Der Algorithmus basiert auf den Regeln der Boolschen Algebra. Eine Prozedur schrieb diese erprobten Algorithmen anschließend in eine Tabelle. Die Tabelle diente in der Praxisphase zur automatisierten Klassifizierung eines ähnlichen Sets von Therapiezieldefinitionen. Eine Prozedur wandte mittels dieser Tabelle die Einzelalgorithmen auf die neuen Zielformulierungen an. Ferner eignete sich diese Prozedur in Verbindung mit der Tabelle der Einzelalgorithmen auch dazu eine Probeauswertung von beliebigen anderen Datensätzen vorzunehmen und vereinfachte die explorative Phase. Mit Hilfe der in der Trainingsphase produzierten Algorithmentabelle vor ließen sich wiederholt verschiedene Datensätze von Therapiezieldefinitionen (z.B. aus einem kontinuierlichen Qualitätsmonitoring der Klinik oder des Rentenversicherungsträgers) automatisiert klassifizieren was die Grundlage für weitere statistische Analysen darstellte. Mittels moderner PC's ist die beschriebene Prozedur selbst bei großen Zahlen (n > 30.000) innerhalb weniger Stunden zu bewerkstelligen. ___MH
© Top Fit Gesund, 1992-2025. Alle Rechte vorbehalten – Impressum – Datenschutzerklärung