Skip to content

qualitative Sozialforschung: Textanalyse durch Sequenzanalyse, Grammatikinduktion, -transduktion, Parsen

Notifications You must be signed in to change notification settings

pkoopongithub/algorithmisch-rekursive-sequenzanalyse

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Algorithmisch Rekursive Sequenzanalyse (ARS)

Grundprinzipien

Die Algorithmisch Rekursive Sequenzanalyse (ARS) ist eine Methode zur Analyse diskreter, endlicher Zeichenketten. Ziel ist die Erstellung einer probabilistischen kontextfreien Grammatik (PCFG), die sowohl die Struktur empirisch beobachteter Sequenzen beschreibt als auch synthetische Sequenzen generiert, die den empirischen Sequenzen entsprechen.

Methodologische Schritte

  1. Hypothesenbildung und Voruntersuchung

    • Auf Grundlage transkribierter Daten (z. B. Gesprächsprotokolle) wird eine vorläufige Grammatik entwickelt, die die Struktur und Interaktionen abbildet (z. B. Begrüßung, Bedarf, Abschluss).
    • Diese initialen Hypothesen dienen als Orientierungshilfe, ohne induktive Schlussfolgerungen einzuschränken.
  2. Zuordnung von Terminalzeichen und Sequenzbildung

    • Jede Interaktion wird einer Kategorie zugeordnet und in ein Symbol (Terminalzeichen) übersetzt, das als Basis für die Sequenzanalyse dient.
    • Die resultierenden symbolischen Zeichenketten repräsentieren die Sequenzen.
  3. Induktion einer Grammatik

    • Aus den Zeichenketten wird eine Grammatik extrahiert, die wiederkehrende Muster und Übergänge beschreibt.
    • Die Wohlgeformtheit empirischer Sequenzen wird überprüft, indem diese gegen die induzierte Grammatik geparst werden.
  4. Generierung und Validierung künstlicher Sequenzen

    • Die induzierte Grammatik dient der Erzeugung künstlicher Sequenzen, die statistisch mit den empirischen Daten verglichen werden, um ihre Repräsentativität sicherzustellen.
  5. Optimierung der Grammatik

    • Ein iterativer Prozess passt die Wahrscheinlichkeiten innerhalb der Grammatik an, um die Korrelation zwischen erzeugten und empirischen Sequenzen zu maximieren.
    • Maßzahlen wie Spearman-Korrelation und p-Wert werden zur Überprüfung der Übereinstimmung und Signifikanz herangezogen.
  6. Simulation mit Multiagentensystemen

    • Die Grammatik wird in Multiagentensysteme implementiert, deren Agenten die Regeln der Grammatik befolgen. Dies erlaubt die Untersuchung möglicher Variationen oder hypothetischer Szenarien.

Technologische Umsetzung

  • Grammatikinduktor: Automatisierte Erstellung von Grammatiken aus Daten (z. B. mit Scheme).
  • Parser: Überprüfung der Sequenzen auf Wohlgeformtheit (z. B. mit Pascal).
  • Transduktor: Generierung künstlicher Sequenzen, die den empirischen Daten entsprechen (z. B. mit Lisp).

Theoretische Grundlage

  • Die Methode folgt einem naturalistischen und empirischen Ansatz und lehnt postmoderne, konstruktivistische und tiefenhermeneutische Ansätze ab. Stattdessen interpretiert sie soziale Strukturen als algorithmische Regeln, die in formale Sprachen übersetzt werden.
  • Ziel ist es, Modelle zu entwickeln, die sowohl falsifizierbar als auch empirisch überprüfbar sind.

Die Algorithmisch Rekursive Sequenzanalyse ermöglicht eine systematische Analyse und Modellierung komplexer sozialer Interaktionen, wobei sowohl die Datenstruktur als auch deren Variabilität berücksichtigt werden.