(This is the German version of JuReko-description; there is also an English description of the project.)

 
Einführung

Die Initiative zur Entwicklung eines Juristischen Referenzkorpus des deutschsprachigen Rechts - kurz: JuReko - geht zurück auf erste Vorstudien (seit 2010) von Jun.-Prof. Dr. phil. Friedemann Vogel zu der Frage, welchen Beitrag korpuslinguistische Methoden zur Klärung rechtslinguistischer, rechtswissenschaftlicher und dogmatischer Forschungsinteressen beitragen können. Eine Umsetzung früher Konzepte musste mangels Ressourcen jedoch bislang zurückgestellt werden.

Gemeinsam mit Dr. iur. Hanjo Hamann gelang im Frühjahr 2014 die Einwerbung eines ähnlich interdisziplinären, jedoch analytisch noch weitergehenden Projektes unter dem Titel: "Vom corpus iuris zu den corpora iurum. Konzeption und Erschließung eines juristischen Referenzkorpus (JuReko)".

Gegenstand dieses Projektes ist die interdisziplinäre Konzeption, Aufbereitung und erste analytische Erschließung eines juristischen Referenzkorpus (JuReko) als quantitativ-empirischer Beitrag zur juristischen Methodik sowie zur Rechts-, Computer- und Korpuslinguistik.

Das Projekt wird auf drei Jahre durch die Akademie der Wissenschaften Baden-Württemberg finanziert.
 

Aktuelles

  • 27.10.2016: JuReko 2.0 enthält zusätzlich 20.000 englische Entscheidungen (~90 Mio. Wörter)
  • 15.5.2016: JuReko 1.0 fertig gestellt mit 6.300 Gesetzestexten (~2,3 Mio. Wörter), 370.000 deutschen Entscheidungen (~800 Mio. Wörter) und 43.000 Artikeln aus juristischen Zeitschriften (~150 Mio. Wörter)
  • 18.03-19.03.2016: The fabric of law and language - Conference 2016
  • 15.09-25.09.2015: Gastspiel - JuReko-Leiter Friedemann Vogel und Computerlinguistin Isabelle Gauer zu Gast an der Beijing Foreign Studies University
  • 31.07.2015: Stand JuReko - Das Korpus wächst
  • 01.02.2015: Neues Teammitglied bei JuReko: Wir freuen uns, dass Isabelle Gauer die computerlinguistische Administration übernimmt
  • 01.10.2015: Geeignete MitarbeiterInnen gesucht, zweite Ausschreibung veröffentlicht
  • 13.06.2014: Das Projekt befindet sich derzeit in der Vorbereitung der ersten Arbeitsphase.

 

Ziele und Aufgabenstellung des Projekts

Das Projekt versteht sich als Beitrag zur interdisziplinären Rechtsforschung und widmet sich den Möglichkeiten und Grenzen einer „Ausmessung“ juristischer Diskurse. Dabei werden neuere Erkenntnisinteressen und Methoden zweier Disziplinen – der Rechts- und Sprachwissenschaft – vereint und Wege zur Entwicklung einer computer- und korpusgestützten Rechtslinguistik beschritten.

Aus juristischer Sicht zielt das Projekt auf eine wirklichkeitsbezogene, Hermeneutik und datengestützte Statistik zusammenführende und damit empirisch reflektierte Fortentwicklung der Rechtsmethodik, aus linguistischer Sicht schafft es eine neue Grundlage für das Verständnis der Rechtssprache als einer besonderen Fachsprache. Dabei fügt sich das Projekt in neuere Forschungsströmungen der beiden beteiligten Disziplinen ein: Neuere empirische Rechtsforschung auf der einen Seite, computergestützte und rechtsmethodisch geschulte Korpuslinguistik auf der anderen. Zwischen diesen Forschungsströmungen soll das Projekt eine Brücke schlagen, die zwar bisweilen schon früher angedacht wurde, nun aber erstmals technisch-methodisch realisierbar erscheint. Dieser Brückenschlag soll zugleich länderübergreifend erfolgen, indem besonderer Wert auf die Vernetzung mit international führenden und am vorliegenden Thema interessierten Fachkollegen gelegt wird.

Die Leitziele des Projektes lassen sich wie folgt zusammenfassen:

  1. Konzeption eines Referenzkorpus des deutschsprachigen Rechts (JuReko): Auf Basis von Vorarbeiten der beiden Antragsteller und eines interdisziplinären Arbeitsworkshops sowie in Zusammenarbeit mit dem Europäischen Zentrum für Sprachwissenschaften (EZS; Mannheim-Heidelberg) soll das Konzept für ein neues, nachhaltiges, digitales Kerntextkorpus erarbeitet werden. Dabei sind insbesondere Fragen zur Textauswahl (Kriterien für Relevanz von Texten v.a. aus den Domänen Legislative, Judikative und rechtswissenschaftlicher Aufsatz- und Kommentarliteratur) sowie zur computerlinguistischen Erhebung, Aufbereitung, Annotation, Speicherung und lizenzrechtlich konformer Zugänglichkeit der Daten dahingehend zu klären, dass ein möglichst breites empirisches Forschungsfeld eröffnet werden kann.
  2. Aufbereitung eines Kernkorpus des JuReko: Im Anschluss an die Konzeption sollen bereits bestehende Großtextkorpora (etwa 75.000 Texte der Rechtsprechung des BVerfG, BAG sowie aller großen juristischen Fachzeitschriften) nach den entwickelten Standards computertechnisch (weiter) aufbereitet sowie weitere leicht zugängliche Textdaten, insbesondere Entscheidungen aller Bundesgerichte akquiriert werden. Die damit verbundenen Arbeiten zielen auf die Entwicklung und Bereitstellung eines Kernkorpus zur empirischen Erforschung zeitgenössischer Rechtssprache, -kommunikation und -methodik.
  3. Erste analytische Erschließung des JuReko auf Basis semiautomatischer Verfahren: Auf Basis der erhobenen Massendaten soll das Kernkorpus des JuReko analytisch erschlossen und dabei die Möglichkeiten und Grenzen einer rechtslinguistisch fundierten, computergestützten Korpusempirie für Sprach- und Rechtswissenschaft ausgelotet werden. Zur Strukturierung werden dabei in Form von Pilotstudien zwei Fragenkomplexe bearbeitet:

    (a) Meinungsbildung im juristischen Diskurs: Rechtsdiskurse zeichnen sich durch eine hohe Dichte semantischer Kämpfe, d.h. sprachlich konstituierte Auseinandersetzungen um den Geltungsrang verschiedener Konzepte und Argumente aus. Die Aushandlungsprozesse unter den beteiligten Akteuren im Text-Netzwerk Recht ist Gegenstand zahlreicher kleinerer qualitativer Studien mit Fokus auf einzelne Themen und Streitpunkte. Für Analysen zur juristischen Meinungsbildung auf globaler Makroebene fehlten bislang sowohl geeignete Daten als auch Methoden. Diese Lücke versucht das hier skizzierte Projekt explorativ zu schließen: Die computergestützte Erhebung und Ausmessung von Zitationsnetzwerken sowie die Ermittlung von statistisch signifikanten Wortfeldern in Relation zu Zeit, Medium, Domäne, Rechtsbereich und Akteuren ermöglichen Rückschlüsse auf Prozesse der Meinungs- und Autoritätenbildung sowie die Entwicklung akademischer Schulen und möglicher „Zitierkartelle“ im juristischen Fachdiskurs; Keyword- und Kookkurrenzanalysen zu ausgewählten Konnektoren geben außerdem Hinweise auf agonale Zentren (Felder 2015) und damit globale Konfliktlinien. – Die Pilotstudie soll Verfahren auf ihre Eignung hin prüfen, die juristische Praxis aus der Metaperspektive als soziales, sich in sprachlichen Massendaten niederschlagendes Netzwerk (Ladeur 2014) zu analysieren.

    (b) Pragmatik der juristischen Methodenlehre: Durch die statistische Erhebung von Parametern zu den systematischen Struktureigenschaften von Rechtstexten soll die bislang allein auf Introspektion basierende Rechtsmethodik und damit verbundene Interpretationsverfahren auf empirischer Basis hinterfragt und weiterentwickelt werden. Exemplarisch soll hierzu erstens die Untersuchung von kontrastiven Wortfeldern und kontrastiven Clustern gebrauchsähnlicher Wörter dazu genutzt werden, den in der Rechtswissenschaft verwandten Topos des „unbestimmten Rechtsbegriffs“ näher zu beleuchten. Letztere werden gemeinhin als „wertungsoffene“ Begriffe charakterisiert – wie etwa die „Unzuverlässigkeit“ von Gewerbetreibenden in regulierten Wirtschaftszweigen –, die allerdings durch den Kontext ihres Gebrauchs tatsächlich oft deutlich stärker vorgeprägt sind, als dies dem einzelnen Rechtsanwender bewusst ist. Eine nähere Untersuchung solcher Begriffe oder typisierter Begriffsklassen auf ihren (kontextuellen) Bestimmtheitsgrad und etwaige gebrauchsverwandte Wörter ermöglicht damit auch einen Beitrag zur Rechtslexikographie, Fachdidaktik und Terminologieforschung. Zweitens soll anhand von ausgewählten Schlüsselwörtern und -phrasen geprüft werden, welche Typen der Auslegung (Kanones) in der juristischen Argumentation dominieren – auch im Vergleich von Rechtsprechung und Rechtswissenschaft. Drittens soll im Anschluss an eigene Vorarbeiten (s.u.) und durch konkordanzgestützte Textauswertung die Rolle der Figur der „Abwägung“ (insb. auch im Sinne der Prinzipientheorie nach Alexy 1994) für die praktische Methodik untersucht werden.

Die beiden Fragenkomplexe sollen das erhobene Kernkorpus sowohl im Querschnitt (synchron) als auch im Längsschnitt (diachron) erschließen, um einerseits kontrastive Vergleiche zwischen verschiedenen Rechtsgebieten, Publikationskanälen (Medien) und institutionellen Domänen (z.B. Rechtsprechung gg. Wissenschaft) zu ermöglichen, andererseits aber auch Entwicklungstendenzen über die Zeit zu erkennen.

Ziel dieser Pilotstudien ist eine exemplarische method(olog)ische Sondierung der Möglichkeiten und Grenzen des erhobenen Korpus und korpusgestützter Verfahren sowie die Formulierung von Hypothesen, die zum Gegenstand weiterführender Einzelstudien in Form von Dissertationen u.ä. werden können.

 

Das juristische Referenzkorpus

Das Korpus wurde mit der Hilfe von xsl-Transformationen und Java-Programmen erstellt und mit PoS-Tags angereichert (TreeTagger). Alle Texte liegen TEI P5 konform vor, wobei Metadaten (zum Beispiel Titel, Autor, Gericht, Datum) ebenfalls in einer relationalen Datenbank erfasst und manuell nachkorrigiert wurden. JuReko 2.0 enthält 6.300 Gesetzestexte (~2,3 Mio. Wörter), 370.000 deutsche Entscheidungen (~800 Mio. Wörter), 20.000 englische Entscheidungen (~90 Mio. Wörter) und 43.000 Artikel aus 21 juristischen Zeitschriften (~150 Mio. Wörter) ab ca. 1981 bis 2015. Damit stellt JuReko die erste repräsentative Datenbasis für quantitative rechtslinguistische Analysen dar.