Mehrfach annotierte Textkorpora
Strukturierte Speicherung und Abfrage
Digitale Korpora haben die Voraussetzungen, unter denen sich Wissenschaftler mit der Erforschung von Sprachphänomenen beschäftigen, fundamental verändert. Umfangreiche Sammlungen geschriebener und gesprochener Sprache bilden mittlerweile die empirische...
Leider schon ausverkauft
Buch (Kartoniert)
- Lastschrift, Kreditkarte, Paypal, Rechnung
- Kostenlose Rücksendung
Produktdetails
Produktinformationen zu „Mehrfach annotierte Textkorpora “
Klappentext zu „Mehrfach annotierte Textkorpora “
Digitale Korpora haben die Voraussetzungen, unter denen sich Wissenschaftler mit der Erforschung von Sprachphänomenen beschäftigen, fundamental verändert. Umfangreiche Sammlungen geschriebener und gesprochener Sprache bilden mittlerweile die empirische Basis für mathematisch präzise Generalisierungen über zu beschreibende Wirklichkeitsausschnitte. Das Datenmaterial ist hochkomplex und besteht neben den Rohtexten aus diversen linguistischen Annotationsebenen sowie außersprachlichen Metadaten. Als unmittelbare Folge stellt sich die Konzeption adäquater Recherchelösungen als beträchtliche Herausforderung dar. Im vorliegenden Buch wird deshalb ein datenbankbasierter Ansatz vorgestellt, der sich der Problematiken multidimensionaler Korpusrecherchen annimmt. Ausgehend von einer Charakterisierung der Anforderungsmerkmale linguistisch motivierter Suchen werden Speicherungs- und Abfragestrategien für mehrfach annotierte Korpora entwickelt und anhand eines linguistischen Anforderungskatalogs evaluiert. Ein Schwerpunkt liegt dabei in der Einführung problemorientierter Segmentierung und Parallelisierung.
Inhaltsverzeichnis zu „Mehrfach annotierte Textkorpora “
1 Einführung und Motivation 2 Linguistische Anforderungen an Sprachkorpora2.1 Natürlichsprachliche Korpora in der Sprachwissenschaft2.2 Deutschsprachige Korpora im internationalen Kontext2.3 Recherche in ausgewählten Korpussammlungen2.4 Multidimensionale Suchkriterien 2.5 Anforderungskatalog für linguistisch motivierte Korpusabfragen3 Design und Implementierung eines Korpusabfragesystems3.1 Spektrum der Speicherungsmodelle3.2 Ein Referenzsystem für die relationale Korpusspeicherung3.3 Evaluierung einzelner Designentscheidungen4 Evaluation des Anforderungskatalogs4.1 Abfrage 1: Einfaches Suchmuster4.2 Abfrage 2: Suffixsuche mit Platzhalterzeichen4.3 Abfrage 3: Komplexes Relativsatz-Muster 4.4 Abfrage 4: ACI-Konstruktionen4.5 Abfrage 5: W-Fragen ohne Verb4.6 Abfrage 6: Movierung in virtuellen Subkorpora 4.7 Abfrage 7: Genitivobjekte4.8 Abfrage 8: Partizipialphrase vor niederfrequentem Nomen 4.9 Abfrage 9: Regulärer Ausdruck mit Rechts-Trunkierung4.10 Abfrage 10: Regulärer Ausdruck mit Links-Trunkierung4.11 Einflussfaktoren auf die Abfrage-Laufzeiten5 Versuch einer Laufzeitoptimierung durch segmentierte Abfragen5.1 Parallelisierung als Chance für das Korpusretrieval5.2 Problemorientierte Algorithmisierung 5.3 Evaluation des alternativen Suchalgorithmus6 Integration in ein Online-Framework6.1 Suchformulare 6.2 Speicherung von Beleglisten6.3 Schnittstellen zu Statistikwerkzeugen6.4 Übersichtslisten7 Zusammenfassung und FazitLiteraturverzeichnis
Autoren-Porträt von Roman Schneider
PD Dr. Roman Schneider leitet den Programmbereichs "Sprachtechnologie und Informationssysteme" am Institut für Deutsche Sprache (IDS) in Mannheim. Daneben engagiert er sich kontinuierlich in der akademischen Lehre, u.A. an den Universitäten Gießen, Leipzig, Mannheim, Trier und Augsburg.
Bibliographische Angaben
- Autor: Roman Schneider
- 2019, 1. Auflage, 315 Seiten, Maße: 15,2 x 22,1 cm, Kartoniert (TB), Deutsch
- Verlag: Narr
- ISBN-10: 3823382861
- ISBN-13: 9783823382867
- Erscheinungsdatum: 15.03.2019
Kommentar zu "Mehrfach annotierte Textkorpora"
Schreiben Sie einen Kommentar zu "Mehrfach annotierte Textkorpora".
Kommentar verfassen