Seminarmodul L-UF Linguistics - Cheatsheet
Historische Entwicklung der Linguistik
Definition:
Historischer Verlauf der Linguistik als wissenschaftliche Disziplin von den Anfängen bis zur Gegenwart.
Details:
- Antike: Erste Sprachtheorien in Griechenland und Indien (z.B. Panini 4. Jh. v. Chr.).
- 18./19. Jahrhundert: Entstehung der historisch-vergleichenden Sprachwissenschaft (z.B. Jacob Grimm, Franz Bopp).
- Saussures Strukturalismus: Ferdinand de Saussure begründet die moderne Linguistik (frühes 20. Jh.).
- Generative Grammatik: Noam Chomskys Theorie der Syntax (1950er Jahre).
- Pragmatische Wende: Hinwendung zur Sprachverwendung und Kontext (ab 1960er Jahre).
- Neuere Entwicklungen: Korpuslinguistik, computerlinguistische Methoden, interdisziplinäre Ansätze.
Phonetik und Phonologie
Definition:
Phonetik: Untersuchung von Sprachlauten; Phonologie: Untersuchung der funktionalen Systeme dieser Laute innerhalb einer Sprache.
Details:
- Phonetik: drei Teilbereiche - Artikulatorische, Akustische, Auditive Phonetik
- Artikulatorische Phonetik: wie Laute gebildet werden (z. B. Position der Zunge, Lippen, etc.)
- Akustische Phonetik: physikalische Eigenschaften von Lauten (z. B. Frequenz, Amplitude)
- Auditive Phonetik: wie Laute vom Ohr und Gehirn verarbeitet werden
- Phonologie: untersucht Phoneme (bedeutungsunterscheidende Laute)
- Minimalpaaranalyse: Methode zur Bestimmung von Phonemen
- Unterschied zwischen Phonem und Allophon: Phoneme sind bedeutungsunterscheidend, Allophone sind verschiedene Realisierungen des gleichen Phonems
- Silbenstruktur: Aufbau von Silben (z. B. Onset, Nukleus, Koda)
- Prosodie: suprasegmentale Merkmale wie Ton, Intonation, Betonung
Generative Grammatik nach Chomsky
Definition:
Theorie der Syntax, die die Struktur von Sätzen definiert und generiert durch formale Regeln.
Details:
- Wichtige Konzepte: Tiefenstruktur (D-Struktur) und Oberflächenstruktur (S-Struktur)
- Transformationsregeln zur Ableitung von S-Sätzen aus D-Sätzen
- Phrasenstrukturregeln: Definition von Konstituentenstrukturen
- Chomsky-Hierarchie: Kategorisierung formaler Sprachen
- Notation: Konstituentenstrukturen durch Klammern und Baumdiagramme dargestellt
- Beispielregel: \(S \rightarrow NP \, VP\)
Diskursanalyse und Korpuslinguistik
Definition:
Diskursanalyse untersucht den Gebrauch von Sprache in bestimmten Kontexten, Korpuslinguistik analysiert große Textsammlungen (Korpora) zur Sprachbeschreibung und -untersuchung.
Details:
- Diskursanalyse: Fokus auf Machtstrukturen, soziale Normen in Texten/Kommunikationssituationen
- Korpuslinguistik: Nutzung von Softwaretools zur Sprachmusteranalyse (z.B. Frequenzverteilungen, Kollokationsanalysen)
- Beispiele für Software: AntConc, Sketch Engine
- Ziel: Kombination beider Disziplinen für umfassende Sprachuntersuchung
Statistische Methoden in der Linguistik
Definition:
Anwendung statistischer Techniken zur Analyse sprachlicher Daten und Muster.
Details:
- Deskriptive Statistik: Mittelwert, Median, Standardabweichung
- Inferentielle Statistik: Hypothesentests, Konfidenzintervalle
- Korrelation und Regression: Zusammenhang und Vorhersage von Variablen
- Wahrscheinlichkeitstheorie: Basis für statistische Inferenz
- Chi-Quadrat-Test: Überprüfung von Verteilungen
- ANOVA: Vergleich von Mittelwerten zwischen Gruppen
- Machine Learning: Anwendung von Algorithmen zur Mustererkennung
- Software-Tools: R, Python (pandas, scipy, nltk)
Natural Language Processing (NLP)
Definition:
Natural Language Processing (NLP) befasst sich mit der automatischen Verarbeitung und Analyse natürlicher Sprache durch Computer.
Details:
- Analysemethoden: Tokenisierung, Parsing, POS-Tagging
- Sprachtechnologien: Maschinelles Übersetzen, Sprachsynthese, Sentiment-Analyse
- Maschinelles Lernen: Verwendung von Algorithmen wie RNNs, LSTMs und Transformers
- Datenquellen: Korpora, annotierte Textdaten
- Anwendungsbereiche: Suchmaschinen, Sprachassistenten, Text Mining
Maschinelles Lernen und Sprachmodelle
Definition:
Maschinelles Lernen (ML) und Sprachmodelle beschäftigen sich mit der Entwicklung von Algorithmen und Modellen zur Verarbeitung und Analyse natürlicher Sprache.
Details:
- ML nutzt Statistik und probabilistische Modelle: Erkennung von Mustern und Vorhersagen.
- Supervised Learning: Datenbeschriftung erforderlich.
- Unsupervised Learning: Entdecken von verborgenen Strukturen.
- Sprachmodelle generieren und verstehen Sprache (z.B. GPT-3).
- NLP (Natural Language Processing): Verknüpfung von Linguistik und ML.
- Wichtige Konzepte: Tokenisierung, Embeddings, Transformer-Architekturen.
- Evaluation: Precision, Recall, F1-Score.
- Gängige Algorithmen: k-NN, SVM, Entscheidungsbäume, neuronale Netze.
Spracherkennung und -synthese
Definition:
Technologie zur automatischen Erkennung und Erzeugung menschlicher Sprache. Spracherkennung wandelt gesprochene Sprache in Text, Sprachsynthese generiert künstliche Sprache aus Text.
Details:
- Spracherkennung: Prozess der Umwandlung von Audiosignalen in Text (ASR - Automatic Speech Recognition)
- Sprachsynthese: Umwandlung von Text in gesprochenes Wort (TTS - Text-to-Speech)
- Wichtige Modelle: Hidden Markov Models (HMM), neuronale Netzwerke, Recurrent Neural Networks (RNN), Long Short-Term Memory (LSTM)
- Merkmale: Sprachqualität, Sprechtempo, Prosodie
- Fehlertypen: Erkennungsausfälle, falsche Erkennungen
- Anwendungen: Sprachassistenten, automatische Untertitelung, Übersetzungsdienste