Logik-Basierte Sprachverarbeitung - Cheatsheet
Grundbegriffe der prädikatenlogischen und Aussagenlogik
Definition:
Grundlagen der Formalisierung und Manipulation von Aussagen in logischen Systemen.
Details:
- Aussagenlogik: Operiert mit Aussagen (True/False).
- Prädikatenlogik: Erweitert Aussagenlogik durch Prädikate und Quantoren.
- Formeln: z.B. \(P \rightarrow Q\), \(\forall x (P(x) \rightarrow Q(x))\)
- Wahrheitstafeln zur Evaluierung von Aussagenlogik-Formeln.
- Beweistheorie: Techniken zur Derivation von Aussagen.
- Einsetzungsregel: Substitution von Termen in prädikatenlogischen Formeln.
- Freie und gebundene Variablen in Prädikatenlogik.
- Interpretationen: Zuweisung von Bedeutungen zu Symbolen in Logik.
Wahrheitstabellen und logische Äquivalenzen
Definition:
Wahrheitstabellen dienen zur Bestimmung der Wahrheitswerte von logischen Ausdrücken und zur Überprüfung logischer Äquivalenzen.
Details:
- Wahrheitstabelle enthält alle möglichen Kombinationen von Wahrheitswerten der Variablen.
- Logische Äquivalenz: Zwei Ausdrücke sind logisch äquivalent, wenn sie unter allen möglichen Wahrheitswerten die gleichen Ergebnisse liefern.
- Äquivalenznotation: \( A \equiv B \)
- Beispiele für logische Äquivalenzen:
- Idempotenz: \( A \land A \equiv A \)
- Domination: \( A \lor True \equiv True \)
Logische Schlussfolgerungen und Beweisverfahren
Definition:
Ableitungen von logischen Aussagen mittels formaler Regeln zur Feststellung der Gültigkeit oder Wahrheitswerte.
Details:
- Deduktion: Schlussfolgerung aus allgemeinen Prämissen auf spezifische Aussagen.
- Induktion: Schlussfolgerung aus spezifischen Beobachtungen auf allgemeine Aussagen.
- Syllogismus: Form der Deduktion, meist in Struktur von 2 Prämissen und einer Konklusion.
- Modus Ponens: \
Grundlagen der Programmiersprache Prolog
Definition:
Logikbasierte Programmiersprache, verwendet Fakten, Regeln und Anfragen; speziell für die Verarbeitung natürlicher Sprache
Details:
- Ein Programm besteht aus Fakten, Regeln und Zielen
- Backtracking zur Lösung von Anfragen
- Unifikation: Verfahren zum Abgleich von Termen
- Syntax: Klauseln enden mit einem Punkt
- Fakt: Kopie\( -> \text{kopf(term1, term2)}. \)
- Regel: Kopf\( :- \text{Körper}. \)
- Ziel (Query): ?- Aussage
Rekursion und Backtracking in Prolog
Definition:
Prolog-Programme nutzen Rekursion und Backtracking für die Suche und Manipulation von Lösungen in logischen Programmen.
Details:
- Rekursion: Eine Funktion ruft sich selbst auf, um ein Problem schrittweise zu lösen.
- Basisfall und rekursiver Fall beachten.
- Backtracking: Methode, um alternative Lösungen zu finden, falls aktuelle Lösung fehlschlägt.
- Prolog durchsucht Optionen, indem es Rücksprünge zu früheren Entscheidungspunkten macht und andere Pfade ausprobiert.
member(X, [X|_]).
member(X, [_|T]) :- member(X, T).
Formale Grammatiken und Parsing-Algorithmen
Definition:
Formale Grammatiken und Parsing-Algorithmen sind zentrale Konzepte in der logik-basierten Sprachverarbeitung, die zur Analyse und Erzeugung von Sätzen in natürlichen und formalen Sprachen verwendet werden.
Details:
- Formale Grammatiken: Regelwerke zur Generierung von Sätzen in einer Sprache.
- Typen nach Chomsky-Hierarchie: Regelsysteme (Typ 0-3), von Typ-0 (rekursiv aufzählbare Sprachen) bis Typ-3 (reguläre Sprachen).
- Produktion: Regel der Form \alpha \rightarrow \beta.
- In Sprachverarbeitung oft genutzt: Kontextfreie Grammatiken (CFGs):
- Parsing-Algorithmen: Algorithmen zur Analyse und Validierung von Sätzen gemäß einer formalen Grammatik.
- Top-down Parsing: Beginnt bei Startsymbol und arbeitet zu Terminalsymbolen hinab.
- Bottom-up Parsing: Beginnt bei Terminalsymbolen und arbeitet zum Startsymbol hinauf.
- Wichtige Algorithmen:
- LL-Parser: liest von links nach rechts, erzeugt linke Ableitung.
- LR-Parser: liest von links nach rechts, erzeugt rechte Ableitung.
- CYK-Algorithmus: dynamische Programmierung, speziell für kontextfreie Grammatiken.
Semantic Composition und Bedeutungsrepräsentation
Definition:
Kombination von Bedeutungen einzelner Worte zu komplexeren Bedeutungen von Phrasen und Sätzen.
Details:
- Semantische Komposition: Regeln zur Kombination von Wortbedeutungen.
- Lambda-Kalkül: Formallogik zur Modellierung von Bedeutungsrepräsentation.
- Bedeutungsrepräsentation: Darstellung von Bedeutungen durch logische Formeln.
- Beispielrechnungen: \ (\lambda x. P(x))(a) \rightarrow P(a)
- Modelle: Herleitung von Wahrheitswerten in spezifischen Modellen.
Architekturen und Pipelines für NLP-Systeme
Definition:
Architekturen und Pipelines für NLP-Systeme strukturieren den Prozess der Verarbeitung natürlicher Sprache durch mehrstufige Analyse und Transformation von Textdaten.
Details:
- Tokenisierung: Text in kleinere Einheiten (Tokens) zerlegen.
- POS-Tagging: Wortartenanalyse zur Bestimmung der jeweiligen Wortarten.
- Parsing: Syntaktische Struktur des Textes ermitteln.
- Named Entity Recognition (NER): Erkennung und Klassifizierung von Namen und Entitäten im Text.
- Sentimentanalyse: Bestimmung der Stimmung oder Emotionalität des Textes.
- Feature-Engineering: Extraktion relevanter Merkmale für das Modell.
- Modell-Training: Lernen von Modellen zur Vorhersage oder Klassifikation.
- Evaluation und Optimierung: Performancemessung und Anpassung der Modelle.
- Einsatz von Pre-trained Modellen wie BERT, GPT, etc., zur Verbesserung der Prozessschritte.