Aufgaben und bungen ARBEIT MIT COSMAS II Wiederholung
Aufgaben und Übungen ARBEIT MIT COSMAS II.
Wiederholung der Theorie � Haben Sie sich die PPT-Präsentation zur Korpuslinguistik angeschaut, sollten Sie jetzt folgende Fragen beantworten können. Ist es nicht der Fall, lesen Sie die Präsetation noch einmal und/oder recherschieren Sie in der Sekundärliteratur: � Was ist ein Korpus? � Nennen Sie einige bekannte Korpora der dt. und tsch. Sprache? � Wo liegt der Unterschied zw. einem Korpus und einem Korpusmanager? Nennen Sie einige Korpora und einige Suchmanager? � Was ist ein Token? Was bedeutet Tokenisierung? � Was ist Lemma? Was bedeutet Lemmatisierung? � Wo gibt´s den Unterschied zwischen Token X Type X Lemma? Erklären Sie diesen Unterschied an dem Satz: Netrpěliví zákazníci stáli v obchodě i před obchodem, přičemž před obchodem jich čekalo jen několik. Erinnern Sie sich an den Unterschied, wenn Sie die Frage 6 aus der folgenden Folie bearbeiten werden. � Was bedeutet Tagging? � Was bedeutet Parsing? Was ist ein Parser? � Was versteht man unter Desambiguierung?
Praktische Anwendung 1. 2. 3. 4. 5. 6. Suchen Sie eine konkrete Wortform, z. B. nebenbei und stellen Sie ihre Frequenz im Korpus W-öffentlich fest. Suchen Sie alle Wortformen des Verbs klagen, stellen Sie die Länderverteilung fest und exportieren Sie die ersten 50 Belege (nur KWICs). Suchen Sie das Substantiv Strauß in der Bedeutung „Tier“ in allen Wortformen. Beseitigen Sie aus der Suche diejenigen Wortformen, die sich auf andere Bedeutungen beziehen. Benutzen Sie dazu die Expansions-/Wortformlisten. Welche Schwierigkeiten bringt Lemma in diesem Zusammenhang? Denken Sie anhand der Belege darüber nach. Versuchen Sie dasselbe mit den Verben sein und aufstehen zu tun. Beschreiben Sie die Komplikationen, die auftauchen. Versuchen Sie jetzt die Komparativformen des Adjektivs vorsichtig im Komparativ (samt Flexion/Deklinationsendungen) zu finden. Inwieweit ist es möglich und welche Grenzen gibt es dabei? Jetzt eine einfache, jedoch „theoretisch“ aussehende Frage: Wieviele Tokens hat der Type Minderwertigkeitskomplex und wieviele Tokens hat das Lemma Minderwertigkeitskomplex?
- Slides: 3