Funded by the Horizon 2020 Framework Programme of
Funded by the Horizon 2020 Framework Programme of the European Union enet. Collect Sprachenlernen und Crowdsourcing – ein innovatives Projekt Plenumspräsentation bei der 7. Da. FWEBKON, 2. März 2018 Verena Lyding & Lionel Nicolas Eurac Research 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 1
Ablauf • Hintergrund • Ziele und Eckdaten des Projekts • Was ist Crowdsourcing? • Projektumsetzung: Crowdsourcing im Sprachenlernen • Beispiele • Forschungsinhalte und Möglichkeiten der Mitwirkung 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 2
Hintergrund Verena Lyding: Computerlinguistin, Wissenschaftlerin im Bereich Korpuslinguistik/Sprachressourcen, Visualisierung. Lionel Nicolas: Informatiker, Ph. D in Automatischer Sprachverarbeitung, Verfahren zum Aufbau von Sprachressourcen, Lernerkorpora Institut für Angewandte Sprachforschung von Eurac Research: (1) Zwei- und Mehrsprachigkeit (2) Fachsprache / Terminologie (3) Sprachtechnologien / Computerlinguistik 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 3
COST Netzwerkprojekt ‘Enet. Collect’ • Förderrahmen: COST Programm unter Horizon 2020 • Fördert europäische Trends im Bereich Forschung und Innovation ü Länderübergreifender Kooperation mittels Arbeitstreffen, Kurzaufenthalten, Trainings und Dissemination ü KEINE Personalkosten • Ziele: ü Erarbeitung gemeinsamer inhaltliche Basis ü Aktive Interessensgemeinschaft aufbauen ü Konkrete Folgeinitiativen vorbereiten (geförderte Projekte) 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 4
Enet. Collect – Sprachenlernen und Crowdsourcing „European NETwork for the COmbination of Language LEarning and Crowdsourcing Techniques“ • Laufzeit: Feb 2017 – Feb 2021 • Über 120 aktive Mitglieder • Aus 37 Mitglieds- und Nachbarstaaten Ø Mitgliederzahlen weiterhin steigend! https: //mapchart. net/europe. html 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 5
Motivation für das Projekt 1. Zunehmender Bedarf an Sprachlernangeboten a) Mehr Lernende: Demographischer Wandel und Globalisierung in Wirtschaft, Politik und Arbeitsmarkt b) Heterogenere Lernerprofile: variable Lernvoraussetzungen, diversifizierte Sprachbiografien und kontextuelle Anforderungen Ø Erfordert eine Diversifizierung und Personalisierung von Lernangeboten! 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 6
Motivation für das Projekt 2. Bestehender Bedarf an umfassenden Sprachdatensätzen a) Methoden der automatischen Sprachverarbeitung stützen sich auf Datensätze wie Lexika b) Datensätze sind lückenhaft und ihre Erstellung ist sehr kostenaufwendig c) Methoden zur kosteneffizienten Erstellung von umfassenden Sprachressourcen sind erforderlich Ø Erwartbar hohes Interesse bei Akteuren aus Forschung und Innovation das Crowdsourcingpotential im Sprachenlernen zu erschließen! 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 7
Ziel des Projekts Ziel: Steigerung der Produktion von Sprachlernmaterialien und sprachlichen Datensätzen (z. B. Wörterbuch) durch Crowdsourcing. Stakeholder: • Sprachlernende & -lehrende • Akteure aus den Bereichen Forschung und Innovation (Sprachdienstleister, Linguisten, Crowdsourcing, NLP, etc. ) Crowdsourcing Synergie: Lernaktivitäten 02/03/18 Sprachdatensätze & -dienste Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 8
Crowdsourcing Definition: Verlagerung einer Expertenaufgabe an ein undefiniertes (und im Allgemeinen großes) Netzwerk von Personen („Crowd) über einen offenen Aufruf (Howe, 2006), typischerweise durch deren Unterteilung in Microtasks. Howe, J. (2006). The rise of crowdsourcing. Wired Magazine, 14(6). Worker Icon made by https: //www. freepik. com from www. flaticon. com 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 9
Crowdsourcing - Beispiele Wikipedia Aufgabe: gemeinschaftliche Erstellung von Lexikoninhalten • Vorgehen: flexible Mitwirkung, bewusst, moderiert • Ergebnis: umfangreiches, aktuelles, vielseitiges Lexikon Ø „Explizites“ Crowdsourcing 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 10
Crowdsourcing - Beispiele Re. CAPTCHA Aufgabe: Eingabe schwer leserlicher Wörter • Vorgehen: Micro-Task, obligatorisch, unbewusst • Ergebnis: 1. Verifizierung des menschlichen Nutzers 2. Erkennung schwer leserlichen gescannten Textes Ø „Implizites“ Crowdsourcing Screenshot: https: //developers. google. com/recaptcha/old/docs/customization 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 11
Crowdsourcing - Aspekte Wer ist die Crowd? (vgl. Fort, 2017) • Gruppe von Personen, die einem „offenen Aufruf“ gefolgt sind • Potentiell von großem Umfang • Experten vs. Nicht-Experten vs. Experten für spezifische Aufgabe Microtasks • Einfach oder Experten-Tasks • Kurze oder längere Tasks Teilnahme • Bewusst (‚explizit‘) oder unbewusst (‚implizit) • Entlohnt oder ohne Entlohnung, generell kostengünstig Fort, K. , “Crowdsourcing: (a bit of) theory and ((quite) some) practice”. Keynote at ‘enet. Collect’ meeting 2017, Bolzano, ITALY. http: //enetcollect. eurac. edu/cost-tools-events/meetings/0917 -bolzano/#meetings 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 12
Crowdsourcing im Sprachenlernen „Explizites“ Crowdsourcing Insbesondere für die Erstellung von Lernmaterialien Ø Vorwiegend durch Lehrende „Implizites“ Crowdsourcing Insbesondere für die Ableitung von Sprachwissen aus Lernaktivitäten und Korrekturaktivitäten Ø Vorwiegend durch Lernende und Lehrende 02/03/18 Lernmaterial Sprachdatensätze Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 13
Umsetzung der Projektziele Erforschung von Crowdsourcing-Technologien für Online-Lernangebote Lernplattform mit Crowdsourcing -Technologie „Crowd“ Lernender und Lehrender 02/03/18 zi pli x „e „im pliz t“ it“ Lernmaterial Anwendungen in Forschung und Innovation Sprachdatensätze Akteure im Bereich Forschung und Innovation Linguistik, Sprachdidaktik, Crowdsourcing, NLP, Sprachervices, etc. Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 14
Crowdsourcing-Potential „Explizit“ Wikipedia als Erfolgsgeschichte (> 46 Mio Artikel, > 250 Sprachen) Quelle https: //stats. wikimedia. org Ø Arbeitszeitersparnis für Lehrende „Implizit“ Lehr- und Lernaktivitäten ersetzen Expertenarbeit (z. B. Lexikonaufbau, Lernerkorpora) • 21% der Europäer über 14 Jahren lernen aktiv eine Sprache Quelle: Bericht der European Commision „Europeans and their languages“, Stand 2012 • ~ 88 Millionen aktive Lerner allein in Europa Ø $$$ für Akteure im Bereich Forschung und Innovation Je besser die Lernangebote, desto größer die „Crowd“! 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 15
Beispiel „Implizites“ Crowdsourcing Anwendungsbeispiel: Lernende bearbeiten Übungen, z. B. „Lückentexte“ Übung: „ Ich sehe dich an ____ Bushaltestelle stehen. “ Funktion: Ø Lernender übt Artikeldeklination. Ø Datenanbieter lernt Genus, Kasus und Numerusinformation über das Wort „Bushaltestelle“. 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 16
Beispiel: „Implizites“ Crowdsourcing Zwei Varianten der Übung: 1. Antwort des Lernenden wird mit korrekter Antwort abgeglichen. Ø Der Lernende wird evaluiert! 2. Korrekte Antwort ist unbekannt und wird vom Lernenden erfragt. Ø Die Datenressource wird um das Wissen des Lernenden erweitert. Ø Antworten vieler Lernender werden gegeneinander ausgewertet. Für den Lernenden erscheint die Übung immer gleich. 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 17
Beispiel: „Implizites“ Crowdsourcing Durch „implizites“ Crowdsourcing gesammelte Daten von Lernenden (L_x): ü ü ü ü ü L_1 „der“ L_2 „die“ L_3 „das L_4 „große“ L_5 „der“ L_6 „ein“ L_7 „das“ L_8 „der“ … 02/03/18 Häufigkeit: • 35 „der“ Auswertung • 32 „ein“ Folgerung • 22 „das“ • 16 „die“ • 1 „große“ Mögliche Ergebnisse: • „der“ ist korrekt • „der“ und „ein“ sind sich strukturell ähnlich • „große“ ist eine Alternativlösung / völlig falsch Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 18
Forschungsinhalte von ‘Enet. Collect’ Kernfragen: „Explizites“ Crowdsourcing • Möglichkeiten der gemeinsamen Materialerstellung? • Organisation und Anpassung des Materials? • Wie können linguistische Erkenntnisse in den Prozess einfließen? „Implizites“ Crowdsourcing • Welche Übungen sind effektiv für Lernende und für die Datensammlung? • Welche Algorithmen erlauben solide Auswertung der Daten? • Wie können aus Datensätzen Übungen generiert werden? 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 19
Forschungsinhalte von ‘Enet. Collect’ Praktische Herausforderungen • Attraktivität und Nutzerfreundlichkeit der Platform • Technische Herausforderungen (Tausende Nutzer gleichzeitig) • Ethische und rechtliche Fragen in Bezug zu Crowdsourcing Enet. Collect ist in 5 Arbeitsgruppen organisiert. 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 20
Mehrwert durch ‚Enet. Collect‘ Ø Mehr Lernmaterialen Ø Mehr Online-Übungsangebote Ø Kosteneffizienter Aufbau von Sprachdatensätzen und –diensten Ø Verbesserung des Forschung-Innovationszyklus Ø Engere Vernetzung der Community Kontinuierliche und nachhaltige Diversifizierung, Personalisierung und Aktualisierung von Sprachlernangeboten 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 21
‘Enet. Collect’-Aktivitäten in Jahr 1 ü Feb ’ 17 Brüssel, Kick-Off, 1 Tag, alle Mitglieder des Managementkomittees ü Jun ’ 17 Ljubljana, Core Group Treffen, 1 Tag, 14 Personen ü Sept ’ 17 Bozen, Erstes Jahrestreffen, 2 Tage, 55 Personen ü März ’ 18 Iasi, Zweites Jahrestreffen, 3 Tage, ca. 80 Personen ü März ’ 18 Iasi, Training, 1, 5 Tage, ca. 15 Personen ü 10 Forschungskurzaufenthalte zwischen Mitgliederinstitutionen ü Vorträge, Pressemitteilungen, Webseite Potential des Netzwerks kann den COST Rahmen übersteigen! 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 22
Möglichkeiten der Mitwirkung ü Befragungen zu Lernangeboten ü Erstellung von Übungsmaterial, Feedback zu Übungsmaterial ü Testen von Prototypen neuer Lernangebote ü Auch: Planung konkreter Kooperationsprojekte Ø Informationen zum Projekt auf: www. enetcollect. eurac. edu Ø Registrieren Sie sich um in Kontakt zu bleiben: https: //goo. gl/forms/YNexp 5 u. ECLq. Kc 42 H 3 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 23
enet. Collect Danke für Ihr Interesse! http: //enetcollect. eurac. edu/ http: //www. cost. eu/COST_Actions/ca/CA 16105 https: //goo. gl/forms/YNexp 5 u. ECLq. Kc 42 H 3 02/03/18 Lyding/Nicolas, Sprachenlernen und Crowdsourcing, COST enet. Collect CA 16105 24
- Slides: 24