Enroll Course: https://www.coursera.org/learn/digital-humanities
In den letzten Jahren hat sich die Welt der Digital Humanities rasant entwickelt und bietet neue Möglichkeiten, Sprache und Texte zu analysieren und darzustellen. Der Kurs „Sprachtechnologie in den Digital Humanities“, der auf Coursera angeboten wird, ist ein hervorragendes Beispiel für die Integration von Linguistik und Informatik. Am 20. Mai 2019 wird dieser beliebte MOOC zum letzten Mal angeboten, bevor er pausiert wird. Hier erfährst du alles, was du über den Kurs wissen musst!
Kursübersicht
Der Kurs umfasst sechs Wochen und befasst sich mit verschiedenen Aspekten der Sprachtechnologie in Bezug auf digitale Textverarbeitung. Die Themen reichen von der Digitaliserung von Texten bis hin zu automatischen Annotationen und der Analyse multilingualer Korpora.
Woche 1 – Wege in die digitale Welt
In der ersten Woche wird behandelt, wie Texte digitalisiert werden und was OCR für praktische Anwendungen bedeutet. Auch die Erstellung von Korpora wird thematisiert, was für Linguisten und Digital Humanities-Forscher von großer Bedeutung ist.
Woche 2 – Strukturierte und nachhaltige Repräsentation von Korpusdaten
Hier werden wichtige Standards zur Textrepräsentation und die Markup Language XML behandelt. Die Teilnehmer lernen, wie sie Korpusdaten strukturiert und nachhaltig darstellen können.
Woche 3 – Eigenschaften von Korpora und grundlegende Analysemethoden
In dieser Woche geht es um Analysemethoden in der Korpuslinguistik, sowie um Grundbegriffe wie Worthäufigkeiten und N-Gramme. Noah Bubenhofer gibt zudem einen Einblick in die visuelle Darstellung von Texteigenschaften.
Woche 4 – Automatische Korpusannotation mit computerlinguistischen Werkzeugen
Diese Woche beleuchtet die automatische Annotation von Korpora und die Herausforderungen, die damit verbunden sind, wie die Erkennung von Eigennamen und die Syntaxanalyse.
Woche 5 – Manuelle Annotation und Evaluation von Korpusdaten
In der vorletzten Woche wird die Kombination aus manueller und automatischer Annotation mit maschinellem Lernen behandelt. Das Thema Crowdsourcing bietet spannende Einblicke in die Datenerhebung.
Woche 6 – Herausforderungen der Multilingualen Textanalyse
Im letzten Modul wird die automatische Sprach-Identifikation und die Wortalignierung in multilingualen Korpora thematisiert, was für internationale Forschungsprojekte von entscheidender Bedeutung ist.
Fazit und Empfehlung
Der Kurs „Sprachtechnologie in den Digital Humanities“ ist eine herausragende Gelegenheit für alle, die sich für die Schnittstelle von Linguistik und digitalen Technologien interessieren. Auch wenn der Kurs nach dem 20. Mai 2019 pausiert wird, stehen die Videos weiterhin auf YouTube zur Verfügung. Ich empfehle jedem, der an Digital Humanities interessiert ist, diesen Kurs zu besuchen, solange er noch verfügbar ist!
Enroll Course: https://www.coursera.org/learn/digital-humanities