KI scheitert am Mainzer Dialekt

18. Mai 2026

Regional - Rheinland-Pfalz - aktuelle Fakten und Einordnung

Sprachmodelle und Dialektverständnis in Mainz

() – Große Sprachmodelle haben erhebliche Schwierigkeiten, den Mainzer Dialekt zu verstehen. Das hat ein Forschungsteam der Johannes Gutenberg-Universität Mainz (JGU) in einer neuen Studie herausgefunden, wie die Universität mitteilte.

Die Forscher erstellten zunächst ein digitales Wörterbuch mit 2.351 Dialektwörtern auf Basis eines Lexikons aus dem Jahr 1966.

Anschließend testeten sie mehrere Open-Source-Sprachmodelle. Die KI musste sowohl die Bedeutung von Meenzerisch-Wörtern erklären als auch aus standarddeutschen Definitionen die passenden Dialektwörter finden.

Die Ergebnisse fielen eindeutig aus: Beim Erklären der Wörter erreichten die Modelle eine Trefferquote von durchschnittlich nur 4,24 Prozent, beim Erzeugen der Dialektwörter sogar nur 0,56 Prozent.

„Die Resultate zeigen sehr klar, dass heutige Sprachmodelle Meenzerisch bislang kaum verstehen“, sagte Ko-Autor Peter Herbert Kann von der Universität . Eine Ursache sehen die Forscher darin, dass Dialekte vor allem gesprochen werden und daher wenig Textdaten für das Training der KI existieren.

Die Studie wurde im Rahmen der Language Resources and Evaluation Conference in Palma de Mallorca veröffentlicht.

Siehe auch:  Wetterbericht für Mecklenburg-Vorpommern (22.12.2025)
Text-/Bildquelle: Übermittelt durch www.dts-nachrichtenagentur.de
Bildhinweis: Roboter (Archiv)

Vier Bürgerfragen. Klare Antworten.

Welche neuen Fakten, Entscheidungen oder Änderungen nennt der Artikel?

  • Sprachmodelle verstehen den Mainzer Dialekt kaum.
  • Trefferquote beim Erklären von Dialektwörtern liegt bei 4,24 Prozent.
  • Trefferquote beim Finden passender Dialektwörter beträgt nur 0,56 Prozent.

Wen betrifft es und wie stark (Zielgruppen, Regionen, Zahlen, Fristen)?

  • Betroffen: Große Sprachmodelle, Forschungsteam der Johannes Gutenberg-Universität Mainz
  • Zielgruppe: Nutzer von KI-Sprachmodellen, Dialektsprecher
  • Ergebnisse: Trefferquote beim Erklären von Dialektwörtern 4,24%, beim Finden von Dialektwörtern 0,56%

Welche Gründe, Ursachen, Hintergründe oder Auslöser werden genannt?

  • Große Sprachmodelle haben Schwierigkeiten mit dem Mainzer Dialekt.
  • Mangel an Textdaten für das Training der KI, da Dialekte hauptsächlich gesprochen werden.
  • Ergebnisse zeigen eine sehr niedrige Trefferquote bei der Erkennung und Erklärung von Dialektwörtern.

Was machen die Politik bzw. die Behörden jetzt konkret?

  • Keine Angabe
Deutsche Textservice Nachrichtenagentur GmbH
Letzte Artikel von Deutsche Textservice Nachrichtenagentur GmbH (Alle anzeigen)