Wenn Sie die im Internet verfügbaren kostenlosen maschinellen Übersetzungssysteme ausprobieren, werden Sie sich entweder totlachen oder entsetzt sein (oder beides).
Daraus zu schließen, dass die maschinelle Übersetzung (Machine Translation = MT) nutzlos sei, wäre eine gefährliche Fehleinschätzung. Wir haben bereits vor über 10 Jahren Kosteneinsparungen von kontinuierlich 30 % mit nachbearbeiteten ("posteditierten") MT-Übersetzungen erreichen können.
Warum hat sich die MT-gestützte Übersetzung dann nicht im großen Stil durchgesetzt?
Einsparungen in der genannten Größenordnung sind nur in kontrollierten Umgebungen mit optimierten Abläufen möglich. Einfach nur "Texte rein — Übersetzungen raus" liefert die oben genannte Wegwerfqualität.
Gegenwärtig gibt es zwei Arten von MT-Systemen: solche, die den Ausgangstext satzweise auf Grundlage grammatikalischer Regeln in die Bestandteile zerlegen und in der Zielsprache wieder zusammensetzen, und solche, die große zweisprachige Text-Corpora verwenden, um mit Hilfe statistischer Methoden Sätze und Satzbestandteile und die dazu passenden Übersetzungsfragmente zu identifizieren, und so eine Übersetzung "auf Puzzle-Basis" erstellen.
Wissenschaftliche Untersuchungen zeigen, dass die Ergebnisse qualitativ etwa vergleichbar sind. Mit anderen Worten, es ist ungefähr der gleiche Aufwand erforderlich, um die MT-Übersetzung auf ein brauchbares Niveau zu heben.
Hat man sauber formulierte Ausgangstexte, können die grammatikalischen Regeln ihre Stärke ausspielen. Verfügt man andererseits über große Mengen bereits übersetzter Texte, die sich alle um den gleichen Sachverhalt drehen, liefert die Statistik bessere Ergebnisse. Außerdem ist die Eingung der Systeme stark sprachabhängig. Ist Deutsch zum Beispiel eine der beteiligten Sprachen, haben statistische System wegen des zerrissenen Prädikats erhebliche Probleme.
Sind ausreichend Textmengen zur Übersetzung aus einem Bereich vorhanden, können MT-Systeme in einer wohlüberlegten Arbeitsumgebung zu Kosten- und Zeiteinsparungen führen. Realistisch sind dabei 20-30%.
Auf grammatikalischen Regeln basiertes MT-System
Statistisches MT-System