Programmausrüstung; Software; Softwaresystem; Programm; Computerprogramm[Classe]
science cognitive (fr)[Classe]
computational linguistics (en)[ClasseHyper.]
computer_science (en)[Domaine]
FieldOfStudy (en)[Domaine]
Informatik, Informationstechnologie - Linguistik, Sprachwissenschaft[Hyper.]
computer_science (en)[Domaine]
FieldOfStudy (en)[Domaine]
maschinelle Übersetzung (n.)
| Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (bspw. Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Hilf bitte der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung. |
Maschinelle Übersetzung (MÜ oder MT für engl. machine translation), auch automatische Übersetzung, bezeichnet die Übersetzung von Texten aus einer Ausgangssprache (in der MÜ als Quellsprache bezeichnet) in eine Zielsprache mit Hilfe eines Computerprogrammes. MÜ ist ein Teilbereich der künstlichen Intelligenz. Während die menschliche Übersetzung Gegenstand der angewandten Sprachwissenschaft ist, wird MÜ vor allem in der Informatik und Computerlinguistik erforscht.
Inhaltsverzeichnis |
Das Verstehen einer Sprache, ohne sie gelernt zu haben, ist ein alter Menschheitstraum (Turmbau zu Babel, J. Bechers numerische Interlingua, Timerio, Babelfisch, Pfingstwunder, Science-Fiction-Geschichten). Die Erfindung der Computer in Kombination mit der Beschäftigung mit dem Phänomen Sprache als wissenschaftlicher Disziplin (Sprachwissenschaft) haben zum ersten Mal einen konkreten Weg zur Erfüllung dieses Traums geöffnet.
Bis zum heutigen Tag hat das militärische Interesse den Weg der MÜ entscheidend geprägt. Eines der frühesten Projekte war ein Russisch-Englisch-Übersetzungsprogramm für das US-Militär. Trotz seiner anekdotenhaft schlechten Qualität genoss das Programm hohe Popularität unter US-Militärs, die sich zum ersten Mal ohne den Umweg über Dritte (Dolmetscher und Übersetzer) selbst zumindest einen Eindruck vom Inhalt russischer Dokumente verschaffen konnten.
Der 1966 für das Pentagon erstellte ALPAC-Bericht bescheinigte der MÜ grundsätzliche Unrealisierbarkeit und brachte mit einem Schlag die Forschung für fast 20 Jahre praktisch ganz zum Erliegen. Erst in den 1980er Jahren begannen Elektrokonzerne wie die Siemens AG (Metal-Projekt) erneut mit der Forschung. Zu diesen Vorhaben zählt auch die Forschungsarbeit im Sonderforschungsbereich "Eletronische Sprachforschung" an der Universität des Saarlandes. Hier wurde das System "SUSY" entwickelt, das in der Lage war, von und ins Deutsche zu übersetzen.[1] Ein weiteres System des Sonderforschungsbereichs war ASCOF, in dem neben morpho-syntaktischen auch semantische Informationen für die Übersetzung herangezogen wurden.[2] In der gleichen Zeit initiierte die japanische Regierung das Fünfte-Generation-Projekt, bei dem MÜ von Englisch in Japanisch zunächst auf der Basis der Programmiersprache Prolog implementiert wurde. Die enge Zusammenarbeit zwischen Universitäten, Elektrokonzernen und Regierung führte zu den weltweit ersten kommerziellen MÜ-Programmen für PCs und hat Japan in die Führungsposition der MÜ-Forschung weltweit gebracht. In den 1990er Jahren lief in Deutschland das BMBF-Leitprojekt Verbmobil, dessen Ziel es war, deutsche, englische und japanische gesprochene Dialogsprache zu dolmetschen. Das Verbmobil-System sollte gesprochene Spontansprache erkennen, die Eingabe analysieren, übersetzen, einen Satz erzeugen und ihn aussprechen.
Der Crash der Dotcom-Unternehmen 2000 bis 2001 hat auch viele kleinere MÜ-Unternehmen in den Ruin getrieben. Heutzutage sind in der MÜ-Software-Industrie weltweit schätzungsweise nur 10 bis 20 Unternehmen aktiv (viele Programme sind lizenziert, so dass der falsche Eindruck einer größeren Vielfalt entsteht), so dass sich die Entwicklung großenteils an den Universitäten abspielt. Eines der bekanntesten Forschungsprojekte dieser Art ist die freie Software Apertium, die von der spanischen Regierung und der Regierung von Katalonien finanziert und an der Universität Alicante weiterentwickelt wird.
Derzeit wird weltweit nur etwa 1 % des gesamten Umsatzes auf dem Übersetzungs-Markt mit MÜ-Anwendungen erzielt.
Dennoch gibt es mehrere Gründe für einen ansteigenden Bedarf an MÜ-Anwendungen:
Alle MÜ-Systeme benutzen (in Datei-Form vorliegende) zweisprachige Wörterbücher und haben zumindest für grundsätzliche Grammatikregeln Module. Die einzelnen Methoden unterscheiden sich dennoch erheblich.
Die wichtigsten Methoden/Herangehensweisen der MÜ sind:
Die meisten Systeme in der Praxis sind eine Mischung aus mehreren Methoden (oft Dominanz des Transfersystems mit Interlingua und EBMT-Elementen).
Nicht zur maschinellen Übersetzung zählt die MAHT (Machine-Aided Human Translation, auch Computer-Aided Translation oder CAT genannt), also die bloß computerunterstützte Übersetzung, bei der ein Computerprogramm den menschlichen Übersetzer durch automatisches Nachschlagen von Terminologie (automatic dictionary look-up), Vergleich mit früheren Übersetzungen (Übersetzungsspeicher) und ähnliche Funktionen unterstützt.
Die MÜ-Forschung benutzt die Evaluation, die skalierte Bewertung der Übersetzungsqualität. MÜ-Übersetzungen werden zunächst pro Satz bewertet; die normalisierte Summe der Sätze ist die Qualität des ganzen Textes. In den meisten Fällen wird die Bewertung per Hand von einem Muttersprachler der Zielsprache durchgeführt und in einer Kennziffer ausgedrückt. In Japan wird oft eine fünfstellige Skala mit 0–4 Punkten verwendet:
Für große Übersetzungen benutzen MÜ-Forscher auch automatische Evaluations-Algorithmen wie den Bleu-Score, die allerdings der menschlichen Urteilskraft unterlegen sind.
Der Stand der MÜ wird von vielen Menschen als unzureichend angesehen. Doch grundsätzlich versteht die Wissenschaft die menschliche Sprache noch unzureichend. Die meisten Sprachwissenschaftler gehen gar davon aus, dass das vollständige Begreifen von Sprache ein vollständiges Begreifen der menschlichen Intelligenz insgesamt impliziert. Man kann also die Ansicht vertreten, dass ein perfektes MÜ-System den menschlichen Geist simulieren und somit eine Form der Künstlichen Intelligenz darstellen müsste. Wie oben erwähnt ist es ein Vorteil der SBMT, dass dieses Problem umgangen wird, da theoretisch auch noch nicht explizit bekannte Regeln extrahiert werden können.
Dass MÜ-Qualität oft als unbefriedigend empfunden wird, hat auch noch handfestere, teilweise behebbare Ursachen:
In keinem MÜ-System wird jede grammatische Regel angewendet beziehungsweise analysiert. Vielmehr wird oft darauf vertraut, dass ein nicht analysiertes grammatisches Phänomen zufällig in der anderen Sprache in ähnlicher Form auftritt, sodass nur die Wörter übersetzt werden müssen. Ein Beispiel ist der Artikel der, die, das, der im Englischen fast immer zu the und fast nie zu a übersetzt wird. Auf eine Analyse als „bestimmter Artikel“ kann also verzichtet werden. Dass aber auch zwischen Deutsch und Englisch solche einfachen Übersetzungen scheitern können, zeigt der obige if-Satz mit „würde“. Zwischen weniger nah und nicht verwandten Sprachen, zum Beispiel Latein und Deutsch bzw. Chinesisch und Deutsch, sind solche direkten Übersetzungen oft nicht mal auf der Wortebene eine sichere Wahl.
Viele komplexe Grammatik-Phänomene sind von der MÜ noch gar nicht oder nur in Ansätzen erforscht. Dann sind free rides oft die einzige Lösung. Solche Phänomene sind (Auswahl):
sensagent's content
Dictionary and translator for handheld
New : sensagent is now available on your handheld
Advertising ▼
Webmaster Solution
Alexandria
A windows (pop-into) of information (full-content of Sensagent) triggered by double-clicking any word on your webpage. Give contextual explanation and translation from your sites !
SensagentBox
With a SensagentBox, visitors to your site can access reliable information on over 5 million pages provided by Sensagent.com. Choose the design that fits your site.
Business solution
Improve your site content
Add new content to your site from Sensagent by XML.
Crawl products or adds
Get XML access to reach the best products.
Index images and define metadata
Get XML access to fix the meaning of your metadata.
Please, email us to describe your idea.
Lettris
Lettris is a curious tetris-clone game where all the bricks have the same square shape but different content. Each square carries a letter. To make squares disappear and save space for other squares you have to assemble English words (left, right, up, down) from the falling squares.
boggle
Boggle gives you 3 minutes to find as many words (3 letters or more) as you can in a grid of 16 letters. You can also try the grid of 16 letters. Letters must be adjacent and longer words score better. See if you can get into the grid Hall of Fame !
English dictionary
Main references
Most English definitions are provided by WordNet .
English thesaurus is mainly derived from The Integral Dictionary (TID).
English Encyclopedia is licensed by Wikipedia (GNU).
Copyrights
The wordgames anagrams, crossword, Lettris and Boggle are provided by Memodata.
The web service Alexandria is granted from Memodata for the Ebay search.
The SensagentBox are offered by sensAgent.
Translation
Change the target language to find translations.
Tips: browse the semantic fields (see From ideas to words) in two languages to learn more.
last searches on the dictionary :
computed in 0.062s
Advertising ▼