Automatic OCR and translation in the field / Maschinelle Dokumentenübersetzung im Feld

The Defense Advanced Research Projects Agency (DARPA) (Wikipedia), which is responsible for the development of new technology for use by the US military, has commissioned a Multilingual Automatic Document Classification Analysis and Translation (MADCAT) system to convert documents of every kind in Arabic (in the first instance) into English. Thus Mark Rutherford on CNET.

If and when it pans out, MADCAT is expected to provide “relevant, distilled, actionable information” to commanders and troops on the ground by translating foreign language text images accurately and automatically without bothering with linguists and analysts, according to the contract specifications. During the MADCAT proposal process DARPA demanded bidders demonstrate a “revolutionary approach,” one that will produce a new benchmark in language translation. Specifically excluded were “minor evolutionary” improvements or “narrow applications” to current technology.
BBN says it plans to pull it off by integrating “optical character recognition with state-of-the-art translation and distillation techniques,” while developing “novel methods for processing handwritten text,” according to its press release.

DARPA’s original announcement is here.

Nomen est omen?

(via MacLingua at Yahoogroups)

Übersetzerbezahlung nach JVEG, Nürnberg-Fürth

Seit der Einführung des JVEG sollen Übersetzer beim Gericht mehr verdienen als nach dem ZSEG. Es gibt drei Stufen der Bezahlung pro Zeile: EUR 1,25, 1,85 und 4,00. Wenn die Übersetzung durch Fachausdrücke erschwert wird, gilt zumindest 1,85.

Anders das Verständnis des Amtsgerichts Fürth im Zusammenhang mit einer Rechnung, die ich 2007 einreichte. Mich rief eine Dame an und sagte einiges dazu: übliche juristische Ausdrücke erschweren einen Text nicht (übrigens ganz besonders, wenn eine Übersetzerin eine Textstelle zum wiederholten Male übersetzt); alle Übersetzer im Raum Fürth verlangen nur 1,25; “die Übersetzer bezahlt der Steuerzahler”; ich könne Aufträge ablehnen. Sie berief sich auf ein Rundschreiben, an dem sich die Kostenbeamten in Fürth hielten. Ich wies sie darauf hin, dass ich auch Rechnungen zu 1,25 gestellt hatte, wo der Text aus einem einfachen Schreiben bestand (ich bin nämlich nicht der Meinung, dass Übersetzer nie weniger als 1,85 verlangen sollten). Sie ließ sich aber durch Argumente nicht beeinflussen.

Das Rundschreiben holte ich beim Gericht ab. Ich gebe es in der Fortführung dieses Eintrags wieder.

Einer Kollegin, die im BDÜ für Gerichtsdolmetschen zuständig war, fiel auf, dass das Schreiben aus dem Jahr 2004 spätere Rechtsprechung (auch des OLG Nürnberg) nicht berücksichtigt, nach der 1,85 pro Zeile berechtigt sind, wenn Fachausdrücke (auch juristische) nicht nur vereinzelt im Text vorkommen, und auch, dass dort schwarz auf weiß steht, dass die Durchschnittsbezahlung gesunken sein soll, was nicht das Ziel des JVEG war.

Meine Übersetzung in diesem Zusammenhang war eine kurze aber schwierige Belehrung in juristischer Sprache.

Hier § 17 (2) ZSEG (bis 2004 gültig):

(3) Die Entschädigung für die Übersetzung eines Textes aus einer Sprache in eine andere Sprache beträgt 1 Euro je Zeile. Ist die Übersetzung erschwert, insbesondere wegen der Verwendung von Fachausdrücken oder wegen schwerer Lesbarkeit des Textes, so kann die Entschädigung bis auf 3 Euro, bei außergewöhnlich schwierigen Texten bis auf 4,30 Euro je Zeile erhöht werden. Für eine oder für mehrere Übersetzungen auf Grund desselben Auftrags beträgt die Entschädigung mindestens 13 Euro.

Hier § 11 (1) und (2) JVEG:

(1) Das Honorar für eine Übersetzung beträgt 1,25 Euro für jeweils angefangene 55 Anschläge des schriftlichen Textes. Ist die Übersetzung, insbesondere wegen der Verwendung von Fachausdrücken oder wegen schwerer Lesbarkeit des Textes, erheblich erschwert, erhöht sich das Honorar auf 1,85 Euro, bei außergewöhnlich schwierigen Texten auf 4 Euro. Maßgebend für die Anzahl der Anschläge ist der Text in der Zielsprache; werden jedoch nur in der Ausgangssprache lateinische Schriftzeichen verwendet, ist die Anzahl der Anschläge des Textes in der Ausgangssprache maßgebend. Wäre eine Zählung der Anschläge mit unverhältnismäßigem Aufwand verbunden, wird deren Anzahl unter Berücksichtigung der durchschnittlichen Anzahl der Anschläge je Zeile nach der Anzahl der Zeilen bestimmt.

(2) Für eine oder für mehrere Übersetzungen aufgrund desselben Auftrags beträgt das Honorar mindestens 15 Euro.

Continue reading

Joining html sections / Viele html-Dateien verbinden?

Die meisten Gesetze kann man heutzutage online als ganze Texte finden, nicht bloß als anklickbare Einzelparagrafen. Wenn aber nur letztere Möglichkeit besteht (z.B. bei älteren Fassungen oder ausländischen Gesetzen), gibt es eine technische Möglichkeit, diese Einzel-Webseiten zu einem Dokument zu verbinden?

Vorgeschlagen wurde mir, dieses mit STAR Transit oder Deja Vu Translation Memory Software zu tun. Gibt es Alternativen?

If I find a statute online and it is only available in the form of one page per section, is there an easy way to download it and combine the sections into one document? I know there are programs that download whole sites, but how can I join the sections?

It has been suggested to me that I can do this using translation memory software – Deja Vu and STAR Transit should both do it (I have the latter). Is there any other way?

Linux for translators 2 / Linux für Übersetzer 2

Further to my entry of 25 December, Marc adds another. Quoting a message to the ITI GerNet group:

PCLOS-Trans
homepage.uibk.ac.at/~c61302/pclostrans.html (German)

Linguas OS
www.baldwinlinguas.com/linguasos.html (English)

PCLOS-Trans is a live DVD, Linguas OS a live CD. Both can be run without
installation, i.e. without making any changes to the user’s hard drive,
but can also be installed on the hard drive if desired. PCLOS-Trans is
more comprehensive and user-friendly, Linguas OS less so but probably
faster.