Was passiert mit unseren Daten?
Die Daten gehen an die EG (GD Translate), um die Verbesserung des maschinellen Übersetzungssystems e-Translation zu unterstützen. Für Daten, die als offene Daten identifiziert werden, werden sie über das EU-Open Data Portal (https://open-data.europa.eu) zur Verfügung gestellt.
Warum sollten wir (öffentliche Institutionen) eigentlich Daten zur Verfügung stellen?
Die Unterstützung der eigenen Sprache unterstützt Europa und umgekehrt. Nur mit ihrer Hilfe und mit der Bereitstellung ihrer Sprachressourcen kann CEF e-Translation auf Ihre Bedürfnisse zugeschnitten werden. Im Rahmen des CEF-Programms steht CEF e-Translation öffentlichen Verwaltungen in allen EU-Mitgliedstaaten und den CEF-assoziierten Ländern (Island und Norwegen) kostenlos zur Verfügung. Für Ihre Daten erhalten Sie also einen besseren Service.
Wir (öffentliche Institutionen) haben keine Daten für Sie! Wir arbeiten nur auf Papier. Wir geben unsere Übersetzungen aus.
Bei Auslagerung von Übersetzungen sollten die übersetzten Daten mit den Übersetzungsspeichern geliefert werden. Verhandeln Sie die Übersetzungsspeicher mit dem Sprachendiensteanbieter vor Ort.
Wir können unsere Daten nicht einfach an Sie weitergeben – sie sind vertraulich!
Die meisten Daten des öffentlichen Sektors sind öffentliche Daten. Die Verwaltungen stellen den Bürgern online verschiedene Arten von Informationen zur Verfügung (z. B. Nachrichten, Rechtstexte, amtliche Kommunikation, Interviews, Broschüren, Hintergrundinformationen etc.). Diese Informationen können auch in einer Fremdsprache verfügbar sein. In Deutschland beispielsweise werden alle Informationen auf der Website der nationalen Regierung auf Deutsch, Englisch und Französisch bereitgestellt.
Wie kann ich meine Daten hochladen?
In drei einfachen Schritten können Sie Daten in das ELR-REPOSITORY hochladen:
- Registrieren (neuer Nutzer) oder melden (Rückkehrer)
- Eine grundlegende Beschreibung der Sprachressource (Titel, Kurzbeschreibung, Sprache (n))
Bitte lesen Sie den Durchgang für Contributors und/oder wenden Sie sich an den Helpdesk
Was ist CEF eTranslation?
Die elektronische Übersetzung ist das maschinelle Übersetzungssystem der Europäischen Kommission. Es handelt sich um einen Online-Dienst mit einer Webnutzerschnittstelle in 24 Sprachen für den menschlichen Gebrauch. Sie garantiert die Vertraulichkeit der Daten. Jede Verwaltung der Mitgliedstaaten, kleine und mittlere Unternehmen (KMU) und Universitätssprachfakultät in einem EU-Land, Island oder Norwegen kann die Webnutzerschnittstelle mindestens bis 2020 kostenlos nutzen. eTranslation kann auch als Web-Service in einem Automaten-zu-Maschine-Szenario genutzt werden. Dieser Web-Dienst ist auf alle Verwaltungen der Mitgliedstaaten oder KMU beschränkt, die an vom CEFF finanzierten Projekten teilnehmen. Im Rahmen von CEF Digital bietet e-Translation automatische Übersetzungsdienste mit dem Ziel an, alle digitalen Dienste jedem EU-Bürger in seiner eigenen Sprache zugänglich zu machen. Europäische öffentliche Online-Dienste wie Europeana, das Open Data Portal, die Online-Plattform für Streitbeilegung usw. sollten von der CEF eTranslation profitieren.
Wie gelangen wir zu eTranslation?
Die elektronische Übersetzung kann von jeder mitgliedstaatlichen Verwaltung genutzt werden. Es ist wie folgt abrufbar:
Mitarbeiter von EU-Institutionen oder - Agenturen können direkt mit ihrem EU-Anmeldeausweis (ehemals ECAS) auf elektronische Übersetzung zugreifen und müssen sich daher nicht registrieren.
Mitarbeiter einer öffentlichen Verwaltung, kleine und mittlere Unternehmen sowie Universitätssprachfakultäten in einem EU-Land, Island oder Norwegen können sich hier selbst registrieren.
Einzelne Zugänge werden automatisch nach 12 Monaten deaktiviert, wenn sie nicht genutzt werden.
Weitere Informationen finden Sie hier.
Warum brauchen wir eTranslation? Wir haben menschliche Übersetzer!
eTranslation kann wesentlich dazu beitragen, den Übersetzungsprozess produktiver und effizienter zu gestalten. Übersetzer der EG sind für die Übersetzung von Inhalten in alle Amtssprachen der EU zuständig. Insgesamt haben 2014 mehr als 7.000 Übersetzer der GD Übersetzung und der EU-Institutionen mehr als 2,3 Mio. Seiten übersetzt. Die elektronische Übersetzung wird täglich für
Französisch, Spanisch, Portugiesisch und Italienisch genutzt, um erste Übersetzungen zu erstellen, die sehr effizient gepostet werden. Bei anderen Sprachen (z. B. Deutsch) ist die Qualität des Outputs immer noch zu niedrig.
Im vergangenen Jahr wurden jedoch durch domänenspezifische Motoren deutliche Fortschritte erzielt. Bei domänenspezifischen Berichten und Texten ist die Qualität des übersetzten Outputs durch die elektronische Übersetzung akzeptabel. In anderen Fällen kann das Tool schnell Langtexte in einer Fremdsprache scannen und auf vom Menschen zu übersetzende Passagen hinweisen.
Insgesamt steht die Übersetzungsqualität in direktem Zusammenhang mit der Verfügbarkeit qualitativ hochwertiger Daten in der Sprache: Wenn die Daten für MÜ-Systeme gut sind, wird das MÜ-System gut sein.
eTranslation kann KMU eine kostengünstige Lösung bieten, z. B. tägliche Gespräche mit ausländischen Kunden zu führen und gleichzeitig weiterhin menschliche Übersetzer für komplizierte Texte einzusetzen, die perfektes Dolmetschen und Verständnis erfordern.
Warum sollten wir eTranslation unterstützen – wir können eine eigene nationale Lösung haben?
Typischerweise werden nationale oder proprietäre Lösungen auf ein bestimmtes Themenspektrum ausgerichtet. Daher ist der Umfang der elektronischen Übersetzung breiter und umfassender. Mit der Unterstützung von e-Translation können die Teilnehmer einen breiteren Service erwarten. Für KMU, die über keine eigenen Übersetzungslösungen verfügen, kann e-Translation ein kostengünstiges Übersetzungsinstrument sein, das erste Eindrücke zu einer Vielzahl von Texten liefern kann.
Maschinelle Übersetzung steht im direkten Widerspruch zu unserer nationalen Politik, dass junge Menschen Fremdsprachen lernen sollten.
Nicht unbedingt. Maschinelle Übersetzung kann tatsächlich eine gute Grundlage für das Erlernen von Sprachen sein. Sie kann zunächst genutzt werden, um die Lücke für Menschen zu schließen, die erst dann eine bestimmte Sprache beherrschen können, wenn sie erste Sprachkenntnisse erwerben. So kann z. B. auf Hochschulebene maschinelle Übersetzung zur automatischen und gleichzeitigen Übersetzung von Vorträgen für ausländische Studierende eingesetzt werden, die die Sprache nicht beherrschen.
Maschinelle Übersetzung funktioniert nie für unsere Sprachen (z. B. estnische, finnische, ungarische und andere morphologisch reiche Sprachen).
Die Verarbeitung bestimmter Sprachen mit den aktuellen MÜ-Technologien ist z. B. wegen ihrer kostenlosen Morphologie oder ihrer freiheitlichen Konstitutionsordnung schwieriger. MÜ-Experten arbeiten an neuen MÜ-Lösungen, die auf neuralen Netzwerken basieren, die besser auf diese Sprachen zugeschnitten sind. Darüber hinaus finanziert die Europäische Kommission mehrere Maßnahmen (z. B. www.qt21.eu) zur Untersuchung von MÜ-Lösungen für Sprachen, die derzeit nur suboptimale MÜ-Unterstützung erhalten. Unabhängig von der Methodik sind jedoch enorme Parallelressourcen für die Umsetzung der Systeme erforderlich, da diese Systeme auf maschinelles Lernen angewiesen sind. Durch die Öffnung des Zugangs zu KMU werden wir Daten für „unterfinanzierte“ europäische Sprachen oder morphisch reiche Sprachen erheben, die Qualität der Übersetzungen verbessern und die Bereiche erweitern können, die von eTranslation abgedeckt werden.
Die Texte, die wir übersetzen müssen, sind vertraulich. Was passiert mit den Texten, die zur Übersetzung vorgelegt wurden? Behalten Sie sie oder werden sie danach gelöscht?
Alle Texte werden innerhalb von 24 Stunden gelöscht, es sei denn, es wird gebeten, die Texte unmittelbar nach Bearbeitung des Antrags zu löschen. Die Nutzer können auch direkt nach dem Download („Löschen nach dem Download“) Löschen oder den Output direkt von der Schnittstelle abrufen (Reiter „Meine Übersetzungsaufträge“), anstatt den Output per E-Mail zu empfangen („Mail me my Translation“). Mit der Anmeldung zur Nutzung dieses Antrags erklären Sie sich damit einverstanden, dass e-Translation die nachstehend beschriebenen personenbezogenen Daten verwendet. Datenschutzerklärung. Mit der Anmeldung zur Nutzung dieses Antrags erklären Sie sich damit einverstanden, dass e-Translation die nachstehend beschriebenen personenbezogenen Daten verwendet. e-Translation erfasst das Login, die Zugangszeit, die angeforderten Sprachen, den Umfang des zur Übersetzung eingereichten Dokuments und die Domäne ihrer E-Mail-Adresse (… @EC). europa.eu) Zugang zum Dienst und zur Bearbeitung von Anfragen sowie zu statistischen Zwecken zu ermöglichen. Diese werden 18 Monate lang aufbewahrt und anschließend archiviert. Wenn Sie sich dafür entscheiden, Ihr Dokument per E-Mail zurücksenden zu lassen, bleibt Ihre E-Mail-Adresse bis zum Versand des Dokuments erhalten. Sie wird dann nur noch auf ihre Domäne reduziert. Nutzer sollten ihre Beurteilung ausüben, wenn sie potenziell sensible Dokumente jedem Online-Dienst, einschließlich eTranslation, übermitteln. Die eingereichten Unterlagen stehen 24 Stunden nach ihrer Löschung zur Verfügung. Es gibt eine Option „Löschen nach Lieferung“, die bei Ankreuzen unmittelbar nach der Lieferung zur Löschung des Textes führt. Daten werden nicht an Dritte weitergegeben. Sollten Bedenken bezüglich der Nutzung personenbezogener Daten durch die elektronische Übersetzung bestehen, schreiben Sie bitte an die DGT-MT@ec.europa.eu.
Sind Übersetzungen urheberrechtlich geschützt? Wenn ja, wer hat das Urheberrecht? Wie wär 's mit maschineller Übersetzung?
a) sind Übersetzungen urheberrechtlich geschützt? Nach international verbindlichen Regelungen (z. B. der Berner Übereinkunft zum Schutz von Werken der Literatur und Kunst) sind Übersetzungen unter anderem alternativ als Originalwerke geschützt, ohne dass das Urheberrecht an dem Originalwerk berührt wird. b) Wenn ja, wer hat das Urheberrecht? Da es sich bei dem Urheberrecht um ein eigenständiges Recht handelt, das dem des Originalwerks gleichwertig ist, unterliegt der Übersetzer der gleichen rechtlichen Regelung wie der Urheber des Originalwerks. Das Urheberrecht an der Übersetzung hängt, obwohl es sich um ein eigenständiges Recht handelt, vom Urheberrecht an dem Originalwerk ab. Denn der Übersetzer selbst kann seine Übersetzung nur verwenden, wenn der Urheber des Originalwerks seine Zustimmung erteilt hat. Für Mitarbeiter/- innen, die Übersetzungen durchführen oder maschinelle Übersetzungsdokumente nachbearbeiten, können die Rechtsvorschriften von Land zu Land unterschiedlich sein. Einige Länder sehen eine direkte Übertragung des Urheberrechts vom Arbeitnehmer auf den Arbeitgeber vor, einige möglicherweise nicht. Arbeitsverträge sollten daher eine Klausel enthalten, die die Übertragung von während der Arbeitszeit erbrachten urheberrechtlichen Werken auf den Arbeitgeber vorsieht. Einen Anwalt hinzuziehen, um Ihnen bei der Formulierung und Anwendung einer solchen Klausel zu helfen. c) Wie wäre es mit maschineller Übersetzung? Eine Übersetzung, die von einer Maschine im Allgemeinen erstellt wird, ist kein urheberrechtlich geschütztes Werk. Nur der Code des Übersetzungsprogramms ist schützenswert. Nichtsdestotrotz bleibt das Urheberrecht bestehen, wenn ein Autor maschinelle Übersetzungen als unterstützendes Werkzeug für Empfehlungen verwendet, die Übersetzung
Entsprechen übersetzte Texte in elektronischer Übersetzung beglaubigten Übersetzungen?
In der Regel obliegt es jedem Mitgliedstaat, zu bescheinigen, dass eine Übersetzung dem Originaltext entspricht, und zwar in der Ausgangssprache, wenn die Übersetzung von gerichtlich registrierten Übersetzern zur Verfügung gestellt wird oder die Übersetzung von der nationalen Verwaltung selbst in Auftrag gegeben wurde.
Bisher hat kein Mitgliedstaat die Auffassung vertreten, dass eine maschinelle Übersetzung, sei es aus der elektronischen Übersetzungoder einer anderen maschinellen Übersetzung, einer menschlichen Übersetzung gleichkommt.
e-Übersetzung kann und wird einen menschlichen Übersetzer nicht ersetzen. Die Plattform soll nur einen ersten Einblick in die Bedeutung eines Textes geben.
Wie kann ich Leistungs- und/oder Nutzungsindikatoren im Zusammenhang mit der Nutzung von eTranslation abrufen?
Einige Nutzungsindikatoren im Zusammenhang mit eTranslation werden auf folgender Seite zur Verfügung gestellt:
https://ec.europa.eu/cefdigital/wiki/display/CEFDIGITAL/eTranslation+dashboard.
Warum sollte ich mich um Überset-zungen kümmern und entsprechende Sprachdaten aufbewa-hren/pflegen?
Ob intern oder extern – Ihr Prozess kann von der kosteneffizienten Weiterverwendung von Sprachdaten aus früheren Übersetzungen profitieren und gleichzeitig die Qualität des Outputs verbessern.
Wie soll ich meine Daten verwalten und warum? Wir haben keine Infrastrukturen und Ressourcen (insbesondere kleine Überset-zungsdienste)!
Im öffentlichen Sektor gibt es eine große Vielfalt im Überset-zungsmanagement: von Papierarbeiten bis hin zu digitalisierten Arbeitsabläufen mit Terminlisten und Speichern von Überset-zungsspeichern. Organisatorisch können auch kleine Verände-rungen im Umgang mit Sprachdaten einen großen Nutzen brin-gen. Die vorgeschlagenen Maßnahmen können ohne große Anstrengungen ergriffen werden, darunter:
- Analyse aller Phasen der Datenentwicklung.
- Darauf aufbauend kann ein „Datenmanagementplan“ (DMP), auch ein sehr grundlegender, erstellt werden:[1] Welche Daten sind wichtig?, [2] wo wird er gespeichert? [3] kann er weiterve-rarbeitet werden?
- Dokumentation aller relevanten Daten
- Nutzen Sie das Web nach Möglichkeit als zusätzlichen Veröffen-tlichungskanal und nutzen Sie die Vorteile verlinkter Daten (siehe https://www.w3.org/DesignIssues/LinkedData.html)
Was sind offene Daten?
Offene Daten sind Daten, die von jedermann für jeden Zweck frei zugänglich, genutzt, wiederverwendet, modifiziert und verbreitet werden können – größtenteils eingeschränkt durch Anforderungen, die die Herkunft und Offenheit wahren. Die wichtigsten Merkmale offener Daten sind: 1. Verfügbarkeit und Zugang: Das Werk muss insgesamt zu Kosten verfügbar sein, die die Kosten für die Vervielfältigung nicht übersteigen, vorzugsweise zum kostenlosen Download im Internet. Die Arbeit sollte auch in geeigneter und modifizierbarer Form zur Verfügung stehen. 2. Wiederverwendung und spätere Nutzung: Die Daten müssen unter Bedingungen zur Verfügung gestellt werden, die eine Wiederverwendung, spätere Nutzung und Verknüpfung mit anderen Datensätzen ermöglichen. Die Daten müssen maschinenlesbar sein. 3. Universelle Teilhabe: Jeder muss die Daten nutzen, weiterverwenden und anschließend nutzen können. Es darf keine Diskriminierung bestimmter Handlungsfelder, Personen oder Gruppen geben. Die spätere Nutzung darf sich nicht auf einzelne Bereiche (z. B. nur im Bildungsbereich) beschränken oder bestimmte Nutzungsarten (z. B. zu kommerziellen Zwecken) ausschließen.
Was sind offene Lizenzen?
Im Allgemeinen ist eine offene Lizenz eine Lizenz, die den Zugang, die Weiterverwendung und die Umverteilung eines Werks ohne oder ohne Einschränkungen gestattet. Die genauen Erlaubnisse hängen vom vollständigen Wortlaut der verwendeten Open-License ab. Unterschiedliche Projekte können leicht unterschiedliche Erlaubnisse oder Einschränkungen erfordern– und es gibt eine Reihe unterschiedlicher Lizenzen, um diesen unterschiedlichen Verwendungen Rechnung zu tragen. Eine Liste der gängigsten offenen Lizenzen finden Sie auf den Open-knowledge-Lizenzen. Die Lizenzen für kreative Commons haben sich zu einem internationalen Standard für offene Lizenzen entwickelt.
Gilt die Anteilsanforderung in CC-Lizenzen auch für Übersetzungen?
Copyleft ist eine Klausel in urheberrechtlich geschützten Nutzungslizenzen, die den Lizenznehmer verpflichtet, Änderungen des Werks unter der Lizenz des Originalwerks zu genehmigen. Die Copyleft-Klausel soll verhindern, dass modifizierte Versionen des Werks mit Nutzungsbeschränkungen vertrieben werden, die das Original nicht besitzt. Da es sich bei einer Übersetzung um eine Anpassung handelt, muss eine Übersetzung auch unter der Lizenz des Originalwerks lizenziert werden.
Wenn ich Zugang zu einer mehrsprachigen Website habe, kann ich daraus rechtmäßig eine mehrsprachige Sprachressource schaffen? Kann ich es dann unter einer offenen Lizenz teilen?
Allein die Tatsache, dass eine Website online ist, gibt keinen Aufschluss über den urheberrechtlichen Status ihrer Inhalte. Für den Inhalt einer mehrsprachigen Website ist daher auch zu prüfen, wie der Inhalt lizenziert ist. Die rechtlichen Grenzen des Text- und Data Mining (TDM) in der EU müssen jedoch gesondert betrachtet werden. Im Gegensatz zu Ländern - einschließlich der USA, Israels, Singapurs, Taiwans und der Republik Korea -, in denen eine „gerechte Verwendung“ gegen Ansprüche auf Urheberrechtsverletzungen geltend gemacht werden kann, die sich aus der Anwendung von TDM-Techniken ergeben, oder in denen TDM-Aktivitäten - wie in Japan - in der Regel nur in Ausnahmefällen erlaubt und verboten sind, bedarf die Anwendung solcher Techniken im Falle einer langfristigen Zwischenlagerung in der EU derzeit in der Regel der Zustimmung des Rechteinhabers. Während das Vereinigte Königreich bereits früh eine besondere urheberrechtliche Ausnahme für den Text- und Datenbergbau eingeführt hat, die rechtmäßigen Zugang zu Text- und Datenanalysen für nichtkommerzielle Forschung ermöglicht, ist der rechtliche Umgang mit TDM in der übrigen EU noch unklar. Mit der bevorstehenden Urheberrechtsreform wird erwartet, dass der Rechtsrahmen konkreter wird, während TDM als eigene Nutzungsform eingestuft wird.
In einigen Ländern (z. B. in Deutschland) sind amtliche Urkunden ausdrücklich vom Urheberrecht ausgeschlossen. Bedeutet dies, dass sie auch in Ländern, die nicht über eine solche Beschränkung verfügen (z. B. im Vereinigten Königreich), als öffentlich zugä
Innerhalb der EU werden ausländische und supranationale amtliche Werke – nach dem international geltenden Grundsatz der Anwendbarkeit des Rechts des Landes, für das der territoriale Schutz beantragt wird, sowie nach dem Territorialitätsprinzip – nach Maßgabe des jeweiligen innerstaatlichen Rechts behandelt. Auch in den USA haben Werke der US-Regierung nach § 105 Urheberrechtsgesetz keinen Anspruch auf inländischen Urheberrechtsschutz und werden daher in den USA als öffentlich zugänglich angesehen. Diese amtlichen Dokumente werden in der internationalen Praxis frei verwendet.
Wie werden rechtliche Informationen zu einer Sprachressource im ELRC-SHARE-Repository verifiziert?
Legt ein Anbieter von Sprachressourcen einen Beitrag zum ELLENANTEILSREGISTER vor, muss er unter anderem bescheinigen, dass er über eine gesetzliche Dokumentation oder einen Titel zur Hinterlegung der Sprachressource verfügt. Bei Zweifeln an der Rechtsform einer bestimmten Ressource wird eine menschliche Untersuchung durchgeführt, um nach Beweisen oder Unterlagen zu suchen, die die Herkunft und Wiederverwendbarkeit der Sprachressource belegen. Ein spezieller Abschnitt, der sich mit der rechtlichen Bewertung der Sprachressourcen befasst, ist in DEN Leitlinien für DIE Validierung von ELR enthalten:
http://lr-coordination.eu/sites/default/files/common/Validation_guidelines_CEF-AT_v6.2_20180720.pdf
Wie stellen Sie die Qualität der im ELLENSHARING-Repository zur Verfügung gestellten Daten sicher? Gibt es einen Validierungsprozess?
ELREC hat einen umfangreichen Validierungsprozess durchgeführt, um sicherzustellen, dass die vom ELRC-KONSORTIUM im Laufe des Projekts erstellten Daten einem hohen Qualitäts- und Genauigkeitsniveau entsprechen.
Ein umfangreiches Dokument, in dem der Validierungsprozess erläutert wird, den jeder Akteur von Sprachressourcen, der seine Daten im ELR-ANTEIL hochladen möchte, beachten sollte, ist unter folgender Adresse zu finden:
http://lr-coordination.eu/sites/default/files/common/Validation_guidelines_CEF-AT_v6.2_20180720.pdf
Wie können Nutzer erkennen, dass eine Sprachressource vom ELR-KONSORTIUM im ELRC-SHARE-Repository verarbeitet wurde?
Um einen kohärenten Katalog zu erstellen, hat das ELRC-Konsortium umfangreiche technische Arbeiten an mehreren Ressourcen durchgeführt, die auf dem GELDAUTOMATEN-Repository zur Verfügung standen, da sie von Dritten gespendet wurden; diese Ressourcen lassen sich leicht identifizieren: Die Markierung (verarbeitet) wird im Titel der Sprachressource angebracht und zusätzliche Metadaten sind in den Kapiteln „erstellt durch ELRISCHE Dienste“ oder „Ressourcenschaffung“ verfügbar. Darüber hinaus werden in der Rubrik „Beziehungen“ die Zusammenhänge zwischen Originaldaten und verarbeiteten Daten dargestellt (z. B. „IS aligned of“).
Liegen die Metadaten zur Beschreibung der Sprachressourcen im ELRC-SHARE-Repository vor?
Alle registrierten Nutzer von ELEFANTENSPEICHERN haben die Möglichkeit, die Metadaten der veröffentlichten Sprachressourcen im JSON-FORMAT herunterzuladen. Bei Anmeldung können Sie auf die Schaltfläche „Export JSON-METADATEN“ klicken, wie hier dargestellt: https://www.elrc-share.eu/repository/browse/acm-news-items-2017-and-2018/93debb64175111ea913100155d026706c1d000ad1e8a43c183c6d0f6a9506013/.
Personenbezogene Informationen wie Kontaktdaten von Metadaten-Urhebern oder Ansprechpersonen sind entsprechend den VORGABEN der DSGVO aus der JSON-Datei ausgeschlossen.