UNTERNEHMENS-MASCHINENÜBERSETZUNGSLÖSUNG
Maschinenübersetzungs-Engines verarbeiten riesige Datenmengen
USA
Überblick
Mehrsprachige Sprachaufnahmen, Texte und Dokumente werden verarbeitet, um eine einzige dokumentarische Datenbank zu erstellen, die mithilfe von NLP durchsucht werden kann, um die relevanten Informationen zu extrahieren, die den Sachverhalt eines Rechtsverfahrens darstellen.
Aufgabe
Im Rahmen eines Gerichtsverfahrens werden die Inhalte von persönlichen Computern, Diktiergeräten und gedruckten Texten gespeichert.
Die transkribierten Sprachressourcen entsprachen dem 350-fachen des Gesamtwerks von Shakespeare. Um die Nadeln im mehrsprachigen Heuhaufen zu finden, war eine automatisierte Lösung erforderlich.
Pangeanics Lösung
Die Corporate Language Solution basiert auf verschiedenen neuronalen Netzwerken, die für die Verarbeitung von Sprache und Text zuständig sind. Die Prozesse umfassen:
-
Transkription, Umwandlung von Sprache in Text.
-
Übersetzung, Erstellung einsprachiger (englischer) Versionen aller Sprachressourcen.
-
Stimmungsanalyse, Erkennung der positiven/negativen Relevanz von Textauszügen.
-
Zusammenfassung, Abstraktion von Absätzen in kurze Sätze.
-
Indexierung, Lokalisierung und Referenzierung von Entitäten (Personen, Organisationen, Daten, Orte, Geldbeträge, Schlüsselwörter) im Dokumentenbestand.
-
Kategorisierung, Einstufung und Sortierung von Dokumenten nach Klasse, Kategorie und Relevanz.
Technologie
Wie funktioniert es?
Die Corporate Solution läuft auf 2-3 Servern beim Kunden vor Ort. Es ist keine Interaktion mit externen Dritten erforderlich, und die Informationen bleiben im Rechenzentrum des Kunden.
-
Ressourcen in verschiedenen Formaten werden in den Eingabebereich geladen und der erste Prozess transkribiert die Ressourcen in ein einheitliches Textformat:
◦ Bilder / Rasterdateien werden per OCR verarbeitet
◦ Sprache wird transkribiert und Akteure werden erkannt und referenziert
◦ PDF-, Word- und PowerPoint-Formate werden alle in reine Textdateien umgewandelt.
-
Spracherkennung und Übersetzung: Die Sprache wird auf Absatzebene erkannt, und wenn es sich nicht um Englisch handelt, wird der Text durch ein neuronales Netzwerk geschickt, das speziell für die Übersetzung von der Quellsprache ins Englische entwickelt wurde
-
Spezifische neuronale Netzwerke erhalten die einsprachige Eingabe und erstellen Datensätze mit den relevanten Ergebnissen (Stimmung, Wichtigkeit, referenzierte Entitäten...) und ein Graphmodell, das später verwendet werden kann, um Referenzen in den Rohdaten zu finden.
Unterstützende Dienste sind für die Verwaltung des kollaborativen Workflows zuständig, indem sie die Daten zu und von neuronalen Netzwerken weiterleiten und die Last verteilen, um die Hardware- und Softwareressourcen effizient zu nutzen.
Vorteile
Manchmal gibt es einfach zu viele Daten und es gibt keine Möglichkeit, die relevanten Informationen mit herkömmlichen Mitteln zu finden.
Kosten und Lieferzeit sind beide wichtige Gründe, eine automatisierte Analyse von Sprachressourcen in Betracht zu ziehen.
Wir mögen Pangeanic's Arbeitsethos und Professionalität. Sie hören ihren Kunden aktiv zu - und das hilft ihnen, jeden Tag die Besten zu sein, um maßgeschneiderte Sprachlösungen anzubieten. Aus meiner Sicht ist das eine ihrer größten Qualitäten
Pangeanic macht den Übersetzungsprozess einfach... Und sie bieten einen freundlichen, schnellen Übersetzungsservice. Die Erstellung einer Datenbank für alle unsere Übersetzungen war besonders nützlich, damit wir Übersetzungen recyceln und Inhalte bei anderen Gelegenheiten und / oder ähnlichen Jobs wiederverwenden konnten.
Die Qualität ist wie gewohnt ausgezeichnet. Die Quelle wurde während der Übersetzung viele Male geändert. Pangeanic reagierte schnell auf die Änderungen und es war hilfreich.