SOLUTION DE TRADUCTION AUTOMATIQUE POUR ENTREPRISES
Moteurs de traduction automatique traitant des quantités massives de données
ÉTATS-UNIS
Aperçu
Les enregistrements vocaux, les textes et les documents multilingues sont traités pour générer une base de données documentaire unique qui peut être interrogée à l'aide du TAL (Traitement Automatique du Langage) afin d'extraire les informations pertinentes constituant les faits d'un processus juridique.
Tâche
Dans le cadre de la procédure d'une affaire juridique, les contenus d'ordinateurs personnels, d'enregistreurs vocaux et de textes imprimés sont stockés.
Les ressources linguistiques transcrites équivalaient à 350 fois l'œuvre complète de Shakespeare. Trouver les aiguilles dans cette botte de foin multilingue nécessitait une solution automatisée.
La solution de Pangeanic
La Solution de Langage d'Entreprise est construite avec différents réseaux neuronaux chargés du traitement de la parole et du texte. Les processus impliquent :
-
Transcription, conversion de la parole en texte.
-
Traduction, générant des versions monolingues (anglaises) de toutes les ressources linguistiques.
-
Analyse des sentiments, détectant la pertinence positive/négative des extraits de texte.
-
Résumé, abstraction de paragraphes en phrases courtes.
-
Indexation, localisation et référencement des entités (personnes, organisations, dates, lieux, montants d'argent, mots-clés) dans le lot de documents.
-
Catégorisation, classement et tri des documents selon la classe, la catégorie et la pertinence.
La technologie
Comment ça fonctionne ?
La Solution d'Entreprise fonctionne sur 2-3 serveurs dans les locaux du client. Aucune interaction avec des tiers externes n'est nécessaire, et les informations sont contenues dans le Centre de Données du client.
-
Les ressources multiformat sont chargées dans la zone d'entrée et le premier processus transcrit les ressources en texte de format unique :
◦ Les images / fichiers raster sont traités par OCR
◦ La parole est transcrite, les intervenants sont détectés et référencés
◦ Les formats PDF, Word et PowerPoint sont tous convertis en fichiers texte brut.
-
Détection de la langue et traduction : La langue est détectée au niveau du paragraphe, et si ce n'est pas de l'anglais, le texte est envoyé à travers un réseau neuronal spécifiquement conçu pour traduire de la langue source vers l'anglais
-
Des réseaux neuronaux spécifiques reçoivent l'entrée monolingue et produisent des enregistrements avec les résultats pertinents (sentiment, importance, entités référencées...) et un modèle de graphe qui peut être utilisé ultérieurement pour trouver des références dans les données brutes.
Les services de support sont chargés de gérer le flux de travail collaboratif en acheminant les données vers et depuis les réseaux neuronaux et en distribuant la charge pour exploiter efficacement les ressources matérielles et logicielles.
Avantages
Parfois, il y a tout simplement trop de données et il n'est pas possible de trouver les informations pertinentes en utilisant des ressources traditionnelles.
Le coût et le délai de livraison sont tous deux de solides raisons d'envisager une analyse automatisée des ressources linguistiques.
Nous aimons l'éthique de travail et le professionnalisme de Pangeanic. Ils écoutent activement leurs clients - et cela les aide à être les meilleurs chaque jour pour fournir des solutions linguistiques sur mesure. De mon point de vue, c'est l'une de leurs plus grandes qualités
Pangeanic facilite le processus de traduction... Et ils fournissent un service de traduction convivial et rapide. La création d'une base de données pour toutes nos traductions a été particulièrement utile afin que nous puissions recycler les traductions et réutiliser le contenu dans d'autres occasions et / ou des emplois similaires.
La qualité est excellente comme d'habitude. La source a été changée plusieurs fois au cours de la traduction. Pangeanic a été rapide à répondre aux changements et cela a été utile.