Pruebe nuestro LLM Masker
Pruebe nuestro LLM Masker

SOLUCIÓN LINGÜÍSTICA PARA EMPRESAS

Traducción adaptativa de transcripciones de fuerzas de seguridad y consultoras en múltiples formatos

EEUU

Veritone-stacked-logo-300x300

Visión general

Veritone necesita una solución in-situ para procesar transcripciones obtenidas por parte de la policía estadounidese, así como soporte a evidencia forense proveniente de discos duros y grabaciones.

Las grabaciones de voz multilingües, los textos y los documentos se procesan para generar una única base de datos documental en la que se puede buscar mediante PLN para extraer la información relevante que constituye los hechos de un proceso judicial.

Pangeanic proporcionó motores de traducción basados en redes neuronales para que los datos pudiesen ser procesados en la nube del sistema de AI de Veritone.

Procesamiento de grandes cantidades de datos en múltiples formatos

Problema

Como parte del procedimiento de un caso judicial, se almacena el contenido de ordenadores personales, grabadoras de voz y textos impresos.

Los recursos lingüísticos transcritos equivalían a 350 veces las obras completas de Shakespeare. Encontrar las agujas en el pajar multilingüe requería una solución automatizada.

Solución ofrecida por Pangeanic

La Solución Lingüística Corporativa está compuesta por diferentes redes neuronales encargadas de procesar el habla y el texto. Los procesos implican:

  • Transcripción, conversión de voz a texto.

  • Traducción, generando versiones monolingües (inglés) de todos los recursos lingüísticos.

  • Análisis del sentimiento, que detecta la relevancia positiva/negativa de fragmentos de texto.

  • Sumarización, resumir párrafos en frases cortas

  • Indexar, localizar y referenciar entidades (personas, organizaciones, fechas, lugares, cantidades de dinero, palabras clave) en el lote de documentos.

  • Categorización, clasificación y ordenación de documentos por clase, categoría y relevancia.

 

Tecnología

¿Cómo funciona?

La Solución Corporativa se ejecuta en 2-3 servidores en las instalaciones del cliente. No es necesaria la interacción con terceros externos, y la información está contenida en el Centro de Datos del cliente.

  1. Los recursos multiformato se cargan en el área de entrada y el primerproceso transcribe los recursos en texto de formato único:

    ◦ OCR de imágenes y archivos rasterizados

    ◦ Se transcribe el habla y se detectan y referencian los actores

    ◦ Los formatos PDF, Word y PowerPoint se convierten en archivos de texto sin formato.

  2. Detección del idioma y traducción: Se detecta el idioma a nivel de párrafo y, si no es el inglés, el texto se envía a través de una red neuronal específicamente diseñada para traducir del idioma de origen al inglés.

  3.  Redes neuronales específicas reciben la entrada monolingüe y producen registros con los resultados relevantes (sentimiento, importancia, entidades referenciadas...) y un grafo-modelo que puede utilizarse posteriormente para encontrar referencias en los datos brutos.

Los servicios de apoyo se encargan de gestionar el flujo de trabajo colaborativo canalizando los datos hacia y desde las redes neuronales y distribuyendo la carga para aprovechar eficazmente los recursos de hardware y software.

 

Beneficios

A veces simplemente hay demasiados datos y no hay forma de encontrar la información relevante utilizando los recursos tradicionales.

El coste y el plazo de entrega son razones de peso para plantearse un análisis automatizado de los recursos lingüísticos.

 

Nos gusta la ética de trabajo y la profesionalidad de Pangeanic. Escuchan activamente a sus clientes, y eso les ayuda a ser los mejores cada día para ofrecer soluciones lingüísticas a medida. Desde mi punto de vista, esa es una de sus mejores cualidades.
Rafael de Jorge
Director de marketing - Onahotels
Pangeanic facilita el proceso de traducción... Y proporcionan un servicio de traducción rápido y amable. Crear una base de datos para todas nuestras traducciones fue especialmente útil para poder reciclar las traducciones y reutilizar el contenido en otras ocasiones y/o trabajos similares.
Chloe Wu
Hisense
La calidad es excelente, como de costumbre. La fuente se ha modificado muchas veces durante la traducción. Pangeanic respondió rápidamente a los cambios y fue de gran ayuda.
Eisuke Seki
ES Japan

¿Le gustaría convertirse en nuestro próximo éxito?

Elija un objetivo; le daremos una solución para lograr los mejores resultados posibles.

Contáctenos

Recurso_Casos_Exito