SOLUÇÃO DE IDIOMA CORPORATIVO
Processamento de grandes quantidades de dados em vários formatos
EUA
Visão geral
Gravações de voz, textos e documentos multilíngues são processados para gerar um único banco de dados documental que pode ser pesquisado usando a NLP para extrair as informações relevantes que constituem os fatos de um processo jurídico.
Tarefa
Como parte dos procedimentos de um caso jurídico, o conteúdo de computadores pessoais, gravadores de voz e textos impressos é armazenado.
Os recursos linguísticos transcritos eram equivalentes a 350 vezes as obras completas de Shakespeare. Encontrar as agulhas no palheiro multilíngue exigia uma solução automatizada.
A solução da Pangeanic
O Corporate Language Solution é construído com diferentes redes neurais responsáveis pelo processamento de fala e texto. Os processos envolvem:
-
Transcrição, conversão de fala em texto.
-
Tradução, gerando versões monolíngues (inglês) de todos os recursos de idiomas.
-
Análise de sentimento, detectando a relevância positiva/negativa de trechos de texto.
-
Resumo, abstração de parágrafos em frases curtas
-
Indexação, localização e referência a entidades (pessoas, organizações, datas, locais, valores monetários, palavras-chave) no lote de documentos.
-
Categorização, classificação e ordenação de documentos de acordo com a classe, categoria e relevância.
Tecnologia
Como isso funciona?
A Corporate Solution é executada em 2 a 3 servidores nas instalações do cliente. Não é necessária nenhuma interação com terceiros externos, e as informações estão contidas no Data Center do cliente.
-
Os recursos multiformato são carregados na área de entrada e o primeiro processo transcreve os recursos em um único formato de texto:
◦ As imagens/arquivos rasterizados são OCRed
◦ A fala é transcrita e os atores são detectados e referenciados
◦ Os formatos PDF, Word e PowerPoint são todos convertidos em arquivos de texto simples.
-
Detecção e tradução de idiomas: O idioma no nível do parágrafo é detectado e, se não for inglês, o texto é enviado por meio de uma rede neural projetada especificamente para traduzir do idioma de origem para o inglês
-
Redes neurais específicas recebem a entrada monolíngue e produzem registros com os resultados relevantes (sentimento, importância, entidades referenciadas...) e um modelo de gráfico que pode ser usado posteriormente para encontrar referências nos dados brutos.
Os serviços de suporte são responsáveis por gerenciar o fluxo de trabalho colaborativo, canalizando os dados de e para as redes neurais e distribuindo a carga para aproveitar de forma eficiente os recursos de hardware e software.
Benefícios
Às vezes, há simplesmente um excesso de dados e não há como encontrar as informações relevantes usando os recursos tradicionais.
O custo e o tempo de entrega são motivos fortes para considerar uma análise automatizada dos recursos linguísticos.
Gostamos do espírito de trabalho e do profissionalismo da Pangeanic. Eles ouvem ativamente seus clientes, e isso os ajuda a ser os melhores todos os dias para oferecer soluções linguísticas personalizadas. Do meu ponto de vista, essa é uma de suas maiores qualidades
A Pangeanic torna o processo de tradução fácil... E eles oferecem um serviço de tradução rápido e amigável. A criação de um banco de dados para todas as nossas traduções foi particularmente útil para que pudéssemos reciclar as traduções e reutilizar o conteúdo em outras ocasiões e/ou trabalhos semelhantes.
A qualidade é excelente, como sempre. O original foi alterado várias vezes durante a tradução. A Pangeanic foi rápida em responder às mudanças e isso foi útil.