CLASIFICACIÓN/ CATEGORIZACIÓN DE TEXTOS

Categorice automáticamente los documentos según los clasificadores de conocimiento

¿Necesita clasificar o categorizar sus textos?

Hable con un experto

¿En qué consiste la clasificación y categorización automática de textos de Pangeanic?

En un conjunto de módulos que implementan tareas comunes de clasificación y categorización. Esto puede estar relacionado con la clasificación de textos o funcionar como un elemento separado, a alto nivel, encontrando también un conjunto de relaciones definidas entre esos módulos.

Los distintos detalles son flexibles: por ejemplo, se puede elegir qué algoritmo de categorización utilizar, qué características (palabras o de otro tipo) de los documentos deben usarse (o cómo elegir automáticamente estas características), en qué formato están los documentos, etc.

sumarizacion-empresa

¿Cómo personalizo mi módulo?

El proceso de personalización del uso de este módulo suele implicar la obtención de una colección de documentos precategorizados de la organización. Pangea entrena sus redes neuronales profundas para reconocer las características de cada documento y la diferencia con otros. Esto crea una representación del “gráfico de conocimiento”, que entrena al categorizador para que reconozca un conjunto de conocimientos particular. Este conjunto entrenado se guarda y se pueden hacer consultas con él.

personalizo-modulo

Existen varias formas de realizar las consultas. El módulo de clasificación y categorización de textos de nivel superior ofrece una categoría general para las operaciones del clasificador de categorías de nivel superior, pero usted puede utilizar las interfaces de las categorías individuales dentro de cada una de ellas.

Precisión de la clasificación/ categorización de textos

Nuestra herramienta semántica clasifica automáticamente los documentos por su contenido y los organiza dentro de categorías generales como Eurovoc, o puede personalizarse según la estructura, la terminología y los procesos de su organización. Las categorías pueden ser legal, cumplimiento, recursos humanos, investigación y desarrollo, contabilidad y finanzas, informes (ventas, gestión, etc.), comentarios de los clientes, boletines informativos y muchas más. La definición de las categorías la puede elegir libremente el usuario, puesto que no está restringida por los algoritmos de categorización.

categorizacion-textos
 

La clasificación / categorización de textos de Pangeanic es una solución ideal para:

  • Gestionar contenidos empresariales / del conocimiento
  • Categorizar documentación financiera
  • Preclasificar documentos seguros
  • Evaluar las nuevas tendencias en los negocios, la ciencia y la tecnología
  • Gestionar la información empresarial
  • Buscar y analizar el estado de las técnicas patentes
  • Sistemas de asistencia de automatizados
  • El categorizador de Pangeanic está disponible como aplicación de servidor para utilizarla en sus propias instalaciones o en SaaS

Tecnología de categorización

Los algoritmos del categorizador de Pangeanic se basan en técnicas de aprendizaje automático profundo. Nuestro enfoque para la categorización de documentos se ejecuta en dos fases: la de entrenamiento y la de predicción.

En la etapa de entrenamiento, el categorizador de Pangea construye un clasificador mediante el aprendizaje de un conjunto de documentos modelo para cada categoría. Su algoritmo de aprendizaje utiliza una amplia gama de características semánticas extraídas de los textos de los documentos:

  • Palabras con etiquetas de categoría gramatical
  • Frases sustantivas y dependencia sintáctica entre ellas
  • Relaciones semánticas complejas detectadas en nuestro procesador lingüístico

Este proceso de entrenamiento crea modelos que en la fase de predicción utilizan el modelo de espacio vectorial para categorizar los documentos. Cada texto recibido se compara con las características semánticas de la categoría del modelo y se calcula el grado de proximidad entre ellas. El documento se asigna a la categoría con el máximo valor de relevancia.

¿Necesita categorizar automáticamente los documentos según los clasificadores de conocimiento?

Hable con un experto

ilustracion-security-2