Pangeanic facilita el descubrimiento de conocimiento
Imagine que está sentado sobre toneladas de datos que es necesario procesar para poder comprenderlos, o sobre macrodatos que deben procesarse todos los días. Estos datos se obtienen desde diferentes entradas. Muchos de ellos son documentos, pero también hay correos electrónicos, grabaciones de voz en formato mp3, clips de noticias basados en texto, entrevistas de radio, sitios web, documentación de terceros en formato PDF, imágenes y textos escaneados, y vídeos.
También puede que reciba información financiera clave de distintos bancos, fondos e instituciones financieras, de los cuales solo tiene que recopilar información clave como nombres de personas, nombres de instituciones, y tipos de cambio entre un par de monedas.
Casos típicos de uso de la ingeniería y descubrimiento de conocimientos
Crear csv / hojas de cálculo con datos financieros procedentes de los bancos centrales e instituciones financieras sobre predicciones de divisas
Proporcionar un informe resumido sobre un tema mediante la extracción de datos de varias fuentes
Etiquetar macrodatos con las típicas etiquetas de PLN para el aprendizaje automático
Extraer nombres, lugares y acciones de una serie de programas de televisión, vídeos de Internet o entrevistas de radio, utilizando primero el habla a texto
Encontrar la opinión de los aportes en redes sociales y etiquetar cada tuit o comentario como positivo negativo
Clasificar automáticamente los documentos según un campo predefinido y crear un resumen
Herramienta de ingeniería del conocimiento y descubrimiento
La herramienta de ingeniería del conocimiento y descubrimiento de Pangeanic está aquí para hacerlo por usted con precisión: no importa la fuente, la convertiremos en texto para que pueda procesarse. A través de una serie de técnicas de PLN, estructuraremos los datos de manera que la información clave pueda ser extraída para usted en un formato fácil de usar. Puede ser una lista de acciones o personas que hacen cosas, palabras clave, cantidades extraídas de tablas de diferentes formas, frases clave o un etiquetado completo del material para que cualquier tipo de información procesable pueda ser tomada en el futuro.
El descubrimiento de conocimientos (Knowledge Discovery o K-Discovery) no debe confundirse con el e-Discovery, ya que no solo extrae información del texto de una lista determinada de palabras clave dejando la fuente intacta. El K-Discovery proporciona una estructura al texto fuente para que el aprendizaje automático y los métodos de minería de datos puedan ser aplicados para cualquier tipo de recuperación de información estructurada en una etapa posterior. Se diferencia de la sumarización porque no pretende crear una representación abstracta del significado para su rápido procesamiento por parte de los humanos (que puede ser un uso final del Knowledge Discovery).
Aplica conocimientos a la fuente, por lo que se pueden realizar muchos tipos de acciones, y se pueden derivar varios tipos de usos de esta.