Por que usar uma Ferramenta de análise de sentimento?
O aumento exponencial de Conteúdo gerado pelo usuário, tais como análises de produtos por usuários que dão suas opiniões, assim como comentários instantâneos em redes sociais e posts em blogs, exigem ferramentas que possam fornecer uma solução para encontrar rapidamente a opinião do público sobre uma ampla gama de tópicos, em qualquer idioma.
A ferramenta de Análise de sentimento da Pangeanic é uma tecnologia personalizável, poderosa e eficiente para extrair automaticamente opiniões positivas ou negativas do texto escrito. Ela pode ser ajustada para detectar emoções específicas (forte aversão ou gosto, medo, raiva, nojo, etc.) a partir de informações textuais não estruturadas. É uma API preparada para análise imediata dentro de frases (fragmentos) ou para o processamento em lote de textos e documentos. A ferramenta de análise de sentimento da Pangeanic também pode ser usada para outros fins, como classificação de opinião de documentos e tarefas de previsão de classificação de revisão.
Como funciona a ferramenta Análise de sentimento?
Há duas abordagens principais para a Análise de sentimento: a tradicional "baseada no léxico", e a nova "abordagem de aprendizado".
A abordagem tradicional da Análise de sentimento é baseada em léxico. Usando esta abordagem, a orientação semântica das palavras em um texto é calculada pela obtenção das polaridades das palavras a partir de um léxico pré-definido. A abordagem de aprendizado supervisionada utiliza fortes técnicas de aprendizado neural de máquina para criar um modelo específico a partir de um grande corpus de documentos. Estes dados variam de um cliente para outro e podem incluir uma triagem de relevância (uma consulta prévia para verificar se um documento pertence ao grupo e deve ser analisado).
Um conjunto de amostras de opiniões positivas e negativas e variações dessas opiniões compõem os dados de treinamento a partir dos quais o modelo é construído. Nossas técnicas de aprendizado de máquina alcançam mais de 80% de precisão desde o início. A personalização e os filtros linguísticos criados por humanos em cada caso aumentam a qualidade esperada para obter uma taxa de precisão de mais de 90%. A dificuldade da Análise de sentimento deve-se à estrutura das opiniões, muitas vezes dependente do campo e às vezes sensível ao contexto.
A abordagem híbrida única da ferramenta de Análise de sentimento da Pangeanic baseia-se no uso de informações linguísticas e estatísticas, assim como um conjunto de regras semânticas complexas dependentes do idioma. Isto, juntamente com o uso de redes neurais profundas para classificar a ironia e resultados aparentemente negativos ou positivos, fornece uma solução de classificação de opinião rápida e única.
Abordagens para processar com sucesso a Análise de sentimento:
Nossos especialistas linguísticos criaram ontologias personalizadas para os campos de dados mais significativos e amplamente utilizados (hotéis, restaurantes, eletrodomésticos, etc.). Eles costumavam ser a base da Análise de sentimento, mas agora alimentam redes neurais profundas para as quais os dados foram previamente rotulados. As opiniões podem ser agrupadas de diferentes maneiras de acordo com as preferências do cliente.
No caso abaixo, laranja representa uma opinião negativa, amarelo, neutra e azul, positiva um. Estas são amostras reais a partir da combinação de nossas técnicas híbridas:
Positiva
Negativa
Neutra
Contexto
Negativa: a peça foi muito curta.
Positiva: Eu adorei que a viagem foi curta.
Detecção neural (contexto)
Positiva: Bailey certificou-se de que eu curtisse. Ele é um artista e tanto.
Negativas/ Intensificadoras (detecção neuronal)
Positiva: Este cheeseburger não é nada mal. Negativa: O atendimento foi muito rápido para o preço.
Opiniões dependentes do campo
Positiva: Pequeno. Peso leve. Portátil. 16Mb. Obrigado, papai!
Neutra: Nem todos os fundos são criados da mesma forma.