Pourquoi utiliser un outil d’analyse du sentiment ?
L’augmentation exponentielle des contenus générés par les utilisateurs, tels que les évaluations de produits par les utilisateurs, ainsi que les commentaires sur les réseaux sociaux et les articles de blog, demande la création d’outils capables de connaître rapidement l’opinion du public sur un large éventail de sujets, dans n’importe quelle langue.
L’outil d’analyse du sentiment de Pangeanic est une technologie personnalisable, puissante et efficace permettant d’extraire automatiquement les sentiments positifs ou négatifs d’un texte écrit. Il peut être paramétré afin de détecter des émotions particulières (forte aversion, affection profonde, peur, colère, dégoût, etc.) à partir d’informations textuelles non structurées. Il s’agit d’une API préparée pour l’analyse immédiate de phrases (fragments) ou pour le traitement par lots de textes et de documents. L’outil d’analyse du sentiment de Pangeanic peut également être utilisé à d’autres fins, telles que la classification du sentiment des documents et les tâches de prédiction des notations.
Comment fonctionne l’outil d’analyse du sentiment ?
Il existe deux grandes approches de l’analyse du sentiment : la traditionnelle « approche fondée sur le lexique » et la nouvelle « approche d’apprentissage ».
L’approche traditionnelle de l’analyse du sentiment est basée sur le lexique. Cette approche permet de calculer l’orientation sémantique des mots d’un texte en obtenant les polarités des mots à partir d’un lexique prédéfini. L’approche supervisée d’apprentissage utilise des techniques d’apprentissage automatique neuronal pour créer un modèle spécifique à partir d’un vaste corpus de documents. Ces données varient d’un client à l’autre et peuvent inclure la sélection de la pertinence (une requête préalable pour vérifier si un document appartient au groupe et doit être analysé).
Un ensemble d’échantillons d’opinions positives et négatives et de variations de ces opinions sert de données d’entraînement à partir desquelles le modèle est construit. Nos techniques d’apprentissage automatique permettent d’atteindre une précision de plus de 80 % dès le départ. La personnalisation et les filtres linguistiques humains, dans chaque cas, ajoutent à la qualité attendue pour obtenir une précision de plus de 90 %. La difficulté de l’analyse du sentiment réside dans la structure des opinions, souvent dépendante du domaine et parfois du contexte.
L’approche hybride unique de l’outil d’analyse du sentiment de Pangeanic repose sur l’utilisation d’informations linguistiques et statistiques, ainsi que sur un ensemble de règles sémantiques complexes dépendant de la langue. Cette approche, ainsi que l’utilisation de réseaux neuronaux profonds pour classer l’ironie et les résultats apparemment négatifs ou positifs, permet une expérience unique et rapide de classification du sentiment.
Approches pour un traitement réussi de l’analyse du sentiment :
Nos experts linguistes ont créé des ontologies personnalisées pour les domaines de données les plus importants et les plus utilisés (hôtels, restaurants, appareils, etc.). Ces ontologies, qui constituaient auparavant la base de l’analyse du sentiment, alimentent désormais des réseaux neuronaux profonds pour lesquels les données ont été prébalisées. Les opinions peuvent être regroupées de différentes manières, selon les préférences du client.
Dans le cas ci-dessous, l’orange représente une opinion négative, le jaune, une neutre et le bleu, une positive. Ce sont de véritables échantillons issus de la combinaison de nos techniques hybrides :
Positif
Négatif
Neutre
Contexte
Négatif : la pièce était courte
Positif : J’aime les voyages courts
Détection neuronale (contexte)
Positif : Bailey s’est assuré que je ne sois pas blésée
Négatifs/Intensificateurs (détection neuronale)
Positif : Ce cheeseburger est pas mal du tout
Négatif : Service trop rapide pour le prix
Avis en fonction du domaine
Positif : Petit. Léger. Portable. 16Mo. Merci Papa !
Neutre : Tous les fonds ne se créent pas de manière égale.