なぜ感情分析ツールを採用するのか?
ユーザーによる製品レビューやSNSへのコメント投稿など、ユーザー生成コンテンツが急増しているため、幅広いトピックに関する、あらゆる言語での意見を迅速に把握するためのツールが必要です。
Pangeanicの感情分析ツールは、テキストから肯定的または否定的な意見を自動的に抽出するための、カスタマイズ可能で強力かつ効果的な技術です。非構造化テキスト情報から特定の感情(強い嫌悪や好意、恐怖、怒り、嫌悪感など)を検出するように調整することができます。これは、文章(フラグメント)内での即時分析、またはテキストや文書のバッチ処理に対応したAPIです。Pangeanicの感情分析ツールは、文書内の意見分類やレビュー評価の予測タスクなどにも使用することができます。
感情分析ツールはどのように機能するのか?
感情分析には主に2つのアプローチがあります。従来の「辞書ベース」アプローチと新しい「学習ベース」アプローチです。
感情分析の従来のアプローチは辞書ベースです。このアプローチでは、事前に定義された辞書から単語の極性を取得することで、テキスト内の単語の意味的方向性が計算されます。
教師あり学習ベースアプローチは、ニューラルネットワークを用いた高度な機械学習技術を使用し、大規模な文書コーパスから特定のモデルを作成します。これらのデータは顧客ごとに異なり、関連性スクリーニング(文書がグループに属し、分析すべきかどうかを事前に確認するためのクエリ)を含むことがあります。
肯定的な意見と否定的な意見、およびそれらの意見のバリエーションのサンプルセットが、モデル構築のためのトレーニング データとなります。当社の機械学習技術は、初期段階から80%以上の精度を達成します。各ケースにおけるカスタマイズと人間が作成した言語フィルターが品質を高め、90%以上の精度を実現します。感情分析の難しさは意見の構造に起因し、多くの場合分野に依存し、時にはコンテキストに依存します。
Pangeanicの感情分析ツールの独自のハイブリッドアプローチは、言語情報と統計情報の両方、および言語に依存する一連の複雑な意味規則の使用に基づいています。これに加えて、皮肉や一見否定的または肯定的な結果を分類し、独自かつ迅速な意見分類ソリューションを提供します。
感情分析を成功させるためのアプローチ
当社の言語の専門家は、最も重要で広く使用されているデータ分野 (ホテル、レストラン、家電製品など) 向けにカスタマイズされたオントロジーを作成しました。これらは以前は感情分析の基礎でしたが、現在ではデータが事前にラベル付けされたディープニューラルネットワークの学習データとなっています。顧客の好みに応じて、意見を様々な方法でグループ化することができます。
以下の例では、オレンジ色は否定的な意見、黄色は中立的な意見、青色は肯定的な意見を表します。以下は、当社のハイブリッド技術の組み合わせによる実際のサンプルです。
肯定的
否定的
中立的
コンテキスト
否定的:演劇が短かった
肯定的:旅行が短かったことが良かった
ニューラル検出(コンテキスト)
肯定的:ベイリーは私が不自由でないようにしてくれた。彼は達人だ。。彼は本当にアーティストだ。
否定/強調表現(ニューラル検出)
肯定的:このチーズバーガーは悪くない
否定的:価格に対してサービスが過ぎる
分野依存の意見
肯定的:小さい。軽い。持ち運べる。16Mb。ありがとう、パパ!
中立的:すべてのファンドが同じように作られているわけではない。