AIを活用したソリューションでテキスト分類を自動化
分類が必要な大量のEメールや文書をお持ちですか?ニーズは一つとして同じものはありません。そのため、当社では各クライアントの分類体系とニーズに応じてAIを活用したテキスト分類ソリューションをオーダーメイドで構築しています。拡張性に乏しい退屈なプロセスの自動化をサポートします。当社は機械学習を使用してお客様のデータのパターンを学習し、計算言語学者としての知識をすべて導入します。AIがこれらのパターンを学習すると、新しいEメールや文書を適切なカテゴリーに自動的に分類できるようになります。
Pangeanicの自動テキスト分類はどのようなものですか?
一般的な分類タスクを実装する一連のモジュールです。これはテキスト分類に関連する場合もあれば、別個の高レベル要素として機能する場合もあります。
様々な詳細は柔軟に設定可能です。例えば、使用する分類アルゴリズムの選択、文書のどの特徴(単語やその他の種類)を使用するか(またはこれらの特徴を自動的に選択する方法)、文書のフォーマットなどを選択できます。
モジュールをカスタマイズするにはどうすればよいですか?
このモジュールのカスタマイズプロセスは、通常、組織から事前に分類された文書のコレクションを入手することから始まります。Pangeanicは、ディープニューラルネットワークを訓練し、各文書の特徴を認識し、他の文書と区別できるようにします。これにより、「知識グラフ」表現が作成され、分類器が特定の知識セットを認識するよう訓練されます。この訓練されたセットは保存され、クエリの実行に使用することができます。
クエリを実行する方法は複数あります。トップレベルのテキスト分類モジュールは、トップレベルのカテゴリ分類器の操作に対して全体的なカテゴリを提供します。 それぞれの中で、個別のカテゴリのインターフェースを使用することができます。
テキスト分類の精度
当社の意味論的ツールは、内容に基づいて文書を自動的に分類し、Eurovocなどの一般的なカテゴリーに整理します。また、お客様の組織の構造、用語、プロセスに応じてカスタマイズすることも可能です。カテゴリーには、法務、コンプライアンス、人事、研究開発、会計・財務、レポート(販売、経営など)、顧客フィードバック、ニュースレターなど、多岐にわたる項目が含まれます。カテゴリーの定義は分類アルゴリズムによって制限されないため、ユーザーが自由に選択できます。
Pangeanicのテキスト分類は以下の場合に理想的なソリューションです:
Pangeanicのテキスト分類は以下の場合に理想的なソリューションです:
- ビジネス/知識コンテンツの管理
- 財務文書の分類
- 機密文書の事前分類
- ビジネス、科学、技術における新しいトレンドの評価
- スパムフィルタリングの改善
- メールインボックスの整理
- 企業情報の管理
- 特許技術の状態の識別と分析
- 自動化支援システム
- Pangeanic分類器はオンサイトまたはSaaSで使用するためのサーバーアプリケーションとして利用可能
- より容易な検索のための文書の分類
- 顧客データからの洞察の獲得
分類技術
Pangeanic分類器のアルゴリズムは、深層機械学習技術に基づいています。当社の文書分類へのアプローチは、訓練と予測の2段階で実行されます。
訓練段階では、Pangeanic分類器は各カテゴリーのモデル文書セットを学習することで分類器を構築します。その学習アルゴリズムは、文書から抽出された広範な意味的特徴を使用します:
- 文法カテゴリーラベル付きの単語
- 名詞句とその構文依存関係
- 当社の言語処理器で検出された複雑な意味関係
この訓練プロセスにより、予測段階でベクトル空間モデルを使用して文書を分類するモデルが作成されます。受信した各テキストは、モデルカテゴリーの意味的特徴と比較され、それらの間の近接度が計算されます。文書は、最も関連性の高いカテゴリーに割り当てられます。