ガジェット通信 GetNews

見たことのないものを見に行こう

MIT研究者が絵文字を使ったツイート分析アルゴリズム!DeepMojiはテキストに含まれる感情を検出

DATE:
  • ガジェット通信 GetNewsを≫

SNS上の発言に含まれる感情を検出する技術は、ブランドや商品に対する顧客の態度の追跡や、金融市場の変動を予測する上で有用なことから、精度向上への期待が高まっている。また、SNS上の差別的発言を迅速に取り締まる手段として、AIによる自動検出が注目されている。

一方で、感情や差別的発言を正確に識別するには、AIが文脈から「皮肉」を理解する必要があり、これには困難を伴っていた。このほど、MITメディアラボの研究者らは、DeepMojiと呼ばれるアルゴリズムを機械学習により訓練し、Twitter上の発言内容から高い精度で皮肉や感情を見分けることに成功した。

・身振りやイントネーションの替わりとして絵文字を

DeepMojiでは、ツイートの文脈理解を助けるために絵文字を活用している。MITメディアラボの准教授であるIyad Rahwan氏は、話し言葉と違い、身振りやイントネーションの表現が入っていないテキストにおいて、文脈を理解するのに絵文字が役立つことに着目した。

テキストの感情分析はすでに広く使用されている技術で、多くのツイートについて、絵文字などを通してラベル付けがなされている。DeepMojiの開発にあたってこれらのデータセットが活用された。

・12億個のデータセットでアルゴリズムを訓練

アルゴリズムを訓練するにあたって、550億個のつぶやきを収集し、その中から64個の人気のある絵文字の組み合わせを含む12億個を選択した。これらについてまず、テキストに含まれる「幸せ、悲しい、ユーモラス」といった特定の感情にマッチした絵文字を予測する訓練を実施。

その後、ラベル付けされた既存のデータセットを活用し、皮肉を識別する訓練を実施した。

・判別精度は人間を超える

こうして訓練されたDeepMojiは、テキストから感情を検出するベンチマークテストにおいて、既存のアルゴリズムよりもはるかに高い精度を示したとのこと。また、人間に対して実施したテストでは、Twitter上の発言内容から、皮肉や感情を正しく識別したのが平均76%だったのに対し、DeepMojiでは82%となり、人間よりも優れた結果を出している。

DeepMojiのWebサイトでは、英文テキストを入力すると適切な絵文字を自動的に追加してくれる。また、このWebサイトでは、自分の最新3つのツイートについてラベル付けすることで、DeepMojiの更なる発展に貢献することもできる(こちらは日本語も可)。

AIが文脈を深読みする能力は、今後もますます向上すると考えられ、テキストの判別のみならず、AIと人間のコミュニケーションにも役立てられると予想される。

DeepMoji

カテゴリー : デジタル・IT タグ :
Techableの記事一覧をみる ▶
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。