Quantcast
Channel: 初心者タグが付けられた新着記事 - Qiita
Viewing all articles
Browse latest Browse all 21105

森久保乃々のネガティブ度を感情分析してみましたけど...。【ポジパと比較】

$
0
0

こちらの記事を見てCOTOHA APIというものを知り,面白そうだったので触ってみることに.
今回はCOTOHA APIを使って森久保乃々のネガティブ度を感情分析してみました.

環境

  • macOS Mojave 10.14.6
  • Python 3.7.6

COTOHA APIとは

自然言語,音声の処理を簡単に行えるAPIです.例えば構文解析や音声認識などができます.NTTコミュニケーションズが提供しています.

森久保乃々とは

アイドルマスターシンデレラガールズに登場するアイドルの1人で,14歳の少女です.机の下がホームで,ときにはプロデューサーから逃げ回ったり,ときにはアイドルを頑張ったりする,そんな子です.
普段は「〜ですけど...」と後ろ向きな発言が多い彼女ですが,一体どれほどネガティブなのか,それを検証してみようというわけです.

感情分析

使い方はこちら
無料枠だと1日1000コールという上限があるので注意.

例えば,初期Nカードの
「あの…もっ…もりくぼですけど…あ、はい、森久保乃々ですけど、あの、プロデューサーさん、いきなりで申し訳ないのですけど、あの、あたし、もうアイドルとか辞めようかなって思って…あの、その…」
というセリフをCOTOHA APIで感情分析すると以下のような結果になります.

{'result': {'sentiment': 'Negative', 'score': 0.48786837208987766, 'emotional_phrase': [{'form': '申し訳ない', 'emotion': 'N'}]}, 'status': 0, 'message': 'OK'}

scoreは0から1の範囲で出るので,このセリフはそこそこネガティブといえるでしょう.感情には「Positive」「Neutral」「Negative」の3種類があります.

実践

  • 分析対象のセリフはMobage版アイドルマスターシンデレラガールズ内に実装されているカードとする.カード1枚につき14種類のセリフがある.
  • 特訓前後で同じセリフは省く.
  • セリフはwebサイトからスクレイピングしてくる.(手作業の方が早かったかもしれない・・)
  • 各感情の回数,割合,平均スコアを算出.
  • さらに,割合×平均スコアを感情の度合いとする.これは,ポジティブなセリフが多ければ多いほど,かつそのスコアが高ければ高いほどポジティブであると考えられるためです.例えば,100%全てがポジティブなセリフで,その平均スコアが1.0なら,度合いは(positive, neutral, negative)=(1, 0, 0)となります.

コード

Githubにあげています.

結果

総セリフ数:410
このうち1つだけ感情が「Positive/Negative」のものがあったので,それは計算に入っていません.

感情回数割合 平均スコア度合い
Positive135回33%0.4280.141
Neutral215回52%0.3420.179
Negative59回14%0.5510.079

Negativeの平均スコアは他より高いものの,回数が少ないため度合いは低くなっています.少し意外な結果でしたが,これは彼女が初期の頃より成長している証だとも言えます.実際,初期のカードのみで感情分析してみると以下のような結果でした.

総セリフ数:25

感情回数割合 平均スコア度合い
Positive6回24%0.3580.086
Neutral12回48%0.3800.183
Negative7回28%0.5800.163

 比較

1人の結果だけでは評価しきれない部分もあるので,他のアイドルと比べてみます.今回はポジティブパッションを感情分析してみることに.
ポジティブパッションとは,本田未央,日野茜,高森藍子の3人からなるユニットの名前です.ポジティブでパッションな彼女たちならばきっと結果も変わってくるでしょう.

本田未央

総セリフ数:476

感情回数割合 平均スコア度合い
Positive199回41.8%0.4620.193
Neutral265回55.7%0.4210.234
Negative12回2.5%0.4420.011

日野茜

総セリフ数:409

感情回数割合 平均スコア度合い
Positive154回37.7%0.4250.160
Neutral228回55.7%0.4380.244
Negative27回6.6%0.3940.026

高森藍子

総セリフ数:457
このうち1つだけ感情が「Positive/Negative」のものがあったので,それは計算に入っていません.

感情回数割合 平均スコア度合い
Positive263回57.5%0.4640.267
Neutral172回37.6%0.3990.150
Negative21回4.6%0.4780.022

先ほどに比べて3人ともネガティブ度が低くポジティブ度が高い結果となりました.単純に回数だけを見てもネガティブな発言が少ないのがわかります.流石ポジパ.

度合いに関してまとめると以下のようになります.

名前Positive度Neutral度 Negative度
森久保乃々0.1410.1790.079
本田未央0.1930.2340.011
日野茜0.1600.2440.026
高森藍子0.2670.1500.022

こうしてみると目に見えて差があるように感じますね.藍子が一番ポジティブ度高かったのは意外でした・・.まあ対象としたセリフを限定したというのもあるのでしょうけど.

今回得たデータを他の手法で解析してみるのも面白そうなのでまた機会があればやってみたいですね.

まとめ

森久保乃々はやっぱりネガティブだったけど,昔よりは成長してるぞ森久保ォ!


Viewing all articles
Browse latest Browse all 21105

Trending Articles