麺活で登場するキーワード間の関連分析基盤を実装&可視化してみた
02
- 6月
2017
Posted By : boomin
麺活で登場するキーワード間の関連分析基盤を実装&可視化してみた

 

Advertisements

概要

twitterは、当然のことながら、文字情報です。
たった140字といえど、されど140字です。

この、言葉が持つ意味をさらに探るべく、追加した機能で分析をしてみました。

 

何を追加したのか?

elastic社から提供されているプラグイン、X-PACKを導入しました。
このX-PACKの中の1つの機能、Graphを使った分析になります。

 

X-PACKとは

以下の機能をまとめて提供する、ElasticSearchとKibanaのプラグインです。

  • Security
  • Alerting
  • Monitoring
  • Reporting
  • Graph
  • Machine Learning

このうち、Graphを使いました。

 

Advertisements

ライセンス

なお、このX-PACKは残念ながら無料ではありません。有料です。
しかし、1か月の試用期間があるので、この期間でいろいろ試してみようというわけです。

じゃあ、そのライセンスはいくらなの?と疑問に思うのですが、本記事の執筆時点で公表されていません
公式サイトを見ると、とりあえず問い合わせろ、というスタンスのようです。
相場もわかりませんね。月額いくらというモデルなんでしょうけど。。。

 

とりあえず分析に入ってみよう

何をどんな切り口で分析してみることにしましょうか。

 

まずは見ていただきましょう

ここでは、以下を対象として前処理と可視化を行いました。

  • hashタグ
    • 水色のアイコン
  • ユーザ名
    • 黄色のアイコン
  • 形態素解析して品詞分解した本文
    • 赤のアイコン

これらの関連の強さを線の太さで表現しました。
一緒につぶやかれているhashタグどうし、そしてそれをどういうユーザがつぶやいているのか、よくわかりますね。

 

 

ただ、形態素解析された本文は、特段品詞による除外をしなかったせいか、
助詞っぽい言葉の関連しか現れてきていませんね。

本格的に分析をするなら、もう少し工夫が必要そうです。

 

麺活監視システムのダッシュボードを眺めてみた

なるほど、なかなか面白い可視化ができるようです。
それでは、実際の題材を探して、分析してみることにしましょう。

見てみると・・・・・ぅん?

 

 

hashタグを拡大してみましょう。

 

 

なるほど。なぜか、静岡と栃木に(麺活的に)局地的なブームがきているようです。
なんだこりゃ。

それでは、これを分析してみることにしましょう。

 

とりあえず可視化した

そこに至るまでに、いろいろと試行錯誤があったのですが。
それは置いておいて。

以下を対象として、その関連の可視化を行いました。

  • hashタグ
    • 緑のアイコン
  • ユーザ名
    • 黄色のアイコン

 

麺活する人たちにとっての「静岡」の今

リアルタイム麺活監視システムにトラップされた、「静岡」というキーワードの関連を以下に示します。

 

 

なるほど、気付くことがいくつかありますね。

  • 「浜松餃子・ラーメンガイド」というアカウントが、静岡と浜松というハッシュタグをよく使うようだ
  • ここを中心に、大きく3つのクラスタに分けられるようだ
    • グルメクラスタ(画像左上)
    • ラーメンクラスタ(画像右上)
    • 餃子クラスタ(画像下部)
  • 先日、静岡にはバナナマンと木下優樹菜が来たのかな?
    • グルメクラスタに属しているので、食べ歩きでもしたんだろうか

他にもあるんですが、キリがないのでこの辺にしておきましょう。

 

麺活する人たちにとっての「栃木」の今

同様にして、「栃木」というキーワードの関連を以下に示します。

 

 

栃木の場合、気付くこととしては、こんな感じでしょうか。

  • 「ほふり」さんというアカウントが、宇都宮中心に稼働しているようだ
  • ラーメン中ニンニクアブラネギコッコマン
    • 何を言っているのか理解できない
    • ぐぐると、小山市にあるコッコマンというお店に関する何かか?
    • 麺スタグラムにも関連が?
    • 濃厚なスープがウリっぽいな

とにかく、いろいろわかったことがあると言えそうです。

 

まとめ

今回は、tweet中からhashタグだったり、形態素解析して得られた本文中のキーワードなどを組み合わせて、
キーワード間の関連を可視化してみました。

こういった可視化によって、これまで気付かなかった事が明らかになることも多そうです。

 

次回予告:麺スタグラム

栃木の関連ノード図で、「麺スタグラム」というキーワードが出てきました。
これはどうやら、instagramで麺活報告をすること、と思えばいいのかな?

 
すでに予備調査をしたのですが、世界の麺活erたちの中でも、日本人(とフィリピン人)は、
麺活スタイルに、他の国の人と比較して、かなり特徴的な活動をする傾向にある
ことがわかっています。

 
次回は、このあたりの分析結果を紹介してみたいと思います。
それでは。

Advertisements

コメントを残す