
概要
twitterは、当然のことながら、文字情報です。
たった140字といえど、されど140字です。
この、言葉が持つ意味をさらに探るべく、追加した機能で分析をしてみました。
何を追加したのか?
elastic社から提供されているプラグイン、X-PACKを導入しました。
このX-PACKの中の1つの機能、Graphを使った分析になります。
X-PACKとは
以下の機能をまとめて提供する、ElasticSearchとKibanaのプラグインです。
- Security
- Alerting
- Monitoring
- Reporting
- Graph
- Machine Learning
このうち、Graphを使いました。
ライセンス
なお、このX-PACKは残念ながら無料ではありません。有料です。
しかし、1か月の試用期間があるので、この期間でいろいろ試してみようというわけです。
じゃあ、そのライセンスはいくらなの?と疑問に思うのですが、本記事の執筆時点で公表されていません。
公式サイトを見ると、とりあえず問い合わせろ、というスタンスのようです。
相場もわかりませんね。月額いくらというモデルなんでしょうけど。。。
とりあえず分析に入ってみよう
何をどんな切り口で分析してみることにしましょうか。
まずは見ていただきましょう
ここでは、以下を対象として前処理と可視化を行いました。
- hashタグ
- 水色のアイコン
- ユーザ名
- 黄色のアイコン
- 形態素解析して品詞分解した本文
- 赤のアイコン
これらの関連の強さを線の太さで表現しました。
一緒につぶやかれているhashタグどうし、そしてそれをどういうユーザがつぶやいているのか、よくわかりますね。
ただ、形態素解析された本文は、特段品詞による除外をしなかったせいか、
助詞っぽい言葉の関連しか現れてきていませんね。
本格的に分析をするなら、もう少し工夫が必要そうです。
麺活監視システムのダッシュボードを眺めてみた
なるほど、なかなか面白い可視化ができるようです。
それでは、実際の題材を探して、分析してみることにしましょう。
見てみると・・・・・ぅん?
hashタグを拡大してみましょう。
なるほど。なぜか、静岡と栃木に(麺活的に)局地的なブームがきているようです。
なんだこりゃ。
それでは、これを分析してみることにしましょう。
とりあえず可視化した
そこに至るまでに、いろいろと試行錯誤があったのですが。
それは置いておいて。
以下を対象として、その関連の可視化を行いました。
- hashタグ
- 緑のアイコン
- ユーザ名
- 黄色のアイコン
麺活する人たちにとっての「静岡」の今
リアルタイム麺活監視システムにトラップされた、「静岡」というキーワードの関連を以下に示します。
なるほど、気付くことがいくつかありますね。
- 「浜松餃子・ラーメンガイド」というアカウントが、静岡と浜松というハッシュタグをよく使うようだ
- ここを中心に、大きく3つのクラスタに分けられるようだ
- グルメクラスタ(画像左上)
- ラーメンクラスタ(画像右上)
- 餃子クラスタ(画像下部)
- 先日、静岡にはバナナマンと木下優樹菜が来たのかな?
- グルメクラスタに属しているので、食べ歩きでもしたんだろうか
他にもあるんですが、キリがないのでこの辺にしておきましょう。
麺活する人たちにとっての「栃木」の今
同様にして、「栃木」というキーワードの関連を以下に示します。
栃木の場合、気付くこととしては、こんな感じでしょうか。
- 「ほふり」さんというアカウントが、宇都宮中心に稼働しているようだ
- アカウントはこちら
- 宇都宮在住のアラフォーのようですね、そう書いてあります笑
- ラーメン中ニンニクアブラネギコッコマン
- 何を言っているのか理解できない
- ぐぐると、小山市にあるコッコマンというお店に関する何かか?
- 麺スタグラムにも関連が?
- 濃厚なスープがウリっぽいな
とにかく、いろいろわかったことがあると言えそうです。
まとめ
今回は、tweet中からhashタグだったり、形態素解析して得られた本文中のキーワードなどを組み合わせて、
キーワード間の関連を可視化してみました。
こういった可視化によって、これまで気付かなかった事が明らかになることも多そうです。
次回予告:麺スタグラム
栃木の関連ノード図で、「麺スタグラム」というキーワードが出てきました。
これはどうやら、instagramで麺活報告をすること、と思えばいいのかな?
すでに予備調査をしたのですが、世界の麺活erたちの中でも、日本人(とフィリピン人)は、
麺活スタイルに、他の国の人と比較して、かなり特徴的な活動をする傾向にあることがわかっています。
次回は、このあたりの分析結果を紹介してみたいと思います。
それでは。