”神回”となった2018年の紅白歌合戦をデータで振り返る

こんにちは。 2018年の紅白歌合戦は米津玄師、サザンオールスターズ松任谷由実などが話題を集め、平成最後にふさわしい(?)盛り上がりっぷりで”神回”とまで呼ばれています。 www.sanspo.com

私も自宅で2018年の紅白歌合戦を楽しませてもらいました。

それで、最近こんな記事を思い出しました。 www.analyze-world.com


私も

「"神回”となった平成最後の紅白歌合戦でこんな感じのことをやってみたい!」

と思い、Twitterーのデータを集めて可視化に取り組んでみました。

なおタイトルは少し釣り気味で、単純に集めたデータを可視化しただけであり複合的な分析をしているわけではありません。

Twitterでの検索ワードの選定が非常に難しく関係ないツイートも多数含まれると思われるので、必ずしも正しい結果とは言えません。生暖かい目で見ていただけると幸いです。

可視化の概要

データ収集のルールや前提を挙げていきます。

対象はTwitterのツイート数

今回の収集対象はTwitterのツイート数としました。

もちろんTwitter以外にも実況サービスはあるでしょうが、最もリアルタイムでの利用者が多いだろうということで。

2018年12月31日19時15分から23時45分までのツイート数を分単位で集計

データの収集期間は2018年の紅白歌合戦の放送時間である、2018年12月31日の19時15分~23時45分までとし、1分ごとのツイート数を集計しました。

つまり紅白歌合戦が放送されていた間にリアルタイムつぶやかれたツイートを対象に、「件数が多い=注目度が高い」という観点でd-田を可視化します。

なおリツイートは収集対象から除外しています。

アーティスト名と曲名による検索

Twitterでツイートする場合、必ずしもアーティスト名でつぶやくとは限りません。

そこで今回は紅白歌合戦の出演アーティストごとにアーティスト名または曲名が含まれたツイートの数を収集することにします。

愛称による検索

たとえば「嵐」であればそのまま「嵐」と書く人がほとんどだと思います。

しかし三代目 J Soul Brothersについて言及する人は、そのまま「三代目 J Soul Brothers」と書くとは限りません。「三代目」のように略称や愛称で書くパターンが多いように思います。

このため、検索ワードにはアーティストの正式名称に加え、愛称も対象にしました。

ただしこの愛称は私の知識とWikipedia等の情報をもとに私が選定したため、アーティストごとに抽出できるツイート数に差が出ていると思われます。

また、グループ内での個人名は考慮していません。(「翔くん」など)

記号の削除

アーティスト名や曲名に記号が入っている場合はそれを削除したパターンも検索条件に追加します。

たとえば「U.S.A」という曲名は「.」を付けずに書く人も多いと思われるため、このような措置を取りました。

アーティストの分割または統合

2018年の紅白歌合戦フューチャリングが多く見られました。

このため、検索アーティストを以下のとおり分割・統合しました。

検索データフォーマット

以上を踏まえ、検索諸元となるcsvデータを以下のイメージで作成しました。

JSoulBrothers,三代目 J Soul Brothers,R.Y.U.S.E.I.,三代目

sakamotofuyumi,坂本冬美,夜桜お七

gohiromi,郷ひろみ,GOLDFINGER'99

……

YOSHIKI,YOSHIKI,ヨシキ

HYDE,HYDE,Red Swan,ハイド

sarahbrightman,サラ・ブライトマン,Miracle

……

kitajimasaburo,北島三郎,まつり,サブちゃん,さぶちゃん

.......

ishikawasayuri,石川さゆり,天城越え,布袋寅泰,布袋

……

1列目は抽出ツイートを出力するためのファイル名です。

2列目以降のカンマ区切りデータをOR条件(いずれかを含む)としてTwitterの検索APIを呼び出します。

データの可視化

前置きが長くなりましたが集めたデータをもとに、

  • 1分あたりのツイート数比較
  • 1分あたりのアーティストごとのツイート数
  • ポジティブなツイートの割合

を可視化してみました。

1分あたりのツイート数比較

全時間帯の全アーティストの1分あたりのつぶやき数をひとつのグラフにまとめてみました。

2018年紅白歌合戦1分あたりのツイート数

……ご覧のとおり対象が全50グループあるため線の色が重複しすぎてよくわかりません。

が、せっかくなのでこの中からとく目立つポイントをピックアップして見ていきます。

2018年を代表するDA PUMPのU.S.A

まずは後半始まってすぐ、21:00過ぎのオレンジの線「DA PUMP」(U.S.A)が目立ちます。1分あたり最大で1万を超えるツイートがありました。

「U.S.A」は誰もが認める”2018年の代表曲”ですから、紅白での注目もやはり高かったようです。

三山ひろし(けん玉)のリベンジが大きな注目を集める

続いて21:45手前の水色の線「三山ひろし」(いごっそ魂)が瞬間的にはDA PUMPを上回るツイート数を見せています。

正直、アーティスト自体は注目度が低いように思いますがなぜでしょうか。

これは検索ワードに「けん玉」を含めたためです。

曲とは直接関係ないもののTwitterを見ていても注目度が非常に大きかったため含めました。

結果として2018年の代表曲であるDA PUMPのU.S.Aよりも大きな注目を集めたようです。

去年のリベンジという、見ていて心臓が痛くなるような企画の勝利と言えそうです。

圧倒的だった米津玄師

そしてひと目で分かるのが23:00頃にピークを迎える紫線の「米津玄師」(Lemon)です。

圧倒的ですね。ピーク時は1分間で3.5万ツイートを超えています。

テレビではDA PUMPにサザンやユーミンと、往年のアーティストが話題を集めましたが、少なくともTwitterの中では米津玄師が圧倒的に注目されていたことがわかりました。

23:00前にも大きくツイートが伸びている時間がありますが、これは何でしょうか……?

意外(?)に注目を集めたMISIA

私が意外だったのは23:10頃がピークの茶色線の「MISIA」(アイノカタチ、つつみ込むように)です。DA PUMPに迫る1万以上のツイートを記録しています。

米津玄師の直後とは言え、メディアでは大きく取り上げられていない印象でした。

しかし私もMISIAの歌唱を聴いてその上手さ、美しさに衝撃を受けていたため、Twitterユーザーも同じ感覚だったのでしょう。

このツイート数の多さも納得です。

サザンとユーミン

そして最後の盛り上がりが終了間際の水色線の「サザンオールスターズ」(希望の轍勝手にシンドバッド緑線の「松任谷由実(この時間帯は歌唱なし)です。

サザンは開始前にも話題に上がっていたので納得ですが1分あたりのツイート数のピークは最後に”胸騒ぎの腰つき”を披露したユーミンの方が高かったようです。


「結局、平成は昭和に勝てなかった」

と言われているように”サザンとユーミンがコラボした勝手にシンドバッド”の破壊力そのものが注目を集めているのだとは思いますが、それでもなお輝く松任谷由実その人の存在感が際立つ結果になりました。

1分あたりのアーティストごとのツイート数

全体のグラフでは細かい部分が分からないので、アーティストごとにグラフ化してみます。

f:id:WorldWorldWorld:20190105102129p f:id:WorldWorldWorld:20190105102125p f:id:WorldWorldWorld:20190105102121p f:id:WorldWorldWorld:20190105102116p f:id:WorldWorldWorld:20190105102215p アーティストごとの時間帯別グラフ

比較のグラフを分割しただけなので内容は同じですね。

強いて挙げれば刀剣男士のツイートが複数伸びる時間帯があり、長い時間に渡って紅白歌合戦の視聴率に貢献したことが伺えます。

ポジティブなツイートの割合

最後にアーティストごとの全ツイート数に対するポジティブワードの割合を出してみました。

といってもこの割合は「筆者が思いつく限りのポジティブワードが入っていること」でカウントしただけであり、アーティストごとの母数(総ツイート数)も大きく異なるため、あくまで参考値です。 (例えば「サザン!!!!!!!」というつぶやきもポジティブな内容と考えられますが、カウントされません。)

選定したポジティブワードはこんな感じです。

凄い,凄すぎ,すごすぎ,すごい,上手,うまい,めっちゃ,めちゃくちゃ,めちゃめちゃ,最高,最強,美しい,きれい,美人,イケメン,尊い,ヤバイ,ヤバすぎ,楽しい,楽しみ,可愛い,かわいい,愛しい,感動,笑顔,笑い,笑った,笑う,素敵,素晴らしい,すばらしい,かっこいい,カッコいい,強そう,強い,うますぎ,良い,さすが,圧巻,貫禄,嬉しい,見たい,幸せ,良かった,おもしろい,面白い,おもしろかった,おもろい,活躍,期待,頑張れ,がんばれ,泣く,号泣

グラフはこのようになりました。
f:id:WorldWorldWorld:20190105102203p

MISIAが特に高い割合を示しています。

MISIAの注目度が高かったのが意外」といいましたが、ポジティブワードの割合からもパフォーマンスの評価が高かったことがわかります。

またLittle Glee Monster乃木坂46などが高い値であることから、パフォーマンスとは別に容姿に対する言及も多いのではないかと考えています。


今回は単純に「良さげな言葉を含む」という観点でしか見ていませんが、ツイート内容を言語解析して何に対する評価なのか(歌、容姿、その他の要因など)を分析できると面白そうです。

可視化は楽しい

以上、データで振り返る2018年の紅白歌合戦でした。

私自身にデータ分析技術が無いためデータ集計結果を単純にグラフ化しただけでしたが、このように可視化して遊ぶだけでも楽しいですね。


なお今回得た最も大きな知見は 無料のTwitterAPIの使用制限が厳しい です。実際この制限のためデータの収集そのものに丸2日ほどかかりました。

TwitterAPIで時系列データを集めたい人は注意しましょう。

"神回"を見逃した人はNHKオンデマンドをどうぞ

”神回"となった2018年の紅白歌合戦U-NEXTのNHKオンデマンドで見ることができます。31日間の無料体験で見ることができるため、見逃した人はぜひお試しください!!!

Lemon

Lemon