【Python応用】電撃文庫の書籍情報をスクレイピングして大雑把にまとめてみた

Python

ここでは「電撃文庫における毎月の書籍情報のスクレイピング」の解析した結果を大雑把にまとめてみました。

スポンサーリンク
スポンサーリンク

行ったこと

「【Python応用】電撃文庫における毎月の書籍情報のスクレイピング」を利用して、2000年~2021年の月別の書籍情報をスクレイピングして結果をまとめてみました。

まとめてみた項目

  • 出版数の推移
  • 単語の頻出-上位30-
  • WordCloudによる可視化

になります。

出版数の推移

2000~2021の月当りの出版数をグラフ化してみました。2017,2018年は出版数が減っていますが、2019から出版数が増えていることが分かります。

近年は書籍新刊点数が減ってきています(総務省統計局「日本の統計 2021」)。そんな中、ライトノベルは人気があることが分かります。

単語の頻出-上位30-

2000~2021のタイトルで使用されている文字をカウントした結果です。第○巻などの数字は意図的に除外した上位の30になります。「~」などの記号は除外していませんでしたが、視覚化すると意外とあって驚きました。

結果的に、記号、「上」「下」などのタイトルには直接関係ないようなものは除外しておく必要がありました。単純に視覚化しても上手くいかない結果となってしまいました。

WordCloudでの可視化

「SAO」「魔法科高校」等々の世界的にヒットしている作品の用語が目立っています。有名どころの名詞が多い印象です。

シリーズもので何冊も出ているので可視化したら目立ったという感じです。

2020年に着目すると → 伸びている

2020年の電撃文庫の出版数は以下の通りです。

2020年は右肩上がりで新刊を出版していることが分かります。コロナの影響等はあまり見られず、順調に出版されていることが分かります。

KADOKAWAのIR情報を覗いてみると、方針に沿った結果で妥当だと言えます。(私は株主ではないですが、まとめてみました)

2021年3月期の第2四半期決算説明資料で、新刊を増やすと言っています。結果を見ると有言実行ですね。

ちなみに2021の1月、2月の出版予定数です。

1月、2月ともに去年の新刊数を上回っています。

結論として、結果としては有言実行していますね。これだけではKADOKAWAの株を買う要素にはなりませんが、買う上では一つの熟考する要素になると思います。誰かの為になれば幸いです。

おすすめの書籍

タイトルとURLをコピーしました