上場企業を分析してみる その1

 

Advertisements

概要

これまでの株価予測について

これまで、以下のように機械学習で株価の予測をしてみました。

機械学習と言っても色々手法やチューニングの方法、パラメタがあり、何がベストかは一概に言えるものじゃありません。
そして、そもそも説明変数として何を使うかも考えないといけません。

これまでの機械学習手法では、「自分自身を学習させて」いたので、過去のトレンドを何も考えずに外挿すると言っても過言でありません。

 

Advertisements

なら、これからどうするか?

財務諸表をもとに、「予測のしやすい株」と「予測のしにくい株」を分類させてみても面白いかもしれません。
ともあれ、財務諸表を理解する必要があります。
ということで、いろいろと株価を可視化してみようと思います。

 

株価と企業の財務諸表の値を、統計手法を使って可視化してみる

うん、統計分析の基本ですが、まずはいろいろと可視化してみましょう。

 

可視化手法

pythonのmatplotlibを使っています。
python超便利。

使用したデータ

まずは、何を可視化しようとしているのか、データの素性を明確にしておきましょう。

  • 2017年6月23日時点の株価、発行株式数などを使用して計算された指標を使用する。
  • 国内の株式市場に上場している、以下の市場を対象(全3,655銘柄)
    • 東証
      • 東証1部(2024銘柄)
      • 東証2部(525銘柄)
      • 東証マザーズ(237銘柄)
      • 東証JASDAQ グローズ(42銘柄)
      • 東証JASDAQ スタンダード(710銘柄)
    • 名証
      • 名証1部(5銘柄)
      • 名証2部(56銘柄)
      • 名証セントレックス(12銘柄)
    • 福証
      • 福証(22銘柄)
      • 福証Q-Board(6銘柄)
    • 札証
      • 札証(9銘柄)
      • 札証アンビシャス(7銘柄)
    • ただし、優先出資証券の以下の2銘柄は、取り扱いの対象外とする
      • 日本銀行
      • 信金中央金庫

この、可視化分析のために、データを集めるのに一番苦労しました。
多くの場合、無料じゃないか、あるいは公開はしているけどスクレイピングは禁止なんですよね。

そこで、Quandlを利用して、このAPIを叩くことで、数千銘柄の株価情報を入手しました。
この方法に行きついて、さらに自動化するコードを書いて、収集できるようになるまでが、意外に長かったorz

 

利益率、PER、PBR、ROEの分布

ここから、取り合えずお買い得銘柄を探すときの定番の指標、営業利益率、PER、PBR、ROEのヒストグラムを見てみましょう。

 

営業利益率

今どき、上場しているからには、10%以上の利益率を狙う経営が求められていると思います。
上場企業たちの利益率分布はいかがでしょうか。

 
営業利益率の分布(全業種:2017年6月23日現在)
 

こんなことがわかりますね。

  • 意外に、先期の業績が赤字だった企業も一定数いる
  • 10%を超える営業利益率の企業は、全上場銘柄の3割程度のようです。

ただ、この瞬間の利益率を見ても、様々な理由で「先期」の利益だけを切り取ってみているわけです。
たとえ赤字でも。大事なのはその理由です。
これは、これから紹介する、他の指標でもすべて同じことが言えるでしょう。

 

PER

野村證券のサイトから、説明を借りてきます。

どのくらいのPERが適当かについての基準はありませんが、国内上場企業の場合、およそ20倍を超えていると、割高と判断することが多いようです。
ただし、その数字も一意なものではなく、業界や業態の特性によっても変わるものです。

 
PERの分布(全業種:2017年6月23日現在)
 

こんなことがわかりますね。
* 平均値と中央値に、かなり差がありますね。
* 実感として、多くの企業は16倍あたりに集中するようです。

 

PBR

野村證券のサイトから、説明を借りてきます。

 
PBRの分布(全業種:2017年6月23日現在)
 

こんなことがわかりますね。
* 多くの企業が、1倍に近い水準に分布しているようです。
* PBRが少なくとも6倍、いや3倍を超えると、なんかしらおかしなことが起きているとして、警戒する必要がありそうです。

 

ROE

野村證券のサイトから、説明を借りてきます。

最近では、ROEが8倍を閾値ととして、それ以上かそれ以下かで、投資家からの評価はかなり別れるようです。

 
ROEの分布(全業種:2017年6月23日現在)
 

こんなことがわかりますね。
* 8倍未満の企業は、かなりありそうですね。
* 中央値が8倍に近いことから、多くの企業は要求される利益水準を達成しているともいえそうです。

 

最後に

株を探すとき、スクリーニングと言って、いろんな指標から対象となる株を絞り込みを行います。
このときの指標として、今回取り上げたような指標が良く使われるようです。
(少なくとも、ググるとたくさん引っかかる)

次回以降は、これらの指標を組み合わせた可視化をすることで、さらに踏み込んだ理解をしてみようと思います。

それでは。

Advertisements

コメントを残す