概要
これまでの株価予測について
これまで、以下のように機械学習で株価の予測をしてみました。
- 【chainer】機械学習で株価の予測を試してみる その1
- 【chainer】機械学習で株価の予測を試してみる その2
- 【TensorFlow】機械学習で株価の予測を試してみる その3
- 【TensorFlow】機械学習で株価の予測を試してみる その4
- 【TensorFlow】機械学習で株価の予測を試してみる その5
- 【TensorFlow】機械学習で株価の予測を試してみる その6
- 【TensorFlow】機械学習で株価の予測を試してみる その7
機械学習と言っても色々手法やチューニングの方法、パラメタがあり、何がベストかは一概に言えるものじゃありません。
そして、そもそも説明変数として何を使うかも考えないといけません。
これまでの機械学習手法では、「自分自身を学習させて」いたので、過去のトレンドを何も考えずに外挿すると言っても過言でありません。
なら、これからどうするか?
財務諸表をもとに、「予測のしやすい株」と「予測のしにくい株」を分類させてみても面白いかもしれません。
ともあれ、財務諸表を理解する必要があります。
ということで、いろいろと株価を可視化してみようと思います。
株価と企業の財務諸表の値を、統計手法を使って可視化してみる
うん、統計分析の基本ですが、まずはいろいろと可視化してみましょう。
可視化手法
pythonのmatplotlibを使っています。
python超便利。
使用したデータ
まずは、何を可視化しようとしているのか、データの素性を明確にしておきましょう。
- 2017年6月23日時点の株価、発行株式数などを使用して計算された指標を使用する。
- 国内の株式市場に上場している、以下の市場を対象(全3,655銘柄)
- 東証
- 東証1部(2024銘柄)
- 東証2部(525銘柄)
- 東証マザーズ(237銘柄)
- 東証JASDAQ グローズ(42銘柄)
- 東証JASDAQ スタンダード(710銘柄)
- 名証
- 名証1部(5銘柄)
- 名証2部(56銘柄)
- 名証セントレックス(12銘柄)
- 福証
- 福証(22銘柄)
- 福証Q-Board(6銘柄)
- 札証
- 札証(9銘柄)
- 札証アンビシャス(7銘柄)
- ただし、優先出資証券の以下の2銘柄は、取り扱いの対象外とする
- 日本銀行
- 信金中央金庫
- 東証
この、可視化分析のために、データを集めるのに一番苦労しました。
多くの場合、無料じゃないか、あるいは公開はしているけどスクレイピングは禁止なんですよね。
そこで、Quandlを利用して、このAPIを叩くことで、数千銘柄の株価情報を入手しました。
この方法に行きついて、さらに自動化するコードを書いて、収集できるようになるまでが、意外に長かったorz
利益率、PER、PBR、ROEの分布
ここから、取り合えずお買い得銘柄を探すときの定番の指標、営業利益率、PER、PBR、ROEのヒストグラムを見てみましょう。
営業利益率
今どき、上場しているからには、10%以上の利益率を狙う経営が求められていると思います。
上場企業たちの利益率分布はいかがでしょうか。
こんなことがわかりますね。
- 意外に、先期の業績が赤字だった企業も一定数いる
- 10%を超える営業利益率の企業は、全上場銘柄の3割程度のようです。
ただ、この瞬間の利益率を見ても、様々な理由で「先期」の利益だけを切り取ってみているわけです。
たとえ赤字でも。大事なのはその理由です。
これは、これから紹介する、他の指標でもすべて同じことが言えるでしょう。
PER
野村證券のサイトから、説明を借りてきます。
PERとは、株価収益率といい、時価総額÷純利益などで計算されます。
一般的には、市場平均との比較や、その会社の過去のレンジとの比較で割高・割安を判断する必要があります。
どのくらいのPERが適当かについての基準はありませんが、国内上場企業の場合、およそ20倍を超えていると、割高と判断することが多いようです。
ただし、その数字も一意なものではなく、業界や業態の特性によっても変わるものです。
こんなことがわかりますね。
* 平均値と中央値に、かなり差がありますね。
* 実感として、多くの企業は16倍あたりに集中するようです。
PBR
野村證券のサイトから、説明を借りてきます。
PBRとは、株価純資産倍率といい、当該企業について市場が評価した値段(時価総額)が、会計上の解散価値である純資産(株主資本)の何倍であるかを表す指標です。
PBRは、分母が純資産であるため、企業の短期的な株価変動に対する投資尺度になりにくく、また、将来の利益成長力も反映しにくいため、単独の投資尺度とするには問題が多い。ただし、一般的にはPBR水準1倍が株価の下限であると考えられるため、下値を推定する上では効果がある。更に、PER(株価収益率)が異常値になった場合の補完的な尺度としても有効である。
こんなことがわかりますね。
* 多くの企業が、1倍に近い水準に分布しているようです。
* PBRが少なくとも6倍、いや3倍を超えると、なんかしらおかしなことが起きているとして、警戒する必要がありそうです。
ROE
野村證券のサイトから、説明を借りてきます。
PBRとは、自己資本利益率という。企業の自己資本(株主資本)に対する当期純利益の割合。
計算式はROE=当期純利益÷自己資本またはROE=EPS(一株当たり利益)÷BPS(一株当たり純資産)。
米国では株主構成に機関投資家が増加し、これらの投資家が「投下した資本に対し、企業がどれだけの利潤を上げられるのか」という点を重視したことも背景となって、最も重要視される財務指標となった。
企業は、株主資本(自己資本)と他人資本(負債)を投下して事業を行い、そこから得られた収益の中から、他人資本には利子を支払い、税金を差し引いて最後に残った税引利益が株主に帰属する。したがって、自己資本利益率は、株主の持分に対する投資収益率を表すことになる。
そのため、経営者が株主に対して果たすべき責務を表した指標と見ることができる。また、それは株主に帰属する配当可能利益の源泉となるものであり、配当能力を測定する指標として使われる。自己資本収益率は株式の投資尺度としても重要である。
最近では、ROEが8倍を閾値ととして、それ以上かそれ以下かで、投資家からの評価はかなり別れるようです。
こんなことがわかりますね。
* 8倍未満の企業は、かなりありそうですね。
* 中央値が8倍に近いことから、多くの企業は要求される利益水準を達成しているともいえそうです。
最後に
株を探すとき、スクリーニングと言って、いろんな指標から対象となる株を絞り込みを行います。
このときの指標として、今回取り上げたような指標が良く使われるようです。
(少なくとも、ググるとたくさん引っかかる)
次回以降は、これらの指標を組み合わせた可視化をすることで、さらに踏み込んだ理解をしてみようと思います。
それでは。