ねほり.com

何もないから何かみつかる

機械学習による株価予測(導き出たのは斉藤正章氏の手法)

      2020/02/26

11回目ではファンダメンタルズ指標を追加することで「AUC=0.70」を超えました。

13回目では過学習(オーバーフィッティング)を抑え学習モデルを可視化しました。

これは、果敢にも人類の夢「株の自動売買で億り人」に挑戦し、詰みかけている一人の中年男の物語です。

前回までで銘柄毎の分類器を作ることは、過学習に陥る可能性が高い事が分かりました。

 

今回は、交差検証で作成された学習モデルを保存し、日経225採用銘柄に適用してみます。

一般的なシステムトレードに近い形です。

交差検証の学習モデルの保存・ロード方法

一般的な交差検証のサンプルル実装は次のようになっています。

学習モデル構築中にテストデータも検証しています。

そして分割数で割っています・・・これは何だろう?

今回の例では、交差検証のために「学習データ」と「検証データ」に5回分割を試みました。

それぞれの学習により構築された「学習モデル」を使って「テストデータ」を予測し「分割数」で割ることで平均値を取っているようです。
 

これが正しいのであれば各学習モデルを保存し、「テストデータ」に適用して「分割数」で割ってあげるだけです。

結果を見る限り同じ結果が得られたので正しいと仮定して、日経平均255採用銘柄を使って確認してみます。

バックテスト結果

日経255採用銘柄に対してmax_depth=4で正解率60%を抽出してバックテストした検証結果は次のとおりです。

利益曲線は次のとおりです。

糞じゃねーか!!!

max_depth=2で色々と実験してみる

このままでは引き下がれないので、max_depth=2にして入力データを変えながら実験してみます。

もはや機械学習でも何でもなく、

  • 株価予測には重要な指標とパラメーターは何なのか?
  • そのストラテジーの構築方法は?

を確認しているに過ぎません。

1998/01/05~2015/12/14 を学習データに使った場合

日経255採用銘柄に対してmax_depth=2で正解率60%を抽出してバックテストした検証結果 (skiprows=0, skipfooter=1000)は次のとおりです。

学習モデル(5つの交差検証の一つ)は次のとおりです。

利益曲線は次のとおりです。

2006/02/20~2019/10/24 を学習データに使った場合

日経255採用銘柄に対してmax_depth=2で正解率60%を抽出してバックテストした検証結果 (skiprows=2000, skipfooter=60)は次のとおりです。

学習モデル(5つの交差検証の一つ)は次のとおりです。

利益曲線は次のとおりです。

2002/01/25~2019/10/24 を学習データに使った場合

日経255採用銘柄に対してmax_depth=2で正解率60%を抽出してバックテストした検証結果 (skiprows=1000, skipfooter=60)は次のとおりです。

学習モデル(5つの交差検証の一つ)は次のとおりです。

利益曲線は次のとおりです。

1998/01/05~2020/01/24 を学習データに使った場合

日経255採用銘柄に対してmax_depth=2で正解率60%を抽出してバックテストした検証結果 (skiprows=0, skipfooter=0)は次のとおりです。

学習モデル(5つの交差検証の一つ)は次のとおりです。

利益曲線は次のとおりです。

考察

ここまでの実験が正しいのであれば、導ける結果は次のとおりです。

  • 5日間移動平均との乖離率は重要な指標
  • 15日間移動平均との乖離率は重要な指標
  • (日経255採用銘柄のみの考察だが)逆張りは有効

と、機械学習は教えてくれました。

そして、これは「斉藤正章氏の逆張り手法」とほぼ同じストラテジーです。

まとめ

一ヶ月かけて機械学習で作成できたストラテジーは斉藤正章氏の手法でした・・・。

そして、今回の取り組みで作成したストラテジーは、次のような魅力の無いものです。

  • 勝率60%未満
  • プロフィットファクター2.0未満
  • 年利5%未満

また、案の定Log関数のような利益曲線となりました。

手動のストラテジーのパラメータ調整やどの指標を使うべきか?の支援ツールとしては意味がありそうです・・・どこかの会社が作りそうですね。

要するに、作ったストラテジーに、あとは何の指標を追加すれば勝率が上がるか?最適なパラメーターは何?を自動的に出力はできそうです。

 - 2020年(社会人16年), 機械学習, システムトレード, テクノロジー

  関連記事

人工知能で「くずし字」の文字認識の現状調査

日本人の多くは、日本人が150年前の文書が読めません。 家系図調査は「除籍謄本」 …

PyAutoGuiでWindows操作の自動化(protraシストレ)

もともとProtraはバックテストだけの目的で、手法が確立したら実践ではPyth …

あなたも株のプロになれる(うねり取り手法:立花義正編)

2002年に、長瀬主演の株投資のドラマがありました。 マーケットの動きは一見デタ …

「中振連」サイト作成業務をしつつ「名刺」を作ることにした

あ~気まぐれ日記とは言え、書くときは連続で本当に書くなぁ…。  &nb …

イザナミ紹介のグランビルの法則の有効性検証(システムトレード)

風邪を引きました。エアコンが寒すぎる・・・。 夏なのに普段から長袖で、エアコンし …

cosisin氏のダウ逆張り改良ドドンパ(待ち)の有効性検証(システムトレード)

9月30日は台風18号が原因で飛行機は午後からは飛びませんでした。 また、午前便 …

MSX : 超戦士ザイダー バトルオブペガスの攻略方法

MSXとは? 「MSX」と言うコンピュータをご存知だろうか?  &nb …

機械学習で株予測(3点チャージ法の有効性検証)

前回、機械学習で解いた学習モデルが勝率50.48%、プロフィットファクター1.1 …

ドラえもんVRで垣間見た新しい視覚体験

バンダイナムコエンターテインメントが製作したVRアトラクション『ドラえもんVR「 …

AWS Summit Tokyo 2013 は飯が食べれず

仕事をサボってAWS(Amazon web service) Summit To …