日足のRSIやらMACDなどテクニカル指標を足したり引いたりするシステムトレードではなく、高速、高頻度、AI、最新鋭の機関投資家の自動売買を調査してみました。
米国勢を筆頭に、為替直物や各種先物でHFTを手掛ける大口投資家のAI活用はかなり進んでいます。
※ HFT=ミリ秒単位の頻繁な売買で利ざやを積み上げるような高速且つ高頻度の取引
- 手数料が個人投資家のものと比べて格安
- お金をかけて高頻度売買専用のシステムを開発
構成としては、データベースサーバー1台300万円、ネットワークは取引所のコロケーションサービス(取引所サーバーと同じ建物同じフロアに設置。月額30万円から100万円超)です。
HFT流行時の手法(2010年〜)
国内におけるアルゴリズム取引は、2010年に東京証券取引所がアローヘッドを導入してから普及しました。
アローヘッドは高速注文を受付するシステムで、従来は売買注文1件あたり2~3秒かかっていたところを0.005秒程度まで短縮できました。
システムトレードの手法は、人間心理を利用したプログラミングです。
具体的には、見せ板(嘘の注文)を出したり、提灯買い(大量注文入れると個人もつられて買うこと)などを意図的に作り出して、利益を積み上げていました。
野村証券のシステムトレード
野村証券の手法は、調べれば色々と書かれています。
従来の手法
- 2016年4月から一部の機関投資家向けに試験的なサービス提供を開始
- AI手法はディープラーニング
- 対象銘柄はTOPIX500、5分後の株価を予測
- 使用するデータは株価の過去の乖離率など
- 的中率は100%ではないが(当然ですが笑)、多くの銘柄で大量の注文を執行する際に有効
- AIベンチャーであるHEROZと共同開発
これにより、アルゴリズム取引における執行アルゴリズムのパフォーマンスは以前に比べ20%程度改善されたそうです。
HEROZの手法は次の通りです。
対象銘柄 | TOPIX CORE30(発表時点であり、その後対象をTOPIX500へ拡張したものと思われます) |
AI手法 | DBN(Deep Belief Network)を採用 |
DBNはディープラーニングの初期モデルであり、各層間のモデルをAE(Auto Encoder)でなくRBM(Restricted Boltzmann Machine)で構成します。
入力変数
7800(個別株データ3900+日経先物データ3900)を1データセットとします。3900の内訳は、チャート情報が500、板情報が3200、Tick情報が200となります。
出力変数
上記の1データセットに対応する解答ラベルが1つ。
モデル数
予測開始時点毎に異なるDBNモデルを作成するようです(9:00時点の予測はDBN1、10:00時点の予測はDBN2、・・・など)。
サンプル数
上記のデータセットが30銘柄×数年分(学習期間を20年とすると30×240営業日×20=144000サンプル/モデル)
層数
入力層(7800)→中間層1(4000)→中間層2(3500)→中間層3(3000)→中間層4(2500)→中間層5(2000)→中間層6(1500)→出力層(1)
入力層~中間層6がそれぞれRBMであり、500変数ずつ次元削減されています(中間層6~出力層が識別部)
現在の手法
HEROZシステムの期待勝率が低く、野村証券の独自システムに変更したそうです。
みずほ証券のシステムトレード
既にトレーダー部隊は解散しており、トレーダー達は外資ヘッジファンドに転職したそうです。
従来の手法
日本個別株・為替・商品先物の約定履歴や板情報履歴および出来高履歴データを使い、TOPIX500の銘柄を対象に30分から1時間後の個別銘柄の株価を予測していました。
現在の手法
1時間後に株価が0.5%以上上昇するか、0.5%以上下落するか、それとも-0.5%~+0.5%のレンジ内に収まるかを予測します。
- 2016年11月末より機関投資家向けにサービス提供を開始
- AI手法はディープラーニング
- 対象銘柄はTOPIX500(順次拡大)、30分~1時間後の株価の上昇/下落幅を予測
- 使用するデータは個別銘柄ごとの注文状況や売買ボリューム、過去の値動きなどのデータ
- 的中率は8割以上に達しているという(これについては後述します)
- 注文金額の0.01%程度の運用成績改善が見込める。システムの利用料は徴収しない
- AIは自社開発(特許取得済)
なお、トムソン・ロイター・ジャパン株式会社が算出するリアルタイムのニュース・センチメント指数「トムソン・ロイター・センチメント・インデックス」を利用しています。
トムソン・ロイター・センチメント・インデックスとは?
市場動向にインパクトのある話題がメディアでどのように発信されているかという認識を数値化したものです。
具体的には、ロイターを始めとする世界の主要メディアから発信される記事の膨大なテキストデータをリアルタイムで自然言語解析技術により指数化しています。
利用しているディープラーニング
7800入力のDBN(Deep Belief Network:DBNは教師なし学習)を使っています。
1つで万能の予測器をつくるのはうまくいかないため、専用のDBNを作って個別に学習させています。
入力としては、合計7800入力のネットワークとなっています。
- 予測対象の個別株の直近の20個の4本値と出来高データ
- 直近の100個のクオートデータ
- 直近100tickの価格
- 約定数量など合計3900データ
- 日経225先物が3900データ
このシステムは4台のサーバにそれぞれ8台のTesla M40 GPUを接続し、もう1台のサーバをストレージサーバやフロントエンドサーバとして使っています。
そして、これらのサーバを56GbpsのInfiniBandで接続し、学習を並列化しています。
【参考】ディープラーニングの原理とビジネス化の現状(7) 株の売買にディープラーニングを活用
大和証券
Cogent Labsが多くの情報を提供しておらず、具体的な中身は分かりません。
従来の手法
分かりません。
現在の手法
2017年11月2日、株式会社Cogent Labs(コージェントラボ)と大和証券株式会社(大和証券)は、人工知能(AI)を利用したリアルタイムの株式出来高予測モデルを開発しています。
- ディープラーニングを取り入れる
- 取引日中における出来高変化をより高い精度で予測する
- シミュレーションでは、予測精度が8割近い銘柄で改善、最大39%改善
予測エンジン名は「TSF(Time Series Forecasting)」と呼ばれてます。
Time Series Forecastingとは?
「時系列データ予測」です。
- 大量の高次元データをリアルタイムで取り込むことができる
- 最新のデータを常に学習する
- 短期から長期まで、指定した時間帯でパターンを検出、予測のアウトプットができる
三菱UFJモルガン・スタンレー証券
三菱UFJモルガン・スタンレー証券は1カ月後の騰落を予測しています。
従来の手法
分かりません。
現在の手法
2016年8月22日、AIによる日経平均株価の騰落予測を試みています。
これは、毎月10日を基準日に設定し、1カ月後に上昇するか下落するかを予測するものです。
2015年10月までの43カ月間の平均的中率は約70%だが、2015年に限ると90%まで跳ね上がるとのことです。
予測の基になるのは株価指数や為替レートなど92種類の経済指標です。
毎月、15年分から、過去の似た相場環境とその直前の経済指標を抽出し、「決定木分析」という統計手法で相関を突き詰めています。
これはある局面において株価を決定する要因を細分化し、「鉱工業生産指数が○○以下」「豪製造業PMI(購買担当者景気指数)が××以上」といった選択肢が樹木の枝のように広がるモデルに落とし込むものです。
三菱UFJ信託銀行
AIに任せるのは局面の判断のみで、銘柄選択には従来通り人間のアナリストも介在しています。
従来の手法
分かりません。
現在の手法
翌日のTOPIX(東証株価指数)の騰落を当てるAIを開発しました。
分析の対象は日次から月次まで約200種類の経済指標です。
2016年3月から自己資金数億円を投じたパイロットファンドでこの機能を活用中です。
ファンドの投資対象は50銘柄強の高配当株で、AIがその日の相場下落を予想した場合は、先物を使ったヘッジ取引を増やします。
AIに2008~15年までの過去データで投資シミュレーションを試みたところ、全ての年で投資収益はプラスでした。
証券会社ゴールドマン・サックス
海外の有名な実例です。
顧客の投資を扱うトレーダーが2000年には本社で約650人いましたが、2017年には3人にまで削減されました。
一方でAIシステムを開発するためのエンジニアを4,000名雇っています。
元ゴールドマンサックスのスタッフを受け入れたヘッジファンドが苦戦しているのとは対象的に、人の手をほとんど使わないゴールドマンサックスは好調です。
日本でもゴールドマンサックスのAI投資信託に人気が集まり、当初の予想を上回り2017年10月時点で1,100億円の運用資金を集めています。
AI自体は、米AIベンチャー、Digital Reasoningを採用しています。
Digital Reasoningは、米テネシー州に2000年に設立された企業で、コグニティブコンピューティングの技術を使って会話分析のソリューションを販売する企業です。
主な顧客は、米CIAといった政府諜報機関の他、金融機関向け、米IBMのスーパーコンピューター「ワトソン」に応用されていることも知られています。