機械学習 fastText、word2vec、BERTまとめ(サンプル実装) 自然言語処理はAI(人工知能)分野で今最も注目の集まる分野です。 一方で、一昨年にBERTが発表され注目を浴びたものの、XLNetやRoBERTaも出てきており、技術進歩の早さについていくのに大変な領域です。 GPU... 2020.08.01 機械学習2020年(社会人16年)テクノロジー
機械学習 機械学習による株価予測(3点チャージ法を改良する→失敗) 羽田空港は全空港職員がマスクをし、利用客も7割がマスクをしています。 一方で、アメリカの空港に着いた途端にマスク着用率は一気に2割にまで下がります。 アメリカのテレビキャスターも 「マスクはウイルスにかかった人が周りへの配... 2020.02.24 機械学習システムトレード2020年(社会人16年)
機械学習 機械学習による株価予測(導き出たのは斉藤正章氏の手法) 11回目ではファンダメンタルズ指標を追加することで「AUC=0.70」を超えました。 13回目では過学習(オーバーフィッティング)を抑え学習モデルを可視化しました。 【13回目】機械学習を使った株価予測(LightGBMをO... 2020.02.19 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習を使った株価予測(LightGBMをOptunaでパラメータチューニング) 8回目で精度の高い学習モデルを構築するために「交差検証」「ROC 曲線とAUC」について実装追加しました。 11回目ではファンダメンタルズ指標を追加することで「AUC=0.70」を超えました。 【12回目】機械学習を使った株... 2020.02.17 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習を使った株価予測(pandas-profiling、create_tree_digraphで可視化する) 株式投資は、予測するものではなくルールに沿って選ぶものです。 その際に、選んだ銘柄が当たろうが外れようが、つねに勝てるルールを作り出す事が大切です。 【11回目】機械学習を使った株価予測(ファンダメンタルズ指標導入でAUC=... 2020.02.16 機械学習システムトレード2020年(社会人16年)投資テクノロジー
機械学習 機械学習を使った株価予測(ファンダメンタルズ指標導入でAUC=0.70超え) 株式投資は、予測するものではなくルールに沿って選ぶものです。 その際に、選んだ銘柄が当たろうが外れようが、つねに勝てるルールを作り出す事が大切です。 【10回目】機械学習を使った株価予測(関連論文・サイトを調査してみる) ... 2020.02.15 機械学習ファンダメンタル投資システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習を使った株価予測(関連論文・サイトを調査してみる) 株式投資は、予測するものではなくルールに沿って選ぶものです。 その際に、選んだ銘柄が当たろうが外れようが、つねに勝てるルールを作り出す事が大切です。 【9回目】機械学習で株価予測(年利・勝率向上の分析) 【8回目】機械学習... 2020.02.13 機械学習システムトレード2020年(社会人16年)投資テクノロジー
機械学習 機械学習で株価予測(年利・勝率向上の分析) 新型コロナウイルス感染症の影響によりスAmazonでのマスクの値段が7~8倍になっています。 マスクが欲しくても手に入りません。 そんな中・・・・、 私を除いて家族全員がインフルエンザAに感染した! ... 2020.02.11 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習で株価予測(交差検証+ROC 曲線とAUCで精度65%) 日本では5つの要因でサラリーマンの給料は上りません。 ① 労働組合の弱体化 ② 非正規雇用者の増加 ③ 少子高齢化の影響 ④ 内部留保を貯め込んで賃金を上げない経営者 ⑤ 規制緩和の遅れがもたらした賃金低迷 この... 2020.02.10 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習で株価予測(騰落レシオ+株価分割対応で複数銘柄) 株式投資で利益を得るために必要な事 知識ではなく(正しい手順による)練習(本人の努力)あるのみ 選んだ銘柄が当たろうが外れようが、つねに勝てる状況を作り出す そのためには、市場がもつ不確実性をかぎりなく排除する必要があ... 2020.02.07 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習で株予測(3点チャージ法の有効性検証) 前回、機械学習で解いた学習モデルが勝率50.48%、プロフィットファクター1.15、平均年利5.91%、最大損失年利-37.23%という事が分かりました。 今回は、現時点で考えている特徴量を追加して成績が改善するか確認してみます。 ... 2020.02.02 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習で株価予測(Protraを使ったバックテスト解決編) 前回は「Backtrader」を使って学習済みデータでProtra風バックテストを試み断念しました。 そもそもProtra風にバックテスト結果を出力したいなら、Protraを使うべきでは? いやいや・・。... 2020.01.31 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習で株価予測(Backtraderでバックテスト調査) 中国・武漢で発生した「新型コロナウイルス(新型肺炎)」が、世界に拡散中です。 これにより投資家心理を圧迫し、アジアの主な株式市場が春節(旧正月)で休場となり商いが薄いなか、日本株のヘッジ売りが目立つ状況です(483円安)。 ... 2020.01.30 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習で株価予測(Pythonのバックテストライブラリ調査) 前回、機械学習で解いた予測結果がどれだけ利益が出ているのか詳しく知ることが出来ませんでした。 そこで、Pythonを使った株価予想(バックテスト)ツールを調べてみます。 【2回目】機械学習で株価予測(TA-LibとLight... 2020.01.28 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習で株価予測(TA-LibとLightGBMを使った学習モデル構築) 以前、LSTMを使ってKerasで実現した学習モデルでは、「一つ手前のデータと、これまでのパターンから次の値を予測する」結果になってしまいました。 勝率も49%でした。 このアプローチにずっと疑問を持っていました... 2020.01.26 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 機械学習で株価予測(Two SigmaのKaggleコンペを確認) 計量的・実証的な投資におけるアルファは質の高いサーベイからもたらされるものであり、近い将来その分析手法の殆どが機械学習に置き換わるものだと考えています。 ・・・・と次の書籍に書いてあります。 この提言が正しいとすると... 2020.01.25 機械学習システムトレード2020年(社会人16年)テクノロジー
機械学習 KaggleのHome Credit Default Risk体験(他人のKernelパクリ編) 過去の「Featured」として、まずはタイタニック同様の「分類」コンテストで有名な次の問題を解いてみます。 Home Credit Default Risk このコンペは与えられた個人のクレジットの情報や以前の応募... 2020.01.19 機械学習2020年(社会人16年)テクノロジー
機械学習 KaggleのHome Credit Default Risk体験(Keras、Pytorch編) Kaggleの過去Featured問題「Home Credit Default Risk」を解いていきます。 このコンペは与えられた個人のクレジットの情報や以前の応募情報などから、各データが債務不履行になるかどうかを予測する問... 2020.01.17 機械学習2020年(社会人16年)テクノロジー
機械学習 KaggleのHome Credit Default Risk体験(サブミット編) ビッグデータ分析、新卒年収は1000万円以上 東大生の人気職種に(産経新聞) 「官僚でもなく、有名企業でもなく、データサイエンティスト職を志望する東大生が目立ち始めている」(就職情報会社)。 滋賀大は平成29年度から、専... 2020.01.13 機械学習2020年(社会人16年)テクノロジー
機械学習 KaggleのDigit Recognizerで画像分析(skorch編) 前回の日記で「Pytorchは難しい」という記載しましたが、このままで終わることはできません。 なぜなら、将来的に「Tensorflow」と「Pytorch」のどちらが生き残るか現時点では分からないからです。 ネットで調... 2020.01.11 機械学習2020年(社会人16年)テクノロジー