機械学習

機械学習で株価予測(Pythonのバックテストライブラリ調査)

前回、機械学習で解いた予測結果がどれだけ利益が出ているのか詳しく知ることが出来ませんでした。 そこで、Pythonを使った株価予想(バックテスト)ツールを調べてみます。 【2回目】機械学習で株価予測(TA-LibとLight...
機械学習

機械学習で株価予測(TA-LibとLightGBMを使った学習モデル構築)

以前、LSTMを使ってKerasで実現した学習モデルでは、「一つ手前のデータと、これまでのパターンから次の値を予測する」結果になってしまいました。 勝率も49%でした。 このアプローチにずっと疑問を持っていました...
機械学習

機械学習で株価予測(Two SigmaのKaggleコンペを確認)

計量的・実証的な投資におけるアルファは質の高いサーベイからもたらされるものであり、近い将来その分析手法の殆どが機械学習に置き換わるものだと考えています。 ・・・・と次の書籍に書いてあります。 この提言が正しいとすると...
機械学習

KaggleのHome Credit Default Risk体験(他人のKernelパクリ編)

過去の「Featured」として、まずはタイタニック同様の「分類」コンテストで有名な次の問題を解いてみます。 Home Credit Default Risk このコンペは与えられた個人のクレジットの情報や以前の応募...
機械学習

KaggleのHome Credit Default Risk体験(Keras、Pytorch編)

Kaggleの過去Featured問題「Home Credit Default Risk」を解いていきます。 このコンペは与えられた個人のクレジットの情報や以前の応募情報などから、各データが債務不履行になるかどうかを予測する問...
機械学習

KaggleのHome Credit Default Risk体験(サブミット編)

ビッグデータ分析、新卒年収は1000万円以上 東大生の人気職種に(産経新聞) 「官僚でもなく、有名企業でもなく、データサイエンティスト職を志望する東大生が目立ち始めている」(就職情報会社)。 滋賀大は平成29年度から、専...
機械学習

KaggleのDigit Recognizerで画像分析(skorch編)

前回の日記で「Pytorchは難しい」という記載しましたが、このままで終わることはできません。 なぜなら、将来的に「Tensorflow」と「Pytorch」のどちらが生き残るか現時点では分からないからです。 ネットで調...
機械学習

KaggleのDigit Recognizerで画像分析(Pytorch編)

これまでディープラーニング(深層学習)の実装にはKerasを利用していました。 近年は「PyTorchがディープラーニング系ライブラリでは良い」という話を聞きます。 今回はPytorchを使って前回扱った「Digit R...
機械学習

Kaggleの概要を理解する(Titanicの次に向けて)

これまで、Kaggleの「Titanic: Machine Learning from Disaster」「House Prices: Advanced Regression Techniques」「Digit Recognizer」に参加...
機械学習

KaggleのDigit Recognizerで画像分析(Keras編)

今回はDigit Recognizerという入門コンペに参加してみます。 Digit_Recognizer_Pic これは機械学習用の画像データとしては最も基本的かつよく使われるMNISTデータセットを用いた画像の分...
機械学習

KaggleのHouse Pricesで回帰分析(モデル作成編)

今回も、kaggleの入門者向けチュートリアルコンペ「住宅価格予測」を解いてみます。 House Prices: Advanced Regression Techniques 各種指標を用いて住宅の価格を予測する分析...
2020年(社会人16年)

新年の挨拶・昨年の振り返りと2020年の目標

9年休なのに何も予定を立てず帰郷もぜず、いつの間にか新年を迎えてしまいました。 昨年の反省 周りで多くの人の飛躍を見てきた年でした。 社内異動でマネージャー昇格 転職(年収2000万円~4000万円へ) 独...
機械学習

KaggleのHouse Pricesで回帰分析(Feature Engineering編)

今回も、kaggleの入門者向けチュートリアルコンペ「住宅価格予測」を解いてみます。 House Prices: Advanced Regression Techniques 各種指標を用いて住宅の価格を予測する分析...
機械学習

KaggleのHouse Pricesで回帰分析(EDA:Exploratory Data Analysis編)

今回は、kaggleの入門者向けチュートリアルコンペ「住宅価格予測」をやってみます。 House Prices: Advanced Regression Techniques 各種指標を用いて住宅の価格を予測する分析...
システムトレード

cosisin氏の2日後の終値の-1Tickの逆指値有効性検証(システムトレード)

クリスマスイブです。 バックテスト結果が良かったので公開してませんでしたが、クリスマスプレゼント(になるかも分かりませんが)として載せておきます。 今回は、cosisin氏の「問題・正解」の有効性を検証します。 【基本...
機械学習

Kaggle の Titanic Prediction Competition でクラス分類(XGBoost、LightGBM、CatBoost編)

機械学習に精通し適切にデータを分類できるだけではなく、膨大なデータから課題を発見しソリューションを提示してリードできる データドリブン・コンサルタント が、市場に求められています。 アクセンチュア株式会...
機械学習

Kaggle の Titanic Prediction Competition でクラス分類(scikit-learn編)

統計学や人工知能(AI)を駆使してデータを分析し、課題の発見や解決に導く「データサイエンス」教育に力を入れる大学が増えてきたそうです。 データサイエンス教育拡大 AI駆使しデータ分析、人材育成へ大学注力 東北大の滝沢博胤副学...
機械学習

Kaggle の Titanic Prediction Competition でクラス分類(Keras Functional API編)

データサイエンティストの転職サイトを見ると年収 600万 ~ 1,200万円ぐらいだ。 書かれている内容を大体まとめると次のようなスキルが必要だと分かる。 【必須】 統計学、機械学習に関する知識・実務経験 デ...
2019年(社会人15年)

台湾・ 新竹県竹北市にある「黄金海岸活蝦之家餐庁」

今年は台湾に8,9回ぐらい出張で行きました。 場所は台北ではなく新竹です。 IT関連の工場や企業が集中しているため「台湾のシリコンバレー」と呼ばれており、多くの日本人ビジネスマンも見かけます。 ただ、出張時は深夜まで会...
機械学習

Kaggle の Titanic Prediction Competition でクラス分類(Jupyter Notebook編)

近くの図書館に行くと、クリスマス装飾に変わっていた。 そして、トイレに次のようなステッカーが貼ってあった。 トイレと恋は勇気を出して 一歩前に踏み出しましょう 何このセンス!!...
タイトルとURLをコピーしました