機械学習

2020年(社会人16年)

機械学習で株価予測(Two SigmaのKaggleコンペを確認)

計量的・実証的な投資におけるアルファは質の高いサーベイからもたらされるものであり、近い将来その分析手法の殆どが機械学習に置き換わるものだと考えています。 ・・・・と次の書籍に書いてあります。 この提言が正しいとすると...
2020年(社会人16年)

KaggleのHome Credit Default Risk体験(他人のKernelパクリ編)

過去の「Featured」として、まずはタイタニック同様の「分類」コンテストで有名な次の問題を解いてみます。 Home Credit Default Risk このコンペは与えられた個人のクレジットの情報や以前の応募...
2020年(社会人16年)

KaggleのHome Credit Default Risk体験(Keras、Pytorch編)

Kaggleの過去Featured問題「Home Credit Default Risk」を解いていきます。 このコンペは与えられた個人のクレジットの情報や以前の応募情報などから、各データが債務不履行になるかどうかを予測する問...
2020年(社会人16年)

KaggleのHome Credit Default Risk体験(サブミット編)

ビッグデータ分析、新卒年収は1000万円以上 東大生の人気職種に(産経新聞) 「官僚でもなく、有名企業でもなく、データサイエンティスト職を志望する東大生が目立ち始めている」(就職情報会社)。 滋賀大は平成29年度から、専...
2020年(社会人16年)

KaggleのDigit Recognizerで画像分析(skorch編)

前回の日記で「Pytorchは難しい」という記載しましたが、このままで終わることはできません。 なぜなら、将来的に「Tensorflow」と「Pytorch」のどちらが生き残るか現時点では分からないからです。 ネットで調...
2020年(社会人16年)

KaggleのDigit Recognizerで画像分析(Pytorch編)

これまでディープラーニング(深層学習)の実装にはKerasを利用していました。 近年は「PyTorchがディープラーニング系ライブラリでは良い」という話を聞きます。 今回はPytorchを使って前回扱った「Digit R...
2020年(社会人16年)

Kaggleの概要を理解する(Titanicの次に向けて)

これまで、Kaggleの「Titanic: Machine Learning from Disaster」「House Prices: Advanced Regression Techniques」「Digit Recognizer」に参加...
2020年(社会人16年)

KaggleのDigit Recognizerで画像分析(Keras編)

今回はDigit Recognizerという入門コンペに参加してみます。 Digit_Recognizer_Pic これは機械学習用の画像データとしては最も基本的かつよく使われるMNISTデータセットを用いた画像の分...
2020年(社会人16年)

KaggleのHouse Pricesで回帰分析(モデル作成編)

今回も、kaggleの入門者向けチュートリアルコンペ「住宅価格予測」を解いてみます。 House Prices: Advanced Regression Techniques 各種指標を用いて住宅の価格を予測する分析...
2019年(社会人15年)

KaggleのHouse Pricesで回帰分析(Feature Engineering編)

今回も、kaggleの入門者向けチュートリアルコンペ「住宅価格予測」を解いてみます。 House Prices: Advanced Regression Techniques 各種指標を用いて住宅の価格を予測する分析...
2019年(社会人15年)

KaggleのHouse Pricesで回帰分析(EDA:Exploratory Data Analysis編)

今回は、kaggleの入門者向けチュートリアルコンペ「住宅価格予測」をやってみます。 House Prices: Advanced Regression Techniques 各種指標を用いて住宅の価格を予測する分析...
2019年(社会人15年)

Kaggle の Titanic Prediction Competition でクラス分類(XGBoost、LightGBM、CatBoost編)

機械学習に精通し適切にデータを分類できるだけではなく、膨大なデータから課題を発見しソリューションを提示してリードできる データドリブン・コンサルタント が、市場に求められています。 アクセンチュア株式会...
2019年(社会人15年)

Kaggle の Titanic Prediction Competition でクラス分類(scikit-learn編)

統計学や人工知能(AI)を駆使してデータを分析し、課題の発見や解決に導く「データサイエンス」教育に力を入れる大学が増えてきたそうです。 データサイエンス教育拡大 AI駆使しデータ分析、人材育成へ大学注力 東北大の滝沢博胤副学...
2019年(社会人15年)

Kaggle の Titanic Prediction Competition でクラス分類(Keras Functional API編)

データサイエンティストの転職サイトを見ると年収 600万 ~ 1,200万円ぐらいだ。 書かれている内容を大体まとめると次のようなスキルが必要だと分かる。 【必須】 統計学、機械学習に関する知識・実務経験 デ...
2019年(社会人15年)

Kaggle の Titanic Prediction Competition でクラス分類(Jupyter Notebook編)

近くの図書館に行くと、クリスマス装飾に変わっていた。 そして、トイレに次のようなステッカーが貼ってあった。 トイレと恋は勇気を出して 一歩前に踏み出しましょう 何このセンス!!...
2019年(社会人15年)

Kaggle の Titanic Prediction Competition でクラス分類(Keras編)

将来が不安です・・・。 先週、上司(センター長、部門長、部長、課長)より、 今後どうするんだ?この仕事じゃ何年も生きていけないぞ!! と言われています。 自分でもそう思います・・・・。 ...
2019年(社会人15年)

システムトレードの動向(過去と今後)まとめ

有名シストレブロガー、書籍、販売中のストラテジーを読み漁る中で、ストラテジに流行があると感じたのでまとめです。 因みにFXシステムトレードのブログも読み漁りましたが、FXの方が数年進んでる印象を受けました。 参考にするな...
2019年(社会人15年)

投資機関の自動売買・支援ツール状況まとめ

日足のRSIやらMACDなどテクニカル指標を足したり引いたりするシステムトレードではなく、高速、高頻度、AI、最新鋭の機関投資家の自動売買を調査してみました。 米国勢を筆頭に、為替直物や各種先物でHFTを手掛ける大口投資家のA...
2019年(社会人15年)

主成分分析が固有値問題となる理由

行列には「固有値」や「固有ベクトル」、統計には「分散」や「共分散」があるというのは、理系の大卒なら誰でも知っている。 しかし、数学として固有方程式を解く方法だけ学んでも、結局何のためにあるのかわからないまま終わってしまう。 ...
2019年(社会人15年)

人工知能で「くずし字」の文字認識の現状調査

日本人の多くは、日本人が150年前の文書が読めません。 家系図調査は「除籍謄本」や「聞き込み」調査が完了したら、次は各研究機関や施設を訪ねて、江戸時代の古文書を調査することになります。 古文書に書かれている字は一般的には「草書」...
タイトルとURLをコピーしました