Data Scientistを目指すとある学生のblog

Data Scientistを目指している学生のblogです。統計分析や機械学習から最適化、英語などの勉強過程も書いていこうと思います。

100個くらい、というか最低100個

こんばんは、

 

題名の「100個くらい」というのはですね、

これから100個くらい有名アルゴリズムやデータの分析、データ構造を書いていこうと思いまして。

内容は、sortとか、~~問題と呼ばれる類いの物とか、ニューラルネットの類いのものとかやっていきたいと思います。

簡単なのはC+で書きます(sort etc)そのほか面倒な物と分析系は、Python (or R)で書いていこうと思います。

紹介したいなと思うことは、いくつかのアルゴリズム(もしくは、言語)で書くかもしれません。

 

と考えていました。

 

 

そこで、もし一日1つ書いたとしたら、100日ですよね。

今日から、100日後というのは、3月の23日なんですよね。

(できたらもっと早く終わらせたいな。。)

 

就活始まってますよね。。。

ということで、難しい内容もやっていきますが、簡単なやつもそこそこ入れていきます。

 

あと、データの分析をする際は、誰でも使えるデータを使って行こうと思いますので、参考にしてくれたら嬉しいです。

あと、自分の研究分野の方によった物も扱うと思いますので、面白そうなら見てってください。

 

取り扱う内容はだいたい下の本に載ってるものを扱います。

 

アルゴリズム系とデータ構造系はこのへんを教科書に

 

 京大の茨木先生の本です。

Cによるアルゴリズムとデータ構造

Cによるアルゴリズムとデータ構造

 

 

図書館にあった可愛らしい本です。

 

アルゴリズム図鑑 絵で見てわかる26のアルゴリズム

アルゴリズム図鑑 絵で見てわかる26のアルゴリズム

 

 統計解析、機械学習系はこのあたり。

 

 

Rによる統計解析

Rによる統計解析

 

 

 

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

 

 

詳解 ディープラーニング ~TensorFlow・Kerasによる時系列データ処理~

詳解 ディープラーニング ~TensorFlow・Kerasによる時系列データ処理~

 

 

 

Rによる機械学習 (Programmer's SELECTION)

Rによる機械学習 (Programmer's SELECTION)

 

 

 

この辺りで本の紹介疲れたんで、記事書くごとに参考資料を載せることにします。

 

 

 

機械学習あたりの勉強

お久しぶりです。

最近、機械学習あたりに強くなろうと思い、

機械学習についての良さそうな本を手にとってみました。

現在進行形で、ある2冊の本を読み進めています。

 

一応、pythonでコードを書くなら重回帰やロジスティック回帰などは、

書けますが、中身がどのようになっているのかなど、

あやふやにモデルを作っていたなと感じたため今回は、じっくり勉強しています。

 

読む前から良さそうだなと思って、読み始めたのですが、

今のところ、2冊ともすごくいい感じです。

 

一冊目は、これです。

 

詳解 ディープラーニング ~TensorFlow・Kerasによる時系列データ処理~

詳解 ディープラーニング ~TensorFlow・Kerasによる時系列データ処理~

 

まだ途中ですが、いいです!!とても!!

読みやすい !!

そして、説明も多く理解とコードの内容が結びつきます(今のところ..)

そして、TensorFlow,Kerasを実際に使ってくれているので、使い方がわかってくる感じです。

また、分析環境の構築も書いてくれていて親切な感じでした。(たまたま、環境一緒でした。)

ディープラーニングメインですので、機械学習全般を網羅したい方には、おすすめしませんが、単純パーセプトロンを始めとする、ニューラルネットの類は結構さわれます。

おすすめの一冊です。

 

 

2冊目

こちらもおすすめです。

 

 

Rによる機械学習 (Programmer's SELECTION)

Rによる機械学習 (Programmer's SELECTION)

 

 こちらは、上の一冊よりも多くの手法を学べます。

決定木から線形回帰、回帰木、ニューラルネット、サポートベクトルマシン、k平均法、バギングなど本当に多いです。

こちらもまだ途中ですが、Rがまだ得意と言えない私にとっては、丁寧で嬉しい一冊です。

 

これから色々することあるのですが、

とりあえずこの2冊をしっかりこなします。

 

今回は、本2冊の紹介でした。

AP試験(応用情報技術者試験)

就職活動で少しは有利かな、と思って今年は資格を取ることにしました。

気持ち的には、基本情報は絶対に、応用は取りたいなーくらいでした。

 

それで、今日そのAP試験がありまして、(基本情報は春取れた)

なんとなくなんですけど、

落ちたと思います。

午前は結果が出ていたので採点すると、

63/80 と合格ライン(48~ 六割ごえ)を超えていました。

解いている時から、ある程度できてる感触があったので午前はとく話すことないんですけど、午後ですね。

 

受けてみた感想として、5割いってんかな?くらいの感じでした。

 

20日程度しか勉強する期間がなかったので、勉強量が足りないと言われたらおしまいですが、基本情報は一月半で取れたので今回もいけるかなと。

 

それに加えて、

教材の範囲をしっかりできていたし、過去問も解くことができていたので試験前日には

「これはいけるなーー」とかんちがいしていました。

 

実際のところは、

午後の試験で、ネットワークをみた時、「SDN?」と知らない単語と遭遇し、変な汗が出てしまうくらいやられました。

 

ネットワークに一番時間を費やしたのに

 

他の分野もそこそこだったし合格は難しいかなと。。。

 

今回、ダメだったなと思った反省事項は、過去の参考書を基本に勉強をしていたことだと思います。大学の図書館にあった最新の本なのですが、26年度向け、、、、、

つまり三年前の試験向けの参考書です。

 

ドッグイヤーと例えられる技術の分野では、

やはり常に最新の知識が求められているのですね。

 

改めてそう思いました。

 

ついでに基本情報は2年前の教材でいけました。

 

最後に、

勉強にしようした教材とサイトを載せておきますね。

 応用情報はこれの26年度

平成29年度【春期】【秋期】応用情報技術者 合格教本 (情報処理技術者試験)

平成29年度【春期】【秋期】応用情報技術者 合格教本 (情報処理技術者試験)

 

 

 基本情報はこれの27年度、

 を使用していました。

 

ですが一番お世話になったのは、

このサイトですね。

www.ap-siken.com

 

これからは、スキルアップ重視で生活していこうと思います^^

 

明日からも頑張るぞーーー

 

テスト期間が終わりました!

やっとテスト期間が終わりました。

 

けど、来月にAPの試験があるんですよね。

 

他にも、色々やりたかったことができなかったのでこれからやっていきたいと思います。

 

ところで、今回のテスト範囲にマッチング理論の話があり、1対1マッチングや、1対多のマッチングの中を理解する際、TCCとDAアルゴリズムpythonのコードで書いたんでのっけようと思います。

 

雑なコードですが、誰かのやくに立てたらいいなと思います。

 

コードについてですが、基本的にGitHubで管理したいなと思っていますが、GitHub慣れてないので,ブログを書くに当たってGitHubにコードあげたりして慣れていこうと思います。

 

時間あるとき、GitHubであげるので少々お待ちをー

 

夏季休業終了〜〜

夏季休業が終わりました!!

短い。。。

 

 

終わってみて

平日はインターン、週末は何かしらしてて、まあまあ充実していたと思います。

 

休暇に入る前に読もうと思っていた本、結局どれも半分くらいしか終わってないです。

量が多すぎる。欲張らずに一つ一つやるべきですかね?

 

GCP本と養成読本の一冊は終わったので後日、内容をかるーく触れてみます。

 

これから、テスト期間入るのでテスト勉強に負けないくらい個人での勉強も頑張って行きます。

 

 

夏季休業中にしたいこと。。。。。

夏季休業に入って一週間が経とうとしています。

この期間を充実したものにするためには、やっぱり計画ですよね。

 

とりあえず、

これやりたいって本を今やっている本も含めて、ここに乗せて置こうと思います。

 

夏季休業後にどれくらい終わっているかなーー

 

・養成読本 2冊

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

 
データサイエンティスト養成読本 機械学習入門編 (Software Design plus)

データサイエンティスト養成読本 機械学習入門編 (Software Design plus)

 

 

 

 

・データ解析のための統計モデリング入門(みどりぼん)

・メタヒューリスティクスの数理

メタヒューリスティクスの数理

メタヒューリスティクスの数理

 

アルゴリズムとデータ構造

アルゴリズムとデータ構造 (21世紀を指向した電子・通信・情報カリキュラムシリーズ)

アルゴリズムとデータ構造 (21世紀を指向した電子・通信・情報カリキュラムシリーズ)

 

Pythonによるスクレイピング&機械学習

プログラマのためのGoogleCloudPlatform入門

プログラマのためのGoogle Cloud Platform入門 サービスの全体像からクラウドネイティブアプリケーション構築まで

プログラマのためのGoogle Cloud Platform入門 サービスの全体像からクラウドネイティブアプリケーション構築まで

 

 

ロジスティクス工学

ロジスティクス工学 (経営科学のニューフロンティア)

ロジスティクス工学 (経営科学のニューフロンティア)

 

・あたらしい数理最適化Python言語とGurobiで解く

あたらしい数理最適化: Python言語とGurobiで解く

あたらしい数理最適化: Python言語とGurobiで解く

 

・基本の78パターンで英会話フレーズ800 

基本の78パターンで 英会話フレーズ800

基本の78パターンで 英会話フレーズ800

 

 

 

って感じです。まぁまぁ終わってるものもあるのですが、多いなー10冊かー

 

 

インターンやレポートもありますが、頑張って終わらせていきます。。。。。

レポートが4つくらい、、3日で終わるかな、

10月にAPの試験受ける予定なのでその勉強も始めないと行けないなーーー。

 

時間大切にしないとなー

 

とりあえず終わらせる計画立てないと、、、がんばろ!!!

 

 

 

 

 

 

 

 

 

最近の勉強

まず養成読本を、がが〜っと終わらせるつもりが、レポートや、頼まれていたプログラムを組んだり、大学でのプレゼンが二週連続であったりとで、結局コツコツ終わらせていっています。

 

次か、その次で他のデータを使って似たようなことをしていこうかと思っています。

あと、今回頼まれていたプログラムというのは、配置問題の一つ、ビンパッキング問題(Bin Packing Problem)に近い問題で、面白いものでしたので、これも少し載っけようかと思ってます。

加えて、最近よくAWSGCPを勉強してた方がいいよと聞くので、GCPを使えるようになろうと思います。

ということで、まずこの本をやろう。

 

プログラマのためのGoogle Cloud Platform入門 サービスの全体像からクラウドネイティブアプリケーション構築まで

プログラマのためのGoogle Cloud Platform入門 サービスの全体像からクラウドネイティブアプリケーション構築まで

 

 後日、書評とかできる立場ではないので、何ができるようになったか、何についての理解ができたかを少し書いていきます。

 

うっし、がんばろ!!!!!