データ解析のライブラリを作っています

何かデータを解析するとなったとき、

  1. データを読み込む (numpy, pandas)
  2. 前処理をする (sklearn)
  3. 統計的解析をする (sklearn)
  4. 結果を出力する (matplotlib)

というフローが一般的だと思います。

しかし、いろいろなデータを解析していると何度も同じコードを書くシチュエーションが 出てきます。

そこで、自分がデータ解析を行った時に書いたコードを整理し、 公開できるものについてはパッケージ化してpypiで公開しようと考えました。

GitHubやTravis CI、テスト駆動開発などの勉強も兼ねています。

バリバリα版ですが、人柱大募集中です(笑)

なにかあればIssueでもPull Requestでもいただければ嬉しいです。

参考