サイクリングデータの分析 ~Strava APIを用いて~

今日のお昼から嵐山までサイクリングに行ってきました。「天気も良くて最高でした」、で終わるのは勿体無いと思ったので、Stravaで計測したデータを分析したいと思います。

  • 準備編
    • ユーザープロフィールデータ
  • 分析編
    • アクテビティーデータを取得
    • 可視化編
      • 標高データ
      • 位置データ
  • まとめ

Rには便利なことに、rStravaというStravaデータの分析ライブラリーが公開されているので、データの取得の部分はそのライブラリーに頼って行いました。

github.com

続きを読む

highcharterでの可視化 ~時系列データ~

最近、ggplot以外での可視化ライブラリを探していたが、今回触れてみたhighcharterがかなり良いのでまとめておく。

  • 前処理
  • hchart(): tibbleデータ可視化
    • ベースとなる構文
    • OHLCデータ
    • 複数のデータをプロットする
  • highchart(): xtsデータの可視化
    • ベースとなる構文
    • 複数のデータの可視化

www.highcharts.com

jkunst.com

続きを読む

Profile: (May 2019)

Profile

シドニー大学ビジネススクールでの留学(2018/02~11)を経て、現在同志社大学商学部商学科B5。

鹿児島出身、北海道育ち、ドイツ在住経験あり。

趣味はNBA観戦と映画・アニメ鑑賞。

データ分析の分野に関心があり、RとPythonを書く

Link

Contact

NBAでのデータ活用

youtu.be

上の動画が今朝BloombergYouTubeチャンネルで紹介されていました。

Sixersの女性データサイエンティストと彼女が所属するアナリティクスチームが紹介されています。

DSチームが行なっているのは主に、コーチ陣の意思決定を科学的にして、再現性を高めようとしていることなど。

分析の細かい部分はチーム毎の機密情報になっているということで紹介はされていなかったが、思った通りトラッキングデータの活用がメインの模様。

続きを読む

Kaggle Days SF 発表メモ

随時更新していきます。

  • The Secrets of Productive Developer Tools | by François Chollet
    • メモ
    • 感想

The Secrets of Productive Developer Tools | by François Chollet

youtu.be

メモ

One of developers of Keras. Winner of an early competition at kaggle.

“Developer UX is critical factor for success”

続きを読む

purrrパッケージまとめ

今回は反復処理をより簡潔に行えるRパッケージのpurrrパッケージのまとめ。パッケージ自体の存在は知っていたし、かなり主流な手法として多くの人が使っていることは知っていたが、それほど使う機会がなかったし、for構文などで済ませてきたので必要性を感じていなかった。けれども、下のビデオをたまたま見つけ、その有用性に気づけたので、この際にまとめておく。

youtu.be

2017のRカンファレンスこののビデオでは、コミュニティの中で有名なCharlotte Wickhamさんがでデータサイエンス初学者を対象に反復処理にフォーカスして講演しています。

続きを読む

"rbokehでインタラクティブな可視化をする"という記事を書いたけど、結局のところrbokehの有用性とは?

qiita.com

先日上の記事をQiitaに投稿しました。bokehというpythonの可視化ライブラリのR版であるrbokehの紹介記事です。

  • 公式ドキュメント
  • Rの可視化パッケージの需要比較
  • まとめ

記事の中では、ベースなデータ可視化方法などを紹介しました。使いやすさと、plotlyなどと違う見栄えを実現できるという点をまとめとして記事を締めくくったはいいけども、実際使う必要あるのか?というライブラリで、腑に落ちていないのが現状です。

続きを読む