2019-01-01から1年間の記事一覧

NBA選手のピークはいつか? PER評価指標を用いた分析

この記事はスポーツアナリティクス Advent Calendar 2019の14日目の記事になります。 PERとは データ 分析 ポジションごとの年齢分布 2変量分析:年齢とPER 考察 まとめ 問題点 バスケットのデータ分析に興味のある人へ 先日Journal of Sports Analyticsを徘…

【Zindi】Sendy Logistic Challenge 2週間チャレンジ参加メモ

初めてZindiのMLコンペに参加したので、その振り返りを残しておく。 zindi.africa Zindiとは Sendy Logistics Challenge 上位者解法からの学び まとめ

Death Strandingをプレイしてみた

先週金曜日にKojima Productionから新しく発売された『デス・ストランディング』を週末と月曜の半日を溶かしてプレイした。 メインストーリーを一通り終わらせただけでサブミッション等はまだ多く残っている状態だが、感想を残しておく。

ggmapパッケージを用いて住所から緯度経度のデータを得る

文字のインプットに対して、緯度経度のデータを取得する方法の一つで、自分が普段使う方法を記録しておきます。 セッティング 住所より緯度経度を取る方法 可視化 自分が用いいるのは、CRANにも上がっていて、使い方が非常に簡単な、ggmapパッケージです。 g…

SIGNATE土地コンペ ざっっっくりと振り返る

また、後日しっかりした振り返り記事等を書きます。 先日終了したSIGNATEさんの土地コンペの表彰式と、解放共有が先ほど行われました。ざっくりとスライドをみた後の学びと自分の結果を振り返りたいと思います。 まず、当コンペが自分にとって初めて真面目に…

サイクリングデータの分析 ~Strava APIを用いて~

今日のお昼から嵐山までサイクリングに行ってきました。「天気も良くて最高でした」、で終わるのは勿体無いと思ったので、Stravaで計測したデータを分析したいと思います。 準備編 ユーザープロフィールデータ 分析編 アクテビティーデータを取得 可視化編 …

highcharterでの可視化 ~時系列データ~

最近、ggplot以外での可視化ライブラリを探していたが、今回触れてみたhighcharterがかなり良いのでまとめておく。 前処理 hchart(): tibbleデータ可視化 ベースとなる構文 OHLCデータ 複数のデータをプロットする highchart(): xtsデータの可視化 ベースと…

Profile: (May 2019)

Profile シドニー大学ビジネススクールでの留学(2018/02~11)を経て、現在同志社大学商学部商学科B5。 鹿児島出身、北海道育ち、ドイツ在住経験あり。 趣味はNBA観戦と映画・アニメ鑑賞。 データ分析の分野に関心があります。ブログで使われたコードや公開可…

NBAでのデータ活用

NBA

youtu.be 上の動画が今朝BloombergのYouTubeチャンネルで紹介されていました。 Sixersの女性データサイエンティストと彼女が所属するアナリティクスチームが紹介されています。 DSチームが行なっているのは主に、コーチ陣の意思決定を科学的にして、再現性を…

Kaggle Days SF 発表メモ

随時更新していきます。 The Secrets of Productive Developer Tools | by François Chollet メモ 感想 The Secrets of Productive Developer Tools | by François Chollet youtu.be メモ One of developers of Keras. Winner of an early competition at ka…

purrrパッケージまとめ

今回は反復処理をより簡潔に行えるRパッケージのpurrrパッケージのまとめ。パッケージ自体の存在は知っていたし、かなり主流な手法として多くの人が使っていることは知っていたが、それほど使う機会がなかったし、for構文などで済ませてきたので必要性を感じ…

"rbokehでインタラクティブな可視化をする"という記事を書いたけど、結局のところrbokehの有用性とは?

qiita.com 先日上の記事をQiitaに投稿しました。bokehというpythonの可視化ライブラリのR版であるrbokehの紹介記事です。 公式ドキュメント Rの可視化パッケージの需要比較 まとめ 記事の中では、ベースなデータ可視化方法などを紹介しました。使いやすさと…

naniarパッケージの紹介記事を書いたことと、プラスのまとめ

qiita.com 上の記事をこの前Qiitaに投稿した。この後、もう少し書いて置くべきことを見つけたので、こっちの記事にまとめておく。 準備編 欠損値確認編 miss_var_run(): 欠損値が出現する頻度の確認 miss_var_span(): 指定したデータスパン内での欠損値確認 …

Apply() ファミリーまとめ

R

Rを使い始めて1年くらい。並列処理ではpythonを使っている名残でforを使ってきたが、今後apply系関数を活用していけるように、今回applyファミリーの知識を体系的にまとめてみようと思いたったのがきっかけ。 applyファミリーとは apply(X, MARGIN, FUN, ...…

世界のRユーザー事情 Stack Overflowサーベイデータより

www.kaggle.com Kaggleで公開されていたStack Overflowのサーベイデータより、Rユーザーの属性などをみてみたいと思います。 「世界の」とタイトルについていますが、Stack Overflowが集計したので、比較的「英語を話せる人が多い国のRユーザー」のデータに…

京都の学生向けアパート家賃の推定とお得な物件探し 再帰分割線形モデルを用いて Part2

Part2です。 Part1はこちらをご覧ください。 kokiando.hatenablog.com 予告通り、今回は実際に再帰分割線形モデルを用いて家賃の推定と、実際にお得な物件を探しいきたいと思います。

京都の学生向けアパート家賃の推定とお得な物件探し 再帰分割線形モデルを用いて Part1

今回は身近な京都の家賃データを用いた分析事例を紹介します。 データ収集から分析のコードはすでにGitHub上がっているので詳しいスクリプトに興味のある方は下記のリンクを参照してください。 github.com 分析準備 パッケージ・データ読み込み library(tidy…

パッケージのダウンロード数を可視化する "cranlogs" Package の紹介

元ネタ記事 www.r-bloggers.com 久しぶりにR-Bloggersの最新記事を見ていたらキャッチーなタイトル記事が挙がっていたので記載されていたコードを眺めてみました。 github.com 機能としては、目立ったものはないですが、ダウンロード数の期間の設定とかが容…

FlickrAPI (ver 0.0.0.9000) is now available on GitHub

R

I just created brand new package called "FlickrAPI". github.com Although it is available and it works, still under process. I am trying to fix bugs and update to release it on CRAN. So... stay tuned! thanks Koki

「Stephen Curryはどれだけ驚異的か?」NBAloveRパッケージを用いたNBAデータ分析

ここ数年、王者に君臨するGolden State Warriorsを率いるスーパースターであるカリーがどれほどすごいのかというのをたらたらと書くだけの記事です。 分析には先日から公開しているNBAloveRという名前のパッケージを用いましたので興味があればご覧下さい。 …