NBAにおけるデータ分析の活用について

NBA

この記事は「スポーツアナリティクス Advent Calendar 2020」の13日目の記事です。 adventar.org 概要 NBAにおけるデータ分析の活用事例 体調管理 ショットセレクション まとめ & NBAデータ分析に関連するおすすめリソース 概要 この記事ではプロバスケット…

Rでの環境変数設定&参照についての備忘録

Databaseに接続する際やAPIのキーをコードで管理したいときに、実際の他者と共有するコードに書いたりすることは絶対に避けるべきことであることは自明であると思う。 上記のようなスクリプト を共有すること自体はそれほど多くはないと思うが、先日久しぶり…

音声データを文字起こして、ワードクラウドで可視化する

今回の記事ではタイトル通り、音声データを音声認識ソフトを用いて文字起こしし、その後ビジュアライゼーションをした一連の流れをまとめておく。 対象となるデータは自分たちがレコードしたポッドキャストのエピソードであるが、手法はおそらく全ての日本語…

長時間のデータ処理が終わったときにLineに通知してくれるパッケージを公開しました。

最近は業務でかなり時間のかかるクエリや、データ集計タスクをこなす機会が多くなってきました。基本的にRStudioでの集計やタスクが終わったときに、そのタスクがいつ終わったのかはコンソールなどを見なければ判別が難しく、ブラウザなどで調べごとをしてい…

Pythonでファイル操作を行うTips集

~Make it less boring vol.1~ 先日、雑務タスクとしてファイル操作を依頼された。基本的にgit bashを使っての操作がメインだったけども、普段使っているpythonでも同じことができるだろうと思い、作業を進めた。基本的な操作のみだったけども、利用頻度も少…

USにおけるポッドキャストの市場動向について語りました。

DD Garage第4回の"The Infinite Dial 2020"でアメリカにおけるポッドキャストのユーザー変化等について語りました。 DD GarageDD Garageテクノロジー¥0podcasts.apple.com

映画のレビューログを可視化するアプリを公開しました。

開発のモチベーション IMDb Analyzer Snapshot 1 Snapshot 2 Snapshot 3 Snapshot 4 まとめ 昨日、映画のレビューログを可視化するアプリを公開しました。まだベータ版ですし、使いづらいと思いますが、意見などあればお聞かせください。 github.com 公開し…

ポッドキャストで『Basketball Data Science』について語りました

ご報告が遅れましたが、先月からデザイナーの友人と共にDD Garageというポッドキャスト番組をはじめました。 DD GarageDD Garageテクノロジー¥0podcasts.apple.com iTunes等をはじめとした多くのポッドキャストプラットフォームで無料で聞くことが可能ですの…

COVID-19ダッシュボードから学ぶ echarts4rでコロプレス地図の描画

近頃covid-19の流行に伴い行政や民間の開発者がそれぞれの可視化ダッシュボードを公開している動きが多く見られます。それぞれに良い点や改善すべき点などが散見されますが、RユーザーとしてSPAを開発する際にはshiny dashboardのフレームワークを活用した事…

NBA選手のピークはいつか? PER評価指標を用いた分析

この記事はスポーツアナリティクス Advent Calendar 2019の14日目の記事になります。 PERとは データ 分析 ポジションごとの年齢分布 2変量分析:年齢とPER 考察 まとめ 問題点 バスケットのデータ分析に興味のある人へ 先日Journal of Sports Analyticsを徘…

【Zindi】Sendy Logistic Challenge 2週間チャレンジ参加メモ

初めてZindiのMLコンペに参加したので、その振り返りを残しておく。 zindi.africa Zindiとは Sendy Logistics Challenge 上位者解法からの学び まとめ

Death Strandingをプレイしてみた

先週金曜日にKojima Productionから新しく発売された『デス・ストランディング』を週末と月曜の半日を溶かしてプレイした。 メインストーリーを一通り終わらせただけでサブミッション等はまだ多く残っている状態だが、感想を残しておく。

ggmapパッケージを用いて住所から緯度経度のデータを得る

文字のインプットに対して、緯度経度のデータを取得する方法の一つで、自分が普段使う方法を記録しておきます。 セッティング 住所より緯度経度を取る方法 可視化 自分が用いいるのは、CRANにも上がっていて、使い方が非常に簡単な、ggmapパッケージです。 g…

SIGNATE土地コンペ ざっっっくりと振り返る

また、後日しっかりした振り返り記事等を書きます。 先日終了したSIGNATEさんの土地コンペの表彰式と、解放共有が先ほど行われました。ざっくりとスライドをみた後の学びと自分の結果を振り返りたいと思います。 まず、当コンペが自分にとって初めて真面目に…

サイクリングデータの分析 ~Strava APIを用いて~

今日のお昼から嵐山までサイクリングに行ってきました。「天気も良くて最高でした」、で終わるのは勿体無いと思ったので、Stravaで計測したデータを分析したいと思います。 準備編 ユーザープロフィールデータ 分析編 アクテビティーデータを取得 可視化編 …

highcharterでの可視化 ~時系列データ~

最近、ggplot以外での可視化ライブラリを探していたが、今回触れてみたhighcharterがかなり良いのでまとめておく。 前処理 hchart(): tibbleデータ可視化 ベースとなる構文 OHLCデータ 複数のデータをプロットする highchart(): xtsデータの可視化 ベースと…

Profile: (May 2019)

Profile シドニー大学ビジネススクールでの留学(2018/02~11)を経て、現在同志社大学商学部商学科B5。 鹿児島出身、北海道育ち、ドイツ在住経験あり。 趣味はNBA観戦と映画・アニメ鑑賞。 データ分析の分野に関心があります。ブログで使われたコードや公開可…

NBAでのデータ活用

NBA

youtu.be 上の動画が今朝BloombergのYouTubeチャンネルで紹介されていました。 Sixersの女性データサイエンティストと彼女が所属するアナリティクスチームが紹介されています。 DSチームが行なっているのは主に、コーチ陣の意思決定を科学的にして、再現性を…

Kaggle Days SF 発表メモ

随時更新していきます。 The Secrets of Productive Developer Tools | by François Chollet メモ 感想 The Secrets of Productive Developer Tools | by François Chollet youtu.be メモ One of developers of Keras. Winner of an early competition at ka…

purrrパッケージまとめ

今回は反復処理をより簡潔に行えるRパッケージのpurrrパッケージのまとめ。パッケージ自体の存在は知っていたし、かなり主流な手法として多くの人が使っていることは知っていたが、それほど使う機会がなかったし、for構文などで済ませてきたので必要性を感じ…

"rbokehでインタラクティブな可視化をする"という記事を書いたけど、結局のところrbokehの有用性とは?

qiita.com 先日上の記事をQiitaに投稿しました。bokehというpythonの可視化ライブラリのR版であるrbokehの紹介記事です。 公式ドキュメント Rの可視化パッケージの需要比較 まとめ 記事の中では、ベースなデータ可視化方法などを紹介しました。使いやすさと…

naniarパッケージの紹介記事を書いたことと、プラスのまとめ

qiita.com 上の記事をこの前Qiitaに投稿した。この後、もう少し書いて置くべきことを見つけたので、こっちの記事にまとめておく。 準備編 欠損値確認編 miss_var_run(): 欠損値が出現する頻度の確認 miss_var_span(): 指定したデータスパン内での欠損値確認 …

Apply() ファミリーまとめ

R

Rを使い始めて1年くらい。並列処理ではpythonを使っている名残でforを使ってきたが、今後apply系関数を活用していけるように、今回applyファミリーの知識を体系的にまとめてみようと思いたったのがきっかけ。 applyファミリーとは apply(X, MARGIN, FUN, ...…

世界のRユーザー事情 Stack Overflowサーベイデータより

www.kaggle.com Kaggleで公開されていたStack Overflowのサーベイデータより、Rユーザーの属性などをみてみたいと思います。 「世界の」とタイトルについていますが、Stack Overflowが集計したので、比較的「英語を話せる人が多い国のRユーザー」のデータに…

京都の学生向けアパート家賃の推定とお得な物件探し 再帰分割線形モデルを用いて Part2

Part2です。 Part1はこちらをご覧ください。 kokiando.hatenablog.com 予告通り、今回は実際に再帰分割線形モデルを用いて家賃の推定と、実際にお得な物件を探しいきたいと思います。

京都の学生向けアパート家賃の推定とお得な物件探し 再帰分割線形モデルを用いて Part1

今回は身近な京都の家賃データを用いた分析事例を紹介します。 データ収集から分析のコードはすでにGitHub上がっているので詳しいスクリプトに興味のある方は下記のリンクを参照してください。 github.com 分析準備 パッケージ・データ読み込み library(tidy…

パッケージのダウンロード数を可視化する "cranlogs" Package の紹介

元ネタ記事 www.r-bloggers.com 久しぶりにR-Bloggersの最新記事を見ていたらキャッチーなタイトル記事が挙がっていたので記載されていたコードを眺めてみました。 github.com 機能としては、目立ったものはないですが、ダウンロード数の期間の設定とかが容…

FlickrAPI (ver 0.0.0.9000) is now available on GitHub

R

I just created brand new package called "FlickrAPI". github.com Although it is available and it works, still under process. I am trying to fix bugs and update to release it on CRAN. So... stay tuned! thanks Koki

「Stephen Curryはどれだけ驚異的か?」NBAloveRパッケージを用いたNBAデータ分析

ここ数年、王者に君臨するGolden State Warriorsを率いるスーパースターであるカリーがどれほどすごいのかというのをたらたらと書くだけの記事です。 分析には先日から公開しているNBAloveRという名前のパッケージを用いましたので興味があればご覧下さい。 …

NBAloveR is now updated!

Hello guys. It has been log time since the last time i have uploaded posts about NBAloveR... But finally the package is now updated! In this update, 5 functions added. github.com getHOF(): Function for getting list of Hall of Famers in NBA…