R

Stephen Curryの記録は打ち破ることができるのか?

この記事はスポーツアナリティクスAdvent Calendar 2021の13日目の記事となります。 (公開予定日からだいぶ過ぎてしまい、申し訳ございませんでした…) はじめに 利用するデータ 歴代のスリーポイント成功数記録の保持者 試合数と成功数 Stephen Curryの記…

Rでの環境変数設定&参照についての備忘録

Databaseに接続する際やAPIのキーをコードで管理したいときに、実際の他者と共有するコードに書いたりすることは絶対に避けるべきことであることは自明であると思う。 上記のようなスクリプト を共有すること自体はそれほど多くはないと思うが、先日久しぶり…

音声データを文字起こして、ワードクラウドで可視化する

今回の記事ではタイトル通り、音声データを音声認識ソフトを用いて文字起こしし、その後ビジュアライゼーションをした一連の流れをまとめておく。 対象となるデータは自分たちがレコードしたポッドキャストのエピソードであるが、手法はおそらく全ての日本語…

長時間のデータ処理が終わったときにLineに通知してくれるパッケージを公開しました。

最近は業務でかなり時間のかかるクエリや、データ集計タスクをこなす機会が多くなってきました。基本的にRStudioでの集計やタスクが終わったときに、そのタスクがいつ終わったのかはコンソールなどを見なければ判別が難しく、ブラウザなどで調べごとをしてい…

COVID-19ダッシュボードから学ぶ echarts4rでコロプレス地図の描画

近頃covid-19の流行に伴い行政や民間の開発者がそれぞれの可視化ダッシュボードを公開している動きが多く見られます。それぞれに良い点や改善すべき点などが散見されますが、RユーザーとしてSPAを開発する際にはshiny dashboardのフレームワークを活用した事…

ggmapパッケージを用いて住所から緯度経度のデータを得る

文字のインプットに対して、緯度経度のデータを取得する方法の一つで、自分が普段使う方法を記録しておきます。 セッティング 住所より緯度経度を取る方法 可視化 自分が用いいるのは、CRANにも上がっていて、使い方が非常に簡単な、ggmapパッケージです。 g…

サイクリングデータの分析 ~Strava APIを用いて~

今日のお昼から嵐山までサイクリングに行ってきました。「天気も良くて最高でした」、で終わるのは勿体無いと思ったので、Stravaで計測したデータを分析したいと思います。 準備編 ユーザープロフィールデータ 分析編 アクテビティーデータを取得 可視化編 …

highcharterでの可視化 ~時系列データ~

最近、ggplot以外での可視化ライブラリを探していたが、今回触れてみたhighcharterがかなり良いのでまとめておく。 前処理 hchart(): tibbleデータ可視化 ベースとなる構文 OHLCデータ 複数のデータをプロットする highchart(): xtsデータの可視化 ベースと…

purrrパッケージまとめ

今回は反復処理をより簡潔に行えるRパッケージのpurrrパッケージのまとめ。パッケージ自体の存在は知っていたし、かなり主流な手法として多くの人が使っていることは知っていたが、それほど使う機会がなかったし、for構文などで済ませてきたので必要性を感じ…

"rbokehでインタラクティブな可視化をする"という記事を書いたけど、結局のところrbokehの有用性とは?

qiita.com 先日上の記事をQiitaに投稿しました。bokehというpythonの可視化ライブラリのR版であるrbokehの紹介記事です。 公式ドキュメント Rの可視化パッケージの需要比較 まとめ 記事の中では、ベースなデータ可視化方法などを紹介しました。使いやすさと…

naniarパッケージの紹介記事を書いたことと、プラスのまとめ

qiita.com 上の記事をこの前Qiitaに投稿した。この後、もう少し書いて置くべきことを見つけたので、こっちの記事にまとめておく。 準備編 欠損値確認編 miss_var_run(): 欠損値が出現する頻度の確認 miss_var_span(): 指定したデータスパン内での欠損値確認 …

Apply() ファミリーまとめ

R

Rを使い始めて1年くらい。並列処理ではpythonを使っている名残でforを使ってきたが、今後apply系関数を活用していけるように、今回applyファミリーの知識を体系的にまとめてみようと思いたったのがきっかけ。 applyファミリーとは apply(X, MARGIN, FUN, ...…

世界のRユーザー事情 Stack Overflowサーベイデータより

www.kaggle.com Kaggleで公開されていたStack Overflowのサーベイデータより、Rユーザーの属性などをみてみたいと思います。 「世界の」とタイトルについていますが、Stack Overflowが集計したので、比較的「英語を話せる人が多い国のRユーザー」のデータに…

京都の学生向けアパート家賃の推定とお得な物件探し 再帰分割線形モデルを用いて Part2

Part2です。 Part1はこちらをご覧ください。 kokiando.hatenablog.com 予告通り、今回は実際に再帰分割線形モデルを用いて家賃の推定と、実際にお得な物件を探しいきたいと思います。

京都の学生向けアパート家賃の推定とお得な物件探し 再帰分割線形モデルを用いて Part1

今回は身近な京都の家賃データを用いた分析事例を紹介します。 データ収集から分析のコードはすでにGitHub上がっているので詳しいスクリプトに興味のある方は下記のリンクを参照してください。 github.com 分析準備 パッケージ・データ読み込み library(tidy…

パッケージのダウンロード数を可視化する "cranlogs" Package の紹介

元ネタ記事 www.r-bloggers.com 久しぶりにR-Bloggersの最新記事を見ていたらキャッチーなタイトル記事が挙がっていたので記載されていたコードを眺めてみました。 github.com 機能としては、目立ったものはないですが、ダウンロード数の期間の設定とかが容…

FlickrAPI (ver 0.0.0.9000) is now available on GitHub

R

I just created brand new package called "FlickrAPI". github.com Although it is available and it works, still under process. I am trying to fix bugs and update to release it on CRAN. So... stay tuned! thanks Koki

「Stephen Curryはどれだけ驚異的か?」NBAloveRパッケージを用いたNBAデータ分析

ここ数年、王者に君臨するGolden State Warriorsを率いるスーパースターであるカリーがどれほどすごいのかというのをたらたらと書くだけの記事です。 分析には先日から公開しているNBAloveRという名前のパッケージを用いましたので興味があればご覧下さい。 …

NBAのデータ分析がしたい NBAloveRパッケージの紹介

R NBA

本記事の概要 NBAloveRパッケージ作成の理由 パッケージの紹介 まとめ NBAloveRパッケージ作成の理由 最初にデータ分析に興味を持ったのが、こちらの方の記事のおかげでした。 gg-hogehoge.hatenablog.com少しばかり勉強していたプログラミングの知識とライ…

ウィスキーデータセットの公開

R

先日ウイスキーのデータセットを公開したのですが、まだ誰も参加していないみたいなので、興味がある人は使って見てください。 Scotch Whisky Dataset | Kaggleデータ自体は、Scotch Whisky Dataというサイトより引っ張って来ました。 Scotch Whiskies Data |…

Anyone who wants to analyze whisky dataset?

R

Just released a whisky dataset at my kaggle page. Scotch Whisky Dataset | KaggleIf you are interested in whisky and data science, feel free to use it and let me know whatever you think.I scraped the dataset from Scotch Whiskies Data Scotch…

GTD ver1.0

GTDWhats up guys! Just released another Shiny application. Go check that out and let me know ur opinions. and u can expect more updates in the near future👍 Peace

Shinyアプリデプロイしました

NBA Team Record ←ようやくできました。 とりあえず最初なので、できはこのくらいでもお許し下さい。ちょっと頑張ったことについて、技術的に挑戦したことを書いてみたいと思います。 データ呼び起こし編 データを参照にしたのは下のリンクからです。 www.ba…

初めてのShinyアプリを作って見た

できは本当にひどいです。(←最初に言っておく)只今Shinyの書き方を勉強しているので、その一日目が終わったので適当に作って見ました。 データを借りて来たのは www.basketball-reference.com こちらからです。

株式投資ポートフォリオを作って運用してみる

ゼミのグループで「東京オリンピックに向けて伸びて行く」14銘柄をピックアップしました。 ざっくり分けると三つあり 1. 建設業界 2. オリンピックナショナルチームのスポンサー企業 3. スポーツ用品メーカ の三つを中グループとして14銘柄選びました。この…

テロ事件に関するデータをいじってみる

昨日バルセロナの繁華街でテロの事件がありましたよね。初めて知った時は本当にショックでした。 自分もまさにその通りを去年の夏休みに訪れていたため、現場の状況などをリアルに想像しすぎてしまいました。 edition.cnn.com昨今特にヨーロッパではテロの事…

隕石落下データを地図上に描画してみる

kaggleのデータセット一覧を見ていたら、Meteorite-landingというものを見つけました。 Meteorite Landings | Kaggle 別に、地質学とか天文学とかに詳しいわけではないのですが面白いデータだと感じたのでRでできるようになったことを織り交ぜながら可視化し…