Data Visualization

Stephen Curryの記録は打ち破ることができるのか?

この記事はスポーツアナリティクスAdvent Calendar 2021の13日目の記事となります。 (公開予定日からだいぶ過ぎてしまい、申し訳ございませんでした…) はじめに 利用するデータ 歴代のスリーポイント成功数記録の保持者 試合数と成功数 Stephen Curryの記…

音声データを文字起こして、ワードクラウドで可視化する

今回の記事ではタイトル通り、音声データを音声認識ソフトを用いて文字起こしし、その後ビジュアライゼーションをした一連の流れをまとめておく。 対象となるデータは自分たちがレコードしたポッドキャストのエピソードであるが、手法はおそらく全ての日本語…

映画のレビューログを可視化するアプリを公開しました。

開発のモチベーション IMDb Analyzer Snapshot 1 Snapshot 2 Snapshot 3 Snapshot 4 まとめ 昨日、映画のレビューログを可視化するアプリを公開しました。まだベータ版ですし、使いづらいと思いますが、意見などあればお聞かせください。 github.com 公開し…

COVID-19ダッシュボードから学ぶ echarts4rでコロプレス地図の描画

近頃covid-19の流行に伴い行政や民間の開発者がそれぞれの可視化ダッシュボードを公開している動きが多く見られます。それぞれに良い点や改善すべき点などが散見されますが、RユーザーとしてSPAを開発する際にはshiny dashboardのフレームワークを活用した事…

ggmapパッケージを用いて住所から緯度経度のデータを得る

文字のインプットに対して、緯度経度のデータを取得する方法の一つで、自分が普段使う方法を記録しておきます。 セッティング 住所より緯度経度を取る方法 可視化 自分が用いいるのは、CRANにも上がっていて、使い方が非常に簡単な、ggmapパッケージです。 g…

サイクリングデータの分析 ~Strava APIを用いて~

今日のお昼から嵐山までサイクリングに行ってきました。「天気も良くて最高でした」、で終わるのは勿体無いと思ったので、Stravaで計測したデータを分析したいと思います。 準備編 ユーザープロフィールデータ 分析編 アクテビティーデータを取得 可視化編 …

highcharterでの可視化 ~時系列データ~

最近、ggplot以外での可視化ライブラリを探していたが、今回触れてみたhighcharterがかなり良いのでまとめておく。 前処理 hchart(): tibbleデータ可視化 ベースとなる構文 OHLCデータ 複数のデータをプロットする highchart(): xtsデータの可視化 ベースと…

"rbokehでインタラクティブな可視化をする"という記事を書いたけど、結局のところrbokehの有用性とは?

qiita.com 先日上の記事をQiitaに投稿しました。bokehというpythonの可視化ライブラリのR版であるrbokehの紹介記事です。 公式ドキュメント Rの可視化パッケージの需要比較 まとめ 記事の中では、ベースなデータ可視化方法などを紹介しました。使いやすさと…

naniarパッケージの紹介記事を書いたことと、プラスのまとめ

qiita.com 上の記事をこの前Qiitaに投稿した。この後、もう少し書いて置くべきことを見つけたので、こっちの記事にまとめておく。 準備編 欠損値確認編 miss_var_run(): 欠損値が出現する頻度の確認 miss_var_span(): 指定したデータスパン内での欠損値確認 …

世界のRユーザー事情 Stack Overflowサーベイデータより

www.kaggle.com Kaggleで公開されていたStack Overflowのサーベイデータより、Rユーザーの属性などをみてみたいと思います。 「世界の」とタイトルについていますが、Stack Overflowが集計したので、比較的「英語を話せる人が多い国のRユーザー」のデータに…

京都の学生向けアパート家賃の推定とお得な物件探し 再帰分割線形モデルを用いて Part2

Part2です。 Part1はこちらをご覧ください。 kokiando.hatenablog.com 予告通り、今回は実際に再帰分割線形モデルを用いて家賃の推定と、実際にお得な物件を探しいきたいと思います。

京都の学生向けアパート家賃の推定とお得な物件探し 再帰分割線形モデルを用いて Part1

今回は身近な京都の家賃データを用いた分析事例を紹介します。 データ収集から分析のコードはすでにGitHub上がっているので詳しいスクリプトに興味のある方は下記のリンクを参照してください。 github.com 分析準備 パッケージ・データ読み込み library(tidy…

パッケージのダウンロード数を可視化する "cranlogs" Package の紹介

元ネタ記事 www.r-bloggers.com 久しぶりにR-Bloggersの最新記事を見ていたらキャッチーなタイトル記事が挙がっていたので記載されていたコードを眺めてみました。 github.com 機能としては、目立ったものはないですが、ダウンロード数の期間の設定とかが容…

「Stephen Curryはどれだけ驚異的か?」NBAloveRパッケージを用いたNBAデータ分析

ここ数年、王者に君臨するGolden State Warriorsを率いるスーパースターであるカリーがどれほどすごいのかというのをたらたらと書くだけの記事です。 分析には先日から公開しているNBAloveRという名前のパッケージを用いましたので興味があればご覧下さい。 …

GTD ver1.0

GTDWhats up guys! Just released another Shiny application. Go check that out and let me know ur opinions. and u can expect more updates in the near future👍 Peace

Shinyアプリデプロイしました

NBA Team Record ←ようやくできました。 とりあえず最初なので、できはこのくらいでもお許し下さい。ちょっと頑張ったことについて、技術的に挑戦したことを書いてみたいと思います。 データ呼び起こし編 データを参照にしたのは下のリンクからです。 www.ba…

初めてのShinyアプリを作って見た

できは本当にひどいです。(←最初に言っておく)只今Shinyの書き方を勉強しているので、その一日目が終わったので適当に作って見ました。 データを借りて来たのは www.basketball-reference.com こちらからです。

株式投資ポートフォリオを作って運用してみる

ゼミのグループで「東京オリンピックに向けて伸びて行く」14銘柄をピックアップしました。 ざっくり分けると三つあり 1. 建設業界 2. オリンピックナショナルチームのスポンサー企業 3. スポーツ用品メーカ の三つを中グループとして14銘柄選びました。この…

テロ事件に関するデータをいじってみる

昨日バルセロナの繁華街でテロの事件がありましたよね。初めて知った時は本当にショックでした。 自分もまさにその通りを去年の夏休みに訪れていたため、現場の状況などをリアルに想像しすぎてしまいました。 edition.cnn.com昨今特にヨーロッパではテロの事…

隕石落下データを地図上に描画してみる

kaggleのデータセット一覧を見ていたら、Meteorite-landingというものを見つけました。 Meteorite Landings | Kaggle 別に、地質学とか天文学とかに詳しいわけではないのですが面白いデータだと感じたのでRでできるようになったことを織り交ぜながら可視化し…