509 Views
July 22, 23
スライド概要
研究室で開催した統計ゼミ2021の資料です。この資料では私が担当したRの使い方について説明しています。
愛知工業大学でマルチエージェントシステムや空間分析を活用した減災に関する研究をしています。
知って・描いて・はじめる いまからRをはじめる人に向けた R Studioで気軽にプログラミングのたのしさを R
2 R 統計計算とグラフィックスに特化した言語および環境 ベル研究所で開発された言語であるSから派生 最近ではデータサイエンティストのための言語としてPythonと 並び注目を集めている 代表的な機能 統計的仮説検定 時系列解析 統計的モデリング クラスタリング 可視化
3 RStudio Rのための統合開発環境 Rの基本的な機能以外にも多くの機能を完備 パッケージの管理 Pythonの実行 Webサーバ など
それでは実際にR Studioを開いて よく使用するペインと使い方を簡単に紹介します。 資料のみを見ている人は [Help] > [Cheat Sheets] > [RStudio IDE Cheat Sheet] を確認してください。
Hadley Wickham R Studioのチーフサイエンティスト Tidyverseをはじめ多くのパッケージを開発 hadley (Hadley Wickham) (github.com) データ分析で望ましいデータ形式 「Tidy data」アプローチの提唱者 「R for Data Science」などのRに関する書籍の著者 5
6 Data exploration 可視化 取り込み 整頓 探索 プログラム 共有 変形 モデリング
7 Tidyverse 分析のための機能 ユーティリティ readr stringr 整頓 tidyr purrr 繰り返し処理 変形 dplyr forcats 質的変数処理 ggplot2 tibble 取り込み 可視化 文字列処理 データ保持 データサイエンティストのためのAll in Oneパッケージ
エネコログサのデータ 8 側枝54本分を計測 穂: panicle 葉: leaf 根の番号(同じ根を持つ場合は同じ数字) 茎の長さ 穂の直径 穂の長さ 葉の数 root_ number culm_ length panicle_ width panicle_ length leaf_ number 1 69.3 2.0 6.9 1 1 49.5 1.3 4.2 3 10 33.6 1.4 4.1 4 茎: culm 根: root
データ可視化 9 ヒストグラム 散布図 エネコログサの茎の長さ エネコログサの穂の長さと幅の関係 15 2.0 度数 穂の幅(cm) 10 5 0 1.5 1.0 0.5 20 40 茎の長さ(cm) 60 2 Tidyverseによるデータ可視化 4 穂の長さ(cm) 6
さらに勉強する方法 身の回りや研究のデータをグラフ化・分析してみる アプリケーションを作成してみる 自分より詳しい人に聞く 本・サイトを読む Rやパッケージのヘルプを読む 有名なリポジトリを読む 10