Tsukuba.R#5最速感想を目指す日記
全く編集せずにメモ書きをupしてみるテスト
Rで回帰分析
- yag_ays あいす
- lm関数 Linear Model 線形回帰分析
- 要素を足したり引いたりして因子を考える
- nls関数 非線形回帰分析
- 成長から年齢推定
- Q. 因子として効いているのかどうか調べるには?
- A. 検定が必要
サイトアクセスログ
- y_benjo
- 統合TV のアクセスログを解析しよう
- アクセスの傾向を把握
- 記事のレコメンド
- "Web解析HACKS"を参考に
- str(log)
- ログの形を変換して下ごしらえ
- 時間を変換
- POSIXctクラスオブジェクトに変換
- ホスト名を変換
- 正規表現で
- クエリ変換
- URLデコード
- 時間を変換
- グラフにしてみる
- ページ別
- アクセス元
- ページ遷移経路
- 隣接行列に
- graph.adjacency
- 隣接行列に
- 考察
- トップページからどこかの記事へが殆ど
- その記事だけ見て終わってしまう
- 別の記事も見てほしい
- 外れ値検出
- どのくらいのデータ量まで出来るのか?
- 不要なノードを削ったグラフにした方が?
- 外部サイトも表示しては?
- 円以外のレイアウトは?
- 見えにくいことが多い
- 下ごしらえはRよりRubyの方が良いのでは?
休憩
- ドア開け係
- バイオインフォの世界は狭いらしい
DBCLSの紹介
- bonohu
- 上水処理場 + 下水処理場
- データの提供
- データ公開の引き受け
- 見やすい形で公開する
Rの基本データ構造
- syou6162
- Tsukuba.Rの近況
- 俺以外はKaigiFreaks....
- ベクトル
- 配列みたいな
- Filter関数
- ベクトルに対して有用そうな関数
- sample
- 与えたベクトルから適当にサンプリングして取って来てくれる
- table
- カテゴリ毎に頻度を数えてくれる
- which.max
- 何番目の要素が最大かを返す
- sample
- アクセス数みたいなので試す
- 月別のアクセス数
- 累積のアクセス数を一緒にplot
- cumsum関数
- 累積から月別のアクセス数を計算
- 階差数列 diff関数
- 累積のアクセス数を一緒にplot
- 月別のアクセス数
- 行列
- 行列に関する各種操作ができるよ
- 固有値とか
- アクセス方法
- [,1] とすると1列目全部を返したりできる
- 列とかを指定するとベクトルと同じような操作が出来る
- ベクトルのFilter関数に対して行列のsubset関数
- 行列とapply
- 行毎、列毎に同じ関数を適用する
- apply(stat.x77, 2, mean)
- 何となく2ってマジックナンバーが嫌な感じ
- 演習問題
- matrix, colnames, rownames
- cbind(colnames(state.x77), rownames(state.x77)[apply(state.x77,2,which.max)])
- 言ってない関数使ってるのはどうなの
- 行列に関する各種操作ができるよ
- データフレーム
- データベースの検索結果みたいなの
- アクセス方法
- matrixとだいたい同じ
- d$Nameみたいに$でアクセスできるのが特徴
- データフレームでもapplyできるよ
- データベースを使ってみる
- TwitterPodのSQLiteから
- dbGetWuery
- 演習おもしろかった