「環境技術」2021年3号 記事情報

掲載年 2021
巻(Vol.) 50
号(No.) 3
166 - 171
記事種類 講座
記事タイトル 環境の分析技術・データ解析・モデル化講座+U.環境のデータ解析・モデル化+R によるデータ加工とグラフ作成の自動化
著 者 藤川陽子
第1著者ヨミ ふじかわ
第1著者所属 京都大学
要 旨 1.はじめに
1.1 講座の概要
 今回の講座では,環境水質データを対象としたR によるデータ解析例を紹介する.まずR の解析に供するデータをtidy(整然とした形式)にする方法について解説する.次に,R を用いて複数地点での多項目水質データのグラフ作成作業を自動化する手順の事例を紹介する.筆者はこのグラフ自動作成手法を用い,機械学習を用いたクラスタリング手法によるデータ解析と同時に多数のグラフを手間をかけずに描画できるようになった.
 筆者はR についても,プログラミング全般についても初心者である.本稿は,そのような初心者が,自分のデータ解析にR を使おうとしたときにどのような課題があったかも紹介する.なお,この分野では標準的と推察するが,著者はデータ整理には一次的にマイクロソフト社のExcel とOriginLab 社のOrigin を使用し,作業の自動化や最新手法によるデータ解析にR を用いている.本稿の中で若干,Excel やOrigin での作業についても追記している.Excel とOrigin は有料ソフトでありR は無料である.
 本稿を執筆するために参考にした書籍は,R 言語については参考文献の1)から3),クラスタリングにかかわる統計手法については4)から5)である.
キーワード:クラスタリング、ggplot2、データ形式
特集タイトル
特集のねらい