Chapter 5 事例・観測値と単位・ユニット

5.1 イベント・データにはどのようなものがあるか

イベント・データといっても研究分野や調査対象によって多種多様であることは既に述べたとおりです。何を「イベント」として定義するかによって、全く異なる研究分野のデータとなるわけです。この観点からは、イベント・データをひとまとめに定義し扱うことは難しいと言わざるを得ません。しかし、本書で扱うイベント・データは、そのデータの基礎となる単位が、何らかの形で定義された「イベント」であるという点において共通しています。

少し分かりにくかったかもしれません。ここで区別したいのは、本書が扱う純粋なるイベント・データと、元々のイベント・データを時間や空間など何らかの分析単位にまとめあげたデータである。後者も前者と同様に、イベント・データと呼ばれることもあるのですが、本書はここを厳密に区別し、後者を「集約データ」(要:もっと良いラベル!)と呼ぶことにします。本書が焦点を当てるのは前者の「イベント」をデータの単位とするデータです。なぜなら、イベント・データのはらむ独特の難しさが前者にのみ含まれていて、そこを皆さんと掘り下げて理解していく点が本書のオリジナリティであるからです。

それでは、後者の「集約データ」の例をみてみましょう。たとえば、統計ソフトRには、デフォルトで練習・参照用のデータが付随しているのですが、その中のUKDriverDeathというデータは、1969年1月から1984年12月までの月ごとの英国のドライバー死亡数を示したものです。自動車運転による死亡という「イベント」を扱ったデータであることに間違いありません。このデータの冒頭部分を表示すると以下のようになります。

x
1687
1508
1507
1385
1632
1511

このデータを可視化するためにグラフにしてみましょう。