Kahjin’s Weblog

[Science][SFAA]Chapter:9-26の和訳

Posted in 未分類 by kahjin on 3月 9, 2008

[9-26]

Summarizing Data

Information is all around us—often in such great quantities that we are unable to make sense of it. A set of data can be represented by a few summary characteristics that may reveal or conceal important aspects of it. Statistics is a form of mathematics that develops useful ways for organizing and analyzing large amounts of data. To get an idea of what a set of data is like, for example, we can plot each case on a number line, and then inspect the plot to see where cases are piled up, where some are separate from the others, where the highest and lowest are, and so on. Alternatively, the data set can be characterized in a summary fashion by describing where its middle is and how much variation there is around that middle.

データの集約(Summarizing Data)

私たちの回りは情報で溢れている。多くの場合、その中には、私たちには理解できないようなものが大量に含まれている。データの集まりというのは情 報の重要な側面が見え隠れする可能性のあるいつくかの集約した性質で表現できる。統計学は大量のデータを整理し、解析するための有用な方法が日夜開発され ている数学の一つの分野である。例えば、データの集まりからどのようなことが考えられるのかを調べるために、数直線上にそれぞれの場合分け(数と対応)し た点をプロットすることができる。そして次に、同じような点がどれくらいあるのか?、点と点の間隔はどれくらい離れているのか?や一番高い点や一番低い 点はどれか?などプロットをじっくりと調べることができる。その代わりに、データの集まりの中央はどこにあるのか?やその中央に対してどれくらいのばら つきがあるのか?を記述することによって、データの集まりを集約したある性質を浮かび上がらせることができるのである。

あれこれ統計解析する前に、一次元ならヒストグラム、2次元以上なら散布図でも描いてみろってことですね。でも、3次元以上だと、視覚的には理解しづらいし、きびしいかも。というか私はよっぽどでない限り、3次元以上は直感的に理解しにくいです。

広告
Tagged with: , ,

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。