Kahjin’s Weblog

[Science][SFAA]Chapter:9-28,29の和訳

Posted in 未分類 by kahjin on 3月 14, 2008

[9-28]

More generally, averages by themselves neglect variation in the data and may imply more uniformity than exists. For example, the average temperature on the planet Mercury of about 15o F does not sound too bad—until one considers that it swings from 300o F above to almost 300o F below zero. The neglect of variation can be particularly misleading when averages are compared. For example, the fact that the average height of men is distinctly greater than that of women could be reported as “men are taller than women,” whereas many women are taller than many men. To interpret averages, therefore, it is important to have information about the variation within groups, such as the total range of data or the range covered by the middle 50 percent. A plot of all the data along a number line makes it possible to see how the data are spread out.

より一般的に言えば、平均はデータのばらつき(範囲)を隠蔽してしまうので、本当はそこに存在しているはずの法則が平均によって目隠しされてしまうかもしれない。例えば、水星の平均温度はおよそ華氏15度であるというのは聞こえはいいのだけれど、それが、上限値が華氏300度で下限値が華氏マイナス300度の間で振れる値だと知っていたら、どうだろうか。ばらつきを考慮しないで、平均を比較するときは誤解を招く恐れがある。例えば、男性の平均身長は女性の平均身長よりも明らかに高いという事実が”男性は女性よりも背が高い”とただ単に報告されたらどうだろうか。一方で、男性より女性の方が背が高い場合もあるだろうという反論は想像に難くないだろう。それゆえ、平均を解釈するために、グループ内のばらつきについての情報、例えば、データの値のとりうるすべての範囲や中央値からデータの値の50%がそこに含まれている範囲などの情報が重要になる。数直線に沿って、すべてのデータの値をプロットすることによって、データがどの程度の拡がりをもっているのかが分かる。

[9-29]

We are often presented with summary data that purport to demonstrate a relationship between two variables but lack essential information. For example, the claim that “more than 50 percent of married couples who have different religions eventually get divorced” would not tell us anything about the relationship between religion and divorce unless we also knew the percentage of couples with the same religion who get divorced. Only the comparison of the two percentages could tell us whether there may be a real relationship. Even then, caution is necessary because of possible bias in how the samples were selected and because differences in percentage could occur just by chance in selecting the sample. Proper reports of such information should include a description of possible sources of bias and an estimate of the statistical uncertainty in the comparison.

重要な情報が欠如しているにもかかわらず、二つの変数間の関係を示そうとして集約したデータの結果を公表してしまうことがよくある。例えば、”異なる信教を持つ夫婦の50%以上は離婚する”という主張は”同じ信教を持つ夫婦での離婚率はどれくらいか”というのを知っていないことには何も語ってはくれない。これら二つの離婚率を比べないことには信教と離婚の本当の関係を知ることはできないだろう。その時でさえ、標本を選んだときに起こりうる傾向や偶然による誤差などにも注意が必要である。故に、そのような情報に関するレポートを優れたものにしたいなら、その傾向の可能性についての説明や比べるときの統計的な曖昧さについての検討などを明記すべきである。

広告
Tagged with: , , ,

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。