Kahjin’s Weblog

[Science][SFAA]Chapter:9-20の和訳

Posted in 未分類 by kahjin on 3月 26, 2008

[9-20]

Mathematical treatment of shape also includes graphical depiction of numerical and symbolic relationships. Quantities are visualized as lengths or areas (as in bar and pie charts) or as distances from reference axes (as in line graphs or scatter plots). Graphical display makes it possible to readily identify patterns that might not otherwise be obvious: for example, relative sizes (as proportions or differences), rates of change (as slopes), abrupt discontinuities (as gaps or jumps), clustering (as distances between plotted points), and trends (as changing slopes or projections). The mathematics of geometric relations also aids in analyzing the design of complex structures (such as protein molecules or airplane wings) and logical networks (such as connections of brain cells or long-distance telephone systems).

形を数学的に扱うことも数字と記号の関係を描画抽象していることになる。(形の)属性は棒グラフや円グラフのように長さや面積として図式化されることもあるし、線図や散布図のように基本軸からの距離として図式化されることもある。形を図式化して表示させることはそのままでは不明なものでも容易にそのパターンを見つけることができるからである。例えば、相対的な大きさ(割合や差分)、変化率(傾き)、急激な不連続性(ギャップやジャンプ)、クラスタリング(プロット間の距離)や傾向(傾きや推移の変化)など。幾何学的関係を数学的にアプローチすることは複雑な構造のデザインを分析するのに役立つ。例えば、たんぱく質の分子構造や飛行機の翼構造、脳細胞間の結合や長距離間テレホンシステムのようなロジカルネットワークなど。

カタカナが多くなってしまった。翻訳って難しいけど、わかりやすい表現って何だろう?って考えながら、一つ一つ訳を形にしていくのは勉強になりました。特に、この章は名前は知っているけど、その定義が自分の中で曖昧なものが多かったので、やって良かった。機会を与えてくれたこのプロジェクトに感謝!!

参考

広告
Tagged with: , ,

[Science][SFAA]Chapter:9-19の和訳

Posted in 未分類 by kahjin on 3月 25, 2008

[9-19]

Coordinate systems are essential to making accurate maps, but there are some subtleties. For example, the approximately spherical surface of the earth cannot be represented on a flat map without distortion. Over a few dozen miles, the problem is barely noticeable; but on the scale of hundreds or thousands of miles, distortion necessarily appears. A variety of approximate representations can be made, and each involves a somewhat different kind of distortion of shape, area, or distance. One common type of map exaggerates the apparent areas of regions close to the poles (for example, Greenland and Alaska), whereas other useful types misrepresent what the shortest distance between two places is, or even what is adjacent to what.

コーディネイトシステムは正確な地図を描くために必須である。しかし、そこにはいくつか曖昧な点がある。例えば、地球面の近似したものを平面で表現しようとすると、ディストーションなしでは表現できない。2、30kmぐらいなら、その違いは問題にならないが、それが数100km、数1000kmにも及ぶと、歪みが必ず現れる。多様な近似表現の中には、形、範囲や距離のディストーションが何種か含まれているものだ。典型的なものは地図で極に近い地域の大きさが誇張されているのは明らかである(グリーンランドやアラスカ)一方、表現としては誤りだが、2点間の最小の距離はどれくらいか、あるいは隣接するものは何と何かというときに役に立つ場合がある。

う〜む、訳がしっくりこない。この辺は専門家の校正が必要だと思う。

参考

Tagged with: , ,

[Science][SFAA]Chapter:9-18の和訳

Posted in 未分類 by kahjin on 3月 22, 2008

[9-18]

Geometrical relationships can also be expressed in symbols and numbers, and vice versa. Coordinate systems are a familiar means of relating numbers to geometry. For the simplest example, any number can be represented as a unique point on a line—if we first specify points to represent zero and one. On any flat surface, locations can be specified uniquely by a pair of numbers or coordinates. For example, the distance from the left side of a map and the distance from the bottom, or the distance and direction from the map’s center.

幾何学的関係は記号と数で表現できる。逆もまた然り。コーディネイト(よく考えられた、整理された)システムを組み立てるというのは数と幾何学を関連させる方法と似ている。最も簡単な例で言えば、仮に点を0と1の存在しているかしていないかと考えるなら、数は線上にある特殊な点として表現できるし、平面上の位置というのはいくつかの数と補助(線や記号)でその特徴を表せる。例えば、地図上の左側からの距離や下側からの距離、あるいは、地図の中心からの距離と方向などである。

coordinateは訳語を覚えるより、そのまま理解というか感覚を理解した方が良いかなあと思いました。

参考

Tagged with: , ,

[Science][SFAA]Chapter:9-17の和訳

Posted in 未分類 by kahjin on 3月 21, 2008

[9-17]

Both shape and scale can have important consequences for the performance of systems. For example, triangular connections maximize rigidity, smooth surfaces minimize turbulence, and a spherical container minimizes surface area for any given mass or volume. Changing the size of objects while keeping the same shape can have profound effects owing to the geometry of scaling: Area varies as the square of linear dimensions, and volume varies as the cube. On the other hand, some particularly interesting kinds of patterns known as fractals look very similar to one another when observed at any scale whatever—and some natural phenomena (such as the shapes of clouds, mountains, and coastlines) seem to be like that.

形とスケールの両方がシステムのパフォーマンスに重要な結果をもたらす。例えば、(2点の線より)3点の面で考える方が、堅牢性が最大化される。表面がなめらかだと、乱雑性が最小化される。どんな質量あるいは体積の物質でさえ、球状の入れ物に入れると、その総表面積が最小化される。同じ形を維持したまま、その物体の大きさだけを変えてやると、幾何学のスケールの概念のおかげで、(大きさが変わっても)すでに分かっている同じような効果を持つことができる。面積は二次元で体積は三次元としての拡がりを持つ。他方で、フラクタルとして知られている面白い特殊な形象パターンはスケールに関係なく、いくつかの自然現象で見られるパターンととてもよく似ている(それらは雲、山や海岸線などの形と似ている)。
参考

先取り。coordinateの訳をどうしようか悩む。

過去記事

Tagged with: , ,

[Science][SFAA]Chapter:9-16の和訳

Posted in 未分類 by kahjin on 3月 19, 2008

まだこの辺は誰もやっていなさそうなので、とりあえず、やってみる。

[9-16]

SHAPES

Spatial patterns can be represented by a fairly small collection of fundamental geometrical shapes and relationships that have corresponding symbolic representation. To make sense of the world, the human mind relies heavily on its perception of shapes and patterns. The artifacts around us (such as buildings, vehicles, toys, and pyramids) and the familiar forms we see in nature (such as animals, leaves, stones, flowers, and the moon and sun) can often be characterized in terms of geometric form. Some of the ideas and terms of geometry have become part of everyday language. Although real objects never perfectly match a geometric figure, they more or less approximate them, so that what is known about geometric figures and relationships can be applied to objects. For many purposes, it is sufficient to be familiar with points, lines, planes; triangles, rectangles, squares, circles, and ellipses; rectangular solids and spheres; relationships of similarity and congruence; relationships of convex, concave, intersecting, and tangent; angles between lines or planes; parallel and perpendicular relationships between lines and planes; forms of symmetry such as displacement, reflection, and rotation; and the Pythagorean theorem.

形象

空間パターンは基本的な幾何学的形象の小さなブロックの集まりとそれに関連する記号表現を組み合わせたもので解釈できる。人がこの世界を感じる(理解する)ためには、その形とパターンを知覚できるかどうかに強く依存している。身の回りにある人の創作物(建築物、車、おもちゃ、ピラミッド)や自然界でよく見られる形態(例えば、動物、葉、石、花、月や太陽)は幾何学の用語でその特徴を表すことができる。幾何学の概念や用語のいくつかは我々が普段使う言葉の一部になってきた。現実世界にあるオブジェクト(物体)を幾何学的図形で完全に表せるわけではないが、オブジェクトと幾何学的図形は近似しているため、我々が知っている幾何学的図形やそれらの間の関係は現実世界のオブジェクトに応用できる。点、線、面、三角形、長方形、正方形、円や楕円;立方体や球体;相似や合同の関係;(曲)線の凹凸、線の交差や接線;二つの線や面で挟まれた間にできる角度やそれらの平行関係あるいは垂直関係;偏向、反射、回転のような対称性を持つ形態やピタゴラスの定理などが多くの目的において有効である。

参考

やばい、日本語訳がすぐにでてこない。ド忘れや訳に困ったやつたち。

Tagged with: , ,

[Science][SFAA]Chapter:9-30の和訳

Posted in 未分類 by kahjin on 3月 16, 2008

[9-30]

Two quantities are positively correlated if having more of one is associated with having more of the other. (A negative correlation means that having more of one is associated with having less of the other.) But even a strong correlation between two quantities does not mean that one is necessarily a cause of the other. Either one could possibly cause the other, or both could be the common result of some third factor. For example, life expectancy in a community is positively correlated with the average number of telephones per household. One could look for an explanation for how having more telephones improves one’s health or why healthier people buy more telephones. More likely, however, both health and number of telephones are the consequence of the community’s general level of wealth, which affects the overall quality of nutrition and medical care, as well as the people’s inclination to buy telephones.

もし、一方の量が大きくなり、他方の量もそれに伴って大きくなれば、2つの量の間には正の相関があると言える。(逆に、他方の量が小さくなれば、負の相関があると言える)。しかし、2つの量の間に強い相関があるということは必ずしもこれらの間に因果関係があるということを意味しない。それらは果因関係かもしれないし、第3の要因が関係して、それらの相関が生じているのかもしれない。例えば、人の平均寿命は1世帯あたりの通信手段の数の平均と正に相関しているとする。通信手段の多さがどのように人の健康の改善に役立っているのか、あるいはなぜ、健康的な人ほど、通信手段を多く持てるのかなどの説明が必要になるだろう。しかし、健康も通信手段の数も人が生活を営むその社会の一般的な豊さの結果であると考えられなくもない(むしろ、こっちの方が妥当である)。なぜなら、社会の一般的な豊さというのは人が栄養価のある食生活が送れているのかや十分な医療保護は受けられているのかという社会の豊さの総合指数?みないなものに影響しているからだ。それと同様に、通信手段の多さが社会の豊かさに影響するなら、人がそれを購買する傾向にあっても何ら不思議ではないからだ。

相関の説明って難しいですね。英語では1以上の接点の数の変化が正に働くか負に働くかってことなんだけど、単純に一方の変数が増加するとき、他方の変数が〜って訳した方がいいのかな。

それと、今の時代にtelephoneの数がどうとかって少しナンセンスかなと思って、思いっきり意訳させてもらいました。

さて、来週のサザエさんは〜って次どこやろうかな。

Tagged with: , ,

[Science][SFAA]Chapter:9-28,29の和訳

Posted in 未分類 by kahjin on 3月 14, 2008

[9-28]

More generally, averages by themselves neglect variation in the data and may imply more uniformity than exists. For example, the average temperature on the planet Mercury of about 15o F does not sound too bad—until one considers that it swings from 300o F above to almost 300o F below zero. The neglect of variation can be particularly misleading when averages are compared. For example, the fact that the average height of men is distinctly greater than that of women could be reported as “men are taller than women,” whereas many women are taller than many men. To interpret averages, therefore, it is important to have information about the variation within groups, such as the total range of data or the range covered by the middle 50 percent. A plot of all the data along a number line makes it possible to see how the data are spread out.

より一般的に言えば、平均はデータのばらつき(範囲)を隠蔽してしまうので、本当はそこに存在しているはずの法則が平均によって目隠しされてしまうかもしれない。例えば、水星の平均温度はおよそ華氏15度であるというのは聞こえはいいのだけれど、それが、上限値が華氏300度で下限値が華氏マイナス300度の間で振れる値だと知っていたら、どうだろうか。ばらつきを考慮しないで、平均を比較するときは誤解を招く恐れがある。例えば、男性の平均身長は女性の平均身長よりも明らかに高いという事実が”男性は女性よりも背が高い”とただ単に報告されたらどうだろうか。一方で、男性より女性の方が背が高い場合もあるだろうという反論は想像に難くないだろう。それゆえ、平均を解釈するために、グループ内のばらつきについての情報、例えば、データの値のとりうるすべての範囲や中央値からデータの値の50%がそこに含まれている範囲などの情報が重要になる。数直線に沿って、すべてのデータの値をプロットすることによって、データがどの程度の拡がりをもっているのかが分かる。

[9-29]

We are often presented with summary data that purport to demonstrate a relationship between two variables but lack essential information. For example, the claim that “more than 50 percent of married couples who have different religions eventually get divorced” would not tell us anything about the relationship between religion and divorce unless we also knew the percentage of couples with the same religion who get divorced. Only the comparison of the two percentages could tell us whether there may be a real relationship. Even then, caution is necessary because of possible bias in how the samples were selected and because differences in percentage could occur just by chance in selecting the sample. Proper reports of such information should include a description of possible sources of bias and an estimate of the statistical uncertainty in the comparison.

重要な情報が欠如しているにもかかわらず、二つの変数間の関係を示そうとして集約したデータの結果を公表してしまうことがよくある。例えば、”異なる信教を持つ夫婦の50%以上は離婚する”という主張は”同じ信教を持つ夫婦での離婚率はどれくらいか”というのを知っていないことには何も語ってはくれない。これら二つの離婚率を比べないことには信教と離婚の本当の関係を知ることはできないだろう。その時でさえ、標本を選んだときに起こりうる傾向や偶然による誤差などにも注意が必要である。故に、そのような情報に関するレポートを優れたものにしたいなら、その傾向の可能性についての説明や比べるときの統計的な曖昧さについての検討などを明記すべきである。

Tagged with: , , ,

[Science][SFAA]Chapter:9-27の和訳

Posted in 未分類 by kahjin on 3月 11, 2008

[9-27]

The most familiar statistic for summarizing a data distribution is the mean, or common average; but care must be taken in using or interpreting it. When data are discrete (such as number of children per family), the mean may not even be a possible value (for example, 2.2 children). When data are highly skewed toward one extreme, the mean may not even be close to a typical value. For example, a small fraction of people who have very large personal incomes can raise the mean considerably higher than the bulk of people piled at the lower end can lower it. The median, which divides the lower half of the data from the upper half, is more meaningful for many purposes. When there are only a few discrete values of a quantity, the most informative kind of average may be the mode, which is the most common single value—for example, the most common number of cars per U.S. family is 1.

データの分布を集約するために、最もよく使う統計的手法は(集団)平均あるいは、ただ単に平均である。しかし、平均を使って何かを解釈するときは注意しなければならない。データが連続的ではない、離散的な値の場合(例えば、1家族あたりの子供の数)、平均は現実的な値をとらないかもしれない(例えば、子供の数の平均は2,2人なんてありえない)。データが通常とはかけ離れた値に強く引っ張られる場合、平均は予測どおりの値には近づかないかもしれない。例えば、少数のお金持ちが個人所得の平均値をぐっと押し上げるようなことが考えられる。データの値を上半分と下半分に分断させるメディアン(median)という手法は多くの目的において平均を使うよりも効果的な場合がある。データがわずかの離散的な値で表現できるなら、最も情報を的確に表現している平均にモード(mode)が当てはまるのかもしれない。モードは、最もありふれた単一の値である。例えば、アメリカの家庭で車を所有している台数のモードは1である。

a small fraction of people who have very large personal incomes can raise the mean considerably higher than the bulk of people piled at the lower end can lower it.の部分はかなり端折ったが、この部分は私が個人的に英語の表現が面白いと感じたところなので、英語のまま理解した方がいいのではないかと思い、直訳は避けた。これってパレートだかパレードとかの法則っていうんだっけ?

追記:2008/03/15

参考

How To Analyze Data Using the Average

このchapterにぴったりの記事を発見!!

追記:2008/03/21

Tagged with: , ,

[Science][SFAA]Chapter:9-26の和訳

Posted in 未分類 by kahjin on 3月 9, 2008

[9-26]

Summarizing Data

Information is all around us—often in such great quantities that we are unable to make sense of it. A set of data can be represented by a few summary characteristics that may reveal or conceal important aspects of it. Statistics is a form of mathematics that develops useful ways for organizing and analyzing large amounts of data. To get an idea of what a set of data is like, for example, we can plot each case on a number line, and then inspect the plot to see where cases are piled up, where some are separate from the others, where the highest and lowest are, and so on. Alternatively, the data set can be characterized in a summary fashion by describing where its middle is and how much variation there is around that middle.

データの集約(Summarizing Data)

私たちの回りは情報で溢れている。多くの場合、その中には、私たちには理解できないようなものが大量に含まれている。データの集まりというのは情 報の重要な側面が見え隠れする可能性のあるいつくかの集約した性質で表現できる。統計学は大量のデータを整理し、解析するための有用な方法が日夜開発され ている数学の一つの分野である。例えば、データの集まりからどのようなことが考えられるのかを調べるために、数直線上にそれぞれの場合分け(数と対応)し た点をプロットすることができる。そして次に、同じような点がどれくらいあるのか?、点と点の間隔はどれくらい離れているのか?や一番高い点や一番低い 点はどれか?などプロットをじっくりと調べることができる。その代わりに、データの集まりの中央はどこにあるのか?やその中央に対してどれくらいのばら つきがあるのか?を記述することによって、データの集まりを集約したある性質を浮かび上がらせることができるのである。

あれこれ統計解析する前に、一次元ならヒストグラム、2次元以上なら散布図でも描いてみろってことですね。でも、3次元以上だと、視覚的には理解しづらいし、きびしいかも。というか私はよっぽどでない限り、3次元以上は直感的に理解しにくいです。

Tagged with: , ,

[Science][SFAA]Chapter:9-33の和訳

Posted in 未分類 by kahjin on 3月 6, 2008

[9-33]

A second major concern that determines the usefulness of a sample is its size. If sampling is done without bias in the method, then the larger the sample is, the more likely it is to represent the whole accurately. This is because the larger a sample is, the smaller the effects of purely random variations are likely to be on its summary characteristics. The chance of drawing a wrong conclusion shrinks as the sample size increases. For example, for samples chosen at random, finding that 600 out of a sample of 1,000 have a certain feature is much stronger evidence that a majority of the population from which it was drawn have that feature than finding that 6 out of a sample of 10 (or even 9 out of the 10) have it. On the other hand, the actual size of the total population from which a sample is drawn has little effect on the accuracy of sample results. A random sample of 1,000 would have about the same margin of error whether it were drawn from a population of 10,000 or from a similar population of 100 million.

二番目に重要なことは標本を(最大限に)活かすも殺すもその大きさで決まるということだ。仮に、全く傾向が生じないある特定の方法で標本を採取するならば、標本が大きければ大きいほど、全てのことをより正確に表現できるようになる。なぜなら、標本が大きければ大きいほど、真にでたらめなばらつきによる効果は小さくなり、その(効果が生み出す)特性上に集約されるようになるからだ。標本の大きさが増加すればするほど、誤った結論を導く機会は減少させられる。例えば、でたらめに標本を選んだとする。1,000の標本中600の標本から発見したある特徴は10の標本中6の標本から発見した特徴よりも選んできた集団の大まかな特徴をより強く証拠づけるものになる(あるいは、それが10の標本中9の標本から発見した特徴だとしてもだ)。一方で、標本を選んできた全集団の実際の大きさというのは標本から得られた結果の正確性にほとんど影響しない。でたらめに選んだ1,000の標本は標本数10,000の集団から選んでいようと、あるいは標本数100,000,000(1億)の似たような集団から選んだとしてもおよそ同じ誤差を含んでいるだろうから。

追記:2008/03/06

もっと、専門的に学んでみたい、勉強したいという方はこれなんか導入としてはいいかも。

私は学生の時に読みました。

次は、[9-26] Summarizing Dataをやります。

参考

統計学を拓いた異才たち―経験則から科学へ進展した一世紀

Tagged with: , ,