スキルアップ
2015年4月16日
統計資料の数字に"だまされない"ために
[連載] 社会人1年生のための統計学教科書【2】
文・浅野 晃
  • はてなブックマークに追加

「何を表現する数字なのか」の答え

1. ここでいう「3%」というのは「商品全体の数のうち、量目不足があった商品の数」であって、「量目不足」があった商品が「いくら不足だったか」については何も述べていません。ですから、消費者がいくら損しているかはわかりません。

2. 1時間あたりで考えれば、朝と夕方は走っている自動車の数が多いわけですから、事故が多いのは当たり前です。「事故を起こしやすい原因があるのか」を考えるには、走っている自動車の台数あたりで考える必要があります。

3. 肺がんが非常に珍しい病気で、1年間に肺がんにかかる人が10人くらいしかいないのなら、たばこを吸っても吸わなくても肺がんにかかる人はほとんどいないわけで、「10倍」といってもたいした意味はありません。これが、たばこを吸って肺がんにかかる人が100万人、吸わなくてかかる人が10万人だとしたら、たばこを吸うことはたいへん危険です。「10倍」というだけでは、たばこが危険かどうかはわかりません。なお、設問の記述は、愛知県がんセンター中央病院のウェブサイト「がんの知識」に出ていたもので、そこでは平成19年の日本人の肺がん死亡者が65,576人であることも書かれています。したがって、たばこを吸うことはかなり危険であるとはいえます。

【やってみよう】統計量を正しく理解しているか


 統計量とは、調査したデータに対して何かの計算をして、データを要約したものです。私たちに一番なじみのある統計量といえば、平均でしょう。平均の計算のしかたはよく知っていると思いますが、「なじみがある」ことを過信すると誤解を生みます。次のような表現について、どのような問題があるかを考えてみましょう。

1. 気象用語でいう「雲量」とは、快晴を0、本曇りを10として、空のうち雲の占める割合を表現する。平均は5程度である。したがって、1年間のうち、多少雲がある曇りの日が一番多い。

2. 「人生50年」という言葉があったように、100年前の日本人の平均寿命は50歳程度であった。当時の女性は5、6人の子どもを生むことは当たり前であったので、子育てが終わった後の人生はたった数年しかなかった。

3. 「500系のぞみ号」は、1997年の運行開始当時、最高速度300km/hの「世界一速い列車」であった。


「統計量を正しく理解しているか」の答え

1. データが「平均値をとる可能性が一番高い」とはかぎりません。どの値をとる可能性がどのくらいであるかを示す「分布」の違いで、いろいろなパターンがあります。最大値と最小値が一番とる可能性が高く、平均値をとる可能性が一番低い、という分布も考えられます。雲量はこのような分布をとる例です。

2. 「平均寿命」とは「0歳児の平均余命」です。昔は乳児死亡率が高かったので、その影響で0歳児の平均余命が短くなっていました。決して「平均寿命が50歳である」からといって「40歳の人の平均余命が10年である」わけではありません。平均余命・平均寿命については、『社会人1年生のための統計学教科書』(SBクリエイティブ)の第12章で解説しています。

3. 「最高速度が世界一速い列車」も「世界一速い列車」のひとつですが、実用的にはある地点からある地点へ移動するときの速度が一番速い列車が「世界一速い列車」ではないでしょうか。なお、鉄道技術の世界では、営業列車の速度は「隣接停車駅間の平均速度」で評価するそうで、その意味で、「500系のぞみ号」の広島→小倉間が当時「世界一速い」列車だったそうです。

(了)





社会人1年生のための統計学教科書
データの見方からリスク・リテラシーまで
浅野 晃 著



【著者】浅野 晃(あさの あきら)
1964 年大阪生まれ。大阪大学大学院工学研究科応用物理学専攻博士後期課程修了。博士(工学)。九州工業大学情報工学部助手,広島大学総合科学部助教授,同大学院工学研究科情報工学専攻教授を経て,現在は関西大学総合情報学部教授。専門は画像科学・感性科学・統計学。電子情報通信学会,応用統計学会,日本感性工学会,米国電気電子学会(IEEE),米国光学会(OSA)会員。アマチュア管弦楽団のコントラバス奏者でもある。近著は『社会人1年生のための統計学教科書』。
  • はてなブックマークに追加