Featured image of post 消失的女嬰 Part 2:200萬人口普查檔敘述統計 (又名:「大數據」資料分析)

消失的女嬰 Part 2:200萬人口普查檔敘述統計 (又名:「大數據」資料分析)

一個女生,他們家生兩個小孩。她是姊姊,請問他比較有可能有弟弟還是妹妹? 1. 弟弟。 2. 妹妹。 3. 一樣可能。 想好答案了嗎?

一個女生,他們家生兩個小孩。她是姊姊,請問她比較有可能有弟弟還是妹妹?

  1. 弟弟
  2. 妹妹
  3. 一樣可能

想好答案了嗎?


答案:弟弟。

根據 2000 年的人口普查檔,這位姊姊有弟弟的比例約 60%,相對地,有妹妹的比例則是 40%。60% 跟 40% 差很多嗎?純粹從生物角度來看,每一胎生男生(有弟弟)的機率只比女生(有妹妹)多約 2.4%。1 那這驚人的 20% 差距打哪來的?

看看下一個問題。

一個男生,他們家生三個小孩。他是老么,請問他最有可能有哪一種哥哥姊姊的組合?選項中第一個字代表該家庭第一胎的性別,第二個字代表第二胎。譬如:「男女」代表年歲最大的是哥哥,第二胎是姊姊。

  1. 男男
  2. 男女
  3. 女男
  4. 女女

這題應該比較好猜了吧!

答案:女女。

這位弟弟最有可能有「兩個姊姊」(相對於其他手足組合)。生三胎,且第三胎是男生的家庭中,前兩胎不同手足組合相應的比例分別是:

表 1:三胎家庭,給定第三胎是男生,前二胎不同手足組合的比例
手足組合男男男女女男女女
比例21212337

造成這兩題答案的原因一樣嗎?不意外地,兩題都是台灣父母重男輕女偏好的表彰。然而,兩題的答案皆來自於下面兩種重男輕女的「行為」嗎?

  1. 第一胎(或第一跟第二胎)生到女生,下一胎來「選」個男生吧
  2. 第一胎(或第二胎或第三胎)生到男生,「好了,心滿意足,不用再生了。」

前者的父母會「手動選擇」自己的下一代,而有「消失的女嬰」。後者的父母則是有「理想的兒女組合」(而不是「理想的小孩數量」),後者行為在學術中被稱為:看到兒子就不生了的規則 (son-stopping rule)

本文觀察台灣 2000 年的人口普查檔中 30—39 歲女性 (1961—1970 世代) 的生育歷史 (200萬個小孩的資料),23嘗試解釋上述兩個問題的答案,有多少由父母「手動選擇」子女造成,多少來自父母遵循「看到兒子就不生了」的規則。


前情提要:從胎次看重男輕女

那些年,消失的六萬女嬰 中,農夫說明了如何從「胎次」觀察台灣三十年來的「重男輕女偏好」。

對於那些很想生男生(重男輕女)卻一直生到女生的家庭,因為養小孩成本跟母親健康因素,生第三胎以上時,憑著「再拼一個男生吧」的精神,他們可能真的比較容易生到男生。這樣的邏輯讓我們預測,隨著胎次的增加,在台灣生男生的比例會提高(生物上,生第幾胎跟生男生是沒關係的)。

表 2:各胎次男性比例
胎次第一胎第二胎第三胎第四胎第五胎
生男比例 (%)51.7651.9754.5758.7658.21
資料來源:2000 年人口普查檔

表二顯示,第一二胎,生男生的比例跟生物鐵則 (51.2%) 差不多 ,但第三胎以上,便明顯提高,將男性比例換算成性別比,58% 代表,每 100 個女性出生,對應到 138 個男生。這是第一個映證台灣具有「重男輕女」偏好的證據。

然而,僅憑胎次資料,我們無法分辨提高的比例來自「手動選擇」還是「看到兒子就不生了」的規則。下一個強大的工具,正如文章開頭的問題提到,是手足的性別組合


從手足組合看「手動選擇」

根據表 1,我們要抓到「重男輕女」的行為,從第三胎的一些數字著手,應該最有可能看到有趣的規律。譬如,根據表 1,我們知道全台灣第三胎中,男生比較多,但到底是哪一些家庭「特別會生」男生?一個直覺的猜測是:一直生到女生的家庭,最會生男生。

圖 1: 三胎以上家庭,前兩胎不同手足組合下,第三胎是男孩的比例
資料來源:2000 年人口普查檔

圖 1 的數字代表,生兩胎後,如果該家庭有生第三胎(或第四胎第五胎),該名第三胎是男生的比例。很明顯地,我們猜對了!前兩胎都生女生的家庭,這些母親 最會生男生。 表 2 只告訴我們第三胎發生了一些事情,圖 1 則藉由手足組合告訴我們,那些事情發生在哪些家庭。「是時候拼個男生」的偏好,以及「手動選擇後代」的效果一覽無遺。

然而,圖 1 顯示的數據,跟文章開頭第二個問題的答案 (表 1),有個值得討論的差異。

文章開頭的問題多了一個條件:只生三胎。而圖二顯示的是三胎以上的家庭,包含四胎及五胎。
如果第三胎的性別會影響家庭生第四胎的意願,譬如雖然前兩胎都生到女生,但第三胎生到男生了,父母很開心,就不生第四胎。
這種「看到兒子就不生了」的規則會直接影響只生三胎的各種手足組合的比例。
可以想像成這是「事後」(生完小孩)才產生的影響,而「手動選擇」是事前(生小孩前)就發生的影響。

精確地說,「看到兒子就不生」的規則如何體現在不同家庭裡呢?表 3 整理了帶有重男輕女偏好,且前兩胎都是女生的家庭,生第三胎時可能的反應。

表 3:不同家庭生第三胎後的可能反應
家庭類別第一種反應(就此打住)第二種反應(再來一個)
A:手動選擇生到男生的家庭A1:好開心啊!好好照顧這二女一男吧。不用再生了!A2:好開心啊!但我還想要再有一個兒子,成雙成對多好,再生一個好拉_
B:沒有手動選擇後代。老天讓他們生到男生的家庭B1:太好了!老天有眼!好好照顧這兩女一男吧。不用再生了。B2:太好了!老天有眼!但我還想要再有一個兒子,成雙成對多好,再生一個好拉_
C:沒有手動選擇後代。老天讓他們生到女生的家庭C1:好吧。看來老天決意如此。那就此打住吧C2:啊...女生也很好啊_不過我們再接再勵吧!再拼一個!

對於得其所望,第三胎生男孩的家庭 (A和B),在這個養小孩很麻煩的時代,我們預測他們較可能就此打住, 看到兒子就不生了。 因此 A1 反應該多於 A2 ,B1 反應多於 B2 。至於那些生了「女女女」組合的家庭該怎麼辦? 繼續生! 因此我們預測 C2 的反應多於 C1。從這個猜測,我們可以想像,前三胎手足組合是「女女女」的家庭,應該比手足組合是「女女男」的家庭,更可能生下一胎(第四胎)。

圖 2: 前三胎「女女女」跟「女女男」的家庭,生第四胎的比例
資料來源:2000 年人口普查檔

果不其然,生「女女女」的家庭,生第四胎的比例硬生生是「女女男」家庭的兩倍。反映「看到兒子就不生了」這個規則可能存在。

文章開頭的問題限制在只有三胎的家庭,因此「女女女」比「女女男」更可能生第四胎的現象,會使得在老么是弟弟的條件下,前兩胎是「女女」的比例再往上升(「女女男」的家庭比「女女女」更可能成為三胎家庭)。

然而圖 2 不能肯定 「看到兒子就不生了」的規則真的存在。讀者不妨在這裡停下來想想,為什麼?


看到兒子就不生了,真的嗎?

圖 2 讓我們猜測「看到兒子就不生」確實存在台灣,一個繼續檢驗的方法是檢查同樣的邏輯衍生的猜測有沒有顯現在資料裡。譬如,對於前兩胎中有一胎是男生的父母而言,只要再生到一個男生,人生應該就很美好了。這樣的話,我們預期看到什麼?

前兩胎是「男女」,第三胎生到男生的家庭就…湊滿一對男生! 比較不會生第四胎 。同樣的,前兩胎是「女男」,第三胎生到男生,也比較不會生第四胎。亦即:

生第四胎的比例:
「男女女」>「男女男」
「女男女」>「女男男」

圖 3: 前三胎不同手足組合家庭,生第四胎的比例
資料來源:2000 年人口普查檔

圖 3 完全符合預期,「男女女」跟「女男女」兩種家庭生第四胎的比例,正是「男女男」跟「女男男」的兩倍。然而,雖然圖四符合猜測。但我們還是沒辦法完全證實「看到兒子就不生了」這個規則存在。

圖 2 跟圖 3 的現象,即使這世上沒有「看到兒子就不生了」這個規則,還是能發生,只要生「女女女」的父母比生「女女男」的父母 原本就更願意 生第四胎(不管第三胎是男是女)。

而生育總數偏好加上重男輕女偏好便可能產生 「女女女」的父母比生「女女男」的父母原本就更願意生第四胎 的事實。

想像是誰會採取「手動選擇後代」這種主動的策略呢?可能是那些有強烈生育總數偏好(只願意生到第三胎)加上重男輕女偏好的父母。

生育總數偏好(只願意生三胎)+重男輕女 = 手動選擇後代
「女女男」的父母本來就比較不願意生第四胎

「女女男」v.s.「女女女」、「男女男」v.s.「男女女」、「女男男」v.s.「女男女」的比較中,前者的父母可能有較高比例本來就只願意生到第三胎(強烈生育總數目偏好讓他們手動選擇後代成功)。這讓我們沒辦法排除「看到兒子就不生了的規則不存在」的可能。


「手動選擇」已經驗明正身

為什麼三胎家庭中,如果老么是男生,前兩個都是姊姊的機率最高?

答案是 台灣父母「手動選擇」後代。 導致「女女」家庭 比較會生男孩。

「看到兒子就不生了」 的規則可能也是部分原因,畢竟我們也發現「女女女」家庭 最愛繼續生小孩, 但這可能只是生育總數偏好導致。

看完三胎跟四胎家庭,你可能會想:「天啊,原本以為 1961—1970 世代的女性應該沒那麼多人願意生三胎跟四胎 (其實三胎家庭的數量比一胎家庭還多),3但竟然還能看到這麼多因重男輕女偏好而起的現象」。

這樣的質疑自然地引領我們詢問:

  1. 會不會生第二胎的時候就已經「手動選擇」後代?
  2. 很多父母決定生第三胎是因為前兩胎的手足組合是可愛姐妹花「女女」?

這兩個問題的答案將讓我們得以回答文章開頭的第一個問題。

為什麼兩個恰恰好的家庭中,姊姊的手足,比較可能是個弟弟?


抓到了,看到兒子就不生!

仿照前面的做法,我們觀察第一胎的性別是否能預測第二胎的性別,以此檢視「手動選擇後代」的存在。第一胎是男生,第二胎也是男生的比例是:51.66%;第一胎是女生,第二胎是男生的比例是:51.73%。沒什麼差異,看來在前兩胎大家還是都很喜歡女生!

不,事情沒那麼簡單。

圖 4: 前兩胎不同手足組合,生第三胎的比例
資料來源:2000 年人口普查檔

圖 4 顯示,雖然父母在第二胎不會手動選擇子女,但是「女男」家庭生第三胎的比例比起「女女」家庭少了18%,他們「看到兒子就不生了」!

為什麼二個恰恰好的家庭的姊姊容易有個弟弟?不是因為父母手動選擇子女。而是因為父母只有在「一女一男」的時候覺得「恰恰好」,打住不生!但如果姊姊有了妹妹,拍謝,這位妹妹會有下個更小的手足,因此讓「女女」家庭跳出問題要件下的分母–兩個孩子的家庭。而且我們還知道,這個更小的手足很可能是弟弟–圖 1 顯示,「女女」家庭的母親最會生男孩。


重男輕女,然後呢?

那些年,消失的六萬女嬰到本文,我們利用胎次以及優生保健法的實施作為自然實驗(關於自然實驗的介紹,詳見自然實驗 : 無法重制的人生/歷史),了解台灣父母確實會「手動選擇」子女。進一步,利用不同手足組合,我們發現「手動選擇」發生在要生第三胎的時候。而對於那些重男輕女偏好可能沒那麼強烈的父母,他們的重男輕女,則在要不要生第三胎的時候,被「看到兒子就不生了」現象所捕捉。

然而,這場重男輕女的戰爭才剛開始。孩子長大了,家裡的資源要怎麼分配呢?

「姊姊犧牲一下,讓弟弟好好唸書吧!」

或者。

「唉,當初連生了兩個女孩,咬緊牙根決定再拼一個。現在慘了,錢不夠賺,生了三個,孩子平均分到的奶粉自然比生兩個孩子要少了。」

下一回,重男輕女如何影響手足教育成就,敬請期待。

本文由沈暉智帥哥的研究觸發靈感,特此感謝。


資料處理

篩選母親樣本過程:

  1. 1961—1970 出生已婚女性的家庭
  2. 該家庭的母親有配偶或同居,且為該戶戶長或戶長配偶

第 2 個標準拿掉了第1個標準下19%的女性。注意到這兩個標準會把離婚或是配偶死亡的家庭除去,這兩種家庭可能都沒有達到夫婦想要的子女數量。另外,隔代教養,或者叔叔伯伯等親戚一起住的大家庭,也不會被納入。主要是因為難以確認母親年齡,也難以認定哪些是目標母親的小孩(而不是叔叔伯伯的小孩)。

本文篩選小孩樣本過程

  1. 小孩小於等於25歲。在2000年普查加上前述女性篩選標準,如果小孩大於25歲,代表該母親在15歲以前便生小孩,可能性很低,因此我們把這些樣本視為編碼錯誤
  2. 5胎以內的家庭已經佔所有家庭 99.多的比例。由於擔心有編碼錯誤,六胎以上的家庭不納入分析

封面圖片由 Ben Grey 拍攝,取自這裡

家庭類別一胎家庭二胎家庭三胎家庭四胎家庭
數目21134647757523455236342
資料來源:2000 年人口普查檔

  1. 一般認為自然的生男生機率約 51.2%,女生為 48.8%。這兩個數字由性別比 105 得到。性別比的定義是:100個女生對應到幾個男生。 ↩︎

  2. 按照台灣一般新聞的標準,這是一篇「大數據分析」,但老實說,這數據不大,而農夫的分析也都只是敘述統計罷了(算平均)。 ↩︎

  3. 資料處理及樣本篩選過程見下方資料處理。 ↩︎ ↩︎

comments powered by Disqus
誠如白鯨記裏頭的鯨魚,我們所追捕的社會議題,其背後的真實訊息,對每個讀者而言可能有不同意義:它或許象徵著人類的極限及不可抗力;它或許純粹滿足人們對真相的渴望;它也可能只是一個謎。不論真相為何,也不論真相對你而言代表著什麼,我們都在此誠摯邀請你一同踏上追尋白鯨的旅途。