分析了台北市近十年房價,原來台北市房市長這樣!

Cliff Chew
Nov 8, 2022

--

我前幾週分析了新加坡近幾年房市走向(這裡這裡這裡)。最近,我發現到台灣政府也有發布類似台灣房價的交易資料。由於我有好多台灣朋友都說台灣房價,尤其是台北,都貴到離譜,我很好奇這官方提供的數字能讓我分析出什麼。當然,我初期會是先做一些比簡單的分析來熟悉下著台灣房市的數據。我也想借此機會用中文來發一篇文章。希望我用中文的語法和邏輯還夠清晰,也希望不會有太多錯字。

撈取官方數據

Fig 1:官方網站撈取資料

撈取資料的步驟不難,只需要照著網頁的指示,一季一季的下載和打開zip檔案。很遺憾,zip檔案裡面的資料卻長這樣。

Fig 2: ZIP檔案裡的貌似暗號的資料名字

可能網站有更詳細的解說,國語比較不好的我也懶得更進一步和官方網頁折騰。更重要的是,每一個csv文件裡都有英文的講解。也不是說中文解說我看不懂,但是我自己看中文解說的話,難免我可能會誤解欄位的意思。所以最終我就憑著檔案裡的英文欄位名字來進行我的分析。

Fig 3: 檔案裡的英文解說 — 我的救星!

繼續處理數據

首先,為了讓自己更方便辨識房屋的買賣時機,我把民國年份改成我比較熟悉的西元年份。我也把分辨不了的年月份,以及不符合邏輯的「總價元」和「單價元平方公尺」刪除。但由於的數字還是蠻龐大的,我就決定先分析台北市的房屋交易。他們的區包括了中正區,大同區,中山區,松山區,大安區,萬華區,信義區,士林區,北投區,南港區,內湖區和文山區,這十二個主要區域。台北市從2011Q1開始,我能確認的房屋交易有133,692件。

接下來,我為總價元做了一個區域的汇总统计(summary statistics)。有一些房屋的交易價看起來也太低了,譬如中正區的NTD 10,000。但由於我也無法辨認這房價的可信度,我也就決定不刪除他們。除此之外,汇总统计的數字反應了在整體趨勢之下,松山和大安區的房價是偏高的,而中正和萬華區的房價是偏低的。

Table 1: 台北房價的汇总统计

我也弄了一個區域的箱形图(boxplot)來以另一個角度來了解台北的房價。

Fig 4: 台北市區域總價箱形图

我們可以從圖看到一些有趣的現象。首先,每一個台北的區域都有自己的异常值(outliers),也很帶出台北各地區的房價都不處於正態分佈(normal distribution)的狀態。

單純的用肉眼來觀察箱形图,台北這十年的總房屋交易價格主能大概的分為兩組:(1)不這麼超過新台幣兩億(NTD 200 million)房價的萬華區,文山區,北投區,大同區和南港區,以及(2)比較會超越新台幣兩億房價的內湖區,松山區,中正區,士林區,中山區,信義區和大安區。

返看汇总统计時,中正區和信義區的總價位中分價位各只是新台幣七百萬了以及一千兩百萬。在印象當中,中正區在台北還算是很適中的地段,而信義區也是一個很繁華的購物商圈。這兩區的總價位中分價位居然會比比較偏遠的南港區總價位中分價的一千九百萬還低。

Fig 5:南港區地圖 (Source — Google Maps)

這點讓我還有一點訝異的。我唯一能想到的是可能中正區和信義區的房價還是比較偏低,但是卻有一些比較高價位的房子被轉賣。我還蠻好奇台北人是這麼看著數據。

在台北房價的頂端,不管是汇总统计或箱形图的分析,松山區和大安區的整體房屋交易價都看起來很驚人。印象當中大安區有一個蠻大的大安森林公園。寫到這裡,我突然記得有一個新加坡人在大安區買了豪宅 — 林俊傑!小S之前住的帝寶也是在大安區。

平方公尺價格

了解台北房屋的總房價可以讓我們了解在台北買房必須支出的資金。要跟準確熱了解台北房價的走勢,我們必須刪除房屋大小的影響,直接採用平方公尺價格 (price per square metre)。

Table 2:「單價元平方公尺」的汇总统计

Table 2 例出了平方公尺價格的汇总统计。單看著數據,區域價格的排列沒和總價格差太大。但文山區的最高平方公尺價格是全台北區域最高的,而南港區的最高平方公尺價格卻是全台北區域最低的。

為了更了解台北方式的走向,我整理出了幾個时间序列图(time series)來對比台北區域和台北整體每一季的平方公尺價格。

Figure 6 顯示了從2012Q3開始,中正區,文山區,北投區,萬華區和信義區的總價元平方公尺整體是比台北總平方公尺價格還要低的。

Figure 7 松山區,中山區,大安區和南港區從2012Q3開始都比台北的總平方公尺價格還要高。

Figure 8大同區,內湖區和士林區的單價元平方公尺和台北總平方公尺價格沒差都少(除了大同區2019Q)。

Fig 6: 比台北總價元平方公尺低的區域
Fig 7: 比台北總平方公尺價格高的區域
Fig 8: 起起伏伏的台北平方公尺價格的區域

有趣的是,整個台北各區的平方公尺價格在2021Q 都暴漲了一波(除了大同區的是反而滑落了)。而這破的漲幅其實符合了一些媒體的報導[link]。而這也讓我想提到各數據分析的關鍵 — 相關的领域知识(domain knowledge)。

领域知识

我本人還蠻喜歡分析實際的數據,因為在整理的當兒能讓我更了解數據背後議題的一些我預先可能不知道的事。其實不知道大家有沒有發現,我在弄Figure 6, 7, 8 的时间序列图,我其實稍稍做了一些手腳。這些时间序列图的數據我都特別的從2013Q1開始,雖然我有的數據是從2011Q1開始的。

以下的Figure 9 就包括了2011和2012的台北房屋交易的價元平方公尺高。

Fig 9: 在2011和2012,台北房屋平方公尺價格起伏很大

在我剛開始研究這數據時,2011和2012的數據有讓我吃驚,因為2011和2012的平方公尺價格波動很大,而只有到了2013年才開始穩定了下來。開始看到這情況的時候,我有懷疑我的分析編程是不是出了什麼問題。但經過反覆的驗證,我真的沒出錯呀。當我又要開始懷疑數據的可靠性時,我覺得在網上查了一些質料,才發現原來台灣政府在2011執行了一些措施來打壓台灣的房屋價格。

To dampen real estate speculation, in June 2011 the [Taiwan] government also began imposing a tax of 10 to 15 percent on properties that are purchased and then resold in less than two years — link

Fig 10: 台北整體價元平方公尺

2011Q3的措施一執行,2011Q4台北市中分平方公尺價格從2011Q2的新台幣二十萬掉到2011Q4的新台幣十六萬,反彈到了2012Q2的新台幣二十一萬,然後終於華樓到低於新台幣十五萬。從那時起,台北市中分價元平方公尺的價格只有在2021Q2的時候才有超越了新台幣二十一萬。

2011和2012台北房價的波動很有可能就是台灣政府措施的影響。為了更好分析台北近期的房價,我決定把2012措施之前的房價省略掉。這樣也能讓我把分析的重心放在措施之後的台北房市。當然,這也是我個人對數據了解後所作出的判斷。

小結論

好多年沒寫那麼長的中文篇章。不知道會不會有人把這篇文章看完。但如果有的話,我真心的感謝你的耐心。希望我小小分析有讓一部分的讀者更了解台北的房價。最終,我那麼喜歡數據分析是因為數據分析能讓我更了解我正在研究的議題。這小小的分析真的讓我稍稍的更了解台北的房價情況。

身為一個外國人,我很樂意聽取任何有關台灣房市的意見和分享,讓我能更了解我先由的分析能如何更好。當然,我現在也只是做了很初步的數據處理和分析。我還有很多對台灣房價的想法想研究和探索。譬如,我了解台中這兩三年的房價暴漲了很多,所以我也想看看台中房價飆漲的狀況。我也聽說新竹的房價也蠻貴的。如果可能的話,我想看看能不能拿台灣和新加坡的房價來做一些初步的對比。真的太多數據研究可以操作了啦!真的希望有更多時間來好好分析!

最後,如果對這些議題有興趣的人,記得follow我的Medium!謝謝大家!

--

--

Cliff Chew
Cliff Chew

Written by Cliff Chew

A person who thinks too much and writes too little

No responses yet