大数据指南:魔都购房攻略(一)

城市数据团 2019-05-04 13:31:26

作者:团支书、张健

数据及算法支持:城市数据团


世界总是那么的公平。


在我醉心研究寒窗苦读期间,闺蜜们已经纷纷恋爱结婚怀孕、磨拳准备买房了。当我得知婚讯、送去违心的祝福、且收到客套的安慰后,她们总是会问一句:


“你是研究城市大数据的吧,你怎么看上海的房价?我到底应该在哪买房呢?”


“房价”,与其他商品的价值一样,是需求与供应在现实世界中的投影。只不过作为不动产,房屋这一商品背后的供需略有特殊:——在我们生活的这个愚蠢的三维世界里,空间具有绝对的排他性,这使得你永远无法拥有两套具有相同空间属性的房屋。极端地说,在空间上任何一栋房屋都是唯一的,它的供应总量也只有01两种。(所以即使是自由市场国家,也存在花多少钱都无法搬迁某些钉子户的情况。很简单,因为只要他不想卖,他的房屋供给就是0。需求除以零供给,结果房价自然是无穷大。)


因此,不动产的供给问题往往是极度复杂的,为了不陷入到哲学性的困境中,我还是从需求角度出发来回答闺蜜们的问题吧。不过,在讨论具体需求之前,第一个问题是:“闺蜜们,你们买的起么?”


买不买得起,看图便知。



上图根据房地产门户网站的全网二手房价数据(时间是2015年3月)制作而成。从图中可以看到每一个小区的单价和所在位置。最高的几根线格外引人注目:东边最高的是陆家嘴滨江的豪宅;中间最高的是新天地的豪宅;而西侧最高的则是佘山的高级别墅。


大部分闺蜜们纷纷表示这些楼盘和她们毫无关系,她们最关心的价位区段叠杂在淡橙色线条中,无法识别。好吧。那么再看下图。




此图把从相关网站获得的上海所有二手房单价进行了1平方公里的栅格化处理。由此可以看到魔都每一平方公里土地(含有住宅价格信心的)的房价中位数空间分布。


我对闺蜜们说:“总体而言,房价在空间上并不完全按照圈层分布,虽然4万以上的豪宅仍然高度集聚在静安区和陆家嘴,但是3万到4万的区域已呈现不规则的形态,主要在市南地区,市北也有杨浦虹口的局部。3万以下的地方仍有大片,所以大家还是很有希望的嘛。看完房价了,现在说说你们的需求是什么呢?”


先举手发言的是春春。


春春是一个原教旨环保主义者。她说:“我以后肯定是不会开车上班的,只能坐地铁了。帮我看看地铁站点附近的房子吧。”

春春的要求是“好交通”。好的,那么好交通(轨交)到底对房价有多大影响呢?再看下图:




我们截取了位于中外环线间的所有二手房房价(据我了解春春也就买得起这个区域了),以1平方公里内有无地铁站为标准为两种:地铁房和非地铁房。可以看到,地铁房的均价为30769.5/M²,非地铁房均价为27525.5/M²。两者相差大约10%。好像也差不多嘛。


是的。实际上从微观角度上观察,轨道交通对房价的影响并不特别显著。我们再将视野从中外环拓展到全市,对每个空间圈层内的地铁房和非地铁房房价进行了拟合,可以得到下图:




可以看到,地铁站点对于房价的影响随着与市中心的距离扩大而不断加强。在市中心5公里范围内,房价几乎不受轨交站点的影响;从5公里以外,轨交对房价的作用才逐渐呈现且加强。换句话说,离市中心越远,地铁房越有价值。面对已经不考虑市中心,即将中外环间的春春,我很(bu)中(fu)肯(ze)地提出了建议:


“你还是多花10%的钱,买在地铁站附近吧。”


春春还没来得及答话。素素已经抢先发问了。


素素是一个有文化的人。她说:“我的需求很简单。我希望我周边住的都是有文化的人,起码都是大学本科以上的吧。”


素素的需求是“好邻居”。对于这一需求,先简单地用“周边地区高学历人群比重”这一指标来进行解释吧。那么,“好邻居”(周边地区高学历人群比重)对房价有什么影响呢?请看下图:




我们根据人口普查数据计算出全上海每一平方公里栅格内的高学历人口比例,将栅格按照高学历人口比例的大小从高到低进行排序,然后用排完序的栅格的平均房价对数绘制出散点图。通过这些栅格房价对数的线性回归可以看到:房价与高学历人口比例呈现较为明显的正相关关系。


我得意地指给素素看,但是,有文化的素素说:“我知道这个有什么用?那我应该买在哪?哪里的性价比最高?”


人们总是习惯相信世界上有一种东西是叫做“性价比”的。餐馆有性价比、手机有性价比、“好邻居”也有性价比。但从经济学角度上看,我们并不建议直接进行“性能”与“价格”之间的比较。所谓的性价比,实际上应该是一种收益和成本的优化关系


以素素的案例来看,既然素素希望通过购房来获得“好邻居”,那么她在“购房”这一行为中的收益是高学历邻居的比重;成本是购房的总支出。因此,素素的最优选择(性价比最高选择)即应当是实现她净收益(收益扣除成本)最大的那个空间栅格(在购买相同居住面积的情况下)。


根据这一原则,我们折算出了魔都所有空间栅格的“好邻居”净收益指数,其空间分布如下图所示:




那些颜色最红的地区,就是好邻居性价比最高地区了。分布很明显,主要在三个区域:


1、五角场区域;

2,花木、金桥、张江区域;

3,徐汇向南延续至闵行区域;

4,如果不介意太远的话,松江大学城附近也不是不错的选择。


我大手一挥:“素素你就去这几个地区去看房吧!”


素素还没来得及答话。夏夏和白白已经围了上来,七嘴八舌。


夏夏说:“我想选一个临近好工作的房子!”


白白说:“我想选一个靠近好吃的地方的房子!”


先看夏夏。“好工作”,非常难以分辨的需求。我们暂且简单地将“好工作”理解为金融、保险、法律、咨询、广告、地产、科研等生产者服务业工作吧。


这些工作岗位对房价是否有影响呢?看图便知:




同样地,我们根据经济普查数据,计算出了上海市每一平方公里栅格内的生产者服务业就业比例,将栅格按照生产者服务业就业比例从高到低进行排序,然后用这些排好序的栅格的平均房价对数绘制出散点图(上图)。从平均房价对数散点的线性回归中可以看到,房价与生产者服务业岗位比重基本呈现正相关关系 换句话说,好工作机会越多的地方,房价越贵。


那么,在购房中“好工作”的性价比分布是怎样呢?同“好邻居”问题一样,我们将“好工作”净收益指数计算出来,其分布如下图所示:




那些颜色最红的地区,就是好工作性价比最高地区了。这些点散落在全市的各个地方,基本上毫无规律。


我大手又一挥:“夏夏你就去这几个地区去看房吧!”


夏夏说:“等一下!你选的这些地方这么多这么零散,跑断腿啊!我要怎么去找?”


我一本正经地回答说:“当然啦,你又没有告诉我具体的好工作是指哪些工作?数据总是很精准的,关键是你的需求不精准!等你想明白了再帮你算一个更好吧!下一个!”


白白赶紧举手,说:“我来了我来了!我希望住的地方附近总是能吃到好吃的,那应该在哪买房子?”


这个需求是个什么鬼呀?我咬着牙开始思考。“好吃的”?妈蛋,那我就直接看周边地区的餐饮最高价吧。高价位餐饮指数和房价有关系吗?看图便知:




我们根据上海餐饮的网络点评数据,计算出全上海每一平方公里栅格内的高端餐饮价值指数,将栅格按照高端餐饮价格从高到低进行排序,然后用这些排好序的栅格的平均房价对数绘制出散点图(上图)。从平均房价对数散点的线性回归中可以看到,房价与高端餐饮指数呈现正相关关系。 换句话说,高级餐厅越多的地方,房价越贵。

白白问道:“那性价比呢?我怎么选房价又便宜餐馆又高级的地方?”


好的,在购房中“好吃的”的性价比分布是怎样呢?我们将“好吃的”净收益指数计算出来,其分布如下图所示:




其中红色的栅格即是高端餐馆指数性价比最高的地区了。从图中可以看到一条清晰的轴线,沿着二号线从陆家嘴一直延伸到虹桥地区。

白白疑惑道:“这里?这不是市中心吗?不是房价最贵一条轴吗?性价比何在?

我思考了一下,解释说:“是啊,所以既然你又想离高级餐馆近,那就只能住在市中心啦。但是,既然数据分析告诉你这里性价比高,那就说明这里应该有不少价格还不算太贵的破房子吧,你去好好挖掘一下。作为一个吃货,你就不要介意住在危房里啦。哈哈。”

应付完春春、素素、夏夏、白白,我已经精疲力竭。


但忽然发现角落里还站着佳佳。


佳佳总是那么地古典和恬静。她羞涩地走过来跟我说:“我不追求性价比啦,反正买房子是我未婚夫宝宝出钱。他说买在哪都不要紧,只要买了能升值就行。


升值?我最讨厌预测房价什么的了。但是迈不过好朋友的面子,我只好放出了大招儿:




此图是我们整理了2015年第一季度的魔都每个二手房小区房价涨幅程度,并以核密度方式绘制而成。红色越深的地区涨幅越大,绿色的表示涨幅越小(甚至局部略有跌幅)。


可以看到,虽然魔都的二手房楼市仍然在高度震荡当中(有涨有跌),但是市中心的房子却依然继续高涨。涨幅最大的区域集中在中环线以内,仅在长宁、闸北、虹口、杨浦的少数地区突破了中环界限。而在中心城(外环线)以外的地区仍然保持高涨态势的,集中在三个片区:宝山顾村、大虹桥和闵行徐泾。


我对佳佳说:“当然,这张图只是反映了近期的二手房变化。假如你要投资的话,我需要明确你的投资目的,是求涨幅还是避风险,然后根据更长时间的变化幅度,再综合交通、人口、企业、教育、公共服务等数据,落实到具体空间范围内,与房价变化综合建立一套回归方程,这样可能能够有更精确的回答。”


说完,我又补充了一句:“哦对了,除了这些之外,我还要知道,你的购房预算是多少呢?”


佳佳还是那么地羞涩,她轻声回答说:“啊,预算啊,其实我也不太知道。宝宝说好像是四万亿吧。哎,但也不一定都放在上海买房啦。”


我嗓子忽然很干,下意识地咽了一口口水。


佳佳叹了口气,又说:“唉,我也不知道是真是假。但你刚才分析了那么多因素真是好玩,但魔都房价总是变来变去的,你说说到底哪个因素影响最大呢?”


还用说吗,影响最大的因素就TM是你啊!


*注:

1,本文所使用数据均来自公开渠道,包括餐饮点评网站、房价网站、人口普查和经济普查等。

2,本文作者不从事(且未曾从事过)任何不动产中介工作。

3,本文不涉及任何一手房信息,不对任何在售楼盘进行推荐,因此不是软文。

4,本文中提及的人物均为化名,跟现实世界没有任何关系,严禁随意联想!

5,本文作者不对文中观点负任何责任,依据此文购房成功者或失败者均请不要联系作者。

6,本文为《大数据指南:魔都购房攻略系列》的第一篇,接下来有可能对学区房、写字楼、房价长期变化以及多因素综合考量等方面进行探讨,具体看作者的忙碌程度和读者关注度。

7,有意向与城市数据团展开合作研究的读者,请将详细的研究计划和数据需求发送到我们的公共邮箱:metrodata@qq.com。由于近期读者来信较多,我们只会选择最感兴趣的信件回复,请见谅。


END.



城市数据团MetroDataTeam):


一个专注城市数据挖掘与分析的组织;

一个致力学术交流与协作研究的平台;

一个提供政府与企业决策咨询的团队。


请通过以下方式联系我们,

公共邮箱metrodata@qq.com


转载请通过本微信平台联系作者