北京房价分析报告

北京市房地产市场是我国最为发达、最具有代表性的房地产市场之一。为了对房价有个更深入的了解,本人从极海数据平台获取了三个月来的北京二手房成交数据共计26851条,对房价的影响因素进行分析.

1.首先通过极海数据云平台做出成交房价的分布图,可以看出,北京市二手房成交价格呈现明显的圈层结构,离中心区域越远房价越低,同时表现出北侧房价高于南侧的现象。

2.该现象与我们的认知相一致,不看图我们也能知道。那真正影响房价的因素是啥呢?幸好数据的维度还是蛮多的,下面将从空间区位、交通设置、户型几个维度,探索性的分析房价的影响因素。以我们最关心的单位面积房价(单位:万元/平方米)作为因变量来进行研究。

从图中可以看出,单位面积房价是呈现左偏分布。具体地,单位面积房价的均值为61848万元/平方米、中位数为56742万元/平方米,其中4-6万元房屋成交量占总成交量的67%,10万以上的房屋成交占总成交量的10.6%,可以看出存在部分高价房拉高了房价的平均水平。案例中,单位面积房价的最小值为1.6万元/平方米,所对应的房屋是房山区华典家园的一个三室二厅,总面积147.52平米;最大值为14.98万元/平方米,所对应的房屋是西城区阳光丽景的一套三室二厅,总面积136.08平米。

这么高的房价也只能让我们北漂一族暗自唱一首凉凉了。闲话少说,继续分析,先把数据分为两类,一类是内部因素,包括卧室数、厅数、所属楼层、房龄、房屋面积等。另一类是区位因素,包括所属城区、是否邻近地铁、是否学区房等。一图胜千言,先做个图看看成色,这里针对内部因素做了几个分组箱线图,可以对此类数据有个直观性的理解。

1) 卧室数、客厅数对于单位面积房价的影响并不十分明显。


2) 这里有代表性的选取了昌平区、丰台区、朝阳区、海淀区、西城区来展示房价与城区的关系,可以看出,城区的房屋单位面积房价差异较大,离中心区域较近的朝阳区、海淀区和西城区的单位面积房价较高,较远的昌平台、丰台区房价偏低。

3)地铁房价格偏高

4)单位房价房龄成正相关,而与房屋面积成负相关。其实房龄与房价成正相关,还有些出乎意料,不过细想,北京的老房子集中的区域可能距离中心区域很近,现在二环内都不让开发,那房价还真是“越老越妖”啊。


通过对本案例数据的描述性分析可以推测:对单位面积房价可能会产生影响的因素包括:区位因素(城区、地铁设施)和内部因素(卧室数、客厅数、面积、房龄等);从影响作用来看,区位因素比内部因素更为明显;其中地铁设施、面积、房龄对于单位面积房价的影响较为明显,所在城区影响力最大。

3.从房价的空间分布来看,以城区来进行计算其实有非常大误差、同样是海淀区,那三环的房子跟五环的相比相差非常大,从房价的分布图也可以看出此类现象,幸好极海的数据每条数据都有地理坐标,那我们就以天安门为中心,看一下与天安门的距离与房价呈现怎样的一种发展趋势。

从图中可以看出,房价与距离呈现一种较为明显的负相关关系,与天安门的距离越远,房价越低,这个结果会对我们的模型构建提供帮助。除此之外,我们还对房屋的朝向、电梯、开发商、楼层,此类指标进行了分析,发现与房价的关系均不明显。

4.找到了影响房价的主要因素,接着我们就以房价为因变量,以房屋距离天安门的距离、房龄、与地铁站的距离、房屋面积为自变量,构建多元线性回归方程,对房价进行评估。由于房屋面积、与地铁站的距离、距离天安门的距离与房价的关系接近二次关系,所以我们构建了二次的多元线性回归方程。

这些结论与之前的猜想基本符合。而且模型的F检验拒绝原假设,说明建立的模型是显著的;调整的R2为0.54,模型的拟合程度尚可接受。
由于自变量与房价并非线性关系,所以比较房价时需要确定比较基准,可以得出以下结论:

对于房龄这一变量,每增加一年价格高出94元;

对于房屋面积这一变量,假设以60平米为基准点,那61平方价格降低5000元。

对于与地铁站的距离这一变量,以2千米为基准点,2.5千米,房价降1287元;

与天安门的距离,以7千米为基准点,那增加8km的房子 房价降低1069元。

最后,假设有一家三口,父母为了能让孩子在海滨区上学,想入手一套西三环北路105号的一套房龄60年、46平、一室一厅的房子,该房子距地铁600米,距离天安门9.5公里,那么房价大约是多少呢?根据交互模型,预测的到的单位面积房价为77479 元/平方米,总价高达 356 万元。

由于房价的影响因素有很多,因此未来的研究中可以考虑在模型中加入更多因素,小区环境(绿化情况、容积率)、周边配套设施(商圈、医院)等因素,开展进一步的研究。