人工智能会告诉你该选择哪里的房子吗?

“决定房产价值的因素,第一是地段,第二是地段,第三还是地段。”

这是李嘉诚著名的地段论,反应了一个房产投资者的主要决策依据。在现实生活中,无论是买房自住、投资商铺还是租房居住,大家都经常会面临“房子在哪”这样一个对生活影响巨大的问题需要决策。住哪里配套好生活方便?买哪里的升值空间大?哪里还属于刚需洼地?在各个房产社区问的最多的都是这样的问题:

如果有一个像星际迷航科学官Data那样的机器人,你任何时候抛出一个问题,他都能通过全面的数据和缜密的分析告诉你一个最正确的结果那该多美好。可惜,人类的科技水平才刚刚达到能训练好一只下围棋很厉害的狗而已,我们梦想的“人工智能”还很遥远,所以你还不得不去社区咨询一下,虽然你也知道这其实并不靠谱。

让人工智能现实一点

但是,且不要灰心!虽然我们关于人工智能的梦想被众多科幻和影视作品描绘地过于美好,甚至有些计算机科学家和软件工程师们“避免使用人工智能一词,因为怕被认为是在说梦话。” 但是,在人工智能的研究和发展过程中,人们也已经在某些领域的某些点上获得一些突破,AlphaGo的成功就在于在机器学习领域的深度学习这个很适合围棋的学习方法上得到了突破。而这些突破一旦获得,很快地就融入到了计算机科学中去。人工智能的发展已经惠及了数据挖掘、工业机器人、物流、语音识别、医疗诊断、搜索引擎等很多工业领域。

现实一点,如果用上人工智能的技术突破是不是能改善我们的决策过程?

如何做决策

我们先来看看做决策的过程。

我们首先需要信息:交通状况、医疗资源、商业配套、教育学区、物业水平、社区环境、房龄和成熟度、人口密度、周边绿化和污染情况、价格和变化趋势……这些都是选房的重要信息。

我们还需要计算和权衡:我们可能更关注社区和商业配套而对价格容忍度较高,或者非常爱惜生命从而对污染零容忍但是并不怎么在乎学区。每个人都有自己偏好、需要妥协的现实、对成本与收益的计算,这个时候需要结合获得到的信息进行综合的考虑。

如果只依靠人的智力,那么决策者不但要熟悉各种信息和数据,还要身负强大的分析能力。但是,这两部分能力对于普通人来说是不是很容易能够达到?

设想一下有人现在要在上海买房,那就先关注一下某个信息(就比如价格)吧,下面是上海所有社区的相关数据,注意,这已经是经过收集、整理并且分成若干区间后的结果了,现实中每一步都需要自己去完成,但即使是这样能在大脑中把这些信息存储下来并能做到随时查阅似乎也不是易事吧?

况且,这还只是一个数据,而真要做系统性的评估,让结论稍微靠谱一点,需要考虑的因素有很多吧?

即使掌握了相对全面的信息,你确信自己面对一些需要取舍的决策时不会陷入两难境地,短暂地患上选择强迫症?或者干脆迷茫地只能听中介小哥的建议?如果想借助一些科学的决策方法,你觉得大部分人会懂得Hedonic价格模型或者一些基本的区位理论吗?

所以,虽然我们并不指望人工智能已经可以解决一切问题,但作为辅助我们进行决策的手段,我们还是应该利用“机器智能”来帮助我们更容易地作出某些决定。从目前看,主要有大数据方法和机器学习相关的手段在相关的场景中有比较实际的作用。

价格估测及趋势判断

大数据可以说是近年人工智能发展一个很大的助力因素,比如现在很多网站会自动推荐你可能喜欢的东西,很多自动驾驶汽车会自己判断路况做出反应,这些背后都有大数据的功劳。你很容易可以联想到,在选择哪里的房子这个问题上,大数据也有类似的用武之地。

比如关于价格,通过对城市、商圈、小区直至个体的数据累积、分析,互联网可以告诉你该房产价格在类似房源中属于偏高还是偏低,在本区域内是否出于合理区间,甚至预测未来价格变动可能的趋势和幅度。这些基于大量样本的数据统计显然会比中介橱窗贴出的小广告更准确地给出价格相关的信息。

这个时候,一些App或者网站也会理所当然地给你展示几个“你可能感兴趣的房源”或者“看这个房源的人们还去看了些别的什么”的内容,你也应该感到很习以为常了吧。

商圈和地段的画像

在大数据的时代非常流行“画像”,因为很多时候没有办法获得一个对象准确的信息,但是可以使用大数据的方法,通过对象经常使用哪些App、经常浏览哪些网页等等行为来“画”出一个大致的“形象”出来。比如通过分析认为某个设备的主人可能是这样的一个形象:估计这是一个25岁左右的男性,未婚,喜欢上豆瓣撩妹,爱看电影,同时最近很关注买车的信息……接下来,广告商们你们看着办吧。

在研究各种和地理位置相关的信息的时候,也有类似的画像手段,我们称之为“地理画像”。

比如,我们会对某个城市的商圈甚至一些更小的区域进行一系列的统计、指标计算、评分、总结,形成这个商圈或者区域的一个“画像”。比如是我们对上海进行画像的例子:

针对上海大约198个片区,我们通过综合每个片区的各种数据信息,使用了6大类12小类总共37个房产相关的指标进行评价,进一步按照各项指标综合画像,并按照画像的相似程度划分为10种有各自鲜明特点的片区类型。

比如,有的片区属于“中心独立景观住区”,所以适合有“改善需求,并且希望居住城市中心,偏向中高端品质住宅”的人群选择;而有的片区属于“近郊新住区”,那么就适合“高收入蓝领,或者从市区外溢的白领,事业处在上升期”的人群重点考察这类片区。我们通过这样的地理画像,来帮助人们更容易找到符合各自需求的地段。

低风险决策

正如我们现在在选择餐厅的时候很有可能会查看一下大众点评的评价一样,为了避免做一个不明智的决策,我们有时候需要借助他人的意见和已被验证的结论,这也正是大数据可以帮助我们做的一件事情——降低决策风险。

对于房产来说,并不能简单地靠评价或者打分来降低决策风险了,因为现在大家基本上都知道现实中会有“排队演员”,网上也有水军的存在。因此,我们需要更加丰富的数据和方法来辅助我们。

举个例子,如果我们想要入手一个房子,现在的价格是每平米2万,怎么来判断这个价格是不是合理?

这里先谈谈我们给某房地产咨询商做的案例。这是一家国内最有名的房地产开发商(之一)于2015年在上海奉贤南桥做的一个项目,当时在犹豫开盘到底定多少价格合适。从下图看一下就知道这个地方是比较偏远的,开放商自己参考了周边的二手房和一些类似品质的新房,大约单价在1.5万到1.8万之间,因此初步想把开盘价格定在了2万左右。

问题是,我们通过计算机进行地理画像,找到了一些与之相类似的地块,这些地块上最近开盘的类似项目价格远高于这个数字。换句话说,如果相信计算机智能给你的结论,那么这个定价对房地产开发商来说可能是偏低的,因为别的地方类似的情况卖的要比这个价格贵;当然,如果你是个购房者,可能就是捞到便宜了,因为同样的房子你去别的地方买要比这里更贵。

最后项目在2015年中开盘,价格调整为2.3万,结果还是一个上午就全部卖光。2015年12月,该项目附近另一地块以楼面价1.9万的价格溢价220%成为2015年度上海最高溢价率地王,未来该项目预计售价将达到每平米4万。从某种程度上来说,开发商的定价偏低,而购买者享受到了一定的实惠。

所以,如果能够找到几个类似的样本作为参考,你的决策风险是不是大大降低?大数据就是为了能够告诉你到底这些“类似”的样本到底在哪里。

衍生新的数据

计算机决策离不开数据,数据是越丰富越好,越精细越好。问题是,数据总是有缺失和错误,同时很有可能在精度或其它方面满足不了计算需求,该怎么办?

比如,人口的分布在房产决策中非常重要,特别对于一些商业地产来说尤其重要。但是即使是国家统计的人口普查数据,最详细也只能到区县的精度,这对于微观分析来说显然不够精细。

因此,作为人工智能中一个重要的领域,机器学习可以帮助我们从无到有产生很多新的数据来。比如上面的人口数据的问题,我们虽然只能有粗略的统计数据,但是我们从常识大概也会知道,有楼房的地方人多,森林覆盖的地方人少;晚上亮灯的地方人多,晚上黑着的地方人少;商业聚集的地方人多,商业不繁荣的地方人少……有很多数据其实是和人口分布息息相关的,但是这个相关关系非常复杂,而且在不同区域会有很不相同的表现。

对于机器来说,就可以通过机器学习来挖掘出它们之间的复杂关系。在这里,每个和人口相关的因素都是机器学习中一个“学习器”,通过对大量样本数据的反复训练,“学习器”能够学习到这个因素和人口之间关系的模型,通过这些模型的组合最终能够得到人口和这些因素之间的关系,这个关系最终能够帮助我们计算出详细程度能够达到100米精度的超精细人口数据。

未来

其实,已经有越来越多的国外互联网公司开始做和地理位置相关的大数据的探索,背后也大量运用了机器学习等技术。比如,Facebook正在根据所有用户的活动绘制覆盖全球的人口地图;也有一些创新的团队根据大量设备的轨迹跟踪情况来给商业地产提供咨询服务;更有越来越多的互联网企业将相关的“智能”加入到App或者网站中去。相信随着人工智能相关技术的发展,会有越来越多的手段来帮助我们来回答“到底该选择哪里的房子”这样的问题。

——其实,这真的是一个很高深的问题。

欢迎从GeoHey获取地理和位置相关的数据、知识、服务

访问网站 http://geohey.com

联系我们 contact@geohey.com

长按关注公众号

WuYF

Founder & CTO

北京