如何快速挖掘商圈人口特征?| 极海人口数据洞察

这是一张 #五角场 商圈全部客群的人生阶段分布图:

就绝对占比而言,上班族的占比最高,达到52%,大学生的占比仅为21%,五角场商圈在 #人生阶段 这一标签上的第一人口特征应该是“上班族”

但很多人对五角场商圈的第一印象却是“大学生”,周边高校云集,带来了大量的学生客群。这种印象也是对的,因为如果我们将商圈内大学生的占比(21%)与城市平均水平(5%)进行对比就会发现,商圈内大学生客群占比城市平均水平高3倍以上,与之相对应的上班族,仅仅高出29%。

说明:可能有很多人知道TGI这个指标,用于衡量特定群体与平均水平差异,TGI指数 = 区域内某一特征群体所占比例 / 城市中具有相同特征群体所占比例 * 100,可以很好的衡量该群体在区域内是否强势。但这里我并没有使用这一指标,因为经过我的观察,使用正负百分比衡量高低要比判断一个数值是不是大于100要简单的多,也更加符合大多数人的认知习惯。

两种角度都有其自洽的逻辑,但却是你挖掘商圈人口特征首先需要判断的问题 —— 用什么样的标准定义一个商圈的人口特征?是绝对值还是相对值?

这种选择常常发生在不同标签样本基数存在差异的数据上,我们这里再举个更好理解的例子。你认为五角场商圈更吸引男性还是更吸引女性?

从绝对值上上判断,五角场商圈的男性占比56% 要高于女性占比44%。但相比于城市平均,却是女高男低,商圈对女性更有吸引力(虽然差距很小)。

回到刚刚的问题,我们应该用什么样的标准定义商圈的人口特征呢?在实践中,我更倾向于使用差值。一是因为差值在一定程度上综合了绝对值和相对值两个指标(差值 = 绝对值 * 相对值),二是因为差值更不容易受到极端值的影响。

在前面的例子中,相较于城市平均,大学生的差值为16%,上班族的差值为12%,虽然上班族占据绝对多数,但大多数商圈都是如此,特征强度不如大学生。

如果你认可这一标准,理论上可以通过逐一查看每一标签下标签值的差异将突出的人口特征记录下来,然后再进行最后的比较。但这样的效率实在太慢了,这里我们提供了一张汇总商圈人口画像特征的图表,让我们可以在一张图上快速识别特征人群。

看懂这张图,我们需要先明确两个指标:

  1. 多于值:即差值,即 区域占比 - 城市占比)
  2. 高于值:即相对值,即 (区域占比 / 城市占比 -1)*100%

我们首先筛选出多于值≥5% 或 高于值≥50% 的标签值,这里之所以并没有完全舍弃相对值是因为我们将给出特征强度TOP3的标签值,相对值可以作为有益的补充。

接下来我们按标签名称(如 #性别 是标签名称,男/女 是标签值) 对筛选出来的标签值进行汇总,计算这些标签值汇总后的绝对值占比、多于值和高于值。

最后我们按汇总后 多于值 的大小对这些标签名称进行排序,图中条形图的长短代表着标签值的多于值,标签名称越靠前意味着该客群特征越显著。

现在我们就可以快速从这张图中总结出该客群的人口画像特征了!

1、五角场商圈最显著的特征是大学生、上班族占比高,尤其以大学生最为突出。二者在商圈内的占比达到73%,多于城市平均水平28%,高于城市平均水平61%。

2、有车客群占比高,达到68%,多于城市平均水平18%,高于城市平均水平35%。

3、餐饮消费水平中等,这里的中等是指100~200之间,在图表的最后有说明。

4、客群外出餐饮消费和逛商场的频次较高。

……

最后,如果对这一模块感兴趣,可以复制下面的链接在网页上打开查看,如果你也也想针对你关注的区域制作相关人口数据报告,也欢迎添加极海小助手与我们联系!

https://stores.geohey.com/insights/mall.html  
测试账号:geohey
测试密码:geohey@2024!

本文也同期发表于极海品牌监测公众号。