一、绪论
(一)研究背景
社区创新发展 社区建设 大数据分析 城市大数据
(二)研究目的
1.探索小区新的经营模式,为其提供数据支撑。
2.使用大数据分析手段,找出提高小区服务水平的重点。
3.对比城市其他区域数据,直观感受区域之间的异同。
4.本报告通过小区物业费这一点,对比武汉市城市数据进行全面分析。
(三)研究内容
本研究为武汉市小区经营模式探析。研究首先对武汉市2514家小区及其周边配套的数据进行收集,然后以住宅体系的层次分化作为切入点,具体以2514家小区的物业费作为指标进行关联性研究。通过关联性算法,挖掘数据集中项与项之间的关系,从而得出研究结论。
二、研究设计
(一)研究对象
1.研究对象:武汉2514家小区
2.数据来源:以政府数据对接为主,网络数据采集进一步补充完善
(二)相关概念定义
1.生活区划分
武房大数据依照区域特征,将武汉市中心城区10个行政区进一步细化为62个生活区。这是武汉第一个对生活区进行了地理边界的划分。同时,在空间尺度上完成由小范围高精度、大范围低精度到大范围高精度的变革,进而进行高精度区域研究。
2.数据指标设计
研究指标分为房产指数、生活指数两个一级指标。房产指数包括房屋均价、容积率、绿化率、物业费等二级指标。生活指数包括教育指数、交通指数、环境指数、医疗指数、繁荣指数等二级指标。
本次研究共包括物业费等在内的二级指标11个,三级指标19个。总计共25个项目指标。
三、研究过程
(一)数据展示
泛海国际居住区兰海园物业费在所有小区中位列第一,达到了5元/㎡。前十名中其他九个小区的物业费在3.8元/㎡至5元/㎡的区间范围之内。
(二)数据离散化
对物业费这一指标数据进行离散化处理。再根据支持度和置信度两个度量标准对数据赋予“频繁”和“紧密”的人为定义。支持度和置信度是算法频繁项集挖掘中两个至关重要的因素,也是算法的关键所在。对项集支持度和规则置信度的计算是影响挖掘算法效率的决定性因素,也是对频繁项集挖掘进行改进的入口点和研究热点。
(三)物业费区间对应指标
根据数据五区间等频划分,挖掘数据特征,得出以物业费区间段为条件对应出的各项指标的均值。
(截图为局部数值)
由大数据物业费离散化区间,可以推及武汉市住宅体系层次分化水平程度与空间分布情况。
通过对应指标均值的研究,可以推及不同武汉市层次住宅体系自身房产价值及其周边配套(教育、交通、环境、医疗、繁荣)的完善程度。
(四)变异系数
变异系数是原始数据标准差与原始数据平均数的比,用以衡量数据离散程度的大小。
便利店变异系数最高,达到了17.0%,离散程度在所有指标中最高。
绿化率变异系数最低,为2.9%,离散程度在所有指标中最低。
(五)关联结果
1.关联结果解析
(图为划分5个区间后,以物业费超过1.52元/㎡为前置条件,所产生的关联规则)
置信度是对关联规则准确度的衡量。
支持度是对关联规则重要性的衡量,支持度越大,关联规则越重要。
以规则1为例,表明在物业费超过1.52元/㎡的条件下,有73.5%的房屋房龄小于6年,这条规则的准确性最高;同时满足物业费超过1.52元/㎡且房龄小于6年两项条件的,占有14.7%,这条规则的重要性最高。
四、研究创新
(一)空间尺度上完成由小范围高精度、大范围低精度到大范围高精度的变革
(二)研究粒度上由“以地为本”到“以人为本”的变革。
责任编辑:黄意