当前位置: 首页 > 后端技术 > Python

用Python分析广州房地产市场

时间:2023-03-26 12:03:34 Python

大家好,我叫查理。好久没发帖了,向关注我的人道歉。这次想结合房地产业务,用Python对广州市的城市进行数据分析,希望能给大家提供一些分析思路。为什么要分析房地产市场?房地产业具有鲜明的地域特色。从房地产企业的角度来看,城市的选择在一定程度上决定了投资的成败。因此,研判一个城市的市场非常重要。早在几年前,同样的资金配置在南京和长沙两座城市,投资回报相差巨大。2017-2019年南京、长沙二手房(元/㎡)那么,我们应该如何分析房地产市场呢?我从数据分析的角度,总结整理了自己的思路。我认为分析一个城市的房地产市场应该包括四个方面:城市经济、相关政策、土地市场和房地产市场。城市经济反映了一个城市的经济实力和潜力,可细分为以下指标:人均GDP和单位面积GDP、人均财政收入和单位面积财政收入、高净值人群规模、人口净流入和第三产业比重。配比、产业互补性、房地产投资依存度、城市友好度等。政府制定的政策也对房地产市场产生巨大影响。相关性高的政策包括金融政策、人口政策、土地政策和购房政策。最后是城市土地市场和房地产市场的分析,这也是整个分析的核心部分。房地产市场分析框架接下来,我将结合Python,以广州为例,尝试分析广州的土地市场和房地产市场。关于城市经济及相关政策的分析将在以后的文章中进行介绍。广州土地市场分析土地市场包括一级市场和二级市场。一级市场是土地使用权流转市场,即国家通过其指定的政府部门将城市国有土地或农村集体土地出让为国有土地。用户市场,出让土地可以是生地,也可以是开发完成“七通一平”的耕地。二级市场是土地使用权出让后的再交易。土地使用者将达到指定的、可交易的土地使用权,进入流通领域市场进行交易。限于篇幅,本文仅分析一级土地市场的数据。获取土地数据土地市场数据一般在当地公共资源交易中心公布,但也常有只公布当周或当月数据的情况。因此,我们可以去专业的土地网站获取交易数据。本文以途流网为例。这个网站结构简单,简单的url翻页结构,然后用xpath解析数据。限于篇幅,爬虫代码不做详细描述,只提供核心代码。defmain():forpageinrange(1,46):#这里设置页数url='https://www.tudinet.com/market-213-0-0-0/list-o1ctime-pg{}.html'.format(page)print(url)headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/70.0.3538.77Safari/537.36',}response=requests.request("GET",url,headers=headers)#print(response.status_code)如果response.status_code==200:re=response.content.decode('utf-8')print("Extracting"+str(page)+"page")time.sleep(random.uniform(1,2))print("-"*80)#print(re)parse=etree.HTML(re)#解析网页项目=parse.xpath('.//div[@class="land-l-cont"]/dl')parse_page(items)iflen(items)<10:print('Gettingdone')breakif__name__=='__main__':time.sleep(random.uniform(1,2))main()运行爬虫代码并提取广州1238块土地经过简单清洗后的数据如下:土地数据分析近10年土地交易情况广州土地招拍挂交易2011-2020年广州土地招拍挂未售出和未售地占规模一半,成交地仅占49.71%,整体成交率不高。未签约的原因主要集中在无意向投标人、投标未达到规定底价等方面。广州近10年土地成交面积(万平方米)2011年至2016年,有广州土地成交量极少,2016年规划建设面积仅为77.3万平方米。2017年之后,交易规模开始进入高潮,2018年计划交易建筑面积达到1635.5万平方米。2019年以来广州土地拍卖挂牌面积(万平方米)从各月土地成交量来看,2019年上半年广州土地拍卖市场较为淡静,开始回归年中后正常。2019年底,土地拍卖市场进入火热状态。2019年11月和12月分别出售了21块和38块土地。土地交易结构近10年广州土地交易占比(%)近10年广州土地交易主要为工业用地、其他用地和住宅用地。工业用地占比高达41.19%。企业发展的重要推动力。土地交易面积广州各区近10年土地招拍挂交易面积(万㎡)从交易面积来看,南沙区和番禺区每年都有一定数量的土地交易,而越秀区和天河区土地成交较少。2020年以来,南沙区土地市场火爆,成交面积远高于广州其他区域。广州房地产市场分析房地产市场分析主要包括新房和二手房交易市场。由于一般房地产信息发布平台上的二手房数量远大于新房,为了尽可能获取大样本数据,提高分析的准确性,本文采用广州二手房-用于房地产市场分析的手房交易数据。获取二手房数据本文使用Python获取方天下发布的广州二手房交易数据。方天下的爬虫也比较简单。爬虫的逻辑类似于贝壳找房子。唯一需要注意的是遍历一个子区域后跳转到下一个子区域的处理。核心代码如下:defmain():#Zengchenga080;番禺a078;南沙a084;花都a0639;白云a076;海珠a074;越秀a072;荔湾a071;天河a073;','a078','a080','a0639','a076','a074','a072','a071','a073','a079','a075']#regionfordistrictindistrict_list:forpageinrange(1,101):#这里设置页数url='https://gz.esf.fang.com/chengjiao-{0}/i3{??1}/'.format(district,page)print(url)headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/70.0.3538.77Safari/537.36',}response=requests.request("GET",url,headers=headers)ifresponse.status_code==200:re=response.content.decode('utf-8')print("Extracting"+district+'th'+str(page)+"page")time.sleep(random.uniform(1,2))print("-"*80)#print(re)parse=etree.HTML(re)#解析网页items=parse.xpath('.//div[@name="div_houselist"]/dl')parse_page(items)iflen(items)<30:#遍历子区域后跳转print('采集完成')breakif__name__=='__main__':time.sleep(random.uniform(1,2))main()代码运行了几分钟,提取了22170套广州二手房数据。简单清洗后,部分数据展示如下:分析二手房数据近五年广州二手房数量及价格走势从广州近年二手房量价走势来看,房价从2015年开始一路上涨,2018年二手房均价达到3.5万元/㎡。不过,二手房成交量已达近年高峰,全年成交8940套。2020年1-6月广州二手房量价走势2020年1-6月,广州二手房均价与2019年基本持平,成交量方面,仅70秒-2月份受疫情影响,手头的房子卖掉了。3月以来,疫情逐步得到控制,房地产市场向好。6月,二手房成交1337套。房价分布2020年上半年广州各区二手房均价(元/㎡)从房价分布来看,1-10月二手房均价最高区域2020年6月为越秀区和天河区,均价分别为46767.52元/㎡和46433.89元/㎡。从化区房价最低,仅为12190.67元/㎡。房产交易TOP202020年1-6月广州二手房交易TOP20房产交易从房产交易来看,2020年1-6月广州二手房交易量最大的楼盘是锦绣增城区天伦花园,共售出78套。成交均价18565.40元/㎡。相关性分析importpandasaspdimportmatplotlib.pyplotaspltimportmatplotlibasmplimportseabornassns%matplotlibinlinesns.set_style('white')#设置图形背景样式为白色df=pd.read_excel("D:\data\realestatedata分析\广州二手房.xlsx")df=df[['房间','大厅','面积(㎡)','楼层数','成交单价(元/㎡)']]#选择requiredcolumndf.rename(columns={'room':'room','hall':'hall','area(㎡)':'area','floors':'floor','成交单价(元/㎡)':'价格'},inplace=True)fig,axes=plt.subplots(1,2,figsize=(12,5))sns.regplot(x='房间',y='价格',数据=df,颜色='r',标记='+',ax=轴[0])sns.regplot(x='大厅',y='价格',数据=df,颜色='g',标记='*',ax=axes[1])广州近五年二手房卧室数、面积、楼层与房价的关系。通过绘制广州二手房的回归图,我们发现广州二手房的卧室数和面积与房价的相关性不大。房子的floor和房价看似有很强的正相关,但实际上是受三个异常值的影响,没有相关性。广州房地产市场板块从广州土地市场来看,近年来土地市场回暖,尤其是南沙区和番禺区的土地市场成交趋稳,未来仍有发展潜力。从房地产市场来看,2019年以来广州二手房价格变化不大,维持在3万元/㎡左右。疫情之下二手房交易受挫,部分房企试图以价换量获取更多销量。疫情逐渐得到控制后,二手房交易明显回暖。市中心房价居高不下,而广州以北的从化和增城房价相对较低,仍有上涨空间。免责声明1.本数据分析仅供学习研究之用,所提供的结论仅供参考;2.作者对房地产行业了解甚少,相关描述可能存在不完善之处,请勿妄加揣测。