当前位置: 首页 > 科技观察

酒店通过机器学习预测哪些客人会放鸽子

时间:2023-03-18 23:37:40 科技观察

现在各大OTA(OnlineTravelAgency)平台极大地方便了人们的出行、酒店住宿、景区门票等,您只需轻松完成预订一个指头。拥有数十家国内外酒店、民宿预订平台。为了吸引更多用户预订,这些平台会鼓励商家设置更宽松的取消政策,比如随时免费取消,或者限时免费取消等。Booking,销量最大的在线酒店预订网站世界上最多的房间,因为可以免费取消的优势而深受旅行者的欢迎。不过,对于用户来说,“免费取消”是一件很美好的事情,但是对于酒店来说,却是一件大事。临时取消订单通常会给酒店带来以下损失:取消的房间不能及时售出,酒店失去收益;酒店以较低的价格出售取消的房间,减少了利润。分销渠道成本;在用户可以随时放出酒店信鸽的情况下,酒店有什么办法尽可能减少损失?葡萄牙商业分析师(BusinessAnalyst,简称BA,这个职位相当于IT公司Manager的产物)ManuelBanza,拥有超过5年的酒店管理经验。利用欧洲酒店预订平台的公开数据,他发现了更容易取消订单的用户特征,从而帮助酒店及时止损。从近120,000份酒店预订数据中发现规律作为一名数据科学爱好者,ManuelBanza从数据科学和机器学习入手。他首先对一个“酒店预订需求数据集”(Hotelbookingdemand)进行了综合分析。该数据集包含普通酒店和度假酒店的32个维度的数据,包括:用户国籍、预订时间、住宿时间、成人和儿童或婴儿人数、订单最终是否取消、取消总次数用户在此订单前的订单信息等HotelBookingDemand酒店预订需求数据集发布者:葡萄牙里斯本大学收录数量:共119,390条数据,32维数据格式:csv数据大小:16.9MB(压缩文件1.3MB)地址:https://hyper.ai/部分数据在datasets/14866通过统计,ManuelBanza发现有不少用户在一年内取消了酒店预订。2018年OTA平台Booking有49.8%的预订单被取消;在HRS集团,这一比例甚至高达66%。总体来看,2018年多个平台的平均预订订单取消率达到39.6%各预订渠道取消订单比例接下来,笔者对数据进行了探索性分析,发现:与普通酒店和度假酒店相比,订单更有可能被客人取消;春节和夏季取消比例较大,冬季取消比例最低;各种预订渠道中,用户在OTA平台下单最多,同时在OTA平台取消订单最多;用户预订时间越早,不确定性越大,取消的概率也越大作者表示,预订时间是分析酒店收入表现时最重要的指标之一。分析结果显示,提前1年以上预订的取消概率最高,为57.14%;一周内预订的取消概率最低,为7.73%。提前预订的天数(横轴)与取消订单的概率(纵轴)成正比。似乎越早计划,就越跟不上变化。建立一个模型来预测订单取消。第一步:数据清洗首先对数据集中的缺失值进行处理。如果变量是数字,则这些缺失值必须替换为特征的平均值,如果变量是分类变量,则必须替换为常量。然后删除reservation_status(预订状态,这个变量代表订单是否取消,0不取消,1取消),因为这是机器学习模型会预测的值。第二步:选择最佳模型在开始测试数据的最佳算法之前,按8:2的比例拆分数据集。然后80%的数据将用于训练模型,20%的数据将用作验证集。在数据科学中,预测订单取消是一个监督分类问题,也称为二元分类。因此,作者选择了LightGBM、CatBoost、XGBoost、H2O等现有的几种二元分类模型进行训练和对比,最终选择了实验效果最好的模型CatBoost。通过CatBoost的预测结果,发现以下几点:如果用户的国籍是葡萄牙,取消订单的可能性很大。但是,对于团体预订,酒店一般不会提前得到每个人的国籍信息。如果取消预订,大多数酒店会将其国籍默认为酒店所在的国家/地区。因此,此信息仅供参考,不一定准确;与至少提出过一项特殊要求的用户相比,未提出过特殊要求的用户更有可能取消订单;lead_time(预订时间和入住时间之间的天数)值越低,预订被取消的可能性就越小(这个预测与之前的数据分析一致)。欧洲之星博物馆是葡萄牙的热门酒店,店内有考古展览。多个OTA平台上线,支持在线预订和免费取消。取消之前,我先救一波。利用这种预测模型,酒店可以提前知道哪些用户有可能取消预订,并及时采取补救措施。比如提前联系取消可能性较大的用户,通过沟通,让他们尽早取消,给酒店留出更多时间卖房。或者,你可以接触到容易取消的用户,告诉他们酒店的好东西,给他们一些入住奖励,尽量挽救他们。