航空客户价值分析实验说明
一、项目背景
(1)行业内竞争:民航的竞争除了三大航空公司之间的竞争之外,还将加入新崛起的各类小型航空公司、民营航空公司,甚至国外航空巨头。航空产品生产过剩,产品同质化特征愈加明显,于是航空公司从价格、服务间的竞争逐渐转向对客户的竞争
(2)行业外竞争:随着高铁、动车等铁路运输的兴建,航空公司受到巨大冲击。
二、航空公司数据说明
目前航空公司已积累了大量的会员档案信息和其乘坐航班记录。
以2014-03-31为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内有乘机记录的所有客户的详细数据形成历史数据,44个特征,总共62988条记录,数据文件以csv存储。部分数据特征及其说明如下表所示。
特征名称 | 特征说明 | |
客户基本信息 | MEMBER_NO | 会员卡号 |
FFP_DATE | 入会时间 | |
FIRST_FLIGHT_DATE | 第一次飞行日期 | |
GENDER | 性别 | |
FFP_TIER | 会员卡级别 | |
WORK_CITY | 工作地城市 | |
WORK_PROVINCE | 工作地所在省份 | |
WORK_COUNTRY | 工作地所在国家 | |
AGE | 年龄 | |
乘机信息 | FLIGHT_COUNT | 观测窗口内的飞行次数 |
LOAD_TIME | 观测窗口的结束时间 | |
LAST_TO_END | 最后一次乘机时间至观测窗口结束时长 | |
AVG_DISCOUNT | 平均折扣率 | |
SUM_YR | 观测窗口的票价收入 | |
SEG_KM_SUM | 观测窗口的总飞行公里数 | |
LAST_FLIGHT_DATE | 末次飞行日期 | |
AVG_INTERVAL | 平均乘机时间间隔 | |
积分信息 | MAX_INTERVAL | 最大乘机间隔 |
EXCHANGE_COUNT | 积分兑换次数 | |
EP_SUM | 总精英积分 | |
PROMOPTIVE_SUM | 促销积分 | |
PARTNER_SUM | 合作伙伴积分 | |
POINTS_SUM | 总累计积分 | |
POINT_NOTFLIGHT | 非乘机的积分变动次数 | |
BP_SUM | 总基本积分 |
三、项目目标
结合目前航空公司的数据情况,可以实现以下目标。(客户价值资料)
(1)借助航空公司客户数据,对客户进行分类。
(2)对不同的客户类别进行特征分析,比较不同类别客户的客户价值。
(3)对不同价值的客户类别提供个性化服务,制定相应的营销策略
四、项目具体流程和实施方案
航空客户价值画像分析项目的总体流程如图所示。
根据项目流程实施方案拆解如下:
1、数据预处理部分由数据库实现
(1)数据读入:【将将结构化数据导入数据库(62988✖44)】
(2)数据清洗
航空公司客户原始数据存在少量的缺失值和异常值,需要清洗后才能用于分析。
I.通过对数据观察发现原始数据中存在票价为空值,票价最小值为0,折扣率最小值为0,总飞行公里数大于0的记录。票价为空值的数据可能是客户不存在乘机记录造成。
处理方法:丢弃票价为空的记录。
这类数据所占比例较小,对于问题影响不大,因此对其进行丢弃处理。
处理方法:保留票价非0,或者平均折扣率不为0且总飞行公里数大于0的记录。
II.其他的数据可能是客户乘坐0折机票或者积分兑换造成。由于原始数据量大,
(3)特征构建
航空公司会员入会时间的长短在一定程度上能够影响客户价值,所以在模型中增加客户关系长度L,作为区分客户的一个特征。L特征定义为:会员入会时间距观测窗口结束的月数。
其余四个特征可以在原始数据中获取
模型 | L | R | F | M | C |
航空公司 | 会员入会时间距观测窗口结束的月数 | 客户最近一次乘坐公司飞机距观测窗口结束的月数 | 客户在观测窗口内乘坐公司飞机的次数 | 客户在观测窗口内累计的飞行里程 | 客户在观测窗口内乘坐舱位所对应的折扣系数的平均值 |
(4)数据标准化
为了消除KMeans聚类分析量纲的差异,需要标准化训练的特征L、R、F、M、C,采用Zscore形式进行数据标准化,标准化形式如下:

其中
表示每一列的均值,
表示每一列的样本标准差,此处可借助数据库统计函数实现
(5)数据预处理结果和数据挖掘模型训练环节的衔接
2、分析与建模部分由采用数据挖掘大数据平台实现
(1)加载建模数据集
(2)选择适当K值,采用KMeans聚类,进行客户分群
(3)输出各个客户群里的关键特征代表值
(4)输出样本数据的类别标签
3、项目结果解读及应用
(1)对不同的客户类别进行特征分析,比较不同类别客户的客户价值。结合可视化图表如雷达图、分散分布图等对模型的结果进行解读
(2)对不同价值的客户类别提供个性化服务,制定相应的营销策略。

