使用机器学习的订阅业务的客户流失预测:主要方法和模型

阅读时间:18分钟

客户保留是基于订阅的产品的主要增长支柱之一商业模式.萨斯市场竞争艰难,甚至在一个产品类别中,客户可以自由地选择大量的提供商。几个不好的经历 - 甚至一个 - 以及客户可能会戒烟。如果在剪辑的顾客中流失不满意,那么物质损失和声誉的损失将是巨大的。

对于这篇文章,我们向专家们伸出援手HubSpot的ScienceSoft讨论SaaS公司如何用预测建模处理客户流失问题。您将发现解决此问题的方法和最佳实践。我们将讨论收集关于一个品牌的客户关系的数据,客户行为的特征与客户流失最相关,并探讨选择性能最好的机器学习模型背后的逻辑。

什么是客户流失?

客户流失(或流失)顾客倾向于放弃一个品牌,不再是一个特定业务的付费客户。在特定时期内不再使用公司产品或服务的客户百分比被称为客户流失率.计算流失率的一种方法是将给定时间间隔内流失的客户数量除以获得的客户数量,然后将该数字乘以100%。例如,如果你在上个月获得了150名用户却失去了3名,那么你的月流失率便是2%。

流失率是企业的健康指标,其客户是订阅者,并在重复的基础上支付服务,SCIENCESTOFT的数据分析部门负责人Alex Bekker.“客户(订阅费企业)选择一个特定时期的产品或服务,这可以相当短暂 - 例如一个月。因此,客户保持开放以获得更有趣或有利的优惠。此外,每次目前的承诺结束时,客户都有机会重新考虑并选择不继续公司。当然,一些自然的流失是不可避免的,而且这个数字与工业到行业的不同。但是越来越多的流失,这是一个明确的迹象,即企业正在做错事。“

品牌可能会犯很多错误,从复杂的入门,当顾客不知道产品使用和功能的容易理解的信息,到糟糕的沟通,例如缺乏反馈或延迟回答询问。另一种情况是:长期客户可能会觉得不被欣赏,因为他们得到的奖金没有新客户多。

一般来说,是整体的客户体验定义了品牌认知,并影响了客户如何认识到他们使用的产品或服务的金钱价值。

事实是,即使是忠实的顾客也不会容忍一个品牌,如果他们有一个或几个问题。例如,59%的美国受访者PricewaterhouseCoopers的调查(普华永道)指出,在几次不良经验之后,他们会向一个品牌说再见,其中17%是一个糟糕的经历。

https://lh3.googleusercontent.com/lfdQS66Soc9Cp3QmYNaU576MDtXBBo1_4-R6_RTeOBsBpMjqBICfv2mDqtscdXYNb4UQOmryDLm_iux-hO4kPIsFuYEUmIqC-Y4mA6pWSoiOcvrD2RVXKpMGdAyORDIR8zbJmmoU

糟糕的体验甚至会疏远忠实的顾客。来源:PWC.

客户流失对企业的影响

客户流失很糟糕。但从长远来看,它究竟如何影响公司业绩呢?

说,不要低估甚至百分比的潮流的影响迈克尔RedbordHubSpot服务中心总经理。”在基于订阅的业务中,即使是很小的月度/季度流失率也会随着时间的推移而迅速增长。仅1%的月流失率就相当于12%的年流失率。考虑到获取新客户的成本远高于保留现有客户,那些流失率高的公司很快就会发现自己陷入财务困境,因为他们必须投入越来越多的资源来获取新客户。”

许多调查专注于客户的获取和保留成本。根据这一个邀请在美国,转化率优化公司,获得新客户的成本可能比保留现有客户的成本高5倍。

流失率确实与收益损失和用户获取支出增加有关。此外,他们在公司的增长潜力中扮演着更微妙的角色,迈克尔继续说,如今的买家并不羞于通过评论网站、社交媒体以及点对点网络等渠道与供应商分享他们的经验。HUBSPOT研究调查发现,49%的买家报告在社交媒体上与某家公司分享过自己的经历。在一个商业信任度不断下降的世界里,口碑在购买过程中扮演着比以往任何时候都重要的角色。根据HubSpot Research的同一项调查,55%的买家不再像以前那样信任他们购买的公司,65%的买家不信任公司新闻稿,69%的买家不信任广告,71%的买家不信任社交网络上的赞助广告。”

HubspotResearch统计数据

客户对企业的信任状况一目了然。来源:HUBSPOT研究信任调查

这位专家总结道,流失率高的公司不仅未能与前客户建立良好关系,而且还因产品的负面口碑而损害了未来的收购努力。

对话分析解决方案提供商CallMiner采访了1000名成年人,以了解他们与公司互动的原因和方式。的调查美国企业每年因客户流失而损失约1360亿美元。更重要的是,导致消费者与品牌断绝联系的公司行为本可以得到纠正。

使用案例对客户潮汐预测

如前所述,流失率是订阅业务的关键性能指标之一。订阅业务模型-由英文书籍出版商开创在17世纪-在现代服务提供商中非常受欢迎。让我们快速看看这些公司:

音乐和视频流服务可能是与订阅商业模式最常见的(Netflix,YouTube,Apple音乐,Google Play,Spotify,Hulu,亚马逊视频,Deezer等)相关联。

媒体。在新闻界,数字媒体是必须的,所以新闻公司除了提供纸质订阅外,还向读者提供数字订阅(彭博、《卫报》《金融时报》《纽约时报、中等等)。

电信公司(有线或无线)。这些公司可以提供全方位的产品和服务,包括无线网络,互联网,电视,手机和家庭电话服务(AT&T,Sprint,Verizon,Cox Communications等)。一些专注于移动电信(中国移动,沃达丰,T-Mobile等)。

软件即服务提供者。云托管软件的采用正在增长。根据Gartner.,萨斯市场仍然是云市场的最大部分。其收入预计将增长17.8%,并于2019年达到851亿美元。SaaS提供商的产品系列广泛:图形和视频编辑(Adobe Creative Cloud,Canva),会计(Sage 50Cloud,FreshBooks),电子商务(BigCommerce,Shopify),电子邮件营销(Mailchimp,Zoho竞选活动)和许多其他人。

这些类型的公司可能会使用流失率来衡量跨部门运营和产品管理的有效性。

用机器学习识别风险客户:解决问题一目了然

不断监控人们如何参与产品,鼓励客户分享意见,并迅速解决他们的问题的公司有更大的机会维持互利的客户关系。

现在想象一下,一家一直在收集客户数据的公司,所以它可以用它来识别潜在搅拌器的行为模式,分段这些风险客户,并采取适当的行动来获得他们的信任。遵循客户流失管理使用的主动方法预测分析。这是一个的四种分析类型这需要通过分析当前和历史数据来预测未来结果、事件或价值的可能性。预测分析利用各种统计技术,如数据挖掘(模式识别)和机器学习(毫升)。

“追踪的一个弱点只是真正的流失是它仅作为客户体验差的滞后指示,这是预测流失模型变得极大价值的地方,”注释迈克尔·雷博福来自集中电话。

的主要特点机器学习构建的系统能够发现数据中的模式,无需显式编程就能从中学习。在客户流失预测的背景下,这些在线行为特征表明使用公司服务/产品会降低客户满意度。

https://lh3.googleussercontent.com/purwbwzko1ru9ji29awbnvg7augwqi8cjaqbn8xs624ftzk78l0uxvos51usny72bd9hyob_m0jkxo-0xe1z2xvctkdj5muvznpjlv2u2s9rdh02wrdrtnll4s7rfegxytgdzlmf.

发现有流失风险的客户有助于提前采取措施

ScienceSoft的Alex Bekker也强调了机器学习对于主动流失管理的重要性:“至于识别潜在的钻柱,机器学习算法可以在这方面做得很好。它们揭示了那些已经离开公司的客户的一些共同的行为模式。然后,ML算法根据这些模式和信号来检查当前客户的行为,如果他们发现了潜在的磨床。”

基于订阅的企业利用ML进行预测分析,找出哪些当前用户对他们的服务不完全满意,并在为时不晚的时候解决他们的问题:”在客户续订前11个月确定可能流失的客户,这样我们的客户成功团队就可以与这些客户建立联系,了解他们的痛点,并与他们一起制定长期计划,帮助客户从他们购买的服务中实现价值。”解释迈克尔。

预测流失建模的用例不仅仅是与潜在流失客户的积极接触和选择有效的保留行动。根据Redbord的说法,基于ml的软件允许客户成功经理定义他们应该联系哪些客户。换句话说,员工可以确保他们在正确的时间与正确的客户交谈。

销售、客户成功和市场营销团队也可以使用数据分析中的知识来调整他们的行动。例如,如果客户显示出流失风险的迹象,这可能不是销售人员获取客户可能感兴趣的额外服务信息的好时机。相反,这种粘性应该与CSM一起,这样他们就可以帮助客户重新参与其中,并看到他们当前拥有的产品的价值。与销售一样,市场营销也可以根据客户当前对客户流失风险的指示,以不同的方式与客户进行接触:例如,没有流失风险的客户比目前有流失风险的客户更适合参与案例研究。”HubSpot的专家解释道。一般来说,顾客互动的策略应该以道德和时机意识为基础。而将机器学习用于客户数据分析可以为这一策略提供洞见。

用机器学习预测客户流失

但如何开始进行流失率预测呢?需要哪些数据?实施的步骤是什么?

与任何机器学习任务一样,数据科学专家首先需要数据使用。vwin拳击宝贝根据目标,研究人员定义了他们必须收集的数据。接下来,以适合于构建机器学习模型的形式制备,预处理和转换所选数据。找到培训机器的正确方法,微调模型,选择最佳表演者是工作的另一个重要部分。一旦选择了用最高精度进行预测的模型,就可以投入生产。

数据科学家为构建能够预测客户流失的ml驱动系统而进行的总体工作范围如下:

  • 了解问题和最终目标
  • 数据收集
  • 数据准备和预处理
  • 建模和测试
  • 模型部署和监控

如果您想了解在这些步骤中会发生什么,请阅读我们关于机器学习项目结构.现在让我们看看如何在流失预测的背景下完成这些阶段。

了解问题和最终目标

了解一个人需要从分析中获得什么洞察力是很重要的。简而言之,您必须决定要问的问题,从而解决什么类型的机器学习问题:分类或回归。听起来很复杂,但与我们忍受。

分类。分类的目标是确定一个数据点(在我们的例子中是客户)属于哪个类或类别。对于分类问题,数据科学家将使用带有预定义目标变量AKA标签(churner/non churner)的历史数据——需要预测的答案——来训练算法。通过分类,企业可以回答以下问题:

  • 这位客户是否会流失?
  • 客户会续订吗?
  • 用户会降低一个定价计划吗?
  • 有任何异常的顾客行为迹象吗?

第四个关于非典型行为符号的问题代表了一种分类问题叫做异常检测.异常检测是关于识别离群值——与其他数据显著偏离的数据点。

回归。客户流失预测也可以作为一项回归任务。回归分析是一种统计技术,用来估计目标变量和其他影响目标变量的数据值之间的关系,用连续值表示。如果这太困难-回归的结果总是一些数字,而分类总是建议一个类别。此外,回归分析允许估计数据中有多少不同的变量影响目标变量。通过回归,企业可以预测特定客户可能在什么时间内流失,或者收到每个客户流失的概率估计。

https://lh6.googleusercontent.com/bp8uqb8sguamkyhglmripzfcehlfuhr3trxtlchxejcpxqiegxctyqbj_7kcchmunibumd1_t0qqvirq2vwioovxqfgwsf97qilz2b_uqhsc0enur4dde4oyo2yiu_rvn1mfyl-j.

这是用于预测电信中的流失概率的逻辑回归的示例对数据的科学vwin拳击宝贝.在这里,可视化描述了服务调用的数量和国际计划的使用如何与用户流失相关联

数据收集

识别数据源。一旦确定了要寻找的见解类型,就可以决定进一步预测建模需要哪些数据源。让我们假设你可以用来预测用户流失的最常见数据来源:

  • CRM系统(包括销售和客户支持记录)
  • 分析服务(例如,Google Analytics,Awstats,Crazyegg)
  • 在社交媒体和评论平台上的反馈
  • 对你的组织的要求提供的反馈等等。

显然,这个列表可能更长或更短,这取决于行业。

数据准备和预处理

为解决问题而选择的历史数据必须转换成适合机器学习的格式。由于模型的性能以及所获得的见解的质量依赖于数据的质量,因此主要目标是确保所有数据点都使用相同的逻辑呈现,并且整个数据集不存在不一致。之前我们写过一篇关于数据集准备基本技术如果您想在主题上了解更多,请随时查看此内容。

功能工程,提取和选择。工程特性是数据集准备的一个非常重要的部分。在此过程中,数据科学家创建了一组属性(输入特征),这些属性代表了与客户对服务或产品的参与度相关的各种行为模式。从广义上讲,特征是ML模型用来预测结果的可测量的特征(在我们的案例中,决策与流失概率有关)。

Alex指出,虽然每个行业的行为特征都是特定的,但识别风险客户的方法是通用的:“企业寻找特定的行为模式,以揭示潜在的投机行为。”

数字营销人员和企业家尼尔·帕特尔分类特征分为四组。客户统计数据和支持特性适用于任何行业。反过来,用户行为和上下文特性是SaaS业务模型的典型特征:

  • 客户人口统计特征包含有关客户的基本信息(例如,年龄,教育水平,地点,收入)
  • 用户行为特征描述一个人如何使用服务或产品(例如,生命周期阶段,他们登录其帐户的次数,积极使用产品时使用的时间的活动会话长度,所使用的功能或模块,行动,货币价值)
  • 支持特征这表征与客户支持的互动(例如,发送的查询,互动次数,客户满意度分数的历史)
  • 语境特征表示关于客户的其他上下文信息。

HubSpot的专家们试图通过使用网站访问者、产生的潜在客户和产生的交易等指标来理解“是什么造就了一个成功的客户”。服务中心总经理Michael Redbord说:“我们不仅追踪使用数据(例如,发布一篇博客文章,编辑交易的预计成交价值,或发送一封电子邮件),还追踪结果数据(例如,电子邮件的点击次数,博客文章的浏览量,一个季度内成交的美元价值)。”不仅要了解你的客户如何使用你的产品,还要了解他们看到了什么结果。如果用户不能从产品中创造价值,那么用户流失的可能性就会增加。”

https://lh4.googleusercontent.com/L5ES6_MWyAJUfWPlGHvaxxPwtxLlp09sx3lJkfmceeEaYTVz9iLm0Q0sMF3Zjc5Wlr95NGQEz_mbFlLQV8x3F1RGIZqyRH5wreLntZz-WKtoBumMT-33TZnBkLzcJaQTqKqpkcPq

不同的用户行为、订阅和人口统计特征如何与互联网服务的流失相关Matt Dancho for Rstudio博客

但数据太多并不总是好事。

特征提取旨在通过离开代表最辨别信息的人来减少变量(属性)的数量。功能提取有助于减少数据维度(维度是数据集中属性的尺寸),并排除无关信息。

功能选择,专家修改之前提取的特征,并定义与客户流失最相关的一组特征。作为特征选择的结果,专家有一个只有相关特征的数据集。

方法。ScienceSoft数据分析部门的负责人Alex Bekker指出,诸如排列重要性、ELI5 Python包和SHapley Additive explained (SHapley Additive explained)等方法可以用来定义最相关和最有用的特性。

所有方法的工作原则都在说明模型如何使其预测(基于模型的特征是特定结论的特征。)模型可解释性是该领域的高优先级问题之一,数据科学家不断开发解决解决方案来解决解决方案它。您可以在文章中阅读更多有关可解释性的信息AI和数据科学vwin拳击宝贝推进和趋势

排列重要性是定义特征重要性的方法之一 - 一个功能对预测的影响。它计算在已经培训的模型上。这是如何完成的权限:数据科学家在单个列中更改数据点的顺序,将模型与所产生的数据集进行馈送,并定义变化的程度降低了其准确性。对结果影响最大的功能是最重要的。

另一种排列重要性的方法是从数据集中删除该功能并重新启动模型。

可以使用折射重要性ELI5- 一个开源Python库,允许可视化,调试ML分类器(算法),并解释其输出。

根据这一点eli5文件此方法在不包含大量列(功能)的数据集上最佳地工作。

使用世鹏科技电子(福芙添加剂解释)框架,专家可以解释“任何机器学习模型”的决定。SHACH还为​​每个功能分配特定预测的重要值。

客户细分。增长的公司和扩展其产品范围的公司通常使用先前定义和选定的功能分段为客户。客户可根据其生命周期阶段,需求,使用过的解决方案,参与水平,货币价值或基本信息分为子组。由于每个客户类别共享公共行为模式,因此可以通过使用专门在代表每个段的数据集上培训的ML型号来提高预测精度。

例如,HubSpot使用客户角色、生命周期阶段、自有产品、地区、语言和客户总收入等细分标准。“像这样的细分组合是我们分割账户所有权和定义CSM的方式[客户支持经理]或销售人员的商业书籍“迈克尔说。

此外,有了关于客户价值的知识,员工可以优先考虑他们的保留活动。

在数据准备、特征选择和客户细分阶段之后,就需要定义追踪用户行为所需的时间,然后才能做出预测。

选择一个观察窗口(客户事件历史记录)。预测模型是关于学习在一个特定时间点之前结束的时间段(窗口)所做的观测和在同一时间点之后开始的一个时间段的预测之间的关系。前一阶段被称为观察独立的解释性窗口,或客户历史事件(让我们使用最后一个清晰度)。后续观察的后期被称为a性能依赖,或响应窗口.换句话说,我们预测未来性能窗口中的事件(用户变动或停留)。

https://lh4.googleusercontent.com/AiDClIh0RA-qBAtrlnQEtL440zrTQV2vJ1SrE9_CGn4rVwFtRpGofGNl65NM-wIQdlKCjKl5U5-FnjlDXU5KS0gHVOJztoU6NBuZU9SkHdZd6Unkt0whyjrAcP3psXAyBc4bCE8j

定义正确的事件历史和观察窗口是至关重要的

Spotify的机器学习工程师Guilherme Dinis, Jr.在他的硕士论文,研究了新的Spotify用户注册的自由计划的行为,以定义他们在注册后的第二周离开或保持活动。

他选择了作为事件历史的第一周的使用。将用户归类为Churners和Active Users Guilherme检查第二周是否存在任何流媒体活动。如果用户继续倾听音乐,他们被归类为非搅拌器。

“保持观察的原因[事件历史]和激活窗口[性能窗口]相对较小的是通过内部关于同一用户群体的内部研究,其中注册后两周内表现出高搅拌概率,“工程师解释道。

因此,要定义事件历史寿命和性能窗口,必须考虑用户通常何时流失。它可能是第二周,就像Spotify的例子,也可能是年度订阅的第11个月。但最有可能的情况是,你不会想知道这个用户可能会在一个月内流失。因为你重新参与的时间非常短。

平衡观测和预测的时间实际上是一项棘手的任务。例如,如果观察窗口是一个月,那么对于每年订阅的客户来说,性能窗口将是11个月。似乎短时间的事件历史和长时间的性能窗口对企业来说是最有利的。你很少花时间观察,有足够的时间重新接触。不幸的是,它并不总是这样工作。一个短暂的事件历史可能不足以做出可靠的预测,所以试验这些参数可能会成为一个反复进行的权衡过程。基本上,您必须定义足以让模型做出合理预测的事件历史,但仍然有足够的时间来处理潜在的变动。

建模和测试

该项目阶段的主要目标是开发一个流失预测模型。专家通常培训众多模型,调整,评估,并测试它们以定义检测潜在搅拌的潜在培训级别的培训数据。

经典的机器学习模型通常用于预测客户流失,如logistic回归、决策树、随机森林等。来自ScienceSoft的Alex Bekker建议使用随机森林作为基线模型“可以评估这种模型的性能,XGBoost,LightGBM或Catboost。”数据科学家通常使用基线模型的性能作为衡量标准来比较更复杂的算法的预测精度。

逻辑回归是一种用于二进制分类问题的算法。它通过测量从属变量和一个或多个独立变量(特征)之间的关系来预测事件的可能性。更具体地,Logistic回归将预测属于默认类别的实例(数据点)的可能性。

一种决策树是一种受监督的学习算法(具有预定义目标变量。),而主要用于分类任务,它也可以处理数值数据。该算法基于输入变量中的最重要的微分器来将数据样本分成两个或更多个均匀组以进行预测。通过每个拆分,正在生成树的一部分。结果,开发了一种具有判定节点和叶节点的树(这是决策或分类)。树从根节点开始 - 最好的预测器。

https://lh5.googleusercontent.com/kUHT_tBdaj_bYhlLDghuBtHO2mmmhvbKL3OHZLYXFxLPw1rGmCWzk5fBru0DFnkm_j6qSTy8AjSXmUjs_jGtDffCT0qWsWr54ldBbLjBBQeEscvEBXmkFoGse4hjeJgjpmdeuHtm

决策树的基本结构。来源:Python机器学习教程

决策树的预测结果可以很容易地解释和可视化。即使没有分析或数据科学背景的人也可以了解某种输出出现的情况。vwin拳击宝贝与其他算法相比,决策树需要更少的数据准备,这也是一个优势。但是,如果在数据中进行了任何小型更改,它们可能是不稳定的。换句话说,数据的变化可能导致正在产生彻底的不同的树。为了解决这个问题,数据科学家在群组中使用决策树(AKA合奏),我们将讨论下一步。

一种随机森林是一种使用众多决策树来实现更高的预测精度和模型稳定性的集合学习方法。该方法处理回归和分类任务。每棵树都根据属性对数据实例(或类或票数)进行分类,林选择收到最多投票的分类。在回归任务的情况下,采取了不同树木的平均值。

https://lh5.googleusercontent.com/vJ07sfWVAFDFi0eHfGz0ohxA4x3aov1-DyhS6S65ZvxoOrd6WU7AEK69w_3lJiu40Qxez2KBqAqShixLp7ByIKk51pCf1Z4kQfXYwiOlaU-olvULRyeHvitEAOJI9hwLPC6o96eY

这就是随机森林预测的方法。来源:ResearchGate

XGBoost.是渐变提升树算法的实现,通常用于分类和回归问题。梯度升压是由一组较弱的模型(树)组成的算法,其总结了他们的估计,以便更准确地预测目标变量。

一种组研究人员从弗吉尼亚大学研究了时间依赖的软件功能使用数据,如登录号和注释号,预测在三个月的时间范围内的SaaS客户流失。作者在四种分类算法中进行了模型性能,以及“XGBoost模型在识别最重要的软件使用特性和将客户划分为流失类型或无风险类型方面取得了最好的结果。”研究人员表示,XGBoost模型能够定义代表客户如何使用SaaS软件的最重要特性,这可以帮助服务提供商在锁定潜在客户时开展更有效的营销活动。

LightGBM是一个使用基于树的学习算法的梯度增强框架。它可以用于许多ML任务,例如,分类和排名。根据文献,LightGBM的一些优点是更快的训练速度和更高的效率,以及更高的准确性。这些算法使用较低的内存,处理大量的数据不明智的在少于10,000行的数据集上使用它们。LightGBM还支持并行和GPU学习(使用图形处理单元来训练大型数据集)。

CatBoost是在决策树库上的另一个渐变升级。它处理数字和分类功能,因此可用于分类,回归,排名和其他机器学习任务。Catboost的一个专业权是它允许使用CPU和两个或更多GPU的培训模型。

技术的选择。许多因素可以影响生产中所需模型的数量及其类型。虽然每个公司的案例都是独一无二的,但通常管理客户数据和业务需求的方法都有重量。预测技术的选择可能取决于:

  • 客户生命周期阶段。例如,HubSpot的专家得出结论,车型的选择可能取决于客户和品牌之间的互动阶段。“船上客户通常不会显示与使用Hubspot超过一年的客户的价值指标。因此,在超过一年的客户上培训的模型可能对这些客户来说非常适合,但在应用于诸如船上的客户时,不准确,“HubSpot的迈克尔解释道。
  • 需要输出说明。当公司代表(例如客户成功经理)必须了解客户流失的原因时,可以使用所谓的白盒子技术,如决策树、随机森林或物流回归。提高可解释性是HubSpot选择随机森林的主要原因之一。有时仅仅检测客户流失就足够了,例如,当公司管理层需要估计下一年的预算,同时考虑到客户流失可能造成的损失时。在这种情况下,可解释性较差的模型将起作用。
  • 客户角色。设想一个提供大量产品的公司,每个产品都设计了特定的用户类型。由于不同的客户角色可能有典型的行为模式,使用专门的模型来预测他们流失的可能性似乎是合理的。Michael Redbord补充道:在一个不断增长的业务中,客户群的性质将不断变化,特别是在引入新产品时。当新的客户角色进入客户基础时,建立在一组客户之上的模型可能不能很好地工作。因此,当我们引入新的产品线时,我们通常会建立新的模型来预测这些客户的流失。”

部署和监控

现在,是流失预测项目工作流程的最后阶段。选定的型号/型号需要投产。一个模型可以合并到现有的软件中,或者成为一个新程序的核心。然而,部署后就忘记的方案是行不通的:数据科学家必须跟踪模型的准确性水平,并在需要时改进它。

“通过机器学习预测客户流失和人工智能是一种永无止境的迭代过程。我们监控模型性能并根据需要调整功能,以提高客户的团队给我们反馈或新数据可用时提高准确性。在任何人类互动的地方-支持电话,CSM QBR(季度商业评论》(harvard business review),销售发现呼叫-我们监测并记录对客户帮助的人工解释,这增强了机器学习模型,提高了我们对每位客户健康预测的准确性。”总结了迈克尔。

测试模型性能的频率取决于数据在组织中过时的速度。

结论

流失率是基于订阅的公司的健康指标。识别不满足的解决方案的客户的能力允许企业了解产品或定价计划弱点,运营问题以及客户偏好和期望,以积极降低流失原因。

定义数据源和观察期非常重要,以完整的客户交互历史。选择模型最重要的功能将影响其预测性能:数据集的定性越多,更精确的预测。

客户群和众多产品的公司将受益于客户细分。ML模型的数量和选择也可能取决于分段结果。数据科学家还需要监控部署的模型,并修改和调整功能以保持所需的预测精度水平。

添加一个评论

注释

《阿凡达》