这是一项具有挑战性的任务,但并非不可能。在我们最近专注于美国汽车行业的工作文件中,我们能够将市场份额的变化直接归因于在线产品评论的定量和定性部分。
一、分析线上评论
我们研究了2002-2013年间416个汽车型号的数据。对于每一种车型,我们从消费者的角度捕捉最相关的考虑因素,包括价格、马力、尺寸和每美元的里程数。然后,我们通过将每个特征插入一个计量经济学模型来模拟客户的决策。这样,我们就可以考虑到汽车本身的任何特征,这些特征可能解释市场份额的上升或下降。我们通过用每年售出的汽车数量除以总市场规模(即当年美国家庭的数量——因为每个家庭都需要一种交通方式)来衡量我们数据集中汽车的市场份额。
我们还从一个领先的行业网站上获取公开的消费者评论。每个车型在发布当年平均有45条相关评论;最受欢迎的车型有近600条。
像大多数产品评论一样,我们研究的评论包括星级评定(一到五星)和文本部分(评论者可以留白)。我们没有把评论的这两部分视为相同的内容,而是对文本部分进行了机器学习(ML)的情感分析。在通过亚马逊的Mechanical Turk招募的人的帮助下,ML模型得到了训练,他们对评论的样本集进行了积极或消极的评分。
消费者评论的分叉性质被证明是至关重要的。孤立地看,星级评价对汽车市场份额的影响表现为综合评价的回报递减,这意味着当汽车评价已经很高时,较高的评价对市场份额的影响可以忽略不计。因此,一辆五星级的汽车比四星级的汽车在网上看到的需求冲击要小,这没有什么直观的意义。
然而,当我们研究星级和情感评级的相互作用时,情况就变得更加清晰了。回报递减的影响曲线变成了一条陡峭的上升线,但只适用于那些有高情感评分的模型。换句话说,高星级对市场份额的影响被书面评论的整体情绪所调节。如果没有文字推荐的语料库,好的星级评价对消费者来说意义不大。
二、双系统思维
我们把情感和星级的联合效应比作丹尼尔·卡尼曼在其畅销书《思考,快与慢》中推广的人类认知的“系统1”和“系统2”框架。系统1(快速和直觉)思维对应的是综合星级评价,它给出了一个快速的众包产品质量印象。系统2(深思熟虑和理性)涵盖了书面评论,它要求作者和读者都付出心理努力。在卡尼曼的框架中,系统2负责认可或重新评估系统1的自动印象,然后将其转化为信念和行动。
当我们看到一个过于接近完美的星级评价时,我们的怀疑心会引导我们到书面评论中去寻找佐证。如果文本中的热情没有评级那么令人印象深刻,我们可能会从决定的边缘退后一两步,考虑其他的选择。
我们在排除了几个备选方案后发现了支持这一解释的经验证据。例如,我们控制了过去的评论对现在可能产生的影响,也就是说,同一款车的前几款车型的受欢迎程度可能会给当前车型的评论内容带来色彩,或者说,早期发布的评论可能为后来的评论定下基调。当我们在分析中减少了这些早期作品的权重时,这些发现仍然成立。当考虑到不同的阅读行为(例如,当人们只阅读负面评论,或只阅读最近的评论),我们的分析也是稳健的。
三、对数据战略家的启示
尽管我们的研究是在一个特定的行业中进行的,但可以从中得出关于数据驱动策略的普遍教训。首先,在线数据有多种格式,包括结构化的(如星级)和非结构化的(如书面评论)。一个真正全面的数据策略不仅要包括所有的格式,而且还要研究它们之间的互动方式。这一点很重要,因为当这些不同的格式被打包在一起时,比如在线产品评论,它们可能会向消费者发出不同的信号。只分析一种形式可能会产生对整体数据的歪曲解释,而整体的观点更有可能产生驱动消费者行为的线索。
第二,数据驱动的策略应该是取决于背景的。在你对数据的商业影响得出确切的结论之前,你需要知道什么能让你所在行业的消费者动心,并据此设计实验。例如,如果我们不首先用一个经过验证的计量经济学模型来复制我们所研究的行业的典型购买过程,我们就不可能根据我们所掌握的数据来产生一个清晰的画面。对数据科学采取即插即用的方法不会让你达到你需要的目的。
第三,由于人工智能(AI)的进步,我们的研究是一个很好的例子,说明现在所有公司无论大小都可以参与这种可扩展的数据分析。诸如情感分析等工具在技术完善性和可及性方面都有了飞跃性的发展。因此,中小型企业(SMEs)没有理由不参与曾经为大型成熟公司保留的行动。
无论你的行业或数据复杂程度如何,你最好的战略赌注是将基于人工智能的能力与全面的数据收集和细致的行业知识相结合。
智慧熊企业数字化管理系统,助力远程高效处理工作事务,团队高效配合下单,生产,发货,采购,财务等事宜。
智慧熊企业数字化管理系统,助力远程高效处理工作事务,团队高效配合下单,生产,发货,采购,财务等事宜。