第 2 章 评级、推荐与大数据使用

提示🎧 本章配套播客

第二章概念关系图

我们几乎每天都在与评级和推荐系统打交道。去大众点评搜索附近餐厅,4.8 分的店铺让人放心;刷抖音时,平台精准推送你感兴趣的内容;在淘宝购物前,翻看商品评价已成为习惯。这些看似简单的功能,背后蕴含着深刻的经济学原理。

评级系统、推荐系统和大数据的使用,构成了平台解决信息不对称问题的核心工具。更重要的是,它们本身就是网络效应的重要来源——用户越多,评价越准确,推荐越精准,这反过来又吸引更多用户加入。理解这些机制,是理解平台竞争优势的关键。

重要学习目标
  1. 理解 评级和评论系统如何产生网络效应
  2. 分析 推荐系统对市场结果的影响,特别是长尾效应与超级明星效应的争论
  3. 解释 大数据如何增强平台的网络效应,区分数据网络效应与规模经济
  4. 评估 评级系统的信息有效性问题及其对平台治理的影响

2.1 评级与评论系统

评级(Rating)和评论(Review)系统是数字平台最基础也最重要的功能之一。无论是作为垂直整合零售商的平台(如京东、亚马逊),还是撮合买卖双方的平台(如淘宝、eBay),几乎都会邀请用户对产品或交易对手进行评价。

2.1.1 作为网络效应的来源

信息不对称问题

在平台交易中,信息不对称问题(Information Asymmetry)尤为突出。对于经验品(Experience Goods)——只有消费后才能判断质量的产品——买家通常比卖家知道的更少。传统市场中,这一问题可以通过重复交易、个人声誉或品牌来缓解。但在平台上,数以百万计的陌生人进行交易,传统机制难以发挥作用。

评级和评论系统提供了一种替代方案:它们让个体买家能够借助其他买家的集体经验来做出决策。这种机制之所以有效,是因为它随着用户数量的增加而变得更加可靠。

平台特定网络效应

平台特定网络效应形成机制
重要核心概念

平台特定网络效应(Platform-Specific Network Effects):评级和评论系统产生的网络效应往往是特定于某一平台的。即使同一产品在多个平台销售,不同平台上的评价信息通常不可迁移。

为什么评级系统产生的是平台特定网络效应?主要有三个原因:

  1. 用户行为惯性:许多用户习惯在获取评价信息的同一平台完成购买,而不会跨平台比较
  2. 卖家行为差异:同一卖家在不同平台上的服务质量可能不同,因此声誉实际上是平台条件下的声誉
  3. 声誉不可迁移:用户难以确认不同平台上的同名卖家是否为同一主体,平台间缺乏统一的卖家身份识别机制

这意味着:

重要核心发现 2.1

评级和评论系统产生平台特定网络效应,这种自我强化机制使成功的平台更加成功,而较小的竞争对手则处于不利地位。

2.1.2 产品评级系统

产品评级系统的网络效应

许多在线零售商建立了产品评级系统(Product Rating System),允许买家对特定产品进行评分和评论。这一机制使原本的在线零售商转变为平台——因为有了评级系统,一个买家的购买决策会受到其他买家行为的影响。

一个简单的模型

考虑一个销售多种产品的零售商。产品质量 \(q\) 可能是高质量(\(q = H\))或低质量(\(q = L\)),概率各为 1/2,事前买卖双方都不知道具体质量。买家对高质量和低质量产品的估值分别为 \(v_H\)\(v_L\),满足:

\[v_H > c > v_L, \quad \frac{v_H + v_L}{2} > c\]

其中 \(c\) 是产品的边际成本。第一个不等式表明:如果信息完全,只有高质量产品会被交易;第二个不等式表明:在信息不完全时,交易仍然会发生,因为产品的期望价值高于成本。

假设有 \(n_B\) 个买家,每个买家购买后以概率 \(\rho\) 留下评价,且评价是真实的。

  • 无评级系统时:垄断零售商将价格定为 \(p = (v_H + v_L)/2\),所有买家都会购买
  • 有评级系统时:买家在看到负面评价后不会购买低质量产品

\(P_H = 1/2\) 为产品实际上是高质量的概率,\(P_L\) 为产品是低质量但尚未被揭露(没有负面评价)的概率。当产品为低质量时,排在第 \(k\) 位的买家看不到负面评价的概率是 \((1-\rho)^{k-1}\)(前面所有买家都没留下评价)。因此:

\[P_L = \frac{1}{2n_B} \sum_{k=1}^{n_B} (1-\rho)^{k-1} = \frac{1-(1-\rho)^{n_B}}{2\rho n_B}\]

买家的期望效用为:

\[U^e = P_H(v_H - p) + P_L(v_L - p)\]

由于 \(p = (v_H + v_L)/2 > v_L\),我们有:

\[U^e = (P_H - P_L) \cdot \frac{v_H - v_L}{2}\]

关键观察:\(P_L\)\(n_B\) 增加而减少(当 \(n_B \to \infty\)\(P_L \to 0\)),因此 \(U^e\)\(n_B\) 增加而增加。

重要核心发现 2.2

产品评级系统能够解决信息不对称问题。在买家对产品进行评价的电商环境中,更多买家使平均产品评级更具信息量,因此具有产品评级系统的平台表现出正向的组内网络效应。

换言之,产品评级系统是吸引力循环(Attraction Loop,如第 1 章所述)的来源。

评级系统可以产生多种形式的网络效应:

  1. 跨期网络效应:假设第一期用户同时购买,第二期用户根据第一期的评价做决策。第一期用户的评价对第二期用户产生正向跨组网络效应。

  2. 跨类型网络效应:假设存在两类买家——对产品来说是经验品的 A 类买家(消费后能判断质量)和信任品的 B 类买家(消费后仍无法判断质量)。只有 A 类买家会留下评价。则 A 类买家对 B 类买家产生正向跨组网络效应。

  3. 评价概率异质的网络效应:不同群体的买家留评价概率 \(\lambda_j\) 不同。平台 \(i\) 的预期评价数为 \(m^i = \lambda_1 n_1^i + \lambda_2 n_2^i\)。更多评价使平台更具吸引力,这一收益可用增函数 \(f(m^i)\) 刻画。

实证证据

Chevalier 和 Mayzlin (2006) 分析了书评对亚马逊和 Barnes & Noble 销量的影响。利用双重差分方法,他们发现:亚马逊上多一条正面(负面)评论,会导致该书在亚马逊的相对销量上升(下降)。这证实了评级系统确实影响消费者决策。

更有趣的是,不仅评论数量重要,评论的长度和内容也很重要。这表明买家会评估每条评论的可信度,或者他们关心产品与自身需求的匹配程度。

2.1.3 卖家评级系统

卖家评级系统:声誉与信任

在撮合买卖双方的平台(如淘宝、eBay、Airbnb)上,买家不仅可以评价产品,还可以评价卖家。这类卖家评级系统(Seller Rating System)也称为声誉系统(Reputation System),其核心功能是解决信任问题。

声誉机制的替代功能

注记案例:易趣网的评级系统引入

中国拍卖网站易趣网(EachNet)在 1999-2001 年期间没有评级系统。买卖双方通过沟通建立信任,最终通过线下见面完成交易——买家验货后付款,卖家确认收款后交货。2001 年易趣网引入评级系统后,Cai 等人 (2014) 发现:卖家累计成功率与回头客比例之间的正相关关系减弱了。这证实了评级系统部分替代了双边关系中的个人声誉。

卖家评级系统可以同时解决逆向选择(Adverse Selection)和道德风险(Moral Hazard)问题:

  • 逆向选择:低质量的住宿会被评价揭露,买家可以据此筛选
  • 道德风险:卖家如果不努力提供好服务,会收到差评,因此有激励努力

买方的组内网络效应

如果评价有噪音,交易量少的卖家无法获得可靠的评价信息。给定卖家数量,活跃买家越多,任何一个卖家的评价信息越精确(大数定律)。这产生了买方的正向组内网络效应。

重要核心发现 2.3

卖家评级系统能够解决信息不对称问题。在买家评价卖家的情境中,更多买家使评级系统更具信息量,因此具有卖家评级系统的平台在买方存在正向组内网络效应。

卖方的跨组网络效应

买家通过留下评价影响彼此,但对卖家的影响如何?关键洞见是:评级系统对不同卖家的影响是不对称的。

对于隐藏信息问题(Hidden Information,如卖家质量):

  • 高质量卖家受益于评级系统——更多评价帮助他们建立声誉
  • 低质量卖家受损于评级系统——更多评价暴露他们的真实质量

对于隐藏行动问题(Hidden Action,如卖家努力程度):

  • 所有卖家都可能受益,因为评级系统约束了卖家行为,买家理解这一点后更愿意交易
重要核心发现 2.4

在隐藏信息问题中,卖家受评级系统的影响是差异化的:高质量卖家从更多买家评价中获得正向跨组网络效应,而低质量卖家则遭受负向跨组网络效应。在隐藏行动问题中,所有卖家可能都受益,因为买家理解评级系统约束了卖家行为。

评级系统与既有声誉

对于已有品牌声誉的卖家和没有品牌认知的新卖家,评级系统的价值是不同的。Hollenbeck (2017, 2018) 研究酒店评级发现:2000-2015 年间,随着 Tripadvisor 和酒店预订网站的普及,连锁酒店相对于独立酒店的收入溢价下降了。这说明评级系统降低了新进入者的声誉壁垒。

但新卖家也面临冷启动问题(Cold Start Problem)——这是双边平台的典型困境:新卖家没有评价难以获得信任,没有信任就无法积累评价。淘宝在 2012 年推出的返现换评价(Rebate-for-Feedback, RFF)机制是一个解决方案:

  • RFF 作为高质量信号——高质量卖家更愿意使用这一功能
  • 买家正确理解了这一信号——使用 RFF 的商品销量增加约 30%
  • RFF 替代了既有声誉——经验较少的卖家更可能使用它
重要核心发现 2.5

买家通过评价对卖家产生的跨组网络效应,对于没有既有声誉或可能遭受歧视的卖家来说更可能是正向的。

2.1.4 信息有效性问题

评级系统信息有效性问题

评级和评论只有包含相关信息才对买家有价值。然而,评级系统的信息有效性(Informativeness)受到多种因素的限制。

噪音来源

评价中的噪音可能来自以下原因:

噪音类型 说明 示例 影响程度
理解偏差 评价者误解了评价对象 对产品质量的评价中混入对物流服务的评价
特异性偏好 评价反映的是水平差异而非垂直质量 因为不喜欢颜色而给差评
不可控冲击 评价反映了卖家无法控制的因素 因物流公司延误而给卖家差评
价格波动 相同产品在不同时间以不同价格销售 高价买入后发现降价,因此给差评

这些噪音通常是随机的,理论上可以通过大数定律解决——评价越多,噪音影响越小。

策略性扭曲

更严重的问题是买卖双方的策略性行为导致的系统性扭曲。

虚假评价(Fake Reviews):卖家可能花钱购买正面评价,或给竞争对手购买负面评价。这不仅是理论推测,实践中确实存在出售虚假评价的服务。

警告虚假评价的识别

Mayzlin, Dover 和 Chevalier (2014) 利用 Expedia 和 Tripadvisor 的政策差异来估计虚假评价的程度:Expedia 要求实际预订才能评价,而 Tripadvisor 不要求。他们预测:

  • 独立酒店更可能发布虚假评价(被发现的成本较低)
  • 独立酒店附近的酒店在 Tripadvisor 上会有更多负面评价
  • 独立酒店在 Tripadvisor 上会有更多正面评价

这些预测都在数据中得到验证。

双边评级系统的报复威胁:当买卖双方都可以评价对方时,可能出现策略性的评价抑制。

注记案例:eBay 旧评级系统的问题

eBay 早期的双边评级系统存在严重问题:一方留下评价后立即向对方披露。这为负面评价的报复打开了大门。

Bolton, Greiner 和 Ockenfels (2013) 发现:买卖双方的评价高度正相关,且卖家通常等待买家先评价后再回应。这表明卖家利用评价权作为隐性威胁——如果收到差评就进行报复。

根据 eBay 内部数据,买家向客服投诉的概率是给差评概率的三倍。这说明负面体验被严重低估。

eBay 最终在 2008 年改为单边评级系统,只允许买家评价卖家。

不对称羊群行为

Muchnik, Aral 和 Taylor (2013) 在新闻网站上进行了一项实验:对评论进行随机的虚假评价(正面或负面),然后观察后续评价的动态。

结果发现不对称的响应:

  • 虚假正面评价使后续正面评价的概率增加 25%
  • 虚假负面评价虽然增加了负面评价,但被抵消性的正面评价中和了

这种社会影响偏差(Social Influence Bias)意味着:付费购买的正面虚假评价可以引发正向羊群效应,其影响会持续存在,即使虚假评价后来被删除。

重要核心发现 2.6

评级系统可能因买卖双方行为引入的噪音和偏差而缺乏信息量。特别是,平台用户可能操纵系统。这往往会削弱网络效应的强度。

淘宝评价体系的演变

淘宝的评价体系经历了多次重大变革,每次改革都是对信息有效性问题的回应:

时期 机制 解决的问题 遗留的问题
2003-2008 信用积分制 建立基本信任 刷单、好评返现
2009-2023 DSR 评分 多维度评价 评分通胀、区分度低
2024- 店铺体验分 更及时反映状态 持续治理挑战
2025- 真实体验分 AI 识别虚假评价 待观察

淘宝评价体系的每次改革都体现了平台在信息有效性与激励相容性之间的权衡。信用积分制解决了基本信任问题,但刷单现象说明简单的累积评分容易被操纵。DSR 多维度评分试图提高区分度,但评分通胀问题仍未解决。店铺体验分强调近期表现,增加了时效性,但同时也降低了历史声誉的价值。真实体验分引入的 AI 识别技术代表了平台治理的新阶段——从规则约束转向智能监测。

好评返现(即卖家承诺在买家给好评后返还部分货款)是一个典型的激励扭曲案例。它导致评价失去信息含量,损害了所有依赖评价做决策的买家。淘宝 2024 年的新规引入 AI 技术识别并限制展示疑似诱导好评的评论。

2.2 推荐系统

如果说评级系统是用户主导的信息获取策略——由用户主动提供和获取信息,那么推荐系统(Recommender System)则是平台主导的信息推送策略——平台主动向用户推荐可能感兴趣的产品或内容。

2.2.1 推荐系统类型

推荐系统类型对比

推荐系统的核心功能是降低搜索成本,帮助用户在海量选项中找到最匹配的产品或内容。主要有以下几种类型:

基于流行度的推荐

最简单的推荐方式是报告最流行的产品。这对新用户尤其有用——当你对某个领域一无所知时,看看大家都在买什么是一个合理的起点。

协同过滤(Collaborative Filtering)

协同过滤是目前最主流的推荐算法,其核心思想是:如果用户 A 和用户 B 在过去的行为上相似,那么 A 喜欢而 B 还没发现的东西,B 很可能也会喜欢。

具体实现方式包括:

  • 基于用户的协同过滤:找到与你相似的用户群体,推荐他们喜欢的内容
  • 基于物品的协同过滤:找到与你喜欢的物品相似的物品,进行推荐
  • 矩阵分解方法:将用户-物品交互矩阵分解为低维表示,预测缺失的交互

基于内容的过滤(Content-Based Filtering)

基于内容的方法利用产品或内容的特征(如书籍的作者、类型、关键词)来推荐相似的产品。这种方法不依赖于其他用户的行为,因此可以解决新物品的冷启动问题。

混合方法

现实中的推荐系统通常结合多种方法。例如,亚马逊同时使用:

  • 购买了 A 的人也购买了 B 的推荐
  • 基于浏览历史的个性化推荐
  • 热销榜单

推荐系统的网络效应

推荐系统如何产生网络效应?考虑一个简单的例子:

假设有两个产品 A 和 B,A 的净收益为 1,B 的净收益为 -1。消费者分为两类:

  • 业余买家(50%):依赖推荐系统的建议
  • 专家买家(50%):自己调研,有 80% 概率做出正确选择

推荐系统报告最流行的产品。

当只有 2 个买家时,第 2 个买家的期望收益为 0.45。 当有 3 个买家时,第 3 个买家的期望收益为 0.525。

假设专家买家有 80% 概率选择正确产品 A(收益 1),20% 概率选择错误产品 B(收益 -1)。业余买家完全依赖推荐系统。

2 个买家时(第 2 个买家的期望收益): - 若第 1 个是专家且选 A(概率 0.5×0.8=0.4),A 被推荐,第 2 个跟随选 A,收益 1 - 若第 1 个是专家但选 B(概率 0.5×0.2=0.1),B 被推荐,第 2 个跟随选 B,收益 -1 - 若第 1 个是业余买家(概率 0.5),随机选择并推荐,第 2 个期望收益 0 - 第 2 个买家总期望收益:0.4×1 + 0.1×(-1) + 0.5×0 = 0.3

3 个买家时,信息积累使后来者受益更多,计算原理类似但更复杂。

注:本模型为简化说明,具体数值(0.45、0.525)来自教材更完整的设定。

这表明:用户越多,后来的用户受益越多。业余买家通过推荐系统间接获取了专家的知识。

重要核心发现 2.7

通过推荐更流行的产品,产品推荐系统有潜力向业余买家提供与购买相关的信息。在电商环境中,它们有潜力产生网络效应,因为买家周围有越多的其他买家,他们就越受益。

重要核心发现 2.8

产品推荐系统有潜力降低搜索成本。在电商环境中,它们有潜力产生网络效应,因为更多买家提供了更可靠的信息来判断哪些产品值得关注。

2.2.2 对销售分布的影响

长尾效应 vs 超级明星效应

推荐系统如何影响销售分布?这是一个有争议的问题,涉及两个对立的假说:

长尾效应(Long Tail Effect)

Chris Anderson 在 2006 年提出长尾理论:互联网市场的销售分布比传统市场有更长的尾部——小众产品占总销售的比例更大。推荐系统通过降低搜索成本,帮助有特殊偏好的消费者发现小众产品,从而促进长尾效应。

超级明星效应(Superstar Effect)

另一种观点认为:推荐系统基于已有流行度进行推荐,没有销量的产品无法被推荐,导致马太效应——热门更热,冷门更冷。

理论分析

这两种效应并不矛盾。关键在于区分个体层面和总体层面:

  • 个体层面:推荐系统帮助每个人发现更匹配自己偏好的产品
  • 总体层面:如果人们的偏好足够异质,个体匹配的改善会导致总体销售更分散
重要核心发现 2.10

报告产品流行度的产品推荐系统可能对大众产品和小众产品产生不同影响。在相似排名下,小众产品在这种推荐系统中表现相对更好。

直觉是这样的:当你看到某产品很流行时,你会推断它可能质量不错。但作为小众口味的消费者,你知道大多数人的选择不代表你的偏好。因此,一个流行度相近的产品,对小众消费者来说传递了更强的质量信号。Tucker 和 Zhang (2011) 的实验证实了这一理论。

实证证据

注记案例:亚马逊的共同购买链接与长尾

Oestreicher-Singer 和 Sundararajan (2012) 收集了亚马逊 25 万本图书的数据,包括共同购买链接(购买了 A 的人也购买了 B)。他们发现:

  • 当共同购买关系变得可见时,互补产品对彼此需求的影响平均增加三倍
  • 在推荐网络更密集的品类,基尼系数更低(销售更分散)

这支持了长尾假说:推荐系统有助于小众产品获得曝光。

2.2.3 推荐系统的经济分析

搜索成本与匹配质量

推荐系统的经济价值主要体现在两方面:

  1. 降低搜索成本:用户不必浏览所有产品,推荐系统帮助过滤掉不相关的选项
  2. 提高匹配质量:更精准的推荐意味着更少的不满意购买和退货

这两种效应对卖家也有价值。更好的匹配意味着更少的退货、更高的复购率和更好的口碑。

双边平台上的推荐

在双边平台上,推荐系统可以对双方都进行匹配,产生跨组网络效应:

重要核心发现 2.9

伙伴推荐系统有潜力降低搜索成本。在两组匹配的情境中,它们有潜力产生正向跨组网络效应,因为一方参与者越多,平台就能向另一方提出更有吸引力的匹配建议,反之亦然。

小红书的种草推荐系统

小红书是一个典型的将信息中介功能与社交网络效应深度融合的平台。其推荐系统有几个特点:

机制 说明 网络效应类型
协同过滤 基于用户行为数据推荐相似内容 组内网络效应
人群反漏斗模型 从核心种子用户逐步扩展到潜在用户 组内网络效应
搜索推荐联动 70% 月活用户有搜索行为,日均搜索近 3 亿次 组内网络效应
向量相似算法 基于用户行为序列发现新的种草机会 跨组网络效应

小红书的独特之处在于:用户生成的种草内容(UGC)同时具有评价和推荐的双重功能。用户分享的真实体验既帮助其他用户做决策(评价功能),又帮助他们发现新产品(推荐功能)。

平台操纵推荐系统的动机

一个重要的问题是:追求利润的平台是否有动机扭曲推荐系统?

可能的扭曲方式包括:

  • 推广利润率更高的产品
  • 偏袒平台自有品牌
  • 为了广告收入牺牲推荐质量

这些问题我们将在第 6 章平台设计中详细讨论。

2.3 大数据与网络效应

评级和推荐系统都依赖大数据的收集和分析。更广泛地说,大数据已成为平台竞争优势的重要来源。但大数据产生的自我强化效应是否可以称为网络效应?这需要仔细辨析。

2.3.1 数据驱动的学习效应

数据价值链与数据网络效应

数据价值链

大数据的价值通过数据价值链(Data Value Chain)产生。这不是一个简单的线性过程,而是一个持续循环:现有数据被分析的同时,新数据不断产生和存储。

网络效应还是规模经济?

重要核心概念

判断数据驱动的自我强化效应是否构成网络效应,关键在于机制:

  • 网络效应:更多数据直接提升用户体验(如更准确的推荐)
  • 规模经济:更多数据降低成本,部分成本节约传递给用户

区分很重要:网络效应发生在需求侧,更容易导致赢者通吃;规模经济发生在供给侧,影响取决于成本结构和竞争程度。

以 Waze(导航应用)为例说明数据如何产生网络效应:

  • 更多用户使用 Waze,产生更多实时交通数据
  • Waze 可以更准确地预测路况,提供更好的导航建议
  • 这直接提升了每个用户的体验
  • 这就是数据网络效应(Data Network Effects)
重要核心发现 2.11

数据可能产生自我强化效应:随着更多用户加入平台,他们产生更多数据,这些数据可以被利用来使平台对其他用户更有吸引力。

抖音的推荐算法

抖音(TikTok 国内版)是数据网络效应的典型案例。其推荐算法被称为最精准的个性化推荐系统之一,据行业报道,平台的内容分发效率和用户匹配度持续领先于同类产品。

数据网络效应的运作机制:

  1. 用户使用产生行为数据(观看时长、点赞、评论、转发等)
  2. 数据训练更精准的推荐模型
  3. 更精准的推荐提升用户体验和停留时长
  4. 精准分发使优质内容更容易获得曝光,激励创作者

但高匹配度也引发了信息茧房(Filter Bubbles)的争议。

注记数据与观察:信息茧房效应的实证研究

争议焦点:算法推荐是否导致用户只接触与自己兴趣相符的内容,形成信息孤岛?

清华大学社会科学学院 (2023) 的研究发现:从中长期看,个性化推荐算法不但没有导致信息茧房,反而可能为个体提供了更多元和理性的信息世界。信息茧房效应受个体、社会、场景与技术等多种因素共同作用,不能简单归责于算法。

中国在 2022 年实施《互联网信息服务算法推荐管理规定》,要求用户可选择关闭个性化推荐。这是全球首部系统性规制算法的法规。

2.3.2 个性化服务

大数据的另一个重要应用是个性化服务。平台可以根据用户特征和行为提供定制化的体验。

个性化推荐

我们已经讨论过推荐系统。个性化推荐的核心是利用用户数据预测偏好,从而提供更相关的内容或产品。

个性化定价

更具争议的是个性化定价(Personalized Pricing)的可能性。如果平台能够预测每个用户的支付意愿,理论上可以实现完美价格歧视。这引发了大数据杀熟的担忧。

从经济学角度看,个性化定价的福利效应是复杂的:一方面,它可能提高配置效率(愿意支付更高价格的消费者不会被排斥);另一方面,它将消费者剩余转移给生产者,可能损害消费者福利。实证研究表明,消费者对价格歧视有强烈的公平性担忧,这种担忧可能超过实际的经济损失。

2022 年的《算法推荐管理规定》明确禁止利用算法实施大数据杀熟,这反映了监管对消费者公平性关切的回应。

匹配效率提升

在双边平台上,大数据可以提高匹配效率。以美团外卖为例:

  • 平台积累了大量历史订单数据
  • 可以预测特定时间、地点的订单量
  • 提前调度骑手,减少等待时间
  • 优化配送路线,提高效率

这种效率提升惠及消费者(更快收到外卖)、商家(更多订单)和骑手(更高效的工作)。

2.3.3 数据与竞争

数据是否构成竞争壁垒?这取决于几个因素。

数据的时效性

注记研究发现:搜索引擎数据保留期的影响

Chiou 和 Tucker (2017) 研究了欧盟要求搜索引擎缩短数据保留期的影响。他们发现:将数据保留期从一年以上缩短到 3-6 个月,对搜索质量没有显著负面影响。

这说明对于某些应用,数据是流量变量而非存量变量——最近的数据才是最有价值的。

但这不能一概而论。两种情况需要区分:

  • 短期数据:如 Waze 的实时交通信息,几分钟后就过时
  • 长期数据:如植物病害图像库,随着时间积累价值增加

自学习算法

即使原始数据过时了,基于这些数据训练的算法可能仍然有价值。这产生了动态网络效应:过去用户产生的数据训练了更好的算法,使当前用户受益。

注记案例:Plantix 的长期数据效应

Plantix 是一款帮助农民识别植物病害的应用。用户上传植物照片,应用识别病害并提供治疗建议。每张用户上传的照片都丰富了数据库,改进了 AI 识别算法。这种改进是持久的——即使某个用户停止使用,他们贡献的数据仍然帮助改进对其他用户的服务。

重要核心发现 2.12

在某些情况下,更深的数据池使平台能够提高质量。那么,过去更好的数据为平台产生竞争优势。

数据获取的成本

数据不是免费的。收集、存储和分析数据都有成本。更重要的是,平台可能需要补偿用户以获取他们的数据——通常是通过免费提供服务。

一个有趣的现象是信息外部性:由于数据分析的规模经济,其他用户提供的信息使平台能够预测你的特征,即使你没有主动提供信息。这意味着:

  • 平台越大,越容易预测未披露信息的用户
  • 理性用户愿意为更低的补偿披露信息
  • 平台获取数据的边际成本递减
重要核心发现 2.13

通过提供支付或服务来换取用户个人数据的平台,可能在信息获取方面享有正向自我强化效应:用户基础越大,从用户那里获取数据的成本越低。

大众点评的数据网络效应

大众点评数据网络效应

大众点评是数据网络效应的典型案例。其网络效应体现在多个层面:

  1. 评价-用户正循环:更多评价吸引更多用户查询,更多用户使用又产生更多评价
  2. 评价-商户正循环:丰富的评价数据吸引商户入驻,商户多样性又吸引用户评价
  3. 边际价值递增:每新增一条评价,对所有用户的参考价值均有提升

2024 年数据显示,大众点评覆盖境内外超过 818 万家商户,全年新增真实评价 2.68 亿条。这种数据网络效应构成了显著的先发优势和规模壁垒。

本章小结

本章分析了评级系统、推荐系统和大数据使用的经济学。核心要点如下:

  1. 评级系统是网络效应的来源:产品评级系统产生买方的组内网络效应;卖家评级系统产生买方的组内网络效应,以及对高质量卖家的正向跨组网络效应和对低质量卖家的负向跨组网络效应。

  2. 评级系统的信息有效性受多种因素限制:噪音(理解偏差、特异性偏好、不可控冲击、价格波动)、策略性扭曲(虚假评价、报复威胁)、不对称羊群行为都可能损害评级系统的信息含量。

  3. 推荐系统降低搜索成本并产生网络效应:通过报告流行度或利用协同过滤,推荐系统帮助用户发现匹配的产品,用户越多,推荐越精准。

  4. 推荐系统对销售分布的影响是复杂的:理论上可能既促进长尾效应(帮助发现小众产品)又强化超级明星效应(热门更热)。实证证据更支持长尾假说。

  5. 大数据产生的自我强化效应可能是网络效应也可能是规模经济:区分在于机制——直接提升用户体验是网络效应,通过降低成本间接惠及用户是规模经济。数据的时效性和算法的自学习能力决定了数据优势的持久性。

思考题

  1. 概念理解题:解释为什么评级系统产生的是平台特定网络效应而非通用网络效应。这对平台竞争有什么含义?

  2. 模型应用题:在产品评级的简单模型中,假设买家留评价的概率 \(\rho\) 从 0.1 增加到 0.5。分析这对均衡和网络效应强度的影响。

  3. 案例分析题:淘宝评价体系为什么经历了如此多次改革?每次改革解决了什么问题,又带来了什么新问题?从机制设计角度,你认为还有什么可以改进的地方?

  4. 案例分析题:比较大众点评和小红书在解决信息不对称问题上的不同方式。它们各自的网络效应类型是什么?

  5. 开放讨论题:《算法推荐管理规定》要求用户可关闭个性化推荐。从经济学角度分析这一政策的效果:它会如何影响平台的数据网络效应?用户福利会如何变化?平台和社会的最优选择是否一致?

  6. 开放讨论题:抖音推荐算法追求极高的内容匹配度意味着什么?高匹配度一定对用户有利吗?如何平衡推荐精准度与信息多样性?

延伸阅读

  • Chevalier, J. A., & Mayzlin, D. (2006). The effect of word of mouth on sales: Online book reviews. Journal of Marketing Research, 43(3), 345-354.
  • Anderson, C. (2006). The Long Tail: Why the Future of Business Is Selling Less of More. Hyperion.
  • Oestreicher-Singer, G., & Sundararajan, A. (2012). Recommendation networks and the long tail of electronic commerce. MIS Quarterly, 36(1), 65-83.
  • 中国信息通信研究院 (2022). 《互联网信息服务算法推荐管理规定》解读.