推荐系统在互联网商业产品中的地位
推荐系统的作用
推荐系统处理的是信息,它的只要作用是在信息生产方和信息消费方搭建起桥梁,是信息经济中的一个装置。
无论推荐系统服务的产品是资讯、社交、电商、游戏等不同的形式,它们最终得到真金白银的手段不一样,即商业模式不一样,但是都有一个关键步骤就是“获得用户注意力”。
用户产生行为就是付出注意力的表现,也因此信息流产品都在看谁家的阅读时间长。信息经济其实就是注意力经济,而推荐系统就是留住注意力的重要手段。
注意力是一种决策可能性,有一个特点是总量有限,随着信息越来越丰富,注意力越来越稀缺。
注意力价值一般在行业日被粗略地称呼为用户价值,实际上应该是注意力价值。
有限的注意力在推荐系统的帮助下,聚到了平台上,平台方需要像电力一样把这些注意力存储起来,存储起来的注意力就是平台方最有价值的资产。
存储这些注意力的是产品,而推荐系统是一种注意力存储设备型号,这就是推荐系统在商业链条中的角色和地位。
注意力的定义:
内容被消耗的加速度与平台内容复杂度的乘积:
$$ attention = A \times C $$
公式中:
- C是内容复杂程度,可以理解为内容被消耗光所需的时间
- A是内容消耗的加速度,而不是速度,因为这里衡量的注意力并不只是内容消费者的注意力,还有内容创作者的注意力,是两者合并之后的结果
- 内容消耗的加速度与参加消耗的用户数量有关,用户数量越多,每天消耗越多,用户数量指数增加,则消耗的加速度就不为0,平台方就有了多余的注意力
提升推荐系统注意力的策略
- 内容创作适当少倾注注意力
- 提升内容难度
- 提高单用户消耗加速度,推荐系统给用户推荐他更愿意消耗的内容
- 提高活跃用户数
推荐系统的成本
大致来说,打造一个推荐系统的成本分布在这几个地方:
- 团队成本
- 硬件成本
- 机会成本
团队成本
团队成本包含团队组建的成本和团队维护的成本,一个推荐系统至少包含全职算法工程师和软件工程师。
硬件成本
推荐系统是数据贪婪型,为了获得更多的数据,需要非常高配置的硬件支持,因为:
- 要存储更多的数据
- 要更安全保存数据
- 要更快响应用户,才能留住用户
- 要更好的开发环境,才能提高工程师开发效率,要知道工程师的时间成本最高
机会成本
机会成本就是:可能推荐系统并没有帮助产品创造什么价值,反而把很多资源投入在这上面,白白浪费了市场窗口期。
信息流
信息流,就是Feed,包括社交动态信息流、也有图文资讯信息流,短视频信息流。
推荐系统是一种注意力存储器,注意力是信息经济时代的稀缺商品,广告商向平台方购买注意力,平台方把存储的注意力分一点给广告商,然后通过推荐系统收集更多注意力补充回来。
最厉害的注意力准出其就是信息流,尤其是个性化信息流,也叫作兴趣Feed,这也是推荐系统的一种。
前世今生
2004年,Facebook问世,2006年,信息流鼻祖NewsFeed横空问世。NewsFeed的成功,验证了几个常识:
- 数据驱动比舆论驱动靠谱,别听人们嘴上是怎么说的,只看人们是如何行动的
- 窥探隐私,向群体靠拢,害怕孤单是普遍人性,把新鲜事公开这件事验证了这一点
- 注意力非常有限,用推荐系统的方法更好地存储注意力,基于兴趣的信息流验证了这一点
原来的时间线信息流都换成了今天的按照兴趣筛选内容,原因是信息泛滥,用户错过的信息量越老越多,注意力耗散很多,无法将耗散的注意力变现成了这些平台最大的痛。
配套设施
信息流是一个低衰减的注意力存储器,但是光有信息流是不完整的,最大的问题可能有两个:
- 内容源不足,无法形成信息过载,注意力就不会稀缺,注意力是无法待价而沽的商品
- 在注意力变成稀缺的事物后,存储的注意力无法变现,反哺平台自身
针对这两个问题,完整的信息流产品还需要配套设施:
内容源
内容源是注意力的重要间接影响因素。Facebook的“你可能感兴趣的人”,是一套重要的配套设施,它是一套大规模矩阵分解算法,这套推荐系统希望用户和用户、用户和APP、公共主页等建立起大量的连接。
社交信息流,内容源依赖于社交关系的数量,而图文资讯信息流,则更多依赖爬虫技术,“不生产内容,只是内容的搬运工”。
内容源是信息流的一种重要基础设施,要想办法建设好,需要考虑以下因素:
- 质量
- 多样性
- 数量:推荐系统解决信息过载问题,没有信息过滤问题怎么办呢?就是先制造信息过载问题,要制造信息过载,信息的数量就要有保障
广告系统
Facebook的广告形态多样:
- Suggested Page
- Page Post
- Suggested App
- Video Ads
广告主花钱购买信息流存储的注意力,俗称信息流变现。
平台方的角度,存储注意力要做的事情就是基于兴趣筛选信息流,重新排序展示,这样的好处是用户不会错过自己感兴趣的,而本质上就是留住注意力,不要衰减。
在注意力购买方这边,通过广告系统,大家去购买自己看中的注意力。
总结与展望
信息流会怎么发展,无法预测,但是可以肯定:
- 信息流是推荐系统在商业上最成功的应用
- 完全依赖数据驱动的信息流会面临黑天鹅事件,所以人和算法协同进化的信息流会是最有生命力的
- 数量上,注意力被大厂屯在自己手中,下一步应该关注的是注意力的质量
本文是《推荐系统三十六式》的读书笔记,仅限个人学习,请勿用作商业用途,谢谢。
Note: Cover Picture