LogitMat：不需要数据的推荐系统

开发运维 2024-02-22 竹子爱熊猫手机阅读

作者 | 汪昊

审校 | 重楼

推荐系统诞生于1992 年的一篇论文。自推荐系统诞生以来，无数的科学家和工程师为这一领域倾注了心血。在过去32 年里，许多大学成立了研究推荐系统的研究组（比如科罗拉多大学的THAT 组），而各种各样的公司（百度、字节跳动等）也充分利用了推荐系统的获客属性，实现了低成本高收益的引流渠道。据报道，推荐系统能够帮助大型网站实现30% 到40% 的流量提升。据咨询公司Modor Intelligence 预测, 2024 年推荐系统的世界市场份额会达到500 亿元人民币以上。

目前，全世界推荐引擎增长最快的地区是亚太地区，而推荐系统的主要玩家都是大规模的云计算公司和老牌巨头企业。在过去几年中，没有哪家创业公司能够快速发展，吃掉大公司的市场份额。因此，我们可以初步认为，推荐系统在全球范围内的发展已经进入了稳定期。

2017 年以来，越来越多的专家关注到了推荐系统算法性能之外的问题，特别是推荐系统的公平性。然而有一个非常棘手的问题，推荐专家们一直没能很好的解决。那就是推荐系统的冷启动问题。在没有数据的情况下，我们该怎么解决推荐的难题？为了介绍相关知识，我们先介绍一下零样本学习的发展历程。零样本学习发端自21 世纪的头十年，然而过去20 年的零样本算法，基本都需要迁移学习或者元学习，没有一个算法能成为真正的零样本学习。这一状况一直等到了2021 年ZeroMat 被发明出来后才得以改变（ZeroMat 的源代码地址：https://github.com/haow85/ZeroMat），后续陆陆续续有新的零样本算法出现，让人们意识到即便不使用任何数据，我们也可以把推荐做的很好。

2023 年 Ratidar Technologies LLC 公司（公司官网：http://ratidar.mysxl.cn）推出了一款不需要数据的推荐系统算法 LogitMat（论文下载地址：https://arxiv.org/ftp/arxiv/papers/2307/2307.05680.pdf）。该算法利用了逻辑回归和矩阵分解结合的方式，在不使用输入数据的情况下，完美地完成了推荐的任务。下面我们来看一下这个算法的细节：

上面这个公式是矩阵分解的损失函数。简单来说，就是我们需要计算出用户特征向量 U 和物品特征向量V, 以便使得他们的点乘和用户评分的差值最小。可以看出来，矩阵分解算法本质上是一个降维算法。我们利用向量点乘将用户评分矩阵的O(mn) 空间复杂度降为 O(k(m+n))，其中m 是用户数、n 是物品数、k 是向量长度。通常k 远小于m 或 n ，因此矩阵分解算法有效的降低了算法的空间复杂度。

我们发现电影评分服从幂律分布，因此我们可以用评分值本身来替换评分的分布。如果我们用逻辑回归来表示评分的分布，也就等价于用逻辑回归来计算评分值。我们得到下面的公式：

其中 U 和 V 就是矩阵分解中的 U 和 V，而 W 和Z 是系数。的值就是下标I 本身。那么我们把这个公式带入到矩阵分解的损失函数公式中去，得到下面的损失函数公式：

利用随机梯度下降对该损失函数求导。我们得到了如下的公式：

虽然公式看起来非常复杂，但其实实现起来只需要比对公式正常输入就可以，因此实现难度并不大。

LogitMat 的发明人随后在MovieLens 1 Million Dataset 和 LDOS-CoMoDa Dataset 两个不同的数据集合上验证了该算法的准确率和公平性。MovieLens 1 Million Dataset 由6040 名用户和3952 部电影的评分组成，而LDOS-CoMoDa Dataset 是个更小的数据集合。作者在测评准确率的时候使用了MAE 指标。之所以作者使用 MAE 指标，是因为该指标历史最为悠久，能够和海量论文实验数据作对比。而在测评公评性的时候，作者采用了 Degree of Matthew Effect。

实验结果如下：

上图显示了LogitMat 和4 种零样本学习，2 种排序学习和经典的矩阵分解算法的对比效果，LogitMat 取得了第2 名的好成绩。

上图显示了算法在 LDOS-CoMoDal 数据集合上的测评结果。同样的，LogitMat 算法的效果非常理想，让人拍案叫绝。

LogitMat 是不需要数据的推荐系统算法，因为在算法的求解过程中没有出现评分矩阵的评分值 R。利用这个思路，我们可以设计出许多新的零样本学习算法。这一切听上去似乎非常可怕——我们可以不利用任何数据预测我们喜欢什么电影。而这并不需要花多少的计算资源就可以实现。事实上，我只要有一台 2024 年的手提电脑就可以预测成千上万人的兴趣爱好。

需要注意的是，我们只需要修改 W 和 Z ，把他们改成更为复杂的形式，就可以把 LogitMat 变为深度学习模型。基于深度学习的零样本学习算法，其实离我们也并不太遥远了。也许有一天，我们会发现，所谓的推荐系统和评分体系不过是一场人类历史上的美丽误会。仅仅因为我们跑的太快，我们忘了自己的数学根基并不牢靠。或许，推荐系统有着我们长久忽略的社会学意义，就像下面这篇论文中描述的：Human Culture: A History Irrelevant and Predictable Experience （论文下载地址：https://arxiv.org/ftp/arxiv/papers/2307/2307.13882.pdf），人类的文化因为幂律现象和时间无关现象被锁死了。

作者简介

汪昊，前 Funplus 人工智能实验室负责人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司担任技术和技术高管职务。在互联网公司和金融科技、游戏等公司任职 13 年，对于人工智能、计算机图形学和区块链等领域有着深刻的见解和丰富的经验。在国际学术会议和期刊发表论文 42 篇，获得IEEE SMI 2008 最佳论文奖、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024最佳论文报告奖。