互联网推荐系统在包括异构消费者和众多产品的环境中很受欢迎。 在这种情况下,能够充分描述所有产品的产品特性通常并不容易获得。 因此,基于内容的系统依赖于用户生成的内容(例如产品评论或文本产品标签)来提出建议。 在本文中,我们开发了一种新颖的协变量引导的异构监督主题模型,该模型使用产品协变量、用户评分和产品标签来根据潜在主题简洁地表征产品,并通过这些主题指定消费者偏好。 推荐上下文也会产生源于数据量、多样性和准确性的大数据问题,就像在我们的设置中包含大量文本和数字数据一样。 因此,我们开发了一种新颖的随机变分贝叶斯 (SVB) 框架,以在此类大数据设置中实现快速、可扩展和准确的估计,并将其应用于电影评级和语义标签的 MovieLens 数据集。 我们表明,我们的模型产生了关于电影偏好的有趣见解,并且比仅使用产品协变量的基准模型预测得更好。 我们展示了我们的模型如何用于针对特定用户的推荐,并说明其在生成相关产品的个性化搜索排名中的用途。