推荐系统之信息茧房问题

news/2024/2/21 2:30:09

什么是信息茧房

信息茧房其实是现在社会一个很可怕的现象,从字面意思来看的话其实比喻的是信息被虫茧一般封锁住。这个问题反映了现在随着个性化推荐的普及衍射的一个社会问题。


326efef29c5180cf89cc06b5d7dd563f833a60e4

​​平时在浏览新闻或者淘宝的时候,平台会自动根据用户的浏览记录获取用户的偏好,然后推送感兴趣的文章。久而久之,比如用户A是个体育迷,那么A获取的信息大多是跟体育相关的,很难获取音乐或者军事等其它相关的资讯,因为平台追求点击率,会一直推送A感兴趣的内容以获取高广告浏览量。时间长了,因为信息茧房的作用,因为信息获取单一,A的社交圈可能也会变的狭小。如果整个社会陷入了个性化推荐系统的信息茧房效应,将是病态的。


所以,真正的个性化推荐绝对不等于只推荐历史感兴趣的内容,这样其实不是一个长期可持续的推荐系统,如果陷入了信息茧房,一定会有用户觉得审美疲劳。那么如何破解信息茧房,因为从推荐模型角度分析,一旦获取了用户的画像,就很难跳出用户习惯的逻辑,比如昨天买个手机,第二天还推荐手机,这个时候可能比较好的一种方法是跨域推荐(cross-domain recommendation)。

跨域推荐的概念

跨域推荐做的事情就是跳出推荐的信息茧房。不是一个新概念了,我上研究生的时候学校就有实验室做相关的研究,今天主要讲下思路。具体大家想了解的话可以看下这个Paper: 《Cross-Domain Recommendation: An Embedding and Mapping Approach》

有几个关键词我觉得可以充分体现跨域推荐的精髓:

“diversity” - “novelty” - “serendipity”

如果我们做一个推荐系统,说是“individuality”,其实我会觉得很normal,不够高级,现在几乎所有推荐系统都有个性化推荐,但是如果一个推荐系统标榜自己是“novelty”,那我就觉得很有意思了。下面聊聊怎么实现novelty。

第一步:确定什么是target & source

这里以新闻推荐为例,如果一用户A,经常浏览同一个类型的新闻,比如体育新闻,如何找到A喜欢的其他类别新闻呢?

795e8e0e6ec48ed8f5b389825b041dd68125d579

这其实是一个user overlap的场景,推荐系统的主体user不变,有个source源是体育新闻,要找到target是体育以外user感兴趣的文章。这就建立了跨域推荐中的target和source关系。

第二步:确定推荐level

跨域推荐有多种level,要确定跨域的种类,大体可以分以下三种:

a9444f6b44fd76014961201c536e2e09bfffad55

其实跨域推荐确定了source和target后只要确定跨域的幅度即可。

  1. Attribute level:挖掘target间的相似属性,推荐同一类别的target。比如一个用户很喜欢买红色、大尺寸的诺基亚手机,attribute level推荐是要在推荐物属性层面做跨域,可以试着给用户推荐黑色、小尺寸的其它手机,这样的跨属性的相同物种推荐会在一定程度上给用户新鲜感

  2. Type level:挖掘target间的相似属性,然后推荐相同大品类下不同小品类的物品。比如用户喜欢红色、大尺寸的诺基亚手机,手机和电脑都属于电子产品,可以推荐红色、大尺寸的电脑给用户

  3. Item level:挖掘target间的相似属性,推荐不同大品类的物品。比如用户喜欢红色、大尺寸的诺基亚手机,直接推荐红色大尺寸的马桶

以上3个跨域level由轻到重,大家可以根据自己的需求选用。其实关键点是如何挖掘物品的属性,因为无论是电脑、手机、马桶,他们都有共通的属性,比如大小、颜色、材质等,下面就介绍如何挖掘这些属性。

第三步:挖掘target间的属性

既然跨域推荐的关键是能挖掘出target间共有的属性,那么有什么办法可以做到这一点呢。首先要根据业务属性人工挖掘出一些隐性特征,比如电商平台可以挖掘出颜色、材质、价格、使用频率等隐性特征,然后可以通过矩阵分解的方式获取具体每个特征的权重(下图中矩阵A和B之间的矩阵)。

93a8bf82907703598f10bc51ef8959967d57ec68

总结

信息茧房效应是因为个性化推荐系统推荐信息的不平衡性,导致用户长期只能浏览限制领域的信息,可以在推荐系统中加入跨域推荐的逻辑来规避信息茧房的影响,具体流程包含确定推荐逻辑中的source和target,确定跨域的粒度,通过矩阵分解找出隐含的共性属性。

参考:https://recsys.acm.org/wp-content/uploads/2014/10/recsys2014-tutorial-cross_domain.pdf


http://www.ppmy.cn/news/803545.html

相关文章

园友推荐的Linux书架

工作几年来,一直从事Linux内核驱动方面的开发。从接触Linux到现在,读过不少Linux方面的书籍,现把认为很不错的一部分列出来和大家分享一下。 入门类 一直认为,在一个系统上学习开发之前,首先需要熟悉这个系统的使用。鉴…

推荐系统的坑

推荐系统的坑 转自: http://www.wangke.me/?p103 标准 不知不觉,从事推荐系统相关工作已近两年,这两年自己踩坑,看人踩坑已然不少。记得一位资深从业者说“现在看起来,推荐系统就是个坑啊!”,心…

推荐系统详解(十)常见模块

巧妇难为无米之炊:数据采集关键要素 推荐系统离不开数据,数据就是推荐系统的粮食,要有数据就得收集数据。在自己产品中收集数据,主要还是来自日志。 日志和数据 数据驱动这个概念也是最近几年才开始流行起来的,在古…

坐在马桶上看算法:快速排序【强烈推荐】

原始出处:http://developer.51cto.com/art/201403/430986.htm 博主:ahalei 来源:http://blog.51cto.com/ 此文章介绍快速排序算法,介绍得非常好,珍藏下来,并强烈推荐! int a[100]; void quickS…

理解FPGA的基础知识——FPGA专业术语(收藏)

■ ASIC(Application Specific Integrated Circuit,专用集成电路) ASIC 是为满足顾客特定需求而设计制造、面相特定用途的集成电路的总称。面向特定用途的集成电路分为全定制IC和半定制 IC。通常所说的ASIC主要指门阵列、嵌入式阵列、标准单…

【GaussDB(DWS)】数据分布式存储-三种类型的表

toc 一、环境说明 华为数据仓库服务DWS,集群版本8.1.3.320集群拓扑结构: 二、数据分布式方式 DWS采用水平分表的方式,将业务数据表的元组打散存储到各个节点内。这样带来的好处在于,查询中通过查询条件过滤不必要的数据&#…

论文笔记--SentEval: An Evaluation Toolkit for Universal Sentence Representations

论文笔记--SentEval: An Evaluation Toolkit for Universal Sentence Representations 1. 文章简介2. 文章概括3 文章重点技术3.1 evaluation pipeline3.2 使用 4. 代码4.1 数据下载4.2 句子嵌入4.3 句子嵌入评估 5. 文章亮点6. 原文传送门7. References 1. 文章简介 标题&…

Mac中使用命令行来加密压缩zip文档

背景 最近需要对一些文件加密,但是Mac上没有找到相应的加密工具,macOS中创建密码保护的压缩 zip 文件很容易并且不需要任何额外附加物或下载。使用命令行的方式处理即可。对压缩包加密之后便意味着有人想要解压缩zip文件时,必须输入正确的密码…

求温度记录仪开发方案

求方案:多路温度仪硬件方案及下位机程序(串口屏程序)开发方案,上位机目前我们可以解决,如有功能更全及界面更靓的我们也一起考虑。如有开发经验,私聊提供开发资料或图片。感谢。 微信/手机:137…

JKTD-1000型铁电材料测试仪

JKTD-1000型铁电材料特性测试系统 关键词:电滞回线,蝴蝶曲线,疲劳,脉冲 1.系统简介: 铁电体具有介电压电、热释电、铁电性质以及与之相关的电致伸缩性质非线性光学性质、电光性质、声光性质、光折变性质、铁电记忆存…

晶闸管阻断测试仪

一、概述 EN-DBC-028-501型阻断特性测试仪是可用于测量晶闸管的VDRM、VRRM、IDRM、IRRM以及二极管的VRRM、IRRM参数以及其它半导体器件的相关参数测试的专业设备。它的测试方法符合GB/JB/T7626-94标准。 该测试台具有漏电流自动保护功能,过电压自动保护功能。阻断电…

MOS测试仪

ENJ2005-C是一款很具有代表性的新型半导体晶体管图示系统,IV曲线自动生成,也可根据实际需求设置功能测试,直接读取数显结果。系统生成的曲线都使用ATE系统逐点建立,保证了数据的准确可靠。系统典型的测试时间是6 to 20ms,通常上百…

6123测试软件,OTP6123系列手持式OTDR测试仪

功能特性cndibOTP6123系列手持式OTDR测试仪 高分辨率彩色触摸屏幕,即使在光线强的地方也可清晰显示,易于读取和操作; 防震的结构设计,充分满足室外应用要求; 简便友好的按键设计,轻松检测光纤质量和故障定位…

福光电子蓄电池测试仪软件,福光电子蓄电池容量测试仪IDCE-4815C系列——交直流两种供电方式...

IDCE-4815C系列蓄电池容量测试仪无线单体监测,超大彩屏显示,交直流两种供电方式 产品特点: 采用蓝牙无线单体监测技术,支持2V/6V/12V单体电压监测。 单体电压采集和记录采用总线数据结构,单体监测数量没有限制,可以同时监测多组电池。 每个无线监测模块可同时监测4个单体…

php温度曲线图表,tg热重分析法的曲线图解怎么看

热重分析是在程序控制温度下,测量物质的质量与温度或时间的关系的方法。进行热重分析的仪器,称为热重仪,主要由三部分组成:温度控制系统,检测系统和记录系统。 以下介绍了一些热重分析(TG)曲线实例分析 一、TG与DTA的联…

耳机电声测试仪软件,杭州爱华 AWA6128D双耳机测试仪

概述: AWA6128D型双耳机麦克风测试仪执行GB/T 12060.4/ IEC 60268-4《声系统设备 传声器测量方法》、GB/T 12060.7 / IEC 60268-7 《声系统设备 头戴耳机测试方法》和IEC 61842 Microphones and earphones for speech communications 等标准。 该仪器由电声测试仪(…

kic炉温测试软件中文版,KIC炉温测试仪-KIC2000炉温测试

KIC炉温测试仪-KIC2000炉温测试 产品说明: 1.传统的温度曲线测量和设置一直是个费时的工作,而KIC的SlimKIC 2000型温度/时间工艺设置器解决了这传统问题。 2.操作员可以从已经设好的锡膏特性数据库中选择所用的锡膏。 SlimKIC 2000自动设置所需的工艺框限或窗口。 3.如果配合…

智能型炉温测试仪kic x5软件,KIC X5 炉温测试仪产品说明ppt课件

《KIC X5 炉温测试仪产品说明ppt课件》由会员分享,可在线阅读,更多相关《KIC X5 炉温测试仪产品说明ppt课件(8页珍藏版)》请在人人文库网上搜索。 1、KIC X5炉温试验机的产品介绍、2、KIC X5炉温试验机的产品说明、软件功能、产品残奥表、产品介绍、绝热…

JinKo 多路温度测试仪使用说明

概述 1.1:测试概述 在硬件测试中,温升测试也是很重要的一项测试,产品各项器件在稳定的环境温度下满载工作的芯片温度,根据测试情况评估散热需求。 1.2:产品图片 1.3:使用设备 名称 厂家 型号 PC电脑 不…

华为OD机试真题 Java 实现【字符匹配】【2023 B卷 100分】,附详细解题思路

目录 一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明 一、题目描述 给你一个字符串数组(每个字符串均由小写字母组成)和一个字符规律(由小写字母和.和组成),识…
最新文章