因子分解机(FM)是一种常用于处理高维稀疏数据中成对(二阶)特征交互的建模方法。然而,一方面,因子分解机(FM)因组合爆炸问题而无法捕捉更高阶的特征交互;另一方面,不加区分地考虑每对特征之间的交互可能会引入噪声、降低预测精度。为了解决以上问题,中国科学院自动化研究所吴书等提出了一种新颖的方法——图因子分解机(GraphFM),它能够将特征自然地表示在图结构中。研究者们特别设计了一种筛选有益特征交互的机制,将它们表示为特征之间的边。然后,该模型通过将因子分解机(FM)的交互函数整合到图神经网络(GNN)的特征聚合策略中,在图结构特征上实现任意阶特征交互建模。基于多个真实数据集的实验结果验证了该研究所提出方法的合理性和有效性。

代码和数据网址:

https://github.com/CRIPAC-DIG/GraphCTR

图片来自Springer

全文下载:

GraphFM: Graph Factorization Machines for Feature Interaction Modelling

Shu Wu, Zekun Li, Yunyue Su, Zeyu Cui, Xiaoyu Zhang, Liang Wang

https://link.springer.com/article/10.1007/s11633-024-1505-5

https://www.mi-research.net/article/doi/10.1007/s11633-024-1505-5

全文导读

预测分析是机器学习和数据挖掘中的一项基本任务,涉及利用输入特征来预测输出目标,例如回归任务中的实数值或分类任务中的类别标签。这对于在线广告及推荐系统等网络应用尤为重要。不同于图像和音频中自然存在的连续特征,网络应用中的特征大部分是稀疏和类别型的。为了精确地对这些类型的特征进行预测分析,考虑特征间的交互尤为重要。例如,假设我们想要通过五个类别变量预测用户对电影的偏好:1)语言 = {英语,中文,日语......},2)影片类型 = {动作,科幻,......},3)导演 = {李安,克里斯托弗·诺兰......},4)主演 = {李小龙,莱昂纳多·迪卡普里奥......},5)上映时间 = {1991年,1992年......}。为了捕捉这些特征交互的影响,模型可能会考虑使用三阶交叉特征,如(类型 = 科幻,导演 = 克里斯托弗·诺兰,主演 = 莱昂纳多·迪卡普里奥)或(语言 = 中文,类型 = 动作,主演 = 李小龙),这些组合可能预示着用户更高的偏好。

因子分解机(FM)是特征交互建模的一种流行且有效的方法,它会为每个独热编码特征学习一个隐向量,并通过这些隐向量之间的内积来建模它们之间的成对(二阶)交互。由于其简洁高效,因子分解机(FM)被广泛应用于推荐系统和点击率预测领域。然而,由于其考虑了所有可能的成对特征交互,因子分解机(FM)存在两个主要缺陷。

因子分解机(FM)的一个主要局限性是无法捕捉三个或更多特征之间的高阶特征交互。虽然针对此问题提出了高阶因子分解机(HOFM),但由于高阶交互的组合爆炸,其计算复杂度极高,这使得其难以在实践中应用。为了解决因子分解机(FM)在捕捉高阶特征交互方面的局限性,研究者们提出了一些利用深度神经网络(DNNs)的变体。基于因子分解机的神经网络(FNNs)将深度神经网络叠加在预训练的因子分解机(FM)之上,以建模高阶交互。神经因子分解机(NFM)设计了一个双交互层用于学习成对特征交互,并应用深度神经网络学习高阶交互。Wide&Deep模型引入了一个包含浅层和深层组件的混合架构,以联合学习低阶和高阶特征交互。DeepFM模型与之类似,将浅层和深层组件结合起来学习上述两种交互。尽管这些基于深度神经网络的模型能够有效地以隐式、特征位级(或按位)的方式学习高阶特征交互,它们往往缺乏为其输出提供有说服力解释的能力。

GraphFM概览

除了无法有效地捕捉高阶特征交互外,因子分解机(FM)的性能也并非最优,因为它不加选择地考虑了每一对特征的交互,即使其中一些交互对预测并无益处。这些无益的特征交互会引入噪声并导致过拟合,因为它们不仅不提供有用信息,反而增加了模型的复杂度,使模型更难以有效训练。例如,在预测电影偏好时,语言和上映时间之间的特征交互可能并不相关,因此也不会为预测提供有用信息。滤除这些不相关的特征交互可以提升模型性能。为了解决此问题,注意力因子分解机(AFM)通过使用注意力分数重新加权每个交叉特征来区分分解后交互的重要性,即通过分配较低的权重来削弱无用交叉特征的影响。然而,它需要一个预定义的最大阶数,这限制了模型发现具有区分性的交叉特征的潜力。因此,自适应分解网络(AFN)采用了一个由多个向量式对数神经元组成的对数神经变换层,以自动学习特征组合阶数,从而自适应地从数据中学习交叉特征及其权重。

目前,图神经网络(GNNs)作为一种有效的模型类别迅速兴起,用于捕捉图中节点之间的高阶关系,并在计算机视觉、自然语言处理及推荐系统等一系列任务中取得了最先进的成果。其核心在于,图神经网络(GNNs)通过逐层迭代聚合邻节点的特征来学习节点嵌入。这使得其能够在嵌入向量中显式地编码节点间的高阶关系。图神经网络(GNNs)在点击率预测的高阶特征交互建模中也展现出巨大潜力。Fi-GNN模型提出将每个特征域视为一个节点,连接每对节点,从而将多字段特征构造成一个全连接图,并采用门控图神经网络(GGNN)在图上建模特征交互。图分解机(GFM)利用因子分解机(FM)聚合二阶邻节点消息,并利用多层图分解机的叠加来聚合更高阶的邻节点消息,以实现推荐系统中邻域的多阶交互。图卷积因子分解机(GCFM)提出了图卷积特征交叉(GCFC)层,为每个输入样本遍历所有特征,并利用每个样本的特征计算相应的多特征交互图,进而传播其对其他特征的影响。基于知识蒸馏(KD)的有向无环图因子分解机(DAGFM)提出了一种基于有向无环图的模型,该模型可以与动态规划(DP)算法结合,以提升知识蒸馏(KD)能力。然而,并非所有的特征交互都是有益的,且图神经网络(GNNs)依赖于邻近节点共享相似特征的假设,这一假设在特征交互建模的情境下未必成立。

总之,在处理特征交互时,因子分解机(FM)存在固有的缺陷。因此,本文提出了一种新颖的模型——图因子分解机(GraphFM),它利用图神经网络(GNNs)的优势来克服因子分解机(FM)在特征交互建模方面的问题。GraphFM通过将特征视为节点、筛选出的有益特征交互视为节点之间的边,使得选出的有益特征交互构成一个图。因此,本文设计了一种新颖的技术来选择有益的特征交互,该技术也涉及推断图的结构。然后,本文采用注意力聚合策略来聚合这些选定的有益交互以更新特征表示。具体来说,为了适应不同语义空间中特征交互的多义性(或上下文依赖性),本文使用了多头注意力机制。本文提出的模型的每一层都基于前几层输出的表示来产生更高阶的交互;因此,所能捕获的交互阶数由网络层深度决定。由于本文提出的方法仅选择有益的特征交互并以显式方式对它们进行建模,它能够高效地捕捉高阶特征交互,从而为模型的输出提供可解释的理由。通过在点击率(CTR)预测基准测试和推荐系统数据集上进行广泛的实验,本文验证了所提出方法的合理性、有效性和可解释性。

总的来说,这项工作的主要贡献有三个方面:1)分析了因子分解机(FM)和图神经网络(GNN)在特征交互建模方面的不足与优势。为了解决其局限并融合其优势,提出了一个用于特征交互建模的新模型——GraphFM。2)通过将特征视为节点、筛选出的成对特征交互视为边,弥合了图神经网络(GNNs)与因子分解机(FM)之间的鸿沟,使得能够利用图神经网络(GNNs)的能力来解决因子分解机(FM)的问题。3)在点击率(CTR)预测基准测试和推荐系统数据集上进行了广泛的实验,以评估所提出方法的有效性和可解释性。实验结果表明,GraphFM能够为特征交互建模和预测决策过程提供有说服力的理由。

全文下载:

GraphFM: Graph Factorization Machines for Feature Interaction Modelling

Shu Wu, Zekun Li, Yunyue Su, Zeyu Cui, Xiaoyu Zhang, Liang Wang

https://link.springer.com/article/10.1007/s11633-024-1505-5

https://www.mi-research.net/article/doi/10.1007/s11633-024-1505-5

BibTex:

@Article {MIR-2023-12-297,

author={ Shu Wu, Zekun Li, Yunyue Su, Zeyu Cui, Xiaoyu Zhang, Liang Wang },

journal={Machine Intelligence Research},

title={GraphFM: Graph Factorization Machines for Feature Interaction Modelling},

year={2025},

volume={22},

issue={2},

pages={239-253},

doi={10.1007/s11633-024-1505-5}}

特别感谢本文第一作者、中国科学院自动化研究所吴书研究员对以上内容的审阅和修改!

MIR纸刊免费寄送
Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务,如您对本篇文章感兴趣,请点击下方链接填写收件地址,编辑部将尽快为您免费寄送纸版全文!

说明:如遇特殊原因无法寄达的,将推迟邮寄时间,咨询电话010-82544737

收件信息登记:

https://www.wjx.cn‍/vm/eIyIAAI.aspx# 

关于Machine Intelligence Research

Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区;2025年发布的最新影响因子达8.7,继续跻身JCR Q1区,最佳排名进入全球第6名;2025年一举进入中科院期刊分区表计算机科学二区。

往期目录
2025年第4期 | 特约专题: 具身智能
2025年第3期 | 大语言模型、医学图像分割、图像阴影去除、写作风格变化检测......
2025年第2期 | 常识知识获取、图因子分解机、横向联邦学习、分层强化学习...
2025年第1期 | 机器视觉、机器人、神经网络、反事实学习、小样本信息网络...
2024年第6期 | 图神经网络,卷积神经网络,生物识别技术...
2024年第5期 | 大语言模型,无人系统,统一分类与拒识...
2024年第4期 | 特约专题: 多模态表征学习
2024年第3期 | 分布式深度强化学习,知识图谱,推荐系统,3D视觉,联邦学习...
2024年第2期 | 大语言模型、零信任架构、常识知识推理、肿瘤自动检测和定位...
2024年第1期 | 特约专题: AI for Art
2023年第6期 | 影像组学、机器学习、图像盲去噪、深度估计...
2023年第5期 | 生成式人工智能系统、智能网联汽车、毫秒级人脸检测器、个性化联邦学习框架... (机器智能研究MIR)
2023年第4期 | 大规模多模态预训练模型、机器翻译、联邦学习......
2023年第3期 | 人机对抗智能、边缘智能、掩码图像重建、强化学习... 
2023年第2期 · 特约专题 | 大规模预训练: 数据、模型和微调
2023年第1期 | 类脑智能机器人、联邦学习、视觉-语言预训练、伪装目标检测... 
好文推荐
清华大学朱军团队 | DPM-Solver++:用于扩散概率模型引导采样的快速求解器
南航张道强团队 | 综述:基于脑电信号与机器学习的注意力检测研究
可信图神经网络的全面综述:隐私性、鲁棒性、公平性和可解释性
哈工大江俊君团队 | SCNet:利用全1X1卷积实现轻量图像超分辨率
下载量TOP好文 | 人工智能领域高下载文章集锦(2023-2024年)
自动化所刘成林团队 | 统一分类与拒识: 一种一对多框架
上海交大张拳石团队 | 综述: 基于博弈交互理论的神经网络可解释性研究
专题好文 | 再思考人群计数中的全局上下文
专题好文 | Luc Van Gool团队: 基于分层注意力的视觉Transformer
浙江大学孔祥维团队 | 综述: 迈向真正以人为本的XAI
澳大利亚国立大学Nick Barnes团队 | 对息肉分割的再思考: 从分布外视角展开
前沿观点 | Segment Anything并非一直完美: SAM模型在不同真实场景中的应用调查
精选好文 | 推荐系统的波纹知识图谱卷积网络
复旦邱锡鹏团队 | MOSS: 一个开源的对话式大语言模型
自动化所黄凯奇团队 | 分布式深度强化学习:综述与多玩家多智能体学习工具箱
约翰霍普金斯大学Alan Yuille团队 | 从时序和高维数据中定位肿瘤的弱标注方法
专题综述 | 大语言模型中的知识生命周期
精选综述 | 零信任架构的自动化和编排: 潜在解决方案与挑战
欧洲科学院院士蒋田仔团队 | 脑成像数据的多模态融合: 方法与应用
金耀初团队&郑锋团队 | 综述: 深度工业图像异常检测
专题好文 | 创新视听内容的联合创作: 计算机艺术面临的新挑战
综述 | 清华张学工教授: 肺癌影像组学中的机器学习
哈工大江俊君团队 | DepthFormer: 利用长程关联和局部信息进行精确的单目深度估计
Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪
贺威团队&王耀南院士团队 | 基于动态运动基元的机器人技能学习
乔红院士团队 | 类脑智能机器人:理论分析与系统应用 (机器智能研究MIR)
南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器
上海交大严骏驰团队 | 综述: 求解布尔可满足性问题(SAT)的机器学习方法
西电公茂果团队 | 综述: 多模态数据的联邦学习
高文院士团队 | 综述: 大规模多模态预训练模型
前沿观点 | 谷歌BARD的视觉理解能力如何?对开放挑战的实证研究
港中文黄锦辉团队 | 综述: 任务型对话对话策略学习的强化学习方法
南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法
ETHZ团队 | 一种基于深度梯度学习的高效伪装目标检测方法 (机器智能研究MIR)
MIR资讯
挺进Q1区前10名!MIR首个影响因子发布
喜报 | MIR 首次入选中科院期刊分区表计算机科学类二区
2025年 AI领域国际学术会议参考列表
致谢审稿人 | Machine Intelligence Research
MIR 2024年度优秀编委名单
喜报!MIR入选中国科技期刊卓越行动计划二期项目
专题征稿 | 生成式人工智能的安全与伦理
专题征稿 | Special Issue on Subtle Visual Computing
特别提醒!请认准MIR官方渠道,谨防受骗
前进20名!MIR再度跻身国际影响力TOP期刊榜单
喜报 | MIR入选图像图形领域 T2级 “知名期刊”!
喜报 | MIR被 ESCI 收录!
喜报 | MIR 被 EI 与 Scopus 数据库收录

内容中包含的图片若涉及版权问题,请及时与我们联系删除