第43卷第l2期 2016年12月 计算机科学 Computer Science Vo1.43 No.12 Dec 2016 基于行为分析的微博传播模型研究 郑志蕴郭芳王振飞李钝 (郑州大学信息工程学院 郑州450001) 摘要 随着微博的迅速兴起和其影响力的不断提高,提取微博信息传播特征和构建传播模型已成为了研究热点。 针对用户转发行为,首先分析了信息传播机制;然后从影响用户转发行为的发布用户、接收用户、用户亲密度和信息时 效性4个方面提取出8个特征因素进行建模;在借鉴传染病动力学SIR模型的基础上,引入用户行为分析和接触节 点,提出基于用户行为分析的SCIR模型,并给出动力学方程;最后利用新浪微博真实转发数据验证模型的合理性。 实验结果表明,考虑用户转发行为的8个影响因素,结合行为分析结果,能够较好地拟合信息传播过程。 关键词微博,传播,SCIR模型,行为分析 中图法分类号TP393 文献标识码 A DOI 10.11896/J.issn.1002—137X 2016.12.007 Study on Microblog Propagation Model Based on Analysis of User Behavior ZHENG Zhi-yun GUO Fang WANG Zhen-fei LI Dun (School of Information Engineering,Zhengzhou University,Zhengzhou 450001,China) Abstract With the rapid rise of twitter and its influence continuing to improve.extracting the microblog information dissemination characteristics and building the propagation model have become a hot research topic.Forward for user be— havior,firstly the information transmission mechanism WaS analyzed.Then accroding to eight factors extracted from publishing user,receiving user,user intimacy and information timeliness four aspects which affect the user behavior,the model was established.After that,the SCIR model was presented based on user behavior analysis and its dynamic equa— tion was given.Finally the rationality of the model was validated by real forwarding data.Results show that forward considering user behavior influence factor,and combining the behavior analysis,can wel1 fit information dissemination process. Keywords Microblog,Propagation,SCIR model,Analysis of behavior 1 引言 近年来,随着社交网络的快速发展和普及,微博(Micro blog)作为一种全新的在线社交应用,其以接入便捷、内容简 单、原创性、时效性和随意性等特点迅速聚集了大量用户,在 全球范围内掀起一股热潮,并开始发挥越来越大的社会影响 博网络中的用户行为、揭示微博传播规律以及构建信息传播 模型具有非常重要的理论意义和应用价值。苑卫国等通过分 析新浪微博的网络拓扑特征,发现微博网络具有小世界、无标 度特性,属于BA无标度网络_1]。在行为分析方面,张呖等基 于用户转发行为分别提取11个用户特征和u个文本特征, 运用信息增益算法对各特征进行权重分析,构建了一种基于 特征加权的预测模型口 ;齐超等针对以前传播效果研究未考 虑用户个体差异的问题,通过微博用户自身、用户关系和微博 内容3方面提取9个相关特征,并结合逻辑回归(LR)方法构 力。截止2014年第三季度,美国著名的微博客网站Twitter 中活跃用户数量已达到2.84亿;到2015年3月,中国的新浪 微博的用户总数量已超过6亿,月活跃用户增至1.67亿,是 国内访问量最大的网站之一。2014年上半年的“马航事件” 和2014年下半年的“冰桶挑战”凸显了新浪微博作为社交媒 建基于行为分析的转发规模和传播深度预测模型[3];易兰丽 以人类动力学理论为基础,综合运用复杂网络、概率论、管理 学、统计学等多个学科的理论知识和方法,对用户的微博信息 发布行为、转发行为和评论行为进行统计分析和理论建模_4 ; 周东浩等结合网络结构特点、节点内容属性和历史传播数据 等信息,提出基于随机游走模型的传播能力排序算法Dif— 体所具有的快速的传播速度、深远的传播范围和积极的社会 影响力。在2015年春晚直播期间,新浪微博推出“让红包飞” 活动,互动人数高达3447万,话题量飙升至6133.4万条,春 晚官方微博的粉丝增长率更是达到63.83 。 微博具有信息发布和用户交流两大功能,信息呈裂变式 传播,其传播速度、广度和影响力远远超出传统媒体。分析微 到稿日期:2015—09—19返修日期:2015—12—13 frank来检测网络中可能的信息传播 ]。在构建传播模型方 面,张彦超等考虑节点度和传播机理,综合复杂网络和传染病 BJsZO5),河南省科技 本文受郑州大学新媒体公共传播学科招标课题阶段性成果(xM础攻关项目(142102310531)资助。  ̄11(1962--),女,博士,教授,CCF会员,主要研究方向为分布式计算、智能信息处理;郭7 ̄-(1992--),女,硕士生,主要研究方向为智能信息 #kN,n, ̄ ̄eNN;=1= ̄(1973一),男,博士,副教授,CCF会员,主要研究方向为社交网络、信息安全,E-mail:iezfwang@zzu.edu.cn(通信作者); 李钝(1975一),女,博士,讲师,主要研究方向为社交网络、大数据。 ・ 41 ・ 动力学理论,建立信息传播SIR模型来分析节点行为规律_6]。 在SIR模型的基础上,陈乾国等提出了一种无标度网络中带 这表明微博网络中用户的转发行为受多种因素影响,对用户 行为进行分析和建模是研究微博传播模型的重要基础。 人工免疫的SIRS类传染病模型,并运用平均场理论分析该 模型的动力学行为,对比了随机免疫和目标免疫两种人工免 3构建基于行为分析的SCIR模型 传播模型对信息真实传播过程的刻画是否准确主要依赖 于对网络特征提取和建模的准确度。本文利用从发布用户、 接收用户、用户亲密度和信息时效性4个方面提取到的8个 特征来优化SIR模型中对于用户转发概率的计算方法,同时 引入一类新节点——接触节点,从而得到改进后的基于行为 分析的SCIR模型。 3.1特征提取 疫策略_7 ;杨子龙等通过提取微博信息老化特征,结合转发时 效性,基于平均转发概率的递减规律提出SIR的改进模型l_8 ; 顾亦然等根据真实在线社交网络中的谣言传播特点和带有潜 伏期的传染病模型,提出基于社交网络的谣言传播SEIR模 型,给出重要熟人免疫策略以抑制谣言的传播Ig ;王辉等在 CSR模型基础上,从心理学上考虑个人接受阈值对接受概率 的影响,改进了CSR模型的传播规则和动力学方程_】 。但 是这些研究并没有同时考虑到微博用户群体的行为习惯差异 微博发布用户自身影响力是信息传播的主要因素,影响 性和用户问相似度两个因素对用户的转发行为的综合影响, 不能实现差异性传播和精准预测。 本文在分析微博信息传播特征的基础上,从发布用户、接 收用户、用户亲密度和信息时效性4个方面提取出8个特征 对用户转发行为进行分析建模;然后在经典SIR模型的基础 上引入接触节点,构建基于行为分析的微博传播SCIR模型; 最后利用新浪微博真实数据对SCIR传播模型进行模拟,仿 真结果显示该模型能够很好地刻画微博信息的传播过程。 2信息传播机制分析 微博网络中,信息传播扩散主要依赖于用户的转发行为。 一个用户发布微博后,粉丝会以一定概率看到,如果粉丝对该 微博内容感兴趣,就会以一定概率转发,不感兴趣则不会转发 微博。在此机制下,微博信息会沿粉丝关注关系进行传播。 本文将微博网络中的注册用户定义为节点,用户之间的关注 关系定义为连接节点的有向边,信息在微博网络中的传播过 程如图1所示。 图1微博信息传播网络图 图1中实线表示用户间的关注关系,虚线表示微博信息 的传播路径,是关注关系的逆方向。用户B,C,D关注用户 A,是A的粉丝,同时用户D也关注用户B和用户C,也是B 和C的粉丝。当用户A发表微博后,其粉丝B,C,D同时看 到微博信息,根据个人习惯、自身兴趣、微博内容及用户A对 各自的不同影响力,决定是否转发这条微博。如果用户B或 用户C转发该微博,则用户D会再次看到该微博信息。 研究表明,微博网络中用户的转发行为不仅与当前状态 有关,用户自身行为习惯、发布用户影响力、用户之间相似度 与亲密度和信息时效性等也是影响用户转发行为的关键因 素。CHA等证明微博发布用户的影响力是影响用户转发行 为的一个重要因素[“]。Crandall等[” 和Singla等[ 的研究 表明节点间的相似度和节点间的影响力呈正相关关系,是影 响微博信息传播的重要因素。同时,微博网络中的转发行为 具有明显的时效性,毛佳昕等分析了新浪微博2009年9月到 2012年11月的数据,统计发现50 的微博的转发延迟小于 55min,90 的微博的转发延迟小于1153min(约19.2h)[ ]。 ・ 42 ・ 力作为用户的一个重要特征,是微博关系的基础。用户影响 力越大,所受的关注度越高,微博被转发的概率就越大,对网 络的影响作用也就越大。本文采用经典PageRank算法来计 算微博发布用户的影响力,如式(1)所示。 T)/…、 R(“)一(1--d)+d・ ∑ 13 ,k"U) (1) ∈R 珊(n)L, 其中,“和 表示两个不同的用户;R(“)和R( )分别表示M 和 的影响力PR值;Fans(“)表示所有关注“的用户,即用 户“的粉丝集合;C( )表示用户 的关注数量;d是[O,1]之 间的阻尼系数,表示用户“关注用户 的概率,1一d表示用 户“关注一个随机用户的概率,引入阻尼系数保证算法具有 收敛性,在实际应用中一般取值为0.85。这是个递归公式, 一个用户的影响力取决于其粉丝的影响力,PR值是众多用户 形成的一个分布概率,所有用户的PR值之和等于1。 用户接收微博信息后对其进行转发的原因有3类:有转 发微博的习惯、对微博内容感兴趣以及受到发布用户或是邻 居节点的影响。有些用户习惯看完微博后转发,有些只是浏 览却很少转发。不同的用户有不同的兴趣爱好,彼此关注点 差别很大,例如有些用户喜欢美食和旅游,有些用户则对八卦 或是体育乐此不疲。个人喜好的差异也会极大地影响用户在 微博网络中的行为。同时,由于微博是一个社交网络,网络中 互相关注的用户可能是现实中熟悉的人。当周围人都关注一 个话题时,无兴趣的用户会受到影响开始关注此话题。基于 这些影响因素,本文选择转发活跃度、兴趣度和邻居节点感染 率3个特征来刻画以上因素对用户网络行为的影响。 T时间段内,用户“转发微博数占其所有发布微博总数 的比例称为转发活跃度A(“),如式(2)所示。 ∑ A( )一 厶r (2) f∈rr 其中,. 表示用户“在第t天转发的微博数, 表示用户在第 t天发布的微博总数。 根据用户“的历史兴趣空间,判断其对新微博w的感兴 趣程度,用M(u,训)表示兴趣度。本文采用基于潜在语义的 分析方法对用户兴趣空间及兴趣度进行建模,步骤如下: Step 1数据采样。收集用户“最近一段时间内所发布 的历史微博信息,构成文档集合 ={d ,d。,…,d 一,d }, 其中d 表示用户“的第i条微博。 Step 2兴趣提取。采用LDA(Latent Dirichlet Alloca— tion)话题模型,自动从文档集 中挖掘出每篇文档对应的 话题组合,构成用户U词语级的兴趣分布向量 ,向量长度 代表兴趣个数,各个分量表示用户对该话题的兴趣度。 Step 3停用词剔除。通过与CSDN(China Software De— 到达用户“时的时效性, 表示“到 的最短信息转发长度。 如图2所示,初始发布者A的微博经B和C转发后到达用户 D的路径包括AD,ABD,ACD,ABCD 4条,对应的信息转发 长度分别是2,3,3,4,则lm=rain{2,3,3,4}=2。 veloper Network)提供的停用词列表进行比对,剔除掉W 中 类似于 的”、“啊”、“你”之类的使用频率高但对兴趣空间的建 立不起作用的停用词,构成用户 的最终兴趣空间J 。 Step 4微博主题分析。对微博内容叫采用LDA话题 模型进行主题分析,剔除停用词,构成叫的主题空间L。 Step 5兴趣度计算。通过用户 的近期兴趣空间J 和 微博叫的主题空间f ,采用Jaeeard相似系数计算这两个离 散分布向量之间的距离,即用户“对于微博叫的兴趣度M 图2微博转发路径 3.2转发概率计算 (“,叫),如式(3)所示。 54(“,叫)= I.nlw (3) 用户“的关注用户中已对微博叫进行转发的数量与“ 关注用户总数的比值表示邻居节点感染率N(u,叫),如式(4) 所示。 № 一 (4) 在微博网络中用户之间建立的是一种单向连接,属于弱 连接关系,可能粉丝对其关注者比较了解,而被关注者对其粉 丝却一无所知。用户之间的相似度和关注关系体现了用户的 亲密度,网络结构越相似,兴趣空间越相近,交互越频繁,说明 用户之间的关系就越亲密,彼此的喜好和情绪越容易相互感 染,转发行为也就更容易发生。本文选取网络结构相似度、兴 趣相似度和交互频度3个特征来衡量两个用户间的亲密度。 用户“和用户 的网络拓扑结构的相似程度表示网络结 构相似度T(u, ),计算方法如式(5)所示。 ∑ T 丁( ㈣ 其中,C(“)和C( )分别表示用户U和用户 所关注的用户集 合,C(志)表示 和 共同关注的用户集合。 构建用户“和用户 的历史兴趣空间L和J ,以两个用 户兴趣空间的相似度作为其兴趣相似度M(“, )。 … 一 (6) 一段时间内用户 和 之间交流的频率用交互频度S (“, )表示。用户的交互行为包括转发、提及和评论3种,如 式(7)所示。 S( , )一 1( + + + + + ) (7) O r“ C“ m“ r C my 其中,‰为用户“转发 的微博次数,c 为评论次数,‰为 提及次数, 为该时间段内用户M转发微博的总次数。S(u, )是利用转发、评论和提及这3种行为占用户总行为的比值 来衡量交互频度,比仅利用行为次数来判断亲密度更准确,更 能体现一方对于另一方的重要性。 微博网络带有明显的时效性。文献[15]对微博的转发路 径长度的统计分析表明,信息在距离初始节点较短的距离内 具有较强的影响力,在网络的第二层、第三层和第四层传播速 度最快,随着传播距离的增加,影响力迅速衰减。本文通过转 发长度来衡量信息的时效性,如式(8)所示。 ,—L1 O(“, ,叫)一 (8) c 其中,O(u, ,叫)表示初始用户 发布的微博叫经过转发后 在已知微博发布用户 和目标微博内容叫的条件下,对 微博接收用户U采用式(9)计算微博的转发概率。 fPc…,硼 一 y(“)一[尺( ),A( ),M(u,叫),N(u,叫),T(u, ), (9) lM(u,u),S(u, ),O(u, ,硼)] Lcu一[ 1, 2, 3, 4, s, 6, 7, 8] 其中,P(u, ,叫)表示用户“对用户 发布的微博叫的转发 概率;y(“)表示影响用户“转发行为的特征向量,其元素是 式(1)一式(8)的计算结果; 表示特征权重向量,分别对应特 征向量y(“)中8个不同特征对用户转发行为的影响权重。 权重的取值采用极大似然函数的方法计算。 3.3基于行为分析的SCIR模型 在刻画社交网络中的信息传播过程时,经典SIR信息传 播模型借鉴传染病动力学理论,将网络中的节点分为S(未感 染节点)、I(传播节点)和R(免疫节点)3类。未感染节点表示 节点尚未接触到微博信息,但有被感染的概率;传播节点表示 节点已看到微博信息并转发该微博;免疫节点表示节点已经 转发过该微博并对其失去兴趣,不会再进行转发。对于特定 的微博信息,网络中的节点在这3种类型间进行转换,一个未 感染节点U收到该微博信息后,以一定概率进行转发,类型由 S变为I,网络中从“出发的边所连接的节点收到这条信息, 并以一定的概率继续转发该微博,同时节点”的类型由I变 为R,之后与其他节点互不影响。 本文在SIR模型的基础上,通过用户行为分析来优化转 发概率的计算方法,并引入一类新节点——接触节点,从而构 建基于行为分析的SCIR微博传播模型。接触节点表示已经 获知目标微博信息但还未对该微博进行转发时的用户。对于 某条目标微博,网络中节点分为未感染节点S(Susceptible)、 接触节点C(Contracted)、传播节点I(Infected)和免疫节点R (Removed)4种类型。基于微博信息传播模型,定义网络中 节点的类型转换过程,如图3所示。 Pcr 图3 SCIR模型节点类型转换图 如果一个未感染节点S与一个传播节点J接触,则S会 以概率1转换为接触节点C,其中未感染节点与传播节点的 接触概率为P…P 称为信息接触概率。接触节点C以概率 P。转换为传播节点J,P 称为接触节点C对目标微博的转发 概率。接触节点C以概率P 转换为免疫节点R,P 称为接触 节点C对目标微博的直接免疫概率。传播节点J以概率P 转换为免疫节点R,P 称为传播节点J对目标微博的间接免 ・ 43 ・ 疫概率。免疫状态为网络的吸收态,凡是进入免疫状态的节 表1网络模型参数 点,其状态在微博传播过程中不再发生变化。 假定目标微博的传播过程中网络中用户数量和彼此之间 的关注关系不会发生变化,即节点总数和网络结构不变。设 网络中总用户数量为N,t时刻网络中4类节点的数量分别 是未感染节点S(£)、接触节点C( )、传播节点J(£)以及免疫 网络的出、人度分布如图4所示,近似服从幂率分布。 节点R( ),则S(£)+C(£)+J(f)+R(£)一N。由于一条目标 微博通常是由一个用户发出,因此J(0)一1,C(0)一尺(O)一0。 根据图3中的节点类型转换过程,可将SCIR模型用微分方 秣 程组描述如下。 茁 茁 一 )K(£) 出发值 入度懂 ㈤ .c( c(f) (a)节点出度分布图 (b)节点人度分布图 (10) c(£) rJ( ) 图4微博有向转发网络出入度分布 (3)用户行为分析:将用户 在该段时间内所发布的信息 卅 ) 汇总为文档D ,所有用户文档组成文档集D,对微博转发网络 其中,第一个式子表示网络中未感染节点数量的变化率;第二 进行特征提取,用于计算接收用户对于目标微博的转发概率。 个式子表示接触节点数量的变化率;第三个式子表示传播节 4.2实验方法和参数学习 点数量的变化率;第四个式子表示免疫节点数量的变化率。 将6个月的数据划分为相互的3组分别进行训练和 (1)信息接触概率P 由网络拓扑结构和用户群体确定。 测试。第1组选取第1个月的数据作为训练数据,用于建立 (2)f一1时,K(£)表示网络中节点的平均出度;£>1时, SCIR模型。将第4个月的数据进行测试,用以分析模型的性 能。以此类推,每一组的训练数据和测试数据时间间隔为3 K(£)表示网络平均额外出度_1 。 个月,最后取各组结果的平均值。SCIR模型中需要学习的参 (3)转发概率 :对发布用户 、接收用户“和目标微博 数是式(9)中的特征权重向量 ,选择命中率作为目标函数, 叫,根据式(9)计算出用户U的转发概率P(“, ,叫),则令 使得命中率最高的特征权重向量为 的最优取值。 Pc —P( ,7A,叫),实现信息的差异化传播。 4.3传播仿真 (4)本文假设用户转发过目标微博后就会对其失去兴趣 基于SCIR模型,对网络中的信息传播进行模拟,实验次 不再转发,所以间接免疫概率P 一1。 数为2000,每次随机选择名人堂中的一个用户作为初始节 4实验与分析 点,通过转发进行信息传播,观察网络中不同类型的节点数量 的变化情况。图5为采用SCIR模型模拟目标微博在转发网 根据SCIR模型,以微博转发网络为信息传播载体,模拟 络中传播时,网络中未感染节点、接触节点、传播节点和免疫 信息在网络中的传播过程,验证SCIR模型的效果和性能。 节点的密度随时间的演化情况。S( )/N在信息传播初期呈 4.1实验数据 迅速递减的趋势,因为网络中一旦某个节点转换为传播节点, 基于新浪微博开放的应用程序接口(Application Pro— 所有粉丝节点以概率P 一1转换为接触节点,表明微博网络 gramming Interference,API),采用广度优先策略,抓取新浪 中信息的裂变式传播模式。c( )/N在话题传播初期呈迅速 微博用户消息内容。 增加的趋势,并在短时间内达到峰值,之后由于网络中未感染 (1)数据采集:首先将选定时间段内的微博信息作为原始 节点S数量的减少以及C类型节点向J类型、R类型的转变, 数据,然后对某一条用户i转发自用户 的微博,分别提取i 其密度随时间递减,并最终在网络中消失;J(f)/N在信息传 和j的 ,检查现有网络中是否存在表示用户i和 的节点 播初期呈增加趋势,达到峰值后逐渐递减,最终在网络中消 失;R(f)/N在传播初期随时间递增,之后逐渐稳定,最终趋 以及表示i和J间转发关系的边,若不存在,则将其添加到网 近于1,即免疫状态是网络中的吸收状态。 络中。本文采集2015年1月1日一2015年6月30日时间段 内热门微博的用户转发信息,得到数据原始信息。 (2)数据预处理:该过程是用户行为分析和传播预测必不 可少的环节。原始数据中存在部分活跃度、参与度极低的用 户以及一些可能的“僵尸粉”、“水军”等,需要对数据进行清 洗,删除无用数据,去掉重复信息,过滤干扰因素,以便提高对 模型性能分析和评估的准确率。 首先基于SVM分类器对原始数据进行垃圾用户检 图5不同类型节点密度随时间变化情况 测l】 ,然后去除粉丝数低于阈值10、日均发布信息数量低于 图6表示在初始条件保持不变的情况下,外部影响概率 阈值0.1的用户,最终得到了一个由63641个节点和2775981 P 取不同值时,传播节点密度J(f)及免疫节点密度R(£)随时 条边构成的转发网络,网络模型参数如表1所列。 间的变化关系曲线。 ・ 44 ・ (1)在网络达到稳态之前,f(£)随P 取值的增大而增加, 度,即I( )将最终趋近于o,R( )最终趋近于1。 (3)网络达到稳定状态的时间随着 的增加而延长,由 于 的增加使得网络中传播节点数目随之增加,从而导致需 因为 表示未感染节点通过各种途径与感染节点的接触概 率,P 的取值越大,未感染节点的转发行为受外部环境的影 响就越大,图6的仿真结果与实际舆情话题的传播规律相符。 ∞ 为P 取值的增大,会使网络中更多的未感染节点转变为传播 噱 嘶 毗 哺 0 要更长的演化时间才可以使传播过程达到稳定状态。 :宝 ∞眙吡0 为了进行合理比较,本文对结果进行归一化处理。图8分别 本实验构建的微博传播网络只是现实网络的简化版本, (2)免疫节点的最终密度随着P 取值的增大而增加,因 至莆 郜《枷鞲啦 一磊 翻唾杠 娘 节点,这些传播节点最终会因为失去对话题的兴趣而成为免 疫节点。 给出SCIR模型关于转发节点密度和免疫节点密度的仿真结 果与真实数据的对比。由图8可知,仿真算法可以对真实数 (a)传播节点密度J(£)/N随时间变化的情况 t (b)免疫节点密度R( )/N随时间变化的情况 图6 不同P 值时传播节点和免疫节点密度随时间变化图 图7分别给出了在其他初始条件不变的情况下,转发概 率 取不同值时,传播节点密度J(£)及免疫节点密度R(f) 随时间的变化曲线。 (a)传播节点密度j(f)/N随时间变化的情况 【 (b)免疫节点密度R(t)/N随时间变化的情况 图7不同加值时传播节点和免疫节点密度随时间的变化图 (1)在网络达到稳态之前,I(£)随P 取值的增大而增大, 而R(£)随P 取值的增大而减小。因为转发概率 的增大表 明处于接触状态的节点转发话题的可能性增加,传播的次级 联效应由此增强,转发节点密度j(£)也随之增大。 (2) 取值的改变不会影响网络中各类节点的最终密 据进行拟合,说明仿真算法能够反映真实信息转发规律。 (a)传播节点 (b)免疫节点 图8 SCIR模型模拟结果与真实数据对比 结束语信息转发是微博中信息传播的重要方式。本文 从实际数据出发,提取了微博信息转发过程中发布用户、接收 用户、用户亲密度和信息时效性4个方面的8个特征进行用 户行为分析和建模,利用分析结果优化了SIR模型中对于用 户转发概率的计算方法,并引入了一种新的节点类型——接 触节点,来刻画已经接触到目标微博但尚未做出行动的这类 用户状态,提出了基于行为分析的微博传播SCIR模型。为 了验证模型仿真效果,本文收集了新浪名人堂2015年1月1 日一2015年6月30日期间的热门微博的用户信息和转发数 据,构建有向转发网络,采用SCIR模型对其中的信息传播进 行模拟。仿真结果呈现出与实际数据相符合的传播效果,证 明提出的SCIR模型在一定程度上体现了微博网络中的信息 转发规律,具有一定参考价值。 参考文献 [1]Yuan We ̄guo,Liu Yun,Cheng Jun-jun,et a1.Empirical analysis of microblog centrality and spread influence based on Bi—。direc—- tional connectionFJ].Acta Physica Sinica,2013,62(3):502—511 (in Chinese) 苑卫国,刘云,程军军,等.微博双向“关注”网络节点中心性及传 播影响力的分析[J].物理学报,2013,62(3):502—511 [2]Zhang Yang,Lu Rong,Yang Qing.Predicting Retweeting in Mi— eroblogs[J].Journal of Chinese Information Processing,2012, 26(4):109-114(in Chinese) 张呖,路荣,杨青.微博客中转发行为的预测研究[J].中文信息 学报,2012,26(4):109-114 (下转第7O页) ・45 ・ E12]Yao Y Y,Zhao Y.Attribute reduction in decision-theoretic rough set models[J].Information Sciences,2008,178(17):3356— 3373 [18]Li T R A rough sets based characteristic relation approach for dynamic attribute generalization in data mining[J].Knowledge- Based Systems,2007,20:485—494 [13]ChenH,YangJA,ZhuangZQ The coreof attributesandmini- mal attributes reduction in variable precision rough set[J].Chi— nese Journal of Computers,2012,35(5):1011—1017 [191 Chen H M,Li T R,Qiao S J,et a1.A rough set based dynamic maintenance approach for approximations in coarsening and refi— ning attribute values[J].International Journal of Intelligent Sys— tems,2010,25(10):1005—1026 [14]Jia x Y,Liao W H,Tang z M,et a1.Minimum cost attribute re— duction in decision-theoretic rough set models[J].Information Sciences,2013,219(10):151—167 [2O]Liu D,Li T R,Ruan D,et a1.An incremental approach for indu— cing knowledge from dynamic information systems[J].Funda— menta Informaticae,2009,94(2):245-260 [15]Jia x Y,Tang Z M,Liao W H,et a1.On an optimization repre— sentation of decision-theoretic rough set model[J].International Journal of Approximate Reasoning,2014,55(1):156—166 E213 Luo C,Li T R,Zhang J 13.Dynamic maintenance of approxima- tions in set—valued ordered decision systems under the attribute [16]Wang G Y,Ma X A,Yu H.Monotonic uncertainty measures for attribute reduction inprobabilistic rough set model[J].Interna— tional Journal of Approximate Reasoning,2015,59:41—67 genera1ization[J].Information ciSences,2014,257(2):210—228 [22]Zhang J B,Li T R,Chen H^,L Composite rough sets for dyna- mic data mining[J].Information ciSences,2014,257:81—100 E233 Yao Y Y.Two semantic issues in a probabilistic rough set model EJ].Fundamenta Informatieae,2011,108(3):249—265 [17]Chan C C.A rough set approach to attribute generalization in data mining[J].Journal of Information Sciences,1998,107:169—176 (上接第45页) E3]Qi Chao.Chen Hong-chang.Yu Yan Micro-blog information diffusion effect based on behavior analysis[J].Journal of Corn— purer Applications,2014,34(8):2404—2408(in Chinese) 61(23):238701(in Chinese) 顾亦然,夏玲玲.在线社交网络中谣言的传播与抑制[J].物理学 报,2012,61(23):238701 [1O]Wang Hui,Han Jiang-hong,Deng Lin,et a1.Dynamics of Rumor Spreading in Mobile Social Networks[J].Aeta Physica Sinica, 2013,62(11):110505(in Chinese) 齐超,陈鸿昶,于岩.基于行为分析的微博信息传播效果[J].计 算机应用,2014,34(8):2404—2408 [43 Yi Lan-li.Research on Statistical Characteristic Analysis and Modeling for Behavior in Microblog Community Based on Hu— 王辉,韩江洪,邓林,等.基于移动社交网络的谣言传播动力学研 究[J].物理学报,2013,62(11):110505 man Dynamics[D].Beijing:eiBjing University of Posts and Tel— ecommunications,2012(in Chinese) [n]Cha M,Haddadi H,Benevenuto F,et a1.Measuring user inf- luence in twitter:the million follower fallacy[C]∥Proceedings of the Sixth International AAAI Conference on Weblogs and SO— cial Media(ICWSM 2012).Menlo Park:AAAI Press,2010:10—17 易兰丽.基于人类动力学的微博用户行为统计特征分析与建模 研究ED].北京:北京邮电大学,2012 [5]Zhou Dong-hao,Han Wen-bao.DiffRank:A Novel Algorithm [123 Crandall D,Cosley D,Huttenlocher D,et a1.Feedback effects for Information Diffusion Detection in Social Networks[J].Chi— nese Journal of Computers,2014,37(4):884—893(in Chinese) between similarity and socia1 influence in online communities[c]∥ Proceeding of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Las Vegas,USA, ACM,2008:160—168 周东浩,韩文报.DiffRank:一种新型社会网络信息传播检测算 法[J].计算机学报,2014,37(4):884—893 [6]Zhang Yan-chao,Liu Yun,Zhang Hai—feng,et a1.The Research of Information Dissemination Model on Online Social Network [131 Singla P,Richardson M.Yes,there is a correlation:From social networks to personal behavior on the Web fC]i}Proceeding of the 17th International World Wide Web Conference.Beijing, China,2008:665—664 [J].Acta Physica Sinica,2011,60(5):66—72(in Chinese) 张彦超,刘云,张海峰,等.基于在线社交网络的信息传播模型 [J].物理学报,2011,60(5):66—72 [14]Mao Jia-xin,Liu Yi—qun,Zhang Min,et a1.Social Influence Anal- ysis for Micro-Blog User Based on User Behavior[J].Chinese Journal of Computers,2014,37(4):791—795(in Chinese) [7]Chen Qian-guo,Zhang Zi—li.Dynamics Behavior and Immune Control Strategies of SIRS Model with Immunization on Scal- efree Complex Networks[J].Computer Science,2013,40(6): 211—214(in Chinese) 毛佳昕,刘奕群,张敏,等.基于用户行为的微博用户社会影响力 分析[J].计算机学报,2014,37(4):791—795 [15]Kwak H,Lee C,Park H,et a1.What is Twitter,a social network 陈乾国,张自力.无标度网络上带人工免疫的SIRS模型动力学 行为及其免疫控制策略[J].计算机科学,2013,40(6):211—214 [8]Yang Zi—long,Huang Shu-guang,Wang Zhen,et a1.Study on Micro Blog Reposting Model Based on Characteristics of Infor— or a news media?[C]∥Proeeddings of the 19th international conference on World Wide Web.ACM,2010:591—600 B6]Newman Network:an introduction[M].New York:Oxford University Press,2009:449 mairon 0bsolescence[J].Computer Science,2014,41(12):82—85 (in Chinese) [17]Li He-yuan,Yu Xiao-ming,Liu Yue,et a1.Research on Detec— 杨子龙,黄曙光,王珍,等.基于信息老化特征的微博传播模型 [J].计算机科学,2014,41(12):82—85 [9]Gu Yi—ran,Xia Ling-ling.The Propagation and Inhibition of Ru— ting Spammer in Micro-blogs[J].Journal of Chinese Information Processing,2014,28(3):62—67(in Chinese) 李赫元,俞晓明,刘悦,等.中文微博客的垃圾用户检测[J].中文 信息学报,2014,28(3):62—67 mors in Online Social Network[J].Acta Physiea Sinica,2012, ・ 70 ・