首页 > 代码库 > 微信传播系列一:社会传播简述
微信传播系列一:社会传播简述
导语
俗话说“酒香不怕巷子深”,表面上说的是酒香引人,实际上是指好酒在街坊邻里间口耳相传,酒借着口碑飘香千里,毋须大张旗鼓的门面,也自会有客似云来。
这就是口碑营销,其背后是社会传播在起作用。线上社交工具的兴起,为传统的社会传播学带来了全新的研究视角,也提供了广阔的应用场景。本文将简要介绍社会传播学中若干经典课题的理论研究,及其在微信中的应用。
1 社会传播学研究什么?
1.1 经典的传播问题
社会传播学想要解答的问题,通俗地讲,就是信息是怎样在人与人之间流转的。经典的定性研究有“弱关系”理论:Granovetter, M. S. 认为弱关系能够突破强关系形成的交际圈,使我们触达多元化的人群与信息,从而发挥出比强关系更大的作用,比如在找工作时,多年不曾联系的旧相识能够带来更关键的工作机会 [1] 。另一方面,Krackhardt, D. 则认为强关系是人与人之间的信任纽带,因此相对于弱关系,人们更愿意接纳强关系带来的新信息,尽管弱关系能带来更多的新信息 [2] 。
除了定性研究,也有不少学者以数学模型为工具,量化传播规模随时间发展的规律。比如著名的 SIR 模型 [3] ,通过一组微分方程描述易感人群 S(t)、感染人群 I(t) 以及痊愈人群 R(t) 之间的在传染病扩散过程中的数量关系。基于此,为了更好地对现实情况进行描摹,后续衍生出考虑感染时延、痊愈后再次感染、被动免疫等各种复杂因素的模型 [4] 。
SIR 模型的应用场景是疾病防控,因此其更关注各个人群的宏观规模。与此相对应的,创新扩散模型则关注个体在不同的阶段以及不同的社交环境中,对新兴事物的接纳概率。比如BASS 模型认为,一个人(在时间点 T 之前不接纳新事物的情况下)在时间点 T 接纳新事物的概率由两部分组成:自身的接纳意愿 p 与模仿他人行为的倾向 q [5] 。
显然,BASS 模型更贴合社会化营销的应用场景,我们可以根据新产品的生命周期 T,估测个体的接纳概率,在不同的阶段有针对性地设计营销方案,比如在初期宣传产品本身的特点,当累积了一定客户量后再以市场占有率作为卖点。然而,模型假设每个个体都能准确感知到所有其它个体对新事物的接纳情况,这显然与实际不符:个体应当只能感知其附近局部的情况,比如好友、甚至是亲密好友的接纳情况。而这就涉及到社交网络的理论。
1.2 近代兴起的社交网络理论
网络科学是近年关注度较高的新兴学科,研究各类复杂网络的拓扑特性、演化规律等,社交网络是其中一个细分领域。最早可以追溯到 Euler, L. 为了解决哥尼斯堡问题而创立的图论 [6] ,“图”是网络的标准表示方法,图论的经典理论也成为网络科学的基础。
但是,不同于图论追求纯数学层面的优美与简洁,网络科学侧重于发现与探究真实网络中的现象与规律。比如 Watts, D. J. 和 Strogatz, S. H. 发现真实网络兼具较大的聚类系数和较短的平均距离这两个特点 [7] ,俗称“小世界效应”,而这是完全规则网格或者完全随机图这种纯数学模型所不具备的特点。
小世界效应中的聚类效应,折射的是人们局部抱团的社交现象,我们无法结交全世界的人,但是同部门内的同事或者同班同学之间一般都会认识,部门内部或班级内部就形成聚类效应。如何把这种局部联系紧密的社团找出来?这引发了大家的兴趣,继而展开了对社团发现的研究,比如 Newman, M. E. J. 和 Girvan, M. 找到一种方法,仅凭网络的拓扑结构(而不考虑网络成员的外部行为)就能够把当中的社团找出来 [8] 。
社交网络中的发现给社会传播学带来了不少启示,比如小世界效应部分解释了社会学家Milgram, S. 早年所做的传播实验:把 160 个包裹随机分给一批人,告诉他们包裹的最终收件人是某位股票经纪,请求他们转寄给他们认为最有可能认识那位股票经纪的朋友,并让他们的朋友也用同样的方式转寄下去。最终 44 个包裹成功送达目的地,而平均的转寄次数仅为 5.43,因而 Milgram, S. 大胆猜想,平均而言每个人都可以循着 6 段关系与世界上任意一位陌生人建立联系 [9] 。作为对这个实验的补充和完善,Facebook 测算出其 7.21 亿活跃用户构成的社交网络的平均距离为 4.74 [10, 11] 。这说明信息可以通过少数的几步跳转,就覆盖社交网络中的大量节点,微信中就有不少这种速度快、辐射广的传播案例 [20, 12] 。
除了用社交网络的理论解释社会传播的现象,学者们也开始尝试在量化模型中引入网络的拓扑结构:在量化个体的接纳概率时,将其看作具体的社交网络中的节点,并考虑其周边的网络拓扑对接纳概率的影响,而不是把他们看作抽象群体(或全体)中的一员 [13, 14, 15] 。
1.3 线上社交带来的新机遇
网络科学的兴起及其与社会传播学的交叉研究,离不开线上社交平台的普及。Facebook、twitter、微博、微信等社交应用迅速流行,现已成为我们不可或缺的社交工具。用户在这些社交平台上相互联系、互动,形成真实社会的投影,为社会传播学提供了海量宝贵的研究范本,这将演化出“计算社会学”学科,带来全新的研究范式,也为传统的社会传播学注入新的生命力 [16] 。
近年就涌现出不少针对线上传播的研究。比如,线上零售电商的用户会将商品推荐给拥有相似兴趣的好友,从而通过推荐链条形成兴趣同质化社团,其中结构紧密的小型社团比松散的大规模社团更乐于接受契合自身兴趣的昂贵商品 [17] ;Facebook 上的传播链条有着惊人的深度,这是由大量始发用户共同作用的结果,并且仅凭始发用户的基础画像信息无法准确预测最终的传播深度 [18] ;通过 Facebook 好友邀请进入游戏的玩家具有更高的粘性,而他们发出的邀请也具有更高的成功率 [19] 。
2 微信的社会传播研究
作为中国最大的社交平台,微信的日登录用户逾 7 亿 [20] 。微信的每对用户可以建立好友关系,多个用户可以建立群组,从而与好友或群组成员进行即时通讯。除此之外,微信还提供“朋友圈”功能,用户既可在朋友圈中向好友分享文字、图片、文章链接等内容,也可以浏览其好友分享的内容。通过好友及群组会话、朋友圈分享等渠道,一些内容在好友之间一传十、十传百,最终可以触达数以千万计的用户 [12] 。用户通过好友接触到各式各样的内容,而内容则在口口相传中广为传播。如何使优质的内容传播更广,使低质量的内容传播受到遏制,是微信社会传播的主要研究问题,接下来,我们将从这两个方面介绍微信数据团队在社会传播领域的具体工作。
2.1 行为传播
行为传播主要应用于社会化营销,对于指定的某类内容,从社交网络中挖掘尽可能少的关键用户进行营销,达到使营销效果最大化的目标。行为传播建模有几个主要的模块,包括同质性计算、传播力计算以及影响力计算。对于某种内容:
? 同质性主要计算用户对于内容的传播意愿;
? 传播力计算用户对于内容的传播能力;
? 影响力是计算如何通过社交关系的影响,增强用户的传播意愿。
2.1.1 同质性计算
传统的行为传播理论,往往假设每个人对同一种创新事物或者产品的兴趣度相似(意愿度相似),直接根据网络中节点的结构属性来挖掘关键节点。但是在实际的社交网络中,用户有着不同的兴趣,用户不同的社交关系也可能由不同原因形成,即使在同一个社交圈子中,用户的兴趣也可能不同,所以直接从现有的社交网络中计算某一类事物的传播特征并不合适。解决这一问题的方法就是同质性计算,即根据用户的历史行为和社交关系信息,计算社交关系两端用户对于某类事物的相似性。通过同质性计算,即从现有的社交网络中,挖掘兴趣相似的用户和子网络,用于后续的传播力计算和影响力计算。
2.1.2 影响力计算
用户的转发意愿,不仅和用户自己的兴趣相关,也和社交影响有关,有个普世的结论,对同一种内容,假如有多个好友进行了传播,那该用户采纳并且也进行传播的概率会增大。进一步,好友中对用户影响大的那些好友进行转发的话,用户转发的概率会进一步增大。影响力计算就是对用户的好友进行计算,评估每个好友对用户的影响力大小,这个影响力的大小和内容相关。基于此,在社会化营销的过程中,通过用户兴趣和社交影响力,提升用户的采纳和传播概率。
2.1.3 传播力计算
传播力即是传统行为传播的主要研究内容,如下图,在传播过程中,不同节点在网络中的位置不同,能够带来后续的传播量不同。传播力计算根据用户在社交网络中的位置以及网络结构,挖掘出能够带来后续广泛传播的节点。目前,计算传播过程中关键节点的指标有很多,例如 PageRank、LeaderRank、Betweenness、Closeness、Kcore、H-index 等等,但是这些指标都是启发式的,和传播力没有直接的逻辑关系,事实上,很多文献也指出不同的启发式指标只适用于一些特定的传播模式,没有很好的普适性。基于此,我们结合复杂网络的结构指标和机器学习算法,研发了微信用户的 WeRank 算法,在实际应用中有很不错的效果。
2.2 信息传播
目前,信息传播在包括 Facebook、twitter、微博、微信等大的社交媒体中,最主要的应用是对低质量信息的管理,以达到净化网络空间的目的。建模方面,信息传播主要是以信息为对象进行建模,包括对信息传播模式的挖掘和理解,基于传播模式对传播规模和速度的预测,以及对信息本身的真伪进行识别等模块。目标是在信息发表早期就能预测信息传播的规模和速度,针对会大规模影响大众的信息进行及时的判断和控制。
2.2.1 传播模式
不同信息的传播模式不同,对于能够爆发以及低质量的信息,往往有其共性的传播模式,所以传播模式的理解是预测、识别和控制的基础。传播模式一般可以概括为几个方面:
? 首先是传播树的结构,目前比较成熟的理论,根据传播树的深度和宽度等综合信息,可以将信息大致分为媒体型和社交型,媒体型是指大部分参与传播的用户都围绕在传播源头附近,源头起着很重要的传播作用;
社交型是指传播的主力军更多是来自传播树的中间力量,靠用户的自发传播形成传播树,在形状上表现出深度比较深的特点。沿着类似的思路,可以对传播树的更多结构特征进行表达学习,进而用到预测和识别过程中。
? 第二个是用户群体的模式,传播群体中有无特殊的群体在传播过程中起着关键的作用,建模过程中可以监控特殊群体的传播行为,去预测和识别信息。
? 第三个是传播用户之间交互和影响的模式,如果传播用户群体之间是否形成了相互的影响关系,传播爆发的可能性会更大。
2.2.2 传播预测
传播预测(cascade prediction)是学术界和工业界都非常热的研究领域,大体可以分为两个方向:
? 一种是对传播结果的预测,根据早期的传播模式和特征,预测整体的传播规模,方法以机器学习算法为主;
? 另一种是对传播过程中,每个时间点的传播规模和速度进行预测,方法以方程建模或者主体模型为主;近几年,也有学者提出将机器学习和复杂系统建模进行结合,在传播过程中,通过机器学习动态地学习人群传播的特征参数,然后基于主体模型进行预测。微信传播预测基于传播时序模式,结合深度学习,将传播的规模做出了预测,取得了比较高的覆盖率和准确率。
2.2.3 谣言识别
如上述,国内外几个大的社交媒体都有专门的谣言识别模块,用于及时控制谣言的大范围传播。识别建模方面,主流的做法,是对信息的内容进行分析,学习目标信息中词组的频率分布与是否谣言的相关性。这种方法有个缺陷,对于内容比较新的谣言很难识别出来;后来,用户与信息的交互情况也考虑了进来,例如,用户是否评论信息以及评论中是否有特定的关键词等,提升了仅仅根据内容本身难识别新谣言的问题;近两年,有些学者将传播模式加入到谣言识别模型的特征中,进一步提升了准确率。我们也借鉴这些先进的技术,建立了微信的谣言识别引擎。
3 结语
人类作为社会性动物,人与人之间频繁地进行着交流,社会传播现象在社会生活中无所不在,小到一则新闻、一首歌曲、一种商品,大到一种观点、一种文化,都在社会中广泛地传播着。线上社交平台,极大地增强了人类的社会属性,既为社会传播的研究提供了肥沃的土壤,也为其带来了广阔的应用舞台。在微信,我们从用户的一次次传播中,探究这些现象背后的机理与动因,并将这些研究反哺于产品研发之中,持续地优化用户的社交体验。
4 参考文献
[1] Granovetter, M. S. The Strength of Weak Ties [J]. American Journal of Sociology, 1973, 78(6): 1360-1380.
[2] Krackhardt, D. The Strength of Strong Ties: The Importance of Philos in Organizations [M]. In N. Nohria, R. Eccles (eds.), Networks and Organizations: Structure, Form, and Action. Boston: Harvard Business School Press, 1992: 216-239.
[3] Kermack, W. O. and Mckendrick, A. G. A Contribution to the Mathematical Theory of Epidemics [J]. Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences. 1927. 115(772): 700.
[4] Hethcote, H. W. The Mathematics of Infectious Diseases [J]. Society for Industrial and Applied Mathematics. 2000. 42: 599-653.
[5] Bass, F. M. A New Product Growth for Model Comsumer Durables [J]. Management Science, 1969, 15: 215-227.
[6] Euler, L. Solutio Problematis ad Geometriam Situs Pertinentis [J]. Comment. Acad. Sci. U. Petrop, 1736, 8: 128-140. Reprinted in Opera Omnia Series Prima, 1766, 7: 1-10.
[7] Watts, D. J. and Strogatz, S. H. Collective Dynamics of “Small-World” Neworks [J]. Nature, 1998, 393(6684): 440-442.
[8] Newman, M. E. J. and Girvan, M. Finding and Evaluating Community Structure in Networks [J]. Physical Review E, 2004, 69(2): 026113.
[9] Milgram, S. The Small World Problem [J]. Psychology Today, 1967, 2(1): 60-67.
[10] Ugander, J., Karrer, B., Backstrom, L., et al. The Anatomy of the Facebook Social Graph [J/OL]. Eprint arXiv, 2011, 1111: 4503v1. [2012-12-14]. http://www.arXiv.org.
[11] Backstrom, L., Boldiy, P., Rosa, M., et al. Four Degrees of Separation [J/OL]. Eprint arXiv, 2011, 1111: 4570v1. [2012-12-14]. http://www.arXiv.org.
[12] WeChat TechPower. 微信小秘密: 2016 年那些 10w+ 文章是怎么刷爆朋友圈的?[OL]. [2017-1-3].
http://mp.weixin.qq.com/s/hlWAW8UybzF5jzhNyRx_Bg. [2017-1-3].http://mp.weixin.qq.com/s/hlWAW8UybzF5jzhNyRx_Bg.
[13] Kearns, M., Suri, S. and Montfort, N. An Experimental Study of the Coloring Problem on Human Subject Networks [J]. Science, 2006, 313(5788): 824-827.
[14] Kearns, M., Judd, S., Tan, J. and Wortman, J. Behavioral Experiments on Biased Voting in Networks [C]. Proceedings of the National Academy of Sciences, 2009, 106(5): 1347-1352.
[15] Zhang, J., Liu, B., Tang, J., et al. Social Influence Locality for Modeling Retweeting Behaviors [C]. In IJCAI, 2013.
[16] Lazer, D., Pentland, A., Adamic, L., et al. Life in the network: the coming age of computational social science [J]. Science, 2009, 323(5915): 721-723.
[17] Leskovec, J., Adamic, L. A., and Huberman, B. A. The dynamics of viral marketing [C]. Proceedings of the 7th ACM conference on Electronic commerce, 2006.
[18] Sun, E., Rosenn, I., Marlow, C. A. and Lento, T. M. Gesundheit! Modeling Contagion through Facebook News Feed [C]. Proceedings of the 3rd International AAAI Conference on Weblogs and Social Media, 2009.
[19] Wei, X., Yang, J. and Adamic, L. A. Diffusion dynamics of games on online social networks [C]. Proceedings of the 3rd Conference on Online Social Networks, 2010.
微信传播系列一:社会传播简述