首页 > 代码库 > 简单而奇妙的网络,复杂而可预测的行为 ----读<链接>有感
简单而奇妙的网络,复杂而可预测的行为 ----读<链接>有感
你知道你为什么在这里吗? ----题记
多月前,已先读<爆发>,再读<链接>,内心不禁向往至深,感慨于科学家巴拉巴西对现实世界深刻的分析,同时也非常感谢两本书的译者(沈伟华老师和周涛老师)辛勤的劳动.然惶惶不敢动笔,今日下定决定,止增笑耳.虽书本残留的体温已经消散,但熠熠发光的思想长存。<链接>一书,成书于00年前后,所探究的问题是网络形成机制以及面向网络结构的相关研究热点。所读的版本是十周年纪念版,故不知原版,只论该版。书虽分为3个部分,但由我读来,分为4个部分尤佳,其精华的第二部分,我是当做两个部分来来读的。
在第一部分之前,作者讲述了网络的重要性,网络是如何让这个世界如此精彩的,而网络又为何如此脆弱,雅虎网站在小男孩的攻击时,竟然如此脆弱,让人唏嘘不已,然而现有以还原论为核心的研究方法可能不再适合用于解释网络结构的复杂性。本章是本书的统领,提出本书的关键性问题,复杂网络结构演化的基本规则是什么样的。
第一部分介绍了复杂网络研究脉络。在70年代以前,复杂网络的研究都以随机网络为研究重点,基于欧拉,哈密顿等多位老师的研究进行,但随机网络并不能有效刻画在线网络结构,虽然随机网络具有优美的数学表达,但小世界网络,六度理论的发现让随机网络成为过去,而现有研究中,只有针对特定研究背景才会利用随机网络结构,如研究不同网络结构下复杂网络特征研究,仍然有人采用随机网络,规则网络进行研究,从物理学上看,仍然是非常有意义的,因为对于物理学中,大量网络仍然是随机网络和规则网络的,而本人从事互联网背景下的网络研究,则不太关注规则网络下的特征,尤其是面向复杂网络下的社区形成,从物理学中成为”渗流”现象。六度分隔理论指出了社会网络结构的一个重要特征,是对随机网络研究的重大进步,复杂网络具有较小的最大路径,最大路径和节点个数成对数关系。当Granovetter很对就业机会的深入观察提出弱连接之后(Granovetter, 1973),就正式引入现代对网络结构研究的重要问题,社会网络关系的趋同和聚团现象,而学术界埃尔德什数的提出也是反映了社会网络的高聚团现象,小世界网络由此而出(Watts and Strogatz, 1998),随机世界观下的网络研究就此作古。
第二部分是本书的核心,我分为两部分读的,首先是复杂网络结构产生机制的解释,然后是对复杂网络的重要研究问题的梳理。小世界网络的发现打开了研究社会网络的一面窗户,但小世界网络的研究是对规则网络中连接的断开重连而得到,但现实世界中,复杂网络产生机理仍旧不明,直至巴拉巴西的大作出世(Barabási and Albert, 1999; Palla and Barabási et al.,2007; Barabási, 2013)。通过对互联网网页结构的深入分析,发现少数页面占有大量连接,而绝大多数页面只有少数几个连接,网络结构度分布密度和度成幂率关系,而其中信息则在其中传递,社会网络结构呈现无标度特征。无标度特征有效的刻画了现有网络结果,虽然基于数值模拟的结果和现实结果有一定差距,比如显示网络结构中存在“幂率饱和”现象,同时幂率值并不一定是3,但是这些都能通过对节点复杂行为进行解释。那么,这里就需要问两个问题:首先,复杂网络的核心要素是什么?然后是复杂网络形成机制是什么?
对于第一个问题,关注点要放在枢纽节点上,枢纽节点扮演了信息桥的作用,故而从网络结构中,枢纽节点是撑起网络结构的骨架,这也导致了在复杂网络的重要特征,复杂网络的鲁棒性以及面对蓄意攻击时的脆弱性,在第一部分中提到的雅虎被攻击一事,便是明证。同时基于此,也引发出两个重要研究问题,其一是如何识别枢纽节点,该研究在管理科学中极为常见,具体为面向社会网络结构的意见领袖识别,具体研究中,结合具体研究背景,多从行为、知识等层面对节点进行描述,提取节点属性,提高准确率;其二是最大化WOM在社会网络中的研究或理解WOM传播的研究,其常用研究方法是模拟或实证,在最大化WOM的研究中,一般策略是选择信息初始节点,基于线性阈值模型(Watts, 2002; Watts and Dodds, 2007)或独立级联模型模拟节点交互行为,从而检验初始节点选择效率,而在实证研究中,多基于Bass模型(Bass, 1969),采用时间序列实证方法对传播过程进行实证,研究特定背景下的传播规律。以上研究其核心都是基于复杂网络的枢纽节点。
对于第二个问题,巴拉巴西在其研究中,分别提出复杂网络的三个演化机制:生长机制、偏好机制和适应机制,前两者刻画了无标度网络的产生,强调了网络演化过程中的先发优势和马太效应,而引人适应机制解释了后来居上。生长机制从动态演化视角认为网络是节点逐次添加而导致了庞大的网络规模,而偏好机制则强调了节点的先发机制,认为节点偏向于连接拥有更多链接的节点,而基于网络检索方法,如PageRank(Brin and Page, 1998; Page and Brin et al., 1999),HITS(Kleinberg,1999)都是在这种假设下去识别枢纽节点;虽然前两个节点解释了网络结构演化的关键,但是无法解释为什么GOOGLE能打败Yahoo等后来居上的现象,从而引入适应度模型和适应机制来提高具有竞争力的节点对链接的吸引力。这三个机制的提出从解释了现有网络产生过程,而解释过程更多来源于物理学层面。
然后是,对复杂网络的研究则多关注网络结构的特征,比如网络的相变行为,网络的碎片化,网络社团识别等,其中基于管理科学背景,我认为尤其有意思的是三个,其一是网络的抗攻击型问题;其二是影响力问题;其三是社团识别,虽然Watts等已提出多种社团度量和识别方法,但仍需要深入发展和应用,当然还有等等。本文不做深入发展。但本文仍要提出一个有意思的问题:无标度网络的维度是多少,然后基于无标度网络的论述,其应具有分形特征,那么如何在无标度网络中提取出自相似的网络结构,在具体使用中,所得结果能否自然而然的推广至全体网络结构?
第三部分是对现有网络的扩充,从生物学,传染病学,互联网等多个领域分析了复杂网络应用的合理性,有助于理解“网络效应”,如为什么互联网市场竞争中,老大远远大于老二、老三,为什么艾滋病等传播表现出如此特征等等,本文就不复述了。
针对《链接》,就写到这吧,感谢该书的作者和译者(沈伟华老师)的工作。过段时间,再整理一下<爆发>。
望客观轻拍。
References:
Barabási, A. (2013). "Network science." PhilosophicalTransactions of the Royal Society A: Mathematical,Physical and EngineeringSciences371 (1987).
Barabási, A. and R. Albert (1999). "Emergence ofscaling in random networks." science 286 (5439): 509-512.
Bass, F. M. (1969). "A New Product Growth for ModelConsumer Durables." Management Science 15 (5): 215 -227.
Brin, S. and L. Page (1998). "The anatomy of alarge-scale hypertextual Web search engine." Computer Networks and ISDNSystems30(1–7): 107-117.
Granovetter, M. S. (1973). "The Strength of WeakTies." American Journal of Sociology 78 (6): 1360-1380.
Kleinberg, J. M. (1999). "Authoritative sources in ahyperlinked environment." J. ACM 46 (5): 604-632.
Page, L. and S. Brin, et al. (1999). The PageRankCitation Ranking: Bringing Order to the Web., Stanford InfoLab.
Palla, G. and A. Barabási, et al. (2007)."Quantifying social group evolution." Nature 446 (7136):664-667.
Watts, D. J. (2002). "A simple model of globalcascades on random networks." Proceedings of the National Academy ofSciences 99 (9): 5766-5771.
Watts, D. J. and P. S. Dodds (2007). "Influentials,networks, and public opinion formation." Journal of consumer research 34(4): 441-458.
Watts, D. J. and S. H. Strogatz (1998). "Collectivedynamics of ‘small-world‘ networks." Nature 393 (6684): 440-442.
简单而奇妙的网络,复杂而可预测的行为 ----读<链接>有感