查看: 1656|回复: 22

“这是什么梗?”,互联网上的新梗老梗若何影响你?

  [复制链接]

9

主题

17

帖子

53

积分

注册会员

Rank: 2

积分
53
发表于 2019-11-15 08:22:55 | 显示全部楼层 |阅读模式
meme卡片集 | ©marble.cards







导语

模因(meme,又译作觅母、迷因),俗称“梗”,是指基因一样依靠宿主、复制传布的“文化基因”。今年的一篇论文,构建了模因在收集上传布的动力学模子,本文将具体先容这项工作。
目 录

1 传统疾病传布的模子概述

2 模因是怎样传布的

3 模因传布的根本模子

4 模因的传布的夹杂通用模子

5 用于考证数据集概述

6 参数拟合

7 猜测模因的风行

8 和疾病模子的对照


自从在《无私的基因》中第一次亮相,模因(meme)这个概念一步步地把它本身酿成了广为传布的模因。与生物学的基因相比,模因指的是文化传布中具有牢固功用的一个组件。正如侯世达所言,它如同在大脑之间腾跃着的火花一样引人留意又可以传布。比如艺术中的哥特式气概,电影分类中的僵尸片。在交际收集上,模因可所以一个概念,对某电视剧的追捧,大概是一个忽然风行起来的Emoji、风行语。
以往关于收集上的信息传布研讨最多的话题是疾病的传布,但是模因在交际收集上的传布因其背后机制的分歧,而显现出分歧的纪律。2019年2月在arxiv.org公布的一篇预印本论文,为模因传布建立了数学模子,并在豆瓣、微博等数据集上考证了模子猜测正确性。本文将以这篇论文为布景,为读者先容模因传布背后的纪律。

论文题目:

A model for meme popularity growth in social networking systems based on biological principle and human interest dynamics

论文地址:

https://arxiv.org/abs/1902.00533






1 传统的疾病传布模子



图1:图示四种疾病传布模子。





已有的疾病传布模子可以为我们研讨模因的传布供给灵感与工具。图1从简单到复杂,一步步展现了若何对疾病传布的进程停止建模。图中的S是易动人群(Susceptible),代表一共有几多人能够会被传染。其中有β%的人传染(Infected),以后有μ%的人被治愈,治愈者有了抗体,不再传染,这是SIR模子描写的情况。而假如全数的人都能治愈,那就是SIS模子,而假如得病后的人有一定几率抗体消失,重新进入易动人群,那这就属于SIRS模子,而SEIR模子在SIR模子根本上加上了表露(Expose)这一步,用来描写不是一切易动人群城市表露在打仗病毒的情况中。



在上述的疾病模子下,人群中已经传染过病毒的人的比例会显现如图2所示的趋向。最初是疾病随机、小范围地爆发和消退,以后有一个指数化增加的阶段,以后在SIS模子中,大部人都传染过,例如流感病毒这样的终极会康复的病毒;而在SIR模子中,指数化增加后,随着越来越多的人获得抗体,传抱病毒的人会逐步回到0点,例如人类终极经过疫苗消灭了天花病毒。




图2:SIS 和 SIR模子传染个体随时候变化表示图





2 模因的传布有何分歧之处



图3:模因与基因进化传布的区分







论文题目:

Evolutionary Dynamics of Cultural Memes and Application to Massive Movie Data

论文地址:

https://arxiv.org/abs/1903.02197?context=physics.soc-ph


图3来自今年5月颁发的论文,该文关注的是模因的进化动力学及其在电影气概上的利用,这里借用过来说明模因与基因进化的三点分歧之处:

  • 任何一个模因的“父辈”会有一个大概多个,而不是只要两个;
  • 模因的变异不是来自于罕有的点突变大概仅仅是父辈之间重组,而是延续的大范围的改变;
  • 模因的传布可以跨越父辈的中心层,间接从第一代传布到第三代。


这三点说明模因的进化,更像是微生物的进化,可以有横向的基因交换,一种菌可以间接从另一种菌那边“借”到有用的基因片断。
由于模因的进化更类似微生物,是以对模因风行水平的建模,也应优先鉴戒已有的对微生物群落建模。由于关注斟酌的是模因的传布微风行,是以以后的模子中不触及模因自己的改变,这里一番诠释,是为了让不熟悉的模因的读者能对这个概念有一些直观的了解,模因能复制,能传布,也能进化。

3 模因传布进程中的三个状态

用微生物的进化进程,来仿生模拟迷因的传布,从而构建起和疾病传布分歧的根本模子,下面将对其停止详解。
图4:细胞的生活周期与模因的生活周期对照






上图是一个从微生物“传布”模子到模因传布模子仿生进程的表示图,红色描写细菌群落的演变,细菌割裂为多个细胞,以后部分细胞存活,部分细胞死去。而对于模因,例如一则谎言、对某电视剧的保举,也是最初由最初一小群人转发,以后部分人被成功传布,部分人则没法被该模因影响(exclusion)。

以一个7小我的群体为例,图5和图6展现了M1、M2、M3、M4这4个模因是若何在他们之间传布的。


图5:模因传布图解





图5b展现的是4个模因在7个用户身上存活生命周期的间轴,a展现的是模因1-4在这个模拟的时候段内别离影响了哪些用户。图b是图a具体细节的描写,其中六边形是代表用户传布模因这一行为。



如图5c所示,针对每个模因,有三种能够性。这小我要末鄙人一时辰以PF的几率传布这一模因,要末以PW否认该模因了,而这两种状态之外剩下的几率里,该人仍然相信该模因,可是并不传布它。d图与b图都描写了模因的状态,只不外是从用户的角度切换成了模因本身保存的角度。图d展现了上面4个模因随着时候流逝在7个用户心中的总状态,这张图可以类比微生物模子中的割裂,保存与灭亡。

4 在模因传布中引入交际收集的影响



图6:模因在交际收集上的传布






上述基于单体模子(Agent-based model)组成的只是根本模子,没有斟酌交际收集合人际互动影响,只要进一步增加对收集动力学建模,才能构建用来猜测模因风行水平的夹杂通用模子。如图6所示,研讨者斟酌群体之间相隔影响,提出了模因传布的3条根基假定:

  • 将一个用户被一个模因影响,比如读到某本书,这个进程称之为激活。这小我被激活的几率随着身旁已激活的人的比例呈Sigmoid函数散布。形象的说,就是朋友圈最初只要几小我追一部剧的时辰,被种草很难,以后随着比例增加,几率速度提升,等人多了以后,用户已经全数覆盖,这时辰模因的传布进入了平台期。(左图所示)
  • 用户两次活跃时候的间隔,呈幂律散布,也就是对某位用户,其在20%时候段中异常活跃,介入了的传布大概接收模因行动数占总数的80%(数字用来打例如),而剩下的时候里,根基不会介入模因的传布。
  • 用户在传布模因时,有一定几率p传布之前收到的模因,在1-p的几率下转播旧的模因。


这三条假定中,最重要的是第一条,该条描写了人际交往对模因传布的影响呈非线性的增加。而Sigmoid函数是最常用的描写非线性增加的函数。在该模子中,用到了sigmoid函数的变种


公式1:改良的Sigmoid函数






从数学上来看,针对某模子,特定的参数B和C别离决议了函数的峻峭水平,以及在横轴上偏移的数值。从模子现实意义上来看,可以形象地了解为:B是传布时候的“衰减率”,该值越小,模因到达传布速度最高点所需的时候相对越长。该数值越大,模因传布形式越趋近于爆发式增加;那时候到达C点时,模因的传布速度到达最快,模因正处于传布速度的颠峰。C值越大,模因需要越长的时候来酝酿,C值越小,爆点来得越早。


图7:模子的建模全进程表示





5 模因在具体数据中的表示形式

在这篇预印本论文中,用到了3种分歧范例的数据集,别离是美食保举网站delicious、豆瓣念书、电影和音乐、以及微博上的转发数据。对于美食网站,收藏一家餐馆算做是传布模因;对于豆瓣,对书/电影/音乐评分算是传布模因;而微博上的转发算是模因的传布。对于一本书、一部电影、一张专辑,假如在某个时辰后不再被说起,那相当于该模因被新的模因覆盖掉了。


表1:数据集的基赋性质






上表说了然利用的数据集的巨细和特征。对于分歧延续时候的数据集,研讨者为了分析方便,对其停止了归一化。该数据集合最使人意外的就是用户数:豆瓣电影的用户数比念书和音乐少了一个数目级,而其模因数目,也就是包括的电影数目却是最多的,而且,电影的记录数目也是最多的,这说明豆瓣电影用户更多是重度用户。而在delicious网站上,用户数目比豆瓣用户数高了2个数目级,收集合传布的模因数目却在附近的水平。这说明这些数据集不可是内容分歧,收集的结构(例如稀疏水平)也有所分歧。

6 从实在数据中预估模子参数

有了模子和数据,接下来要做的是从实在数据中去拟合模子中的参数。下表给出了分歧数据集拟合出的参数。


表2:模子练习后的参数




这里美食网站有收藏一家餐馆,以及将该餐馆移除收藏两个操纵,是以其对应的B和C有两个。先看α与ρ,它们是决议用户分享频次和优先级的参数,其中假定转发时候间隔是幂率散布的,α是幂率函数中的唯一参数,α越大转发越频仍,而ρ是人们转发新消息的几率,ρ越接近于1,人们越偏向于传布新信息。
民以食为天。美食网站的用户、均匀两次活跃之间的间隔是一切网站间最小的。豆瓣电影都是些重度用户,活跃时候的间隔次之。而念书所需的时候较长,用户活跃的时候间隔也是相对最大的,这合适预期。
另一个风趣的发现是:豆瓣系的网站,其拟合出的B和C都是附近的,也就是说,非论是电影、图书还是音乐,艺术文学作品背后模因的分散方式均匀来说都是以相对陡峭的方式停止的。
最使人意外的是微博和美食网站的拟合出的B都是0.24,意为美食网站和微博上模因的传布更具爆发性,美食与短消息更具吸引力,更轻易让人们停止传布。微博是虽然也有部分网红餐饮成份,但其支流是以文娱资讯为代表的实时消息。两者的引爆点不异,也许这能用进化心理学诠释,人们评价消息能否值得转发,和评价食品的黑白,背后有着类似的动力。美食网站有将餐厅移出收藏这个选项,该数据拟合的B、C值别离是0.4和0.8也就是反过来,当人们起头对一家餐厅落空爱好的时辰,它会以更快的速度被抛弃。
从这里引伸到交际收集合,可以晓得,当一个交际收集合碰到的50%左右的用户都在传布伪科学、假消息等无效信息时,那这个交际媒体味起头敏捷流失用户,从最早的天涯,到后来的大家网莫不如此。

7 模子猜测的成果及其启迪






图8中的横轴是正则化后的时候,纵轴是某个模因还有几多风行的潜力。P即是1的时辰,意味着在数据集包括的时候内,模因的传布和用户的流出到达了平衡。图中非论是黑色虚线代表的模拟成果,还是理论推算出的蓝色虚线,依照数据拟合出的参数,在对Pn的猜测上,几近没有误差。这说了然该模子包括了对模因传布有影响的全数身分,且适用于多种截然分歧的收集。
下面是Pn的计较公式,其中的St是某时辰该模因在几多用户中“存活”,Wt是几多人接收到,却没有被该模因影响(overwrite),Ft是几多人在传布模因,Pn的分母为最大值时(逼近1),意味着传布该模因的人最小(逼近0),即该模因已经过气了。
公式2:模因风行度与时候关系计较公式




对照三种分歧收集,对于模因的传布的纪律,可以比力异同。非论是什么样的内容,一切的模因城市过气,对于文艺作品,其传布是相对线性的,而在微博上,模因的爆发则加倍忽然。

8 对照疾病传布模子及总结

相比疾病的传布,模因从传布机制上就不是非黑即白的,必必要斟酌人的行为——同伴压力(peer pressure)(比如大师都看权利的游戏,我不看显得分歧群),也需要斟酌人际交往的频次遵照幂律散布。是以不能简单的点窜某种疾病传布模子,而需要从微生物群落的繁衍鉴戒灵感,同时在收集合引入交际的机制。交际收集由于其内容分歧,其数据看起来有明显的不同。但在本文论述的模子下,数据的差别可以经过拟合出的参数分歧加以诠释,后续再按照参数去猜测模因风行的群体统计目标。分歧收集可以用不异的模子正确猜测,意味着在微观层面,这些收集有着不异的天朝气制。虽然没法具体猜测一部电影能否会火,但对交际收集的分类题目、收集的鲁棒性、以及收集合模因的管控机制设想有所助益。

作者:郭瑞东

审校:陈曦

编辑:王怡蔺

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

5

主题

6701

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13407
发表于 2019-11-15 09:11:22 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

9

主题

6698

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13405
发表于 2019-11-15 10:55:54 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

10

主题

6726

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13462
发表于 2019-11-15 11:26:38 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

8

主题

6753

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13514
发表于 2019-11-15 12:18:00 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

12

主题

6714

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13440
发表于 2019-11-15 12:36:49 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

7

主题

6720

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13447
发表于 2019-11-16 06:33:05 来自手机 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

2

主题

6670

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13342
发表于 2019-11-16 06:51:48 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

10

主题

6697

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13404
发表于 2019-11-16 07:35:55 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

6

主题

6712

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13430
发表于 2019-11-16 07:39:16 | 显示全部楼层
互联网真的是时代的趋势啊
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表