第50章 来自数学天才的反击(2/2)
全距值=32
平均差=30秒
第三页:2017年某小花耍大牌谣言互动数据
湖畔居士与同好账号包含统一关键词第一条动态发布时间列表。
全距值=32分05秒
平均差=31秒
……
周默按时间序列将湖畔居士与30个同好账号最近两年参与的每一次舆论攻击全部列出。
因为事件过去并不久,网民们对周默列出的14次舆论事件记忆犹新。而14页PPT的计算结果如14把刀,刀刀见血。
全距值都在32分左右,上下差不超过30秒。
平均差均在30秒左右,上下差不到5秒钟。
看到这里,网上已经一片哗然。
这么整齐划一犹如一直训练有素军队在行动的数据不能用巧合来形容,这是阴谋!
有细心的网友迅速地找到了周默提到的所有ID,然后将最新的动态放在一起。
哈!
新动态也符合这个规律……
实锤了!
湖畔居士工作室内的键盘声消失了。
湖畔居士用颤抖的手点燃了一支烟。
巧合,纯属巧合……
然而,周默并没就此罢休。
PPT16页。
科普:社交网络用户关系的拓扑特性。
知否的关系网络是由用户间的关注与被关注的关系形成的(如图所示),而且这是一种属于复杂网络的有向无权关系网络。
这种关系网络具有拓扑特性,因此需要网络度及度分布、聚类系数以及网络拓扑结构图这几种要素来反映这一特性。
P17.一种改良的LinearPro-gramming算法在社交网络中用户关系的识别中的运用。
……
P24.
首先将所有在历次舆情中出现在相关账号中用户的数据信息进行有效划分,操作步骤如下:
步骤一:获得数据样本X={x1,x2,…,xn};
步骤二:计算xi到其k邻域xki的距离d(xi,xki);计算全部样本点到k邻域的平均值
步骤三:计算数据的密度的公式如式……
步骤四:得到数据的判定函数如式……
步骤五:重复步骤二到步骤四,直到把异常信息全部删除掉。
网友们都要疯了,这尼玛得罪谁也别得罪学霸,否则连人家说的话都看不懂。
继续下翻,网友们终于松了一口气。
因为第34个PPT截图的标题是“以鹰眼观察为例”。
然而,网友高兴的太早了,因为除了周默列出的密密麻麻的ID号以及谁都看不懂的数据外,唯一能看懂的只有几行字。
步骤一:建立对象矩阵X和聚类数N;
步骤二:高度重叠对象作为聚类中心;
步骤三:利用k均值算法计算相似度。以“鹰眼观察”关注的其他用户信息生成关系图如图所示。其中计算对象相似度的公式如式……
步骤四:用各个类的平均向量更新聚类中心,再把每一个对象分别和这n个聚集中心的距离做比较,把相近的分为一类;
步骤五:不断的重复步骤三到步骤四,直到满足终止条件为止。
P62.结论
根据计算,所有关联账号均关注“湖畔居士”而湖畔居士却没有关注对方;
同好账号均互相关注;
同好账号关注对象中有90%的账号为共同关注账号;
湖畔居士率先发起含有关键词动态,此后3分钟内评论区出现的ID账号中有95%会在同好账号评论区出现,且时间在同好账号发布包含共同话题动态后的五分钟内。
同好账号在每一次舆情中的关键词与话题重合率100%;
同好账号均互相关注;
同好账号日常发言次数为零;
同好账号均习惯性集中在某一时间点变成活跃用户且话题重合率100%;;
同好账号关注对象均出现相似特征(因时间紧张不能有效排除被蒙蔽网友ID,故本文制作概述,不做详细表述)
P63.一种基于抽象代数半群法分析文字表达风格的数学模型及一种基于进化算法的神经网络搜索爬虫应用。
又是一大段没人能看懂的文字和公式……
P86.结论
周默毫不客气的将30个同好账号在网络上所有的留言进行的分析,最终分成了6个群组。
虽然没有明确说出这些账号为6人分别操作,但语言风格相似度80%、常见错别字重合度98%的结论已经尽在不言中。
最后,周默留下一行红色如血的文字。
别再惹我!
网络上一片哑然。
谁还敢惹你