经常听到“搞安全的圈子”这个词,那么安全的这个圈子有多大呢?哪些人是活跃在线上,正在搞安全的呢? 笔者也想知道这个问题的答案,于是做了点有意思的小测试,写下本文。
(注:本文中所指的圈子,仅仅是指那些活跃在线上的安全人员,不包括什么相关部门的隐世高手或者是地下市场的各类大牛)
测试流程
- 以我自己的腾讯微博【我收听的人】作为起点,收集【第一页】的人。注意:只收集了第一页,大约30人(有一些官方的游戏帐号,例如:天天爱消除)。
再以这些人为起点,继续搜集他们所收听的【第一页】的人。
以上过程中,我们需要记录的有2类数据。(1)用户ID及昵称;(2)收听ID与被收听ID
编写perl脚本将以上过程自动化,将爬取结果存入sqlite数据库中。
一段时间后,觉得数据差不多了,CTRL+C 终止了爬取过程。得到了2576个微博ID和3410个微博收听关系。
由于微博ID中有些帐号是官方帐号,例如:t(腾讯薇薇), 或者是业界大佬,例如:pony(麻花疼),当然还有一些著名公知、游戏宣传ID等。均被剔出上述结果。最终,我们可以得到2209个微博ID。
从sqlite中导出剔除知名ID后的用户关系数据。使用cytoscape软件进行简单的分析。
测试结果
1. 内外两大圈!
将网络关系通过yFiles的circular layout进行展示,我们可以得到内外两大圈,如下图:
放大显示,我们可以发现,在内圈上,基本都是活跃在安全圈子的人,比如,黑哥。如下图:
至于其它的ID是不是,大家可以去查下上图这几个微博ID。 例如上图中reb1r7h这个ID,很陌生对吧,我也没见过,但是我们查看一下他微博内容,会发现他确实是与安全有关的,如下图:
2. 当然,上图只是截了一个角落,为了进一步看看,这个“内圈”到底覆盖程度如何?我们来搜索下我们经常能见到的ID。
@axis ,微博ID:aullik5,为了方便显示,我们选取与aullik5相关的结点及二级结点,可以得到下图:
前些天,看到tombkeeper在微博上推荐台湾女黑客(微博ID:wintersnow1119),我们会发现,这位女黑客也在我们的圈子里。同样将数据独立显示出来。
我们好像发现了什么:@sogili 这个猥琐的娃子,也关注了女黑阔!!
以我们团队为例,以平时低调的verkey为入口,展现二级结点数据。可以发现我们团队的人员就全部出现在内部小圈子上了。
最后,我在看剑心这个结点的时候,附近还看见了一个很陌生,但是读起来很好听的单词。tarantula!
查了下,原来是。。。(哈哈,是她,是她,就是她,你们自己查去!)
3. 最终,我们手上就有了一份安全人员的大名单。
总结
我仅仅只采集了用户【收听的人】,而没有采集用户的【粉丝】。因为微博上名人经常被收听,而这些名人的粉丝数目众多,如果采集粉丝,当遇到名人时,采集器就会陷入名人不能自拔。当然可以通过黑名单的方式来排除名人,但是我们想要搜集这份黑名单几乎是不可能的。同时,用户【收听的人】价值明显高于【粉丝】,得到的关系结果更为真实。
我们的起点是很小的,在我自己的收听名单第一页中,人数是非常有限的,但是最终收获的名单是挺全面的,这说明这种采集方法还是十分有效果的。
安全圈有多大?也许就这么大?
这两年安全行业发展得很不错,来一次新浪微博的?估计多了不少人!
二哥的思维好棒
活跃的旧那几个
weibi what
不玩weibo
同意核总,我也认识很多人都不用微博的
膜拜ING
胖子更威武。。。
多个ID很有必要!
居然也看到了我等屌丝的微博ID,顿时觉得压力好大!
好棒的文章。
流动人员大。
生物学博士威武
左下角不是我,各种求不社工。
已修改 :)
大赞!
核总也不玩啊
天天都有人入圈 天天都有人退圈
还有很多人不用微博的,像哥这种屌丝压根不知道微博是神马东西……
@瞌睡龙 1. 内网两大圈,修改一下,是内外两大圈。 这句“我们可以得到内网2个大圈”,也一样,是内外两大圈。
不大不大一点都不大
围观黑阔
我也是这样加安全圈子里的腾讯好友的 哈哈