该项目主要是研究微博某些大V粉丝圈的社团结构。
- 爬取某一人气微博博主的粉丝,以及粉丝的关注对象。
- 将其粉丝和粉丝关注的对象建立网络。
- 用GN和Louvain算法进行粉丝社团结构的划分。
- 另外,用GN和Louvain算法对《权力的游戏》中的人物进行社团划分。
-
weibofans.py 爬取微博粉丝和关注列表数据。
在爬取微博数据时,需要先登录微博,将cookie内容复制下来,程序运行时输入。另外,每爬取一条数据,休眠0.2秒,是为了不触发微博的反爬机制,否则微博会断开连接。
-
weibo_gn.py 采用GN算法进行社团划分
-
weibo_louvain.py 采用Louvain算法进行社团划分
-
fans.csv 爬取的微博粉丝和关注列表保存的数据库
-
storm.csv 《权力的游戏》中人物关系数据集