各种复杂网络处理工具
各种复杂网络处理工具
networkx
igraph
BGL
SNAP
还有matlab的包,软件gephi,基于java等
对于大规模网络,主要问题在于速度!
graphs与networks的区别在于:networks在graphs的基础上,在nodes和edges上存在关联的数据。
igraph
开发语言:C语言,效率较高
使用语言:R,C,python
可视化:igraph和ggplot2
BGL(Boost graph Library)
开发语言:C++,C++的准标准库Boost提供
算法:图算法,(估计是没有提供复杂网络支持的,也不一定)
使用语言:C++
NetworkX
开发语言:python,速度慢
使用语言:python
可视化:matplotlib
SNAP
斯坦福提供的用于复杂网络计算的平台库
开发语言:C++,核心使用C++开发
使用语言:Python,C++
NetworkX与Igraph对比
NetworkX和igraph是做网络分析非常常用的两个包,且两者皆可在Python中运行。两者的功能也大体类似。但就效率而言,后者要比前者高出很多。原因在于:NetworkX is a pure-python implementation, whereas igraph is implemented in C.因此,如果是做大型网络的需要注意了,赶紧从NetworkX跳到igraph来,你不会后悔的。
对比很明确,当图较大时,两者甚至可以达到几百倍的差距。
建议
SNAP的平台使用C++开发,速度快,但是接口文档相对不太方便,可以学习一下
Igraph比networkx快很多,可以考虑转
networkx文档很好,速度真心不行,看来库的实现很重要
BGL可能只适用图,对复杂网络可能支持不太好
关于使用SNAP生成给定幂律指数的power-law图,由于需要生成大图,我选择使用SNAP,相关的操作见博客:
猜想
如果通过python接口,使用snap的库,并在spark上运行,岂不是相当于一个分布式图计算系统了,当然,在不考虑速度的情况下! (现在回头看,这个猜想太傻比了,请忽略!)