第 8 章 搜索、挖掘和可视化数据

在本章中,我们将介绍:

  • 对 IP 地址进行地理编码

  • 收集维基百科编辑的 IP 地址

  • 可视化维基百科上的贡献者位置频率

  • 从 StackOverflow 职位列表创建词云

  • 抓取维基百科上的链接

  • 可视化维基百科上的页面关系

  • 计算维基百科页面之间的分离度

在本章中,我们将研究如何搜索网页内容、得出分析结果以及如何可视化这些结果。 我们将学习如何定位内容海报并可视化其位置的分布。 然后我们将研究如何抓取、建模和可视化维基百科页面之间的关系。