Beautiful Soup的使用
第 2 章介绍了正则表达式的相关用法,只是一旦正则表达式写得有问题,得到的结果就可能不是我们想要的了。而且每一个网页都有一定的特殊结构和层级关系,很多节点都用 id 或 class 作区分,所以借助它们的结构和属性来提取不也可以吗?
本节我们就介绍一个强大的解析工具——BeautifulSoup,其借助网页的结构和属性等特性来解析网页。有了它,我们不需要写复杂的正则表达式,只需要简单的几个语句,就可以完成网页中某个元素的提取。
废话不多说,接下来就感受一下 Beautiful Soup 的强大之处吧。