Python3+BeautifulSoup4的安装实例教程

来源：互联网 2024-10-11 20:56:44

用正则表达式来提取网页中的内容是相当麻烦的，这里介绍一个可以从html或xml文件中提取数据的python库：beautiful soup.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.beautiful soup会帮你节省数小时甚至数天的工作时间.beautiful soup 4.2.0 文档

具体运用在官方文档中已经讲述的很清楚了，这里就不再赘述。说一下我安装时遇到的问题吧。

1.安装python3
官网下载并安装python3，加入Path变量，把安装好的python.exe重命名为python3.exe

2.安装pip3
输入：>pip3
问题提示：Fatal error in launcher: Unable to create process using '"'
输入：>python3 -m pip install --upgrade pip
问题提示：Requirement already up-to-date: pip in c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages
输入：>python3 -m pip install --upgrade pip --force-reinstall

立即学习“Python免费学习笔记（深入）”；

输出：

输入：>pip3 -V

输出：pip 9.0.1 from c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages (python 3.6)

pip3安装完成

3.安装BeautifulSoup4

>pip3 install beautifulsoup4

如果要用源码安装，下载BS4的源码 ,然后通过setup.py来安装，

将下载的压缩包解压到本地，用命令转换成Python3代码：

进入Python的安装目录下的\Tools\scripts，里面有2to3.py，用命令转换

\Python36-32\Tools\scripts>python 2to3.py -w C:\Users\****\AppData\Local\Programs\Python\Python36-32\beautifulsoup4-4.6.0

用命令提示符进入到BS4的解压的目录，开始安装：