python 网络爬虫设置ip代理

发布时间：2020-08-15 17:55:03

发布者：神棍子

浏览量:

在爬虫爬取信息的过程中，有部分会出现刚开始采集正常，但是爬取几次之后就没有办法再次采集数据了，这基本上就是因为ip被爬取的服务器给禁了，所以在爬取过程中最好添加上代理ip，这样每爬取一次就切换一次ip，便可减少被封的可能。

首先需要一个ip的代理池，现在基本上都是付费，格式基本都是 ip+端口号

用request模块进行url访问时，设置ip代理：

proxies参数：参数中需要传进一个对象对象中需要两个参数一个是http一个是https但是传递的内容是一样的

参数url格式为：http://+ip+端口。

当需要进行用户名密码认证的时候便需要在传递两个参数：http://+用户名+密码+@+ip+端口。

例：

代码1

(无需认证)

代码2

（认证）

访问写法为：

request.get(url=url,proxies={'http': 'http://admin:admin@175.167.236.26:57114', 'https':'http://admin:admin@175.167.236.26:57114'}}

需要注意的是，虽然你写好了，而代理服务器有可能拒绝你代理，会返回403错误，所以需要在结果中判断响应值是不是200，如果进行多次请求的时候建议加上访问过期时间，不然你的主机或者服务器会非常卡顿~

上一篇：三元表达式多个条件多次判断

下一篇：打造一个高质量网站，有哪些步骤是必不可少的！

关键词:

2025-06-07

python程序获取deepseekapi流程查看详情

2025-04-01

网页开发入门编程-后端开发查看详情

2024-08-02

Mircopython通过URAT串口收发信息查看详情

2024-07-19

python生成自动连接wifi二维码查看详情

2024-06-29

分享一份python每天8点自动发送邮件的案例查看详情

2024-03-31

很多人都知道的三个Python编码常用高级技巧查看详情