他们在爬网页时,是怎么用的代理IP?

比如用CURL的话,代理IP该怎么用啊,是开启软件还是直接在CURL做的设置啊,求指教。

http://php.net/manual/en/book.curl.php

phpif ($this->proxy) curl_setopt($process, CURLOPT_PROXY, $this->proxy);
    function curlPost($url, $post='', $autoFollow=0){
        $ch = curl_init();
        $user_agent = 'Safari Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_1) AppleWebKit/537.73.11 (KHTML, like Gecko) Version/7.0.1 Safari/5
        curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);
        // 2. 设置选项,包括URL
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
        curl_setopt($ch, CURLOPT_HEADER, 0); 
        curl_setopt($ch, CURLOPT_HTTPHEADER, array('X-FORWARDED-FOR:61.135.169.125', 'CLIENT-IP:61.135.169.125'));  //构造IP
        curl_setopt($ch, CURLOPT_REFERER, "http://www.baidu.com/");   //构造来路
        curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'GET');
        if($autoFollow){
            curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);  //启动跳转链接
            curl_setopt($ch, CURLOPT_AUTOREFERER, true);  //多级自动跳转
        }   
        //  
        if($post!=''){
            curl_setopt($ch, CURLOPT_POST, 1);//post提交方式
            curl_setopt($ch, CURLOPT_POSTFIELDS, $post);
        }   
        // 3. 执行并获取HTML文档内容
        $output = curl_exec($ch);
        curl_close($ch);
        return $output;
    }

CURLOPT_HTTPHEADER,

写爬虫必备

  • 有什么好的解决方案实现php和html的代码分离么
  • 在Windows下搭建了一个PHP环境,运行RSA加解密函数时出现了错误
  • laravel怎么实现多条件模糊查询,而且前端选择查询的选项可以为空!
  • 在twig中创建表单时指定使用bootstrap样式,但是显示的效果还是默认的效果,这是为什么?
  • 有没有好的php延时队列
  • phpmailer发邮件本地成功,服务器上失败
  • ajax获取session变量更新的值
  • 百万级的静态图片文件,如何处理最合适,网站需要获取图片的路径
  • PHP如何实现收货地址以及发货仓库的优先仓库选择问题
  • 如何解决 magic_quotes_sybase 配置项对 stripslashes 方法的影响?
  • 关于composer的疑惑