博客
关于我
JAVA使用爬虫代理的方案
阅读量:721 次
发布时间:2019-03-21

本文共 2965 字,大约阅读时间需要 9 分钟。

如何通过代理隧道实现IP转换技术
作为开发人员,在进行网络调试或需要隐藏真实IP地址时,有时候需要通过代理隧道的方式来实现IP地址的转换。以下是一段示范代码,展示了如何在Java中使用代理服务器来访问外部URL。
代码解析:
Maven中可以通过添加依赖来实现:
```xml
org.apache.http
httpcomponents-client
4.0.2

示范代码如下:

import java.io.ByteArrayOutputStream;
import java.io.InputStream;
import java.net.Authenticator;
import java.net.HttpURLConnection;
import java.net.InetSocketAddress;
import java.net.PasswordAuthentication;
import java.net Proxy;
import java.net.URL;
import java.util.Random;
public class Demo {
public static void main(String[] args) throws Exception {
// 要访问的目标页面
String targetUrl = "http://httpbin.org/ip";
// 代理服务器
String proxyServer = "t.16yun.cn";
int proxyPort = 31111;
// 代理隧道验证信息
String proxyUser = "username";
String proxyPass = "password";
try {
URL url = new URL(targetUrl);
Authenticator.setDefault(new ProxyAuthenticator(proxyUser, proxyPass));
// 创建代理服务器地址对象
InetSocketAddress addr = new InetSocketAddress(proxyServer, proxyPort);
// 创建HTTP类型代理对象
Proxy proxy = new Proxy(Proxy.Type.HTTP, addr);
// 设置通过代理访问目标页面
HttpURLConnection connection = (HttpURLConnection) url.openConnection(proxy);
// 解析返回数据
byte[] response = readStream(connection.getInputStream());
System.out.println(new String(response));
} catch (Exception e) {
System.out.println(e.getLocalizedMessage());
}
}
public static byte[] readStream(InputStream inStream) throws Exception {
ByteArrayOutputStream outSteam = new ByteArrayOutputStream();
byte[] buffer = new byte[1024];
int len = -1;
while ((len = inStream.read(buffer)) != -1) {
outSteam.write(buffer, 0, len);
}
outSteam.close();
inStream.close();
return outSteam.toByteArray();
}
}

默认代理认证实现类:

class ProxyAuthenticator extends Authenticator {
private String user, password;
public ProxyAuthenticator(String user, String password) {
this.user = user;
this.password = password;
}
protected PasswordAuthentication getPasswordAuthentication() {
return new PasswordAuthentication(user, password.toCharArray());
}
}

代码说明:

  • imports部分包含了所有所需的网络相关类
  • 主方法中定义了目标访问地址,代理服务器信息以及相应的验证用户信息
  • 使用默认的ProxyAuthenticator设置代理认证信息
  • 通过InetSocketAddress创建代理服务器地址)
  • 创建Proxy对象并设置访问模式为HTTP
  • 使用HttpsURLConnection通过代理服务器打开目标URL
  • 通过readStream方法读取并转化返回数据
  • 核心技术点解释:

    本实现采用的是Proxy类的代理隧道功能(Proxy.class),通过在请求头中添加Proxy-Tunnel来启用隧道代理功能。默认的Authenticator实现可以通过自定义的ProxyAuthenticator来配置代理服务器的认证信息。

    对于一些网络调试场景,使用代理隧道方式可以有效隐藏真实IP地址,同时也方便在局域网中测试外部访问的服务。相比普通的翻墙或代理服务器,本质上这个实现只是简单地进行了IP转换,通过Proxy-Tunnel头字段让服务器لیمood diywanglian proxiesConnell毫不客气地 available。

    建议:

    在生产环境中使用这种方式需要注意IP地址的使用限制。多线程访问时,可以通过声明static变量或通过ThreadLocal来保证每个线程使用独立的代理IP信息。具体实现需要根据业务需求进行调优和合理控制。

    转载地址:http://xmoez.baihongyu.com/

    你可能感兴趣的文章
    mysql /*! 50100 ... */ 条件编译
    查看>>
    mudbox卸载/完美解决安装失败/如何彻底卸载清除干净mudbox各种残留注册表和文件的方法...
    查看>>
    mysql 1264_关于mysql 出现 1264 Out of range value for column 错误的解决办法
    查看>>
    mysql 1593_Linux高可用(HA)之MySQL主从复制中出现1593错误码的低级错误
    查看>>
    mysql 5.6 修改端口_mysql5.6.24怎么修改端口号
    查看>>
    MySQL 8.0 恢复孤立文件每表ibd文件
    查看>>
    MySQL 8.0开始Group by不再排序
    查看>>
    mysql ansi nulls_SET ANSI_NULLS ON SET QUOTED_IDENTIFIER ON 什么意思
    查看>>
    multi swiper bug solution
    查看>>
    MySQL Binlog 日志监听与 Spring 集成实战
    查看>>
    MySQL binlog三种模式
    查看>>
    multi-angle cosine and sines
    查看>>
    Mysql Can't connect to MySQL server
    查看>>
    mysql case when 乱码_Mysql CASE WHEN 用法
    查看>>
    Multicast1
    查看>>
    mysql client library_MySQL数据库之zabbix3.x安装出现“configure: error: Not found mysqlclient library”的解决办法...
    查看>>
    MySQL Cluster 7.0.36 发布
    查看>>
    Multimodal Unsupervised Image-to-Image Translation多通道无监督图像翻译
    查看>>
    MySQL Cluster与MGR集群实战
    查看>>
    multipart/form-data与application/octet-stream的区别、application/x-www-form-urlencoded
    查看>>