Как сказано в заголовке, я хочу загрузить исходный код веб-сайта через прокси-сервер SOCKS5 с использованием Winsock2. Программа скомпилирована с помощью MinGW.
Используемая документация взята из RFC 1928.
Чтобы познакомить вас с этой темой, чтобы установить соединение между сервером SOCKS5 и веб-сервером, я должен отправить два запроса на сервер socks. Если эти два выполнены успешно, я могу использовать дескриптор сокета с send () и recv () для взаимодействия с веб-сервером через туннель, который мы только что создали.
Согласно RFC, первый пакет будет выглядеть так:
+----+----------+----------+
|VER | NMETHODS | METHODS |
+----+----------+----------+
| 1 | 1 | 1 to 255 |
+----+----------+----------+
Мне нужен только один метод, без авторизации. И я построил пакет таким образом:
char *initPacket1 = new char[3];
int initPacket1Length = sizeof(initPacket1) / sizeof(initPacket1[0]);
initPacket1[0] = 5; //SOCKS Version. [VER]
initPacket1[1] = 1; //No. of methods [NMETHODS]
initPacket1[2] = 0; //No auth required [X’00’]
if(send(hSocketSock, initPacket1, initPacket1Length, 0) == SOCKET_ERROR)
{
return -1;
}
Ответ должен быть двухбайтовым пакетом с версией и методом. Первая проблема заключается в том, что иногда этот шаг не выполняется. В частности, функция recv () работает, но полученные байты недействительны. Но это случается только несколько раз.
Затем мне нужно создать второй пакет, который сообщает прокси-серверу о необходимости подключения к целевому веб-сайту. Пакет, который я должен построить, имеет следующую форму:
+----+-----+-------+------+----------+----------+
|VER | CMD | RSV | ATYP | DST.ADDR | DST.PORT |
+----+-----+-------+------+----------+----------+
| 1 | 1 | X’00’ | 1 | Variable | 2 |
+----+-----+-------+------+----------+----------+
И как я собираю этот пакет:
char *initPacket2 = new char[10];
int initPacket2Length = sizeof(initPacket2) / sizeof(initPacket2[0]);
initPacket2[0] = 5; //SOCKS Version;
initPacket2[1] = 1; //1 = CONNECT, 2 = BIND, 3 = UDP ASSOCIATE;
initPacket2[2] = 0; //Reserved byte
initPacket2[3] = 1; //1 = IPv4, 3 = DOMAINNAME, 4 = IPv6
memcpy(initPacket2 + 4, &dest.sin_addr.S_un.S_addr, 4);
memcpy(initPacket2 + 8, &dest.sin_port, 2);
if(send(hSocketSock, initPacket2, initPacket2Length, 0) == SOCKET_ERROR)
{
return -1;
}
Вторая большая проблема заключается в том, что в поле ответа каждый раз отображается «07», что означает «Команда не поддерживается».
Мне уже нужно изменить второй байт из второго пакета, но безуспешно.
Скорее всего, я что-то упускаю при сборке пакета и не могу понять, что.
Полная программа: main.cpp
#include <winsock2.h>
#include <string>
#include <iostream>
#include "util.hpp"
using namespace std;
int main(void)
{
//SOCKS5 info
u_short sockPort = 45554;
std::string sockIp = "xx.xx.xx.xx";
//Destination info
u_short destPort = 80;
std::string destIPorURL = "checkip.dyndns.com";
//Check to see if winsock2 is available
WSADATA wsaData;
if (WSAStartup(MAKEWORD(2,0), &wsaData)==0)
{
if (LOBYTE(wsaData.wVersion) < 2)
{
cout << "WSA Version error!";
return -1;
}
}
else
{
cout << "WSA Startup Failed";
return -1;
}
///////////////////////////////////////////////////////////////////////////////////////////
//Init sockaddr for SOCKS5
cout << "Initialize sock_addr for socks4 connection...";
sockaddr_in sock;
sock.sin_family = AF_INET; // host byte order
sock.sin_port = htons( sockPort ); // short, network byte order
if(!utils::getHostIP(sock.sin_addr.S_un.S_addr, sockIp)) // Write ip address in the right format
{
cout << "fail";
return -1;
}
cout << "done" << endl;
//Creating socket handler
cout << "Creating socket handler...";
SOCKET hSocketSock = INVALID_SOCKET;
if( (hSocketSock = socket(AF_INET, SOCK_STREAM, 0)) == INVALID_SOCKET )
{
cout << "fail";
return -1;
}
cout << "done" << endl;
/////////////////////////////////////////////////////////////////////////////////////////////
//Init sockaddr for destination server
cout << "Initialize sock_addr for destination server...";
sockaddr_in dest;
dest.sin_family = AF_INET;
dest.sin_port = htons( destPort );
if(!utils::getHostIP(dest.sin_addr.S_un.S_addr, destIPorURL)) // Write ip address in the right format
{
cout << "fail";
return -1;
}
memset( &(dest.sin_zero), '\0', 8 );
cout << "done" << endl;
////////////////////////////////////////////////////////////////////////////////////////////////
//Time to connect to SOCKS5 server
cout << "Connecting to sock server...";
if(connect(hSocketSock, reinterpret_cast<sockaddr *>(&sock), sizeof(sock)) != 0)
{
cout << "failed";
return -1;
}
cout << "done" << endl;
//Documentation: https://tools.ietf.org/pdf/rfc1928.pdf
//We have to send first packet which tell to SOCKS5 to enter on
//sub-negociation mode so we can connect to actual destination server
// The client connects to the server, and sends a version
// identifier/method selection message:
// +----+----------+----------+
// |VER | NMETHODS | METHODS |
// +----+----------+----------+
// | 1 | 1 | 1 to 255 |
// +----+----------+----------+
//Allocate space for the first initialize packet and his replay
char *initPacket1 = new char[3];
int initPacket1Length = sizeof(initPacket1) / sizeof(initPacket1[0]);
char reply1[2];
memset( &reply1, '\0' , strlen((const char *)reply1) );
initPacket1[0] = 5; //SOCKS Version. [VER]
initPacket1[1] = 1; //No. of methods [NMETHODS]
initPacket1[2] = 0; //No auth required [X’00’]
//Now we are sending the packet we just created
cout << "Sending first init packet...";
if(send(hSocketSock, initPacket1, initPacket1Length, 0) == SOCKET_ERROR)
{
cout << "failed";
return -1;
}
cout << "done" << endl;
//And our expected replay format:
//
// The server selects from one of the methods given in METHODS, and
// sends a METHOD selection message:
// +----+--------+
// |VER | METHOD |
// +----+--------+
// | 1 | 1 |
// +----+--------+
//Receiving response from server
cout << "Waiting for response...";
if(recv(hSocketSock, reply1, 2, 0) == SOCKET_ERROR)
{
cout << "failed";
return -1;
}
cout << "done" << endl;
//reply[0] = our version
//reply[1] = out method. [X’00’ NO AUTHENTICATION REQUIRED]
if( !(reply1[0] == 5 && reply1[1] == 0) )
{
cout << "Error: bad result on reply:" << (int)reply1[0] << " " << (int)reply1[1] << endl;
return -1;
}
//We can now delete forst packet
delete[] initPacket1;
//We have to build initialize packet. This will transmit to SOCKS5 server
//the web server we want to connect to.
//
// The SOCKS request is formed as follows:
//
// +----+-----+-------+------+----------+----------+
// |VER | CMD | RSV | ATYP | DST.ADDR | DST.PORT |
// +----+-----+-------+------+----------+----------+
// | 1 | 1 | X’00’ | 1 | Variable | 2 |
// +----+-----+-------+------+----------+----------+
//
// Where:
// o VER protocol version: X’05’
// o CMD
// o CONNECT X’01’
// o BIND X’02’
// o UDP ASSOCIATE X’03’
// o RSV RESERVED
// o ATYP address type of following address
// o IP V4 address: X’01’
// o DOMAINNAME: X’03’
// o IP V6 address: X’04’
// o DST.ADDR desired destination address
// o DST.PORT desired destination port in network octet
// order
//Building that packet
char *initPacket2 = new char[10];
int initPacket2Length = sizeof(initPacket2) / sizeof(initPacket2[0]);
char reply2[16];
int reply2Length = sizeof(reply2) / sizeof(reply2[0]);
initPacket2[0] = 5; //SOCKS Version;
initPacket2[1] = 1; //1 = CONNECT, 2 = BIND, 3 = UDP ASSOCIATE;
initPacket2[2] = 0; //Reserved byte
initPacket2[3] = 1; //1 = IPv4, 3 = DOMAINNAME, 4 = IPv6
memcpy(initPacket2 + 4, &dest.sin_addr.S_un.S_addr, 4);
memcpy(initPacket2 + 8, &dest.sin_port, 2);
//Send the second init packet to server. This will inform the SOCKS5 server
//what is our target.
cout << "Sending second init packet...";
if(send(hSocketSock, initPacket2, initPacket2Length, 0) == SOCKET_ERROR)
{
cout << "failed";
return -1;
}
cout << "done" << endl;
//Reading the response
//Expected response format:
// The SOCKS request information is sent by the client as soon as it has
// established a connection to the SOCKS server, and completed the
// authentication negotiations. The server evaluates the request, and
// returns a reply formed as follows:
// +----+-----+-------+------+----------+----------+
// |VER | REP | RSV | ATYP | BND.ADDR | BND.PORT |
// +----+-----+-------+------+----------+----------+
// | 1 | 1 | X’00’ | 1 | Variable | 2 |
// +----+-----+-------+------+----------+----------+
// Where:
// o VER protocol version: X’05’
// o REP Reply field:
// o X’00’ succeeded
// o X’01’ general SOCKS server failure
// o X’02’ connection not allowed by ruleset
// o X’03’ Network unreachable
// o X’04’ Host unreachable
// o X’05’ Connection refused
// o X’06’ TTL expired
// o X’07’ Command not supported
// o X’08’ Address type not supported
// o X’09’ to X’FF’ unassigned
// ......................................
cout << "Waiting for response...";
if(recv(hSocketSock, reply2, reply2Length, 0) == SOCKET_ERROR)
{
cout << "failed";
return -1;
}
cout << "done" << endl;
cout << "Returned packets: " << endl;
cout << "VER: " << (int)reply2[0] << endl;
cout << "REP: " << (int)reply2[1] << endl;
cout << "RSV: " << (int)reply2[2] << endl;
cout << "ATY: " << (int)reply2[3] << endl;
cout << endl;
}
Возвращенный байт REP равен 07, но мне нужен 0, чтобы продолжить.
Я приложил исходные файлы с полезными функциями на случай, если вы захотите протестировать.
util.hpp:
#include <winsock2.h>
#include <string>
#include <algorithm>
#include <vector>
namespace utils
{
std::string getHostFromUrl(std::string &url);
bool getHostIP(unsigned long &ipAddr, std::string urlOrHostnameOrIp);
namespace IPAddr
{
bool isValidIPv4(std::string &ip);
std::string reverseIpAddress(std::string ip);
std::string decimalToDottedIp(unsigned long ip);
unsigned long stripToDecimal(std::string &ip);
}
namespace strings
{
std::vector<std::string> split(std::string &s, char delim);
std::string removeSubstrs(std::string &source, std::string pattern);
}
};
util.cpp:
#include <stdexcept>
#include <iostream>
#include <sstream>
#include <stdio.h>
#include "util.hpp"
#define cout std::cout
#define endl std::endl
/////////////////////////////////////////////////////////////////////////////////////
// _ _ _ _ _
// | \ | | __ _ _ __ ___ ___ ___ _ __ __ _ ___ ___ _ _| |_(_) |___
// | \| |/ _` | '_ ` _ \ / _ \/ __| '_ \ / _` |/ __/ _ \ | | | | __| | / __|
// | |\ | (_| | | | | | | __/\__ \ |_) | (_| | (_| __/ | |_| | |_| | \__ \
// |_| \_|\__,_|_| |_| |_|\___||___/ .__/ \__,_|\___\___| \__,_|\__|_|_|___/
// |_|
/////////////////////////////////////////////////////////////////////////////////////
bool utils::getHostIP(unsigned long &ipAddr, std::string url)
{
HOSTENT *pHostent;
std::string hostname = getHostFromUrl(url);
if( utils::IPAddr::isValidIPv4(hostname) )
{
//IP Address must be reversed in order to be compatible with sockAddr.sin_addr.S_un.S_addr
//example: 192.168.1.2 => 2.1.168.192
hostname = utils::IPAddr::reverseIpAddress(hostname);
ipAddr = utils::IPAddr::stripToDecimal(hostname);
return true;
}
if (!(pHostent = gethostbyname(hostname.c_str())))
{
return false;
}
if (pHostent->h_addr_list && pHostent->h_addr_list[0])
{
ipAddr = *reinterpret_cast<unsigned long *>(pHostent->h_addr_list[0]);
return true;
}
return false;
}
std::string utils::getHostFromUrl(std::string &url)
{
std::string urlcopy = url;
urlcopy = utils::strings::removeSubstrs(urlcopy, "http://");
urlcopy = utils::strings::removeSubstrs(urlcopy, "www.");
urlcopy = utils::strings::removeSubstrs(urlcopy, "https://");
urlcopy = urlcopy.substr(0, urlcopy.find("/"));
return urlcopy;
}
// ___ ____ _ _ _
// | _ _|| _ \ / \ __| | __| | _ __ ___ ___ ___
// | | | |_) | / _ \ / _` | / _` || '__|/ _ \/ __|/ __|
// | | | __/ / ___ \| (_| || (_| || | | __/\__ \\__ \
// |___||_| /_/ \_\\__,_| \__,_||_| \___||___/|___/
bool utils::IPAddr::isValidIPv4(std::string &ipv4)
{
const std::string address = ipv4;
std::vector<std::string> arr;
int k = 0;
arr.push_back(std::string());
for (std::string::const_iterator i = address.begin(); i != address.end(); ++i)
{
if (*i == '.')
{
++k;
arr.push_back(std::string());
if (k == 4)
{
return false;
}
continue;
}
if (*i >= '0' && *i <= '9')
{
arr[k] += *i;
}
else
{
return false;
}
if (arr[k].size() > 3)
{
return false;
}
}
if (k != 3)
{
return false;
}
for (int i = 0; i != 4; ++i)
{
const char* nPtr = arr[i].c_str();
char* endPtr = 0;
const unsigned long a = ::strtoul(nPtr, &endPtr, 10);
if (nPtr == endPtr)
{
return false;
}
if (a > 255)
{
return false;
}
}
return true;
}
std::string utils::IPAddr::reverseIpAddress(std::string ip)
{
std::vector<std::string> octeti = utils::strings::split(ip, '.');
return (octeti[3] + "." + octeti[2] + "." + octeti[1] + "." + octeti[0]);
}
unsigned long utils::IPAddr::stripToDecimal(std::string &ip)
{
unsigned long a,b,c,d,base10IP;
sscanf(ip.c_str(), "%lu.%lu.%lu.%lu", &a, &b, &c, &d);
// Do calculations to convert IP to base 10
a *= 16777216;
b *= 65536;
c *= 256;
base10IP = a + b + c + d;
return base10IP;
}
std::string utils::IPAddr::decimalToDottedIp(unsigned long ipAddr)
{
unsigned short a, b, c, d;
std::ostringstream os ;
std::string ip = "";
a = (ipAddr & (0xff << 24)) >> 24;
b = (ipAddr & (0xff << 16)) >> 16;
c = (ipAddr & (0xff << 8)) >> 8;
d = ipAddr & 0xff;
os << d << "." << c << "." << b << "." << a;
ip = os.str();
return ip;
}
// ____ _ _
// / ___| | |_ _ __ (_) _ __ __ _ ___
// \___ \ | __|| '__|| || '_ \ / _` |/ __|
// ___) || |_ | | | || | | || (_| |\__ \
// |____/ \__||_| |_||_| |_| \__, ||___/
// |___/
std::vector<std::string> utils::strings::split(std::string &s, char delim)
{
std::vector<std::string> elems;
std::stringstream ss;
ss.str(s);
std::string item;
while (std::getline(ss, item, delim))
{
elems.push_back(item);
}
return elems;
}
std::string utils::strings::removeSubstrs(std::string &input, std::string pattern)
{
std::string source = input;
std::string::size_type n = pattern.length();
for (std::string::size_type i = source.find(pattern); i != std::string::npos; i = source.find(pattern))
{
source.erase(i, n);
}
return source;
}