У меня есть модульный тест, который проверяет поведение на блокирующих и неблокирующих сокетах — сервер пишет длинный ответ, и в какой-то момент он больше не может писать и блокируется при записи.
Обычно одна сторона пишет, а другая не читает.
Под Solaris в какой-то момент я получаю ошибку «Недостаточно места» (после записи 75 МБ) вместо блокировки при записи:
Программа, воспроизводящая проблему:
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>
#include <signal.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <sys/un.h>
#include <netinet/in.h>
char const *address = "127.0.0.1";
#define check(x) do { if( (x) < 0) { perror(#x) ; exit(1); } } while(0)
int main()
{
signal(SIGPIPE,SIG_IGN);
struct sockaddr_in inaddr = {};
inaddr.sin_family = AF_INET;
inaddr.sin_addr.s_addr = inet_addr(address);
inaddr.sin_port = htons(8080);
int res = fork();
if(res < 0) {
perror("fork");
exit(1);
}
if(res > 0) {
int fd = -1;
int status;
sleep(1);
check(fd = socket(AF_INET,SOCK_STREAM,0));
check(connect(fd,(sockaddr*)&inaddr,sizeof(inaddr)));
sleep(5);
close(fd);
wait(&status);
return 0;
}
else {
int acc,fd;
check(acc = socket(AF_INET,SOCK_STREAM,0));
int yes = 1;
check(setsockopt(acc,SOL_SOCKET,SO_REUSEADDR,&yes,sizeof(yes)));
check(bind(acc,(sockaddr*)&inaddr,sizeof(inaddr)));
check(listen(acc,10));
check(fd = accept(acc,0,0));
char buf[1000];
long long total= 0;
do {
int r = send(fd,buf,sizeof(buf),0);
if(r < 0) {
printf("write %s\n",strerror(errno));
return 0;
}
else if(r==0) {
printf("Got eof\n");
return 0;
}
total += r;
if(total > 100*1024*1024) {
printf("Too much!!!!\n");
return 0;
}
printf("%lld\n",total);
}while(1);
}
return 0;
}
Вывод на Solaris (последние две строки)
75768000
write Not enough space
Ожидаемый результат в Linux (последние две строки)
271760
write Connection reset by peer
Что происходит только тогда, когда другая сторона закрывает сокет.
Любые идеи, почему и как я могу это исправить, какие параметры установить?
P.S.: OpenSolaris 2009.06, x86
Правки
- Добавлен полный код C, который воспроизводит проблему
Ответ:
Это похоже на ошибку в конкретной версии ядра Solaris, библиотеки libc.
tcp_xmit_hiwat
, также я пытался установитьSO_SNDBUF
на стороне отправителя иSO_RCVBUF
на стороне читателя на небольшой размер, но это не дало никакого эффекта, я все еще мог записывать много мегабайт без блокировки. - person Artyom   schedule 28.08.2011