sunnybear Apr 7 2008 at 18:33

Как gzip-сжатие влияет на производительность сервера

1 min

4.1K

Client optimization*

+52

Comments 40

ivan_suroegin Apr 7 2008 at 18:36

"gzip = чтение/записать на диск + инициализация библиотеки + создание архива"

исправить на Запись. ;)

Roxis Apr 7 2008 at 19:08

на высоконагруженных проектах не стоит сжимать файлы каждый раз

alfa Apr 7 2008 at 20:34

для высоконагруженных проектов под nginx, можно использовать http_gzip_static_module http://wiki.codemongers.com/NginxHttpGzi… :)

UFO just landed and posted this here

fog Apr 7 2008 at 19:44

Спасибо, познавательно.

dir01 Apr 7 2008 at 19:48

Дело, конечно, ваше, но зачем переносить статью?

235 Apr 8 2008 at 02:32

ощущается довольно много работы ушло на создание такого материала, вполне обосновано его дарить публике, но и оставить непосредственное авторство. можно понять, подобный вариант даже лучше просто ссылки-анонса

Angerslave Apr 7 2008 at 20:57

Впринципе результаты ожидаемые. Хотя в данном случае я надеялся увидеть выкладки не по статическим данным, а по динамическим... А по статике и так понятно - сжали один раз и забыли.

sunnybear Apr 7 2008 at 21:04

чем в Вашем понимании статические данные от динамических для gzip'а отличаются? и те, и другие это просто набор байтов, но полученных немного по-разному. Способ получения начального объема информации на результаты по быстроте сжатия и передачи этой информации, по-моему, очень слабо влияет (если вообще влияет).

alfa Apr 7 2008 at 21:11

я возможно упустил, а есть график зависимости использования cpu от степени сжатия c 1 по 9-й

sunnybear Apr 7 2008 at 21:14

нет, не делал. В тестах использовалась дефолтная (7 вроде) степень сжатия. У Apache обычно от 3 до 7 используется, по-моему.

alfa Apr 7 2008 at 21:22

жаль :) если будет возможность, сделайте, у nginx дефолтовая 1, не думаю что там дефолтовая максимальная стоит, имхо 3 и не выше, на http://www.zlib.org не нашел почему-то в доках.

alfa Apr 7 2008 at 21:29

я имел в виду апач, судя по докам он берет дефолтовую zlib
для примера... 64139 байт html
gzip -1 = 12891 байт
gzip -9 = 10726 байт
gzip -3 = 12300

diamant Apr 7 2008 at 21:11

дык статику достаточно сжать один раз после изменения и потом только отдавать, а динамические данные придётся сжимать при каждом запросе.

sunnybear Apr 7 2008 at 21:16

значит, это модель для динамических запросов, как наиболее нагружающих сервер на сжатие ведь сравнивались расходы на сжатие с расходами на передачу. А первые всегда будут только в случае динамического контента.

alfa Apr 7 2008 at 21:12

а то в nginx ставлю то 3 то 9, к своему стыду, ни разу не пробовал замерять результат

dmx Apr 7 2008 at 22:30

Смотрел тесты давно, правда тестировали IIS. Наиболее выгодным уровнем сжатия был 9. Максимально возможный 10, вроде, могу ошибаться.

WarGoth Apr 8 2008 at 02:55

Я считаю, что, наоборот, сильно влияет. Генерация динамических данных на сервере занимают больше памяти, поэтому чем быстрее отдаете их, тем быстрее память освобождается для следующих запросов

abrwalk Apr 7 2008 at 21:26

>> gzip = чтение/записать на диск + инициализация библиотеки + создание архива

а при чём тут запись на диск? вы же сами позднее говорите:

>> любой веб-сервер и так берет файл из файловой системы и архивирует уже в памяти, а потом пишет в сокет

sunnybear Apr 7 2008 at 21:28

в тестах использовался "чистый" gzip. Apache вообще не участвовал из-за большой погрешности на сетевые задержки

masterbo Apr 8 2008 at 11:52

а погрешность на параллельные дисковые операции чем-то проще?

sunnybear Apr 8 2008 at 12:03

не понял Вашего вопроса. Из модельной зависимости исключены (во возможности) любые погрешности, не относящиеся к использованию процессора/оперативной памяти

whiteRed Apr 7 2008 at 22:41

неудобно, что не на всех графиках шкалы подписаны

huh Apr 7 2008 at 23:43

Спасибо конено, но дисковая подсистема получилась какая-то сферическая в вакууме. Если уж меряли, то напишите, под какой осью-ядром, какая ФС использовалась, что за винты.

ptitov Apr 8 2008 at 03:08

mod_deflate ничего не пишет на диск

sgdin Apr 8 2008 at 10:05

никак не влияет

jetro Apr 8 2008 at 10:06

нас не забанят!

-2

kashey Apr 8 2008 at 11:18

Хм уже который год использую гзип сжатие на сайтах.
Среднее значение работы zlib:0,002с GZIP:71%
Те тратится всего ничего, а уменьшается почти в два раза данные.
Сжимается каждый раз на лету.
Размер тестовой страницы 12КБ

Немного не понятны слова о записи\чтения диска.. Вроде как исключительно CPU bound
Ну а если с процом совсем плохо то можно перейти на deflate сжатие.
Оно к сожалению работает очень далеко не везде, зато сжимает файлы практически также(проверял 1-2% разницы, в обе строны) но проца требует на сервере много меньше

smirnoffs Apr 8 2008 at 12:31

Подпишите графики!

alexkbs Apr 8 2008 at 12:53

Неучтено влияние дискового кеша.

99% что все последующие чтения одного неизменённого файла проводились из диского кеша.
(в выводе free его размер указан в последней колонке)

sunnybear Apr 8 2008 at 12:57

Алексей, поясните Вашу мысль. Сначала все файла архивировались, потом просто открывались. Дисковые операции идентичны, чего, собственно, и хотелось достичь. Или Вы имеете в виду другое?

alexkbs Apr 8 2008 at 13:14

Когда Вы читаете некий файл в первый раз он действительно считывается с жесткого диска. Когда Вы читаете этот же файл (и он с прошлого чтения не менялся) он читается уже из дискового кеша в оперативной памяти. Т.е. как таковая дисковая операция происходит только один раз для каждого файла.

Я говорю про Linux, под другими разновидностями Unix это может быть по-другому.

sunnybear Apr 8 2008 at 13:32

к сожалению, Вы не ответили на вопрос: почему Вы считаете, что что-то оказалось не учтено, ведь дисковые операции в обеих сериях были идентичны

alexkbs Apr 8 2008 at 16:28

Все "идентичные операции" были из кеша и дисковых операций практически не было. Т.е. они не учтены.

Обычно принято при таких тестах очищать дисковый кеш тем или иным способом.

sunnybear Apr 8 2008 at 16:34

при чем здесь дисковые операции и взятия из кеша? ведь оценивались затраты на архивирование, а не на работу с файловой системой

alexkbs Apr 8 2008 at 16:48

В статье описываются некие "издержки на файловую систему", я говорю о них.

sunnybear Apr 8 2008 at 16:56

я так понимаю, основная претензия к термину "издержки на файловую систему"? Могу переформулировать как "издержки на файловую систему и дисковый кеш", так Вас больше устроит?

bg8s Apr 8 2008 at 15:19

не открывается почему-то статья :/

UFO just landed and posted this here

vorob Apr 9 2008 at 12:47

недавно тестировал mod_deflate
15 тыс хостов
по данным cacti уменьшился исходящий трафик в пике с 10мбит до 2мбит
немного увеличилась нагрузка на cpu +3-5%
Opteron 246 2Ghz (cpufreq 1Ghz)
RAM 1gb
scsi

Show the best of all time