33
Web, кэширование и memcached Андрей Смирнов (НетСтрим)

Web, кэширование и memcached

  • Upload
    dysis

  • View
    76

  • Download
    1

Embed Size (px)

DESCRIPTION

Web, кэширование и memcached. Андрей Смирнов (НетСтрим). Кэширование. Время отклика сервера – важный фактор для пользователей. Для сложного сайта генерация одной страницы ~ 20- 5 0 запросов к БД. Вычислительно сложные задачи (запросы) ~ 1-  секунд. - PowerPoint PPT Presentation

Citation preview

Page 1: Web,  кэширование и  memcached

Web, кэширование и memcached

Андрей Смирнов (НетСтрим)

Page 2: Web,  кэширование и  memcached

Кэширование• Время отклика сервера – важный фактор для

пользователей.• Для сложного сайта генерация одной

страницы ~ 20-50 запросов к БД.• Вычислительно сложные задачи

(запросы) ~ 1- секунд.• Кэширование как способ минимизации времени отклика и

снижения нагрузки на сервер.

Page 3: Web,  кэширование и  memcached

Кэш• Кэш встречается везде: ЦП, жесткий диск, магнитола в

машине, буферы ОС, …

• Успех кэша в принципе локальности.

Page 4: Web,  кэширование и  memcached

memcached• Большая хэш-таблица в памяти, доступная через сетевой

протокол.• Операции:

– get/set/del– «Атомарность»

• incr/decr• cas/add/replace• append/prepend

Brad Fitzpatrick

Page 5: Web,  кэширование и  memcached

Общая схема кэширования

Backend: БД, и т.п.

memcached

Frontend

Page 6: Web,  кэширование и  memcached

Архитектура memcached• Никаких вычислительно сложных операций.• Все операции – O(1).• Никаких нитей – асинхронный ввод/вывод.• Время отклика

сервера – почти RTT.

Page 7: Web,  кэширование и  memcached

Потеря ключей• Ограниченность объема памяти, выделенного memcached.• Истек срок жизни ключа.• Отказ сервера или

процесса memcached.

Page 8: Web,  кэширование и  memcached

Применение memcached• «Можно потерять»:

– кэширование выборок БД;– вычислительно сложные значения.

• «Не хотелось бы потерять»:– счетчики посетителей, просмотров и т.п.

• «Совсем не должны терять»:– сессии пользователей.

Page 9: Web,  кэширование и  memcached

Задачи1. Формирование ключа кэширования.2. Кластеризация memcached.3. Счетчики и атомарность.4. Как избежать одновременного перестроения кэшей. 5. Сброс группы кэшей.6. Анализ статистики memcached, slab-аллокатор.7. Отладка memcached, дополнительные вопросы.

Page 10: Web,  кэширование и  memcached

Ключ кэширования• Ключ – строка ограниченной длины.

– По параметрам выборки должен однозначно определяться ключ.– При изменении параметров выборки ключ должен изменяться.

• Вариант: ключ = md5(serialize(параметры))

Page 11: Web,  кэширование и  memcached

Кластеризация memcached• Зачем:

– увеличение объема кэша;– обеспечение некоторой

отказоустойчивости;– распределение нагрузки.

• Как распределить ключи?

memc2memcN

Frontend memc1

Page 12: Web,  кэширование и  memcached

Распределение ключей• Необходима функция: f(ключ)=номер_сервера• «Стандартный вариант» по модулю:f(ключ)=crc32(ключ)%кол-во_серверов

• Consistent hashing:

Page 13: Web,  кэширование и  memcached

Атомарность операций• memcached не обеспечивает операций блокировки.• Обычные операции get/set не обеспечивают атомарности.• Самые простые атомарные операции:

инкремент/декремент (incr/decr).

Page 14: Web,  кэширование и  memcached

Счетчики в memcached• Пример: счетчик просмотров в реальном времени.

– число просмотров аккумулируется и сохраняется в БД;– после просмотра увеличиваем (incr) счетчик в memcached;– если получили ошибку,

выбираем начальное значение из БД (set).

• Наличие race condition.

Page 15: Web,  кэширование и  memcached

Счетчик онлайнеров

450 580 434 497 101 503

0 1 2 3 4 5

Текущий изменяемыйключ

Значение счетчика = (5,0,1,2,3)

Онлайнеры – кол-во уникальных сессий за последние 5 минут

Время жизни каждого ключа – 5 минут

Page 16: Web,  кэширование и  memcached

Одновременное перестроение кэшей• Пусть есть кэш с большим количеством обращений на

чтение.• В какой-то момент истекает срок жизни кэша.• Большое число frontendов пытаются одновременно

перестроить кеш.• Получаем огромную

нагрузку на backend в один момент времени.

Page 17: Web,  кэширование и  memcached

Решение проблемы• Храним ключи кэшей без ограничения по времени.• В значение кэша записываем реальное время жизни кэша.• Если получили устаревший кэш, предпринимаем попытку

перестроения с блокировкой.• Если кто-то уже перестраивает кэш, подождем или

вернём старое значение.

Page 18: Web,  кэширование и  memcached

Пример1. Обращаемся за кэшем, например

‘user_info_id_159’

2. Сравниваем срок годности с текущим временем.

3. Кэш «протух» → необходимо его построить заново.

срок годности: 2008-10-07 21:00

данные кэша: [ id: 159login: ‘user’nick: ‘Hello’…

]

Ключ user_info_id_159:

Page 19: Web,  кэширование и  memcached

Пример• Пытаемся заблокироваться по ключу

user_info_id_159_lock.• Не удалось получить блокировку:

– ждём снятия блокировки;– не дождались: возвращаем старые данные кэша;– дождались: выбираем значения ключа заново, возвращаем

новые данные (построенный кэш другим процессом).

• Удалось получить блокировку:– строим кэш самостоятельно.

Page 20: Web,  кэширование и  memcached

Блокировки в memcached• Первый вариант: get/set блокировка

– get(lock) ? 1 → locked– set(lock, 1, small_timeout) … delete(lock)– неатомарная, простая, работоспособна для нас.

• Корректная блокировка: gets/cas блокировка– gets(lock) → значение, unique– cas(lock, 1, unique, small_timeout)– атомарна, корректна.

Page 21: Web,  кэширование и  memcached

Сброс группы кэшей• Один и тот же объект часто входит в несколько

разных выборок, а значит и кэшей, т.е. изменение объекта должно приводить к инвалидации группы кэшей.

• memcached не поддерживает «папки», т.к. это противоречит сложности О(1) для всех операций.

• Что делать?

Page 22: Web,  кэширование и  memcached

Тэгирование кэшей• Тэг – это имя и версия группы кэшей.• Версия – монотонно увеличивающееся число.• Сброс группы кэшей – увеличение версии тэга

группы.

Page 23: Web,  кэширование и  memcached

Тэгирование кэшей• В memcached вместе с данными кэша отправляем

номера версий всех тэгов, которые были актуальны на момент создания кэша.

• При получении кэша, он считается валидным, если:– у него не истекло собственное «время жизни»;– текущая версия всех тэгов, с которыми связан

кэш, равна версиям, записанным в кэше.

Page 24: Web,  кэширование и  memcached

ПримерБыло: Записали в кэш:

tag1 25

tag2 63

срок годности: 2008-10-07 21:00данные кэша: [ … ]тэги: [ tag1 : 25 tag2 : 63 ]

Page 25: Web,  кэширование и  memcached

Пример

tag2++

Page 26: Web,  кэширование и  memcached

ПримерСтало: Лежит в кэше:

tag1 25

tag2 64

срок годности: 2008-10-07 21:00данные кэша: [ … ]тэги: [ tag1 : 25 tag2 : 63 ]

кэш устарел!

Page 27: Web,  кэширование и  memcached

Версия тэга и слейвы БД• Удачный вариант версии – текущее время:

– монотонно увеличивается;– при потере значения тэга в memcached корректно

восстанавливается.

• Версия в виде времени может использоваться для компенсации задержки в синхронизации слейвов БД:– если (текущее время – версия) < 10 сек., используем для

выборки мастера.

Page 28: Web,  кэширование и  memcached

Статистика memcached• Команда stats позволяет получить различную

статистику по работе memcached.• «Обычная статистика»:

– процент хитов по отношению к общему числу «get» (эффективность кэша);

– ключи, удаленные раньше времени из кэша (достаточность объема памяти);

– объем памяти процесса, uptime и т.п.

Page 29: Web,  кэширование и  memcached

slab-аллокатор• Баланс между внутренней фрагментацией и

эффективностью использования памяти.• Эффективные O(1) алгоритмы.• Набор slab’ов под блоки предопределенного размера:

64, 128, 256, …, 210.• Каждый slab: использовано кусков,

занято кусков, список свободных кусков, очередь LRU.

Page 30: Web,  кэширование и  memcached

Статистика slab-аллокатора

0

50

100

150

200

250

300

Об

ъем

, Mб

104 224 440 872 1720 3376 6600 12904 25224 49280 96256 188000 367192Размер slab, байт

Page 31: Web,  кэширование и  memcached

Отладка memcached• Проблемы плохо воспроизводятся в

локальном/тестовом окружении.• Отладка возможна только в реальном времени (без

остановок).• Вариант решения: одно действие – один символ в

лог:

MLWUHHHHHHHHHHHHHHHMLLHHHHHHHHHH

Page 32: Web,  кэширование и  memcached

Дополнительные вопросы• memcached как способ

межпроцессного/межъязыкового взаимодействия;• Кэширование memcached («кэширование кэша»): в

теле процесса, в локальном кэше (eAccelerator и т.п.)• Другая семантика: memcachedb, memcacheq, и т.п.

Page 33: Web,  кэширование и  memcached

Всё!• Вопросы?

• Контакты:– [email protected]– http://smira.ru/