Как сделать вычислительную инфраструктуру для большого кластера презентация

Содержание

1. Как сделать вычислительную инфраструктуру для большого кластера
2. Введение и Архитектура Доставка задач/результатов Отладка и анализ Обобщение опыта: корректность, надежность, производительность
3. О нас Mirantis делает проекты на заказ:
4. Что мы строим Очень тяжелые вычисления (но
5. Обычно (на суперкомпьютерах) используют: Это называется «batch scheduler»
6. Нам не подходит Они предполагают: Планировщик
7. Терминология Задача = поток задачек
8. Становятся возможными некоторые трюки для повышения утилизации. But this margin is too small…
9. Пример неудачной архитектуры Очевидно, single bottleneck –
10. Более удачная архитектура Планировщик Слушает команды о
11. Пример Клиент – Планировщику: Создай задачу
12. Введение и Архитектура Доставка задач/результатов Отладка и анализ Обобщение опыта: корректность, надежность, производительность
13. Трубы Как очереди Только шире, быстрее и
14. Надежная доставка Цикл жизни демона: Получить задачку
15. Масштабирование Из коробки RabbitMQ совсем не подходит
16. Масштабирование Голова задачи
17. Трудности Маленький лимит соединений у RabbitMQ под
18. Сохранность данных при крахах RabbitMQ Client RabbitMQ
19. Не перегружать RabbitMQ Если слишком яро слать
20. Не перегружать RabbitMQ Оказывается, отличная метрика загрузки
21. Не перегружать RabbitMQ Ограничить число сообщений «в
22. Около 5000 ядер, 4 RabbitMQ Нет перегрузок – нет проблем
23. Поддерживать асинхронные прерывания Иногда надо всё бросить
24. Переключаться между кроликами Задаче досталось несколько демонов.
25. Как это закодировать Можно сделать лапшу, делающую
26. Как не сойти с ума Разумеется, слои*.
27. Слои API проще некуда: Отсыльщик: Отослать Получить/сбросить
28. Слои «При ошибке переоткрыться» «При ошибке
29. Например По числу кроликов задачки ответики
30. Введение и Архитектура Доставка задач/результатов Отладка и анализ Обобщение опыта: корректность, надежность, производительность
31. Отладка и анализ Дебаггер – не вариант
32. Пара фокусов в рукаве Мощный логгер Глобальная
33. Мы рисуем http://jkff.info/software/timeplotters/
34. http://jkff.info/software/timeplotters/
35. Что для этого нужно? Очень подробные логи. Еще об этом – позже.
36. Введение и Архитектура Доставка задач/результатов Отладка и анализ Обобщение опыта: корректность, надежность, производительность
37. Корректность: Главный принцип Как писать правильный код?
38. Корректность: Главный принцип Код точно неправильный. Как быть?
39. Как быть? Быть скромнее Дать себе шанс
40. Быть скромнее Не думать «ничего, отладим» Это
41. Цитаты в тему «Write the simplest thing
42. Дать себе шанс найти ошибку Максимально подробные
43. Минимизировать «ядро корректности» Часть, от корректности которой
44. Минимизировать распространение ошибки Расставлять «барьеры» До барьера
45. Барьеры Уничтожение процесса (выполнение действия в отдельном
46. Избегать опасных приемов Изменяемое состояние Многопоточность Блокирование, синхронизация Обратная связь Редко выполняющийся код
47. Введение и Архитектура Доставка задач/результатов Отладка и анализ Обобщение опыта: корректность, надежность, производительность
48. Надежность Всё перезапускаемо и готово к перезапуску
49. Перезапускаемость Если она есть: Можно перезапустить оборзевший
50. Asynchronous, one-way messaging Противоположность RPC, прямое следствие
51. Eventual consistency Стремление к согласованности
52. Eventual consistency Client RabbitMQ Disk fsync fsync
53. Eventual consistency Master Slave Хозяин и раб
54. Введение и Архитектура Доставка задач/результатов Отладка и анализ Обобщение опыта: корректность, надежность, производительность
55. Производительность Несколько аспектов: Стабильность под нагрузкой Пропускная способность Задержка
56. Главное Ресурсы конечны
57. Какие ресурсы конечны Вот что кончалось у
58. Мораль Планируйте потребление ресурсов Особенно таких, потребление
59. Пропускная способность Избегайте обратной связи Из-за нее
60. Задержка Прогнозируйте и измеряйте Уменьшайте длину цепи

Главная
Разное
Как сделать вычислительную инфраструктуру для большого кластера

Слайд 1Как сделать вычислительную инфраструктуру для большого кластера
Евгений Кирпичёв
Станислав Лагун

Mirantis Inc. www.mirantis.com

Слайд 2Введение и Архитектура
Доставка задач/результатов
Отладка и анализ
Обобщение опыта: корректность, надежность, производительность

Слайд 3О нас
Mirantis делает проекты на заказ:
Высокотехнологичные, иногда долгосрочные, для «топовых»

заказчиков (Cisco, Mentor Graphics, Cadence, GE, …)

В основном – масштабируемые системы, клауды, research

Слайд 4Что мы строим
Очень тяжелые вычисления (но очень параллельные)
Простой API – задача

= поток подзадач: CreateJob, SubmitTask, OnResult
Много одновременных задач разной важности
Очень разнородные вычисления: От секунд (нужна интерактивность) до дней (но не мешать чужой интерактивности)
Задействовать кластер целиком
Устойчивость к временным падениям компонент (и к перманентным падениям вычислительных узлов)

Слайд 5Обычно (на суперкомпьютерах) используют:

Это называется «batch scheduler»

Слайд 6Нам не подходит

Они предполагают:
Планировщик ничего не знает про задачу
Просто выделяет ядра
Задачи

монолитны
«Мне надо 100 ядер»
Как появится 100 ядер – запустят
На 99 не запустят
Есть куча сложных правил и квот
Акцент на фичи, а не на эффективность

Без этих предположений можно сделать эффективнее.

Слайд 7Терминология
Задача = поток задачек

Слайд 8Становятся возможными некоторые трюки для повышения утилизации.
But this margin is too

small…

Слайд 9Пример неудачной архитектуры
Очевидно, single bottleneck – не масштабируется
+балансировка нагрузки очень математически

нестабильна

Клиент 1

Клиент 2

Клиент 3

брокер

Слайд 10Более удачная архитектура
Планировщик
Слушает команды о запуске-останове задач
Приказывает демонам обслуживать задачи
Трубы (как

очереди, только шире)
Доставляют задачки и ответики
Вычислительные демоны на узлах
Слушаются планировщика
Тянут из очереди задачки, считают, публикуют ответики

+клиенты

+статистика

+логгирование

+мониторинг

Слайд 11Пример
Клиент – Планировщику: Создай задачу A, важность 30%
Планировщик (выбирает несколько демонов)

– демонам: Ты, ты и ты – бросайте всё и подключайтесь к трубе А.

Клиент бросает задачки в трубу А
Демоны считают, бросают ответики
Клиент собирает ответики, бросает новые задачки и т.п.

Слайд 12Введение и Архитектура
Доставка задач/результатов
Отладка и анализ
Обобщение опыта: корректность, надежность, производительность

Слайд 13Трубы
Как очереди
Только шире, быстрее и неупорядоченные
На основе RabbitMQ
Лучший продукт в своем классе

(надежная доставка)
Но «из коробки» сам по себе не масштабируется

Слайд 14Надежная доставка
Цикл жизни демона:
Получить задачку
Посчитать
Отослать ответик
Подтвердить получение задачки

Если помрет, RabbitMQ заметит

и перешлет задачку другому.

Слайд 15Масштабирование
Из коробки RabbitMQ совсем не подходит
Одна очередь плохо тянет 10000 клиентов
Встроенная

кластеризация делает не то
От нее вообще лучше отказаться (одни проблемы)
Очевидное решение: несколько очередей + load balancing

Слайд 16Масштабирование
Голова задачи

(подбираются демонами)
задачки
Голова задачи

ответики
(отсылаются демонами)

Демон выбирает случайного кролика
и всю жизнь работает

с ним

Слайд 17Трудности
Маленький лимит соединений у RabbitMQ под Windows (не потянет 500-1000 машин)
Решено:

каждая машина подключается к кому-нибудь одному
Не терять данные при крахах демонов
Решено: подтверждения тасков
Переустанавливать соединение при случайных разрывах связи
Не терять данные при крахах RabbitMQ
RabbitMQ не гарантирует безопасность данных вне транзакции!
Не перегружать RabbitMQ
Иначе начинаются ужасы (тормоза, разрывы связи, крахи)
Поддерживать асинхронные прерывания (немедленное переключение) без потери данных
Самая сложная часть
Переключаться на другой RabbitMQ, если в этом кончились задачки (иначе starvation)

Слайд 18Сохранность данных при крахах RabbitMQ
Client
RabbitMQ
Disk
fsync
fsync
fsync
0..3
Publish confirmations
Клиент буферизует сообщения, про которые еще

не известно, на диске ли они.
При разрыве связи повторить «возможно-утерянные» сообщения.

4..5

6..7

Слайд 19Не перегружать RabbitMQ
Если слишком яро слать сообщения, RabbitMQ захлебнется (не успевая

писать на диск)
Тормоза, крахи, потеря соединения

Белое – «ждем задачи»
доставка тормозит,
или реконнектимся

Слайд 20Не перегружать RabbitMQ
Оказывается, отличная метрика загрузки – число/размер неподтвержденных сообщений
4 задачи,

4 разноцветных кролика
Один кролик не поспевает.

Слайд 21Не перегружать RabbitMQ
Ограничить число сообщений «в полете»
На каждого кролика?
Нет, тогда один

медленный будет всех тормозить
А как тогда?
Давать очередное сообщение случайному неперегруженному.

Слайд 22Около 5000 ядер, 4 RabbitMQ
Нет перегрузок – нет проблем

Слайд 23Поддерживать асинхронные прерывания
Иногда надо всё бросить и заняться другой задачей
Прервать запущенную

задачку и кинуть обратно в трубу
Или прервать ожидание задачки
Порвать соединения с трубами предыдущей задачи
Убедиться, что все ответики и отклоненные задачки точно сохранены на диск
Об этом мы узнаем из другого потока
Многопоточность – это всегда ад
К счастью, это почти единственное использование многопоточности
Но все равно ад.

Слайд 24Переключаться между кроликами
Задаче досталось несколько демонов. 3 подключены к rmq1, 1

к rmq2
Дисбаланс
Голодание
Нет задачек в нашем – переключимся на другой
А если он отвалился?
А если в нем тоже нет?
А если нигде нет? (избегать бури реконнектов)
Нельзя надолго создавать дисбаланс нагрузки на кроликов
Нужно найти того, где есть, как можно быстрее
Решение есть, немножко хитрое, нет времени рассказать ☹

Слайд 25Как это закодировать
Можно сделать лапшу, делающую все сразу
Реконнекты, подтверждения доставки, переключение, балансировка, асинхронные прерывания…

Слайд 26Как не сойти с ума
Разумеется, слои.

Паттерны Adapter, Composite etc, они же

Combinator Library

Слайд 27Слои
API проще некуда:
Отсыльщик:
Отослать
Получить/сбросить список неподтвержденных
Уничтожиться (возможно, асинхронно)
Слушатель:
Достать сейчас (blocking + timeout)
Достать

потом (callback)
Уничтожиться (возможно, асинхронно)

Слайд 28Слои
«При ошибке переоткрыться»
«При ошибке
попробовать еще раз»
«При ошибке сделать
то-то и

то-то»

«Преобразовать тип
сообщения»

«Слушать сразу несколько»

«Балансировать отправку
между несколькими»

«Игнорировать неподтвержденные при закрытии»

Слайд 29Например

По числу
кроликов

задачки
ответики

Слайд 30Введение и Архитектура
Доставка задач/результатов
Отладка и анализ
Обобщение опыта: корректность, надежность, производительность

Слайд 31Отладка и анализ
Дебаггер – не вариант (только для локальных тестов)
Где и

когда произойдет ошибка – заранее неизвестно
Post mortem отладка по логам
And you have to be pretty damn good at it
Это не логи вебсервера, где все реквесты независимы
Несколько взаимодействующих, иногда многопоточных подсистем
Проблемы с корректностью – недетерминированы
Проблемы с производительностью – не локальны
Логов, по нашим меркам, дофига (тысячи важных сообщений в сек.)

Слайд 32Пара фокусов в рукаве
Мощный логгер
Глобальная ось времени (точнее, чем NTP)
Тянет сотни

тысяч сообщений в секунду от тысяч клиентов
http://code.google.com/p/greg – опенсорс-версия
Ставим 1шт. на кластер, получаем точную глобальную картину (без мучений со специальным сбором-слиянием логов)
GNU textutils + awk (пока хватает, MapReduce не юзаем)
timeplotters – две специальных рисовалки
http://jkff.info/software/timeplotters/

Слайд 33Мы рисуем
http://jkff.info/software/timeplotters/

Слайд 34http://jkff.info/software/timeplotters/

Слайд 35Что для этого нужно?
Очень подробные логи.
Еще об этом – позже.

Слайд 36Введение и Архитектура
Доставка задач/результатов
Отладка и анализ
Обобщение опыта: корректность, надежность, производительность

Слайд 37Корректность: Главный принцип
Как писать правильный код?

Слайд 38Корректность: Главный принцип
Код точно неправильный.
Как быть?

Слайд 39Как быть?
Быть скромнее
Дать себе шанс найти ошибку
Минимизировать «ядро корректности»
Минимизировать распространение ошибки
Избегать

опасных приемов

Слайд 40Быть скромнее
Не думать «ничего, отладим»
Это будет стоить вам увеличения времени разработки

в разы
Не лепить все фичи сразу:
Каждый раз приходится разломать и отлаживать по отдельности
Безжалостно уничтожать некритичные фичи
Единственный их эффект – усложнение отладки

Слайд 41Цитаты в тему
«Write the simplest thing that could possibly work»
Ward Cunningham

«Debugging

is twice as hard as writing the code in the first place. Therefore, if you write the code as cleverly as possible, you are, by definition, not smart enough to debug it»
Brian Kernighan

Слайд 42Дать себе шанс найти ошибку
Максимально подробные логи
Не бывает «слишком много логов»
Не

бывает «от логгирования код некрасивый»

Слайд 43Минимизировать «ядро корректности»
Часть, от корректности которой зависит работоспособность системы.
Веб-сервер:
Неправильное вычисление в

процессе обработки запроса ? неправильный ответ
Дедлок в пуле сокетов ? виснет весь сервер

Слайд 44Минимизировать распространение ошибки
Расставлять «барьеры»
До барьера – будь что будет
После барьера верны

некоторые свойства
Барьер должен быть очень надежен

Слайд 45Барьеры
Уничтожение процесса (выполнение действия в отдельном процессе)
Защищает от утечек ресурсов внутри

процесса
Периодический перезапуск системы
Защищает от неограниченно долгих зависаний
Закрытие соединения с очередью
В худшем случае (неподтвержденная)задача будет сдублирована
Eventual consistency
negative feedback, периодическая сверка желаемого и действительного

Слайд 46Избегать опасных приемов
Изменяемое состояние
Многопоточность
Блокирование, синхронизация
Обратная связь
Редко выполняющийся код

Слайд 47Введение и Архитектура
Доставка задач/результатов
Отладка и анализ
Обобщение опыта: корректность, надежность, производительность

Слайд 48Надежность
Всё перезапускаемо и готово к перезапуску остальных
Asynchronous one-way messaging (противоположность RPC)
Явно

формулировать переход ответственности за целостность данных
Все компоненты готовы к дублям и потерям данных
Eventual consistency

Слайд 49Перезапускаемость
Если она есть:
Можно перезапустить оборзевший процесс
Можно навсегда забыть о редких крахах
Можно

перезапускать процесс периодически и забыть навсегда об утечках и зависаниях
Если ее нет:
Надо вылизывать код, пока не исчезнут самые маловероятные крахи и утечки
Если крах не по вашей вине (ОС, библиотека...) – это все равно ваши проблемы.

Слайд 50Asynchronous, one-way messaging
Противоположность RPC, прямое следствие из перезапускаемости.

Лучше возложить ответственность за

доставку сообщений на софт, который хорошо умеет это делать.
Или использовать ненадежный транспорт (UDP).

Слайд 51Eventual consistency
Стремление к согласованности

Слайд 52Eventual consistency
Client
RabbitMQ
Disk
fsync
fsync
fsync
0..3
Publish confirmations
4..5
6..7
Клиент и кролик постепенно согласуют знание о том, какие

данные надежно сохранены

Слайд 53Eventual consistency
Master
Slave
Хозяин и раб постепенно согласуют представление о том, чем рабу надо

заниматься

«Займись B»

«Занимаюсь A»

«Займись B»

«Занимаюсь B»

Слайд 54Введение и Архитектура
Доставка задач/результатов
Отладка и анализ
Обобщение опыта: корректность, надежность, производительность

Слайд 55Производительность
Несколько аспектов:
Стабильность под нагрузкой
Пропускная способность
Задержка

Слайд 56Главное
Ресурсы конечны

Слайд 57Какие ресурсы конечны
Вот что кончалось у нас:
Соединения с RabbitMQ
Erlang-процессы в RabbitMQ
Cинхронные

AMQP-операции / сек. (e.g. queue.declare) с RabbitMQ
Установленные соединения / сек. с RabbitMQ
Установленные соединения / сек. с логгером
Внутренние буферы сообщений в логгере
Место в пуле потоков (медленно разгребался)
Одновременные RPC-вызовы
Место на диске
CPU и диск одной машины, куда погрузили два сервиса сразу
Успешно проходящие UDP-пакеты по нагруженному каналу
Транзакции RabbitMQ в секунду (чего уж там – в минуту)
Терпение при анализе больших логов
Память у инструментов рисования логов
...

Слайд 58Мораль
Планируйте потребление ресурсов
Особенно таких, потребление которых растет с масштабом
Особенно централизованных
Центральные одноэкземплярные

сервисы
Сеть
Учитывайте паттерн загрузки!
Его бывает трудно предсказать
Наивные бенчмарки нерепрезентативны

Слайд 59Пропускная способность
Избегайте обратной связи
Из-за нее задержка начинает уменьшать пропускную способность
Задержку оптимизировать

гораздо труднее

Слайд 60Задержка
Прогнозируйте и измеряйте
Уменьшайте длину цепи задержки
Избегайте компонентов с непредсказуемой задержкой
Избегайте централизованных

компонентов на пути запроса
Не делите ресурсы между throughput-sensitive и latency-sensitive компонентами
Плохая идея использовать один и тот же RabbitMQ и для команд, и для задач
Рано или поздно придется управлять приоритетами запросов/действий вручную
Понадобятся не просто очереди, а приоритетные очереди

Скачать презентацию

Как сделать вычислительную инфраструктуру для большого кластера презентация

Содержание

Слайд 1Как сделать вычислительную инфраструктуру для большого кластераЕвгений КирпичёвСтанислав ЛагунMirantis Inc. www.mirantis.com

Слайд 2Введение и АрхитектураДоставка задач/результатовОтладка и анализОбобщение опыта: корректность, надежность, производительность

Слайд 3О насMirantis делает проекты на заказ: Высокотехнологичные, иногда долгосрочные, для «топовых»

Слайд 4Что мы строимОчень тяжелые вычисления (но очень параллельные)Простой API – задача

Слайд 5Обычно (на суперкомпьютерах) используют:Это называется «batch scheduler»

Слайд 6Нам не подходитОни предполагают:Планировщик ничего не знает про задачуПросто выделяет ядраЗадачи

Слайд 7ТерминологияЗадача = поток задачек

Слайд 8Становятся возможными некоторые трюки для повышения утилизации.But this margin is too

Слайд 9Пример неудачной архитектурыОчевидно, single bottleneck – не масштабируется+балансировка нагрузки очень математически

Слайд 10Более удачная архитектураПланировщикСлушает команды о запуске-останове задачПриказывает демонам обслуживать задачиТрубы (как

Слайд 11ПримерКлиент – Планировщику: Создай задачу A, важность 30%Планировщик (выбирает несколько демонов)

Слайд 12Введение и АрхитектураДоставка задач/результатовОтладка и анализОбобщение опыта: корректность, надежность, производительность

Слайд 13ТрубыКак очередиТолько шире, быстрее и неупорядоченныеНа основе RabbitMQЛучший продукт в своем классе

Слайд 14Надежная доставкаЦикл жизни демона:Получить задачкуПосчитатьОтослать ответикПодтвердить получение задачкиЕсли помрет, RabbitMQ заметит

Слайд 15МасштабированиеИз коробки RabbitMQ совсем не подходитОдна очередь плохо тянет 10000 клиентовВстроенная

Слайд 17ТрудностиМаленький лимит соединений у RabbitMQ под Windows (не потянет 500-1000 машин)Решено:

Слайд 18Сохранность данных при крахах RabbitMQClientRabbitMQDiskfsyncfsyncfsync0..3Publish confirmationsКлиент буферизует сообщения, про которые еще

Слайд 19Не перегружать RabbitMQЕсли слишком яро слать сообщения, RabbitMQ захлебнется (не успевая

Слайд 20Не перегружать RabbitMQОказывается, отличная метрика загрузки – число/размер неподтвержденных сообщений4 задачи,

Слайд 21Не перегружать RabbitMQОграничить число сообщений «в полете»На каждого кролика?Нет, тогда один

Слайд 22Около 5000 ядер, 4 RabbitMQНет перегрузок – нет проблем

Слайд 23Поддерживать асинхронные прерыванияИногда надо всё бросить и заняться другой задачейПрервать запущенную

Слайд 24Переключаться между кроликамиЗадаче досталось несколько демонов. 3 подключены к rmq1, 1

Слайд 25Как это закодироватьМожно сделать лапшу, делающую все сразуРеконнекты, подтверждения доставки, переключение, балансировка, асинхронные прерывания…

Слайд 26Как не сойти с умаРазумеется, слои*.*Паттерны Adapter, Composite etc, они же

Слайд 28Слои«При ошибке переоткрыться»«При ошибке попробовать еще раз»«При ошибке сделать то-то и

Слайд 29НапримерПо числу кроликовзадачкиответики

Слайд 30Введение и АрхитектураДоставка задач/результатовОтладка и анализОбобщение опыта: корректность, надежность, производительность

Слайд 31Отладка и анализДебаггер – не вариант (только для локальных тестов)Где и

Слайд 32Пара фокусов в рукавеМощный логгерГлобальная ось времени (точнее, чем NTP)Тянет сотни

Слайд 33Мы рисуемhttp://jkff.info/software/timeplotters/

Слайд 34http://jkff.info/software/timeplotters/

Слайд 35Что для этого нужно?Очень подробные логи.Еще об этом – позже.

Слайд 36Введение и АрхитектураДоставка задач/результатовОтладка и анализОбобщение опыта: корректность, надежность, производительность

Слайд 37Корректность: Главный принципКак писать правильный код?

Слайд 38Корректность: Главный принципКод точно неправильный. Как быть?

Слайд 39Как быть?Быть скромнееДать себе шанс найти ошибкуМинимизировать «ядро корректности»Минимизировать распространение ошибкиИзбегать

Слайд 40Быть скромнееНе думать «ничего, отладим»Это будет стоить вам увеличения времени разработки

Слайд 41Цитаты в тему«Write the simplest thing that could possibly work»Ward Cunningham«Debugging

Слайд 42Дать себе шанс найти ошибкуМаксимально подробные логиНе бывает «слишком много логов»Не

Слайд 43Минимизировать «ядро корректности»Часть, от корректности которой зависит работоспособность системы.Веб-сервер:Неправильное вычисление в

Слайд 44Минимизировать распространение ошибкиРасставлять «барьеры»До барьера – будь что будетПосле барьера верны

Слайд 45БарьерыУничтожение процесса (выполнение действия в отдельном процессе)Защищает от утечек ресурсов внутри

Слайд 46Избегать опасных приемовИзменяемое состояниеМногопоточностьБлокирование, синхронизацияОбратная связьРедко выполняющийся код

Слайд 47Введение и АрхитектураДоставка задач/результатовОтладка и анализОбобщение опыта: корректность, надежность, производительность

Слайд 48НадежностьВсё перезапускаемо и готово к перезапуску остальныхAsynchronous one-way messaging (противоположность RPC)Явно

Слайд 49ПерезапускаемостьЕсли она есть:Можно перезапустить оборзевший процессМожно навсегда забыть о редких крахахМожно

Слайд 50Asynchronous, one-way messagingПротивоположность RPC, прямое следствие из перезапускаемости.Лучше возложить ответственность за

Слайд 51Eventual consistencyСтремление к согласованности

Слайд 52Eventual consistencyClientRabbitMQDiskfsyncfsyncfsync0..3Publish confirmations4..56..7Клиент и кролик постепенно согласуют знание о том, какие

Слайд 53Eventual consistencyMasterSlaveХозяин и раб постепенно согласуют представление о том, чем рабу надо

Слайд 54Введение и АрхитектураДоставка задач/результатовОтладка и анализОбобщение опыта: корректность, надежность, производительность

Слайд 55ПроизводительностьНесколько аспектов:Стабильность под нагрузкойПропускная способностьЗадержка

Слайд 56ГлавноеРесурсы конечны

Слайд 57Какие ресурсы конечныВот что кончалось у нас:Соединения с RabbitMQErlang-процессы в RabbitMQCинхронные

Слайд 58МоральПланируйте потребление ресурсовОсобенно таких, потребление которых растет с масштабомОсобенно централизованныхЦентральные одноэкземплярные

Слайд 59Пропускная способностьИзбегайте обратной связиИз-за нее задержка начинает уменьшать пропускную способностьЗадержку оптимизировать

Слайд 60ЗадержкаПрогнозируйте и измеряйтеУменьшайте длину цепи задержкиИзбегайте компонентов с непредсказуемой задержкойИзбегайте централизованных

Похожие презентации

Обратная связь

Что такое ThePresentation.ru?