Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность

Лекция

Привет, сегодня поговорим про задачи параллельных вычислений, обещаю рассказать все что знаю. Для того чтобы лучше понимать что такое задачи параллельных вычислений, чрезвычайная параллельность , настоятельно рекомендую прочитать все из категории Высоконагруженные проекты.Паралельные вычисления. Суперкомпьютеры. Распределенные системы.

Параллельные вычисления — способ организации компьютерных вычислений, при котором программы разрабатываются как набор взаимодействующих вычислительных процессов, работающих параллельно (одновременно). Термин охватывает совокупность вопросов параллелизма в программировании, а также создание эффективно действующих аппаратных реализаций. Теория параллельных вычислений составляет раздел прикладной теории алгоритмов .

Существуют различные способы реализации параллельных вычислений. Например, каждый вычислительный процесс может быть реализован в виде процесса операционной системы, либо же вычислительные процессы могут представлять собой набор потоков выполнения внутри одного процесса ОС. Параллельные программы могут физически исполняться либо последовательно на единственном процессоре — перемежая по очереди шаги выполнения каждого вычислительного процесса, либо параллельно — выделяя каждому вычислительному процессу один или несколько процессоров (находящихся рядом или распределенных в компьютерную сеть).

Основная сложность при проектировании параллельных программ — обеспечить правильную последовательность взаимодействий между различными вычислительными процессами, а также координацию ресурсов, разделяемых между процессами.

чрезвычайная параллельность (чрезвычайно параллельная задача, англ. embarrassingly parallel) — тип задач в системах параллельных вычислений, для которых не требуется прилагать больших усилий при разделении на несколько отдельных параллельных задач (распараллеливании). Чаще всего не существует зависимости (или связи) между этими параллельными задачами, то есть их результаты не влияют друг на друга.

Чрезвычайно параллельные задачи практически не требуют согласования между результатами выполнения отдельных этапов, что отличает их от задач распределенных вычислений, которые требуют связи промежуточных результатов. Параллельные задачи легки для исполнения на серверных фермах (серверных кластерах), они хорошо подходят для больших распределенных платформ в Интернете, таких как BOINC.

Типичным примером чрезвычайно параллельной задачи является работа графического процессора (GPU) при расчете 3D проекций, когда каждый пиксель на экране может рассчитываться самостоятельно.

задачи параллельных вычислений

Построении вычислительных систем с максимальной производительностью

–компьютеры с распределенной памятью
–единственным способом программирования подобных систем является использование систем обмена сообщениями

Поиск методов разработки эффективного программного обеспечения для параллельных вычислительных систем

–компьютеры с общей памятью
–технологии программирования проще
–по технологическим причинам не удается объединить большое число процессоров с единой оперативной памятью
–проблемным звеном является система коммутации

Примеры чрезвычайно параллельных задач

Некоторые примеры чрезвычайно параллельных задач:

Обслуживание статических файлов на веб-сервере.
Расчет элементов множества Мандельброта и других фракталов, когда каждая точка может быть вычислена независимо.
Рендеринг в компьютерной графике. В трассировке лучей каждый пиксель может быть проработан самостоятельно. В компьютерной анимации каждый кадр может быть обработан независимо.
Полный перебор или «поиски грубой силы» — поиск в криптографии последовательным перебором возможных комбинаций. Ярким примером является сеть распределенных вычислений distributed.net.
BLAST-поиски в биоинформатике.
Крупномасштабные системы распознавания лица, предусматривающие сравнение тысяч входных изображений (например снимков лиц по системам безопасности или видеонаблюдения) с большим количеством сохраненных изображений определенных лиц (например, портретов преступников).
Компьютерное моделирование сравнения многих независимых сценариев, таких как климатические модели.
Генетические алгоритмы и другие эвристические алгоритмы.
Статистический ансамбль с численного прогноза погоды.
Моделирование и реконструкция событий в физике элементарных частиц.
Этап сбора отношений в вариации кратных многочленов метода квадратичного решета — алгоритм в факторизации целых чисел (MPQS).
При генерировании Bitcoin хеширование для одного и того же блока, но с разной служебной информацией в заголовке, может выполняться параллельно.

Реализации чрезвычайно параллельных задач

В языке программирования R пакет «Snow» (Simple Network of Workstations — простая сеть рабочих станций) реализует простой механизм для использования коллекции рабочих станций или кластера Beowulf для чрезвычайно параллельных вычислений.

Способы синхронизации параллельного взаимодействия

В некоторых параллельных системах программирования передача данных между компонентами скрыта от программиста (например, с помощью механизма обещаний), тогда как в других она должна указываться явно. Об этом говорит сайт https://intellect.icu . Явные взаимодействия могут быть разделены на два типа:

Взаимодействие через разделяемую память: на каждом процессоре мультипроцессорной системы запускается поток исполнения, который принадлежит одному процессу. Потоки обмениваются данными через общий для данного процесса участок памяти . Количество потоков соответствует количеству процессоров. Потоки создаются либо средствами языка (например, в Java или C#, C++ (начиная с C++11), C (начиная с C11)), либо с помощью библиотек явно (например, в С/C++ с помощью PThreads), либо декларативно (например, с помощью библиотеки OpenMP), или автоматически встроенными средствами компилятора (например, High Performance Fortran). Данный вид параллельного программирования обычно требует какой-то формы захвата управления (мьютексы, семафоры, мониторы) для координации потоков между собой.
Взаимодействие c помощью передачи сообщений: на каждом процессоре многопроцессорной системы запускается однопоточный процесс, который обменивается данными с другими процессами, работающими на других процессорах, с помощью сообщений. Процессы создаются явно, путем вызова соответствующей функции операционной системы, а обмен сообщениями — с помощью библиотеки (например, реализация протокола MPI), или с помощью средств языка (например, High Performance Fortran, Erlang или occam). Обмен сообщениями может происходить асинхронно, либо c использованием метода «рандеву», при котором отправитель блокирован до тех пор, пока его сообщение не будет доставлено. Асинхронная передача сообщений может быть надежной (с гарантией доставки) либо ненадежной .

Параллельные системы, основанные на обмене сообщениями, зачастую более просты для понимания, чем системы с разделяемой памятью, и обычно рассматриваются как более совершенный метод параллельного программирования. Существует большой выбор математических теорий для изучения и анализа систем с передачей сообщений, включая модель акторов и различные виды исчислений процессов. Обмен сообщениями может быть эффективно реализован на симметричных мультипроцессорах как с разделяемой когерентной памятью, так и без нее.

У параллелизма с распределенной памятью и с передачей сообщений разные характеристики производительности. Обычно (но не всегда), накладные расходы памяти на процесс и времени на переключение задач у систем с передачей сообщений ниже, однако передача самих сообщений более накладна, чем вызовы процедур. Эти различия часто перекрываются другими факторами, влияющими на производительность.

Гибридный способ: на многопроцессорных системах с распределенной памятью (DM-MIMD), где каждый узел системы представляет собой мультипроцессор с общей памятью (SM-MIMD), можно использовать гибридный метод программирования . На каждом узле системы запускается многопоточный процесс, который распределяет потоки между процессорами данного узла. Обмен данными между потоками на узле осуществляется через общую память, а обмен данными между узлами — через передачу сообщений. В этом случае количество процессов определяется количеством узлов, а количество потоков — количеством процессоров на каждом узле. Гибридный способ программирования более сложен (требуется особым образом переписывать параллельную программу), но наиболее эффективен в использовании аппаратных ресурсов каждого узла многопроцессорной системы.

Разумеется в такой системе можно также использовать и исключительно метод передачи сообщений, то есть запустить на каждом процессоре каждого узла отдельный процесс. В этом случае количество процессов (и потоков) будет равно количеству процессоров на всех узлах. Этот способ проще (в параллельной программе надо только увеличить количество процессов), но является менее эффективным, так как процессоры одного и того же узла будут обмениваться друг с другом сообщениями, словно они находятся на разных машинах .

Типичные задачи, допускающие параллельные вычисления

map — выполнение одной и той же функции над каждым элементом массива входных данных, с получением равного по мощности массива результатов вычисления
reduce — выполнение одной и той же функции для добавления вклада каждого элемента входных данных в одно итоговое значение

Закон Амдала

Ускорение программы с помощью параллельных вычислений на нескольких процессорах ограничено размером последовательной части программы. Например, если можно распараллелить 95 % программы, то теоретически максимальное ускорение будет 20-кратным, невзирая на то, сколько процессоров используется.

Закон Амдала (англ. Amdahl's law, иногда также Закон Амдаля — Уэра) — иллюстрирует ограничение роста производительности вычислительной системы с увеличением количества вычислителей. Джин Амдал сформулировал закон в 1967 году, обнаружив простое по существу, но непреодолимое по содержанию ограничение на рост производительности при распараллеливании вычислений: «В случае, когда задача разделяется на несколько частей, суммарное время ее выполнения на параллельной системе не может быть меньше времени выполнения самого медленного фрагмента» . Согласно этому закону, ускорение выполнения программы за счет распараллеливания ее инструкций на множестве вычислителей ограничено временем, необходимым для выполнения ее последовательных инструкций.

Математическое выражение

Пусть необходимо решить некоторую вычислительную задачу. Предположим, что ее алгоритм таков, что доля {\displaystyle \alpha } Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность от общего объема вычислений может быть получена только последовательными расчетами, а, соответственно, доля {\displaystyle 1-\alpha } Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность может быть распараллелена идеально (то есть время вычисления будет обратно пропорционально числу задействованных узлов {\displaystyle p} Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность ). Тогда ускорение, которое может быть получено на вычислительной системе из {\displaystyle p} Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность процессоров, по сравнению с однопроцессорным решением не будет превышать величины

Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность

Иллюстрация

Таблица показывает, во сколько раз быстрее выполнится программа с долей последовательных вычислений {\displaystyle \alpha } Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность при использовании процессоров.

\	10	100	1 000
0	10	100	1 000
10 %	5,263	9,174	9,910
25 %	3,077	3,883	3,988
40 %	2,174	2,463	2,496

Из таблицы видно, что только алгоритм, вовсе не содержащий последовательных вычислений ( Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность ), позволяет получить линейный прирост производительности с ростом количества вычислителей в системе. Если доля последовательных вычислений в алгоритме равна 25 %, то увеличение числа процессоров до 10 дает ускорение в 3.077 раз, а увеличение числа процессоров до 1000 даст ускорение в 3.988 раз.

Отсюда же очевидно, что при доле последовательных вычислений Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность общий прирост производительности не может превысить . Так, если половина кода — последовательная, то общий прирост никогда не превысит двух.

Идейное значение

Закон Амдала показывает, что прирост эффективности вычислений зависит от алгоритма задачи и ограничен сверху для любой задачи с Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность . Не для всякой задачи имеет смысл наращивание числа процессоров в вычислительной системе.

Более того, если учесть время, необходимое для передачи данных между узлами вычислительной системы, то зависимость времени вычислений от числа узлов будет иметь минимум. Это накладывает ограничение на масштабируемость вычислительной системы, то есть означает, что с определенного момента добавление новых узлов в систему будет увеличивать время расчета задачи.

Программные инструменты параллелизма

OpenMP — стандарт интерфейса приложений для параллельных систем с общей памятью.
POSIX Threads — стандарт реализации потоков (нитей) выполнения.
Windows API — многопоточные приложения для C++.
PVM (Parallel Virtual Machine) позволяет объединить разнородный (но связанный сетью) набор компьютеров в общий вычислительный ресурс.
MPI (Message Passing Interface) — стандарт систем передачи сообщений между параллельно исполняемыми процессами.

Вау!! 😲 Ты еще не читал? Это зря!

Распределенные вычисления
Многопоточность
Многозадачность
Параллельные вычислительные системы
Классификация параллельных вычислительных систем
Закон Амдала
Вычислительный конвейер
Симметричная мультипроцессорность
Грид
GPGPU
NUMA
Кластер
MIPS
LINPACK
NAS Parallel Benchmarks
Закон Густавсона — Барсиса
Закон Мура
Кластер (группа компьютеров)
Компьютеры пятого поколения

В общем, мой друг ты одолел чтение этой статьи об задачи параллельных вычислений. Работы впереди у тебя будет много. Смело пиши комментарии, развивайся и счастье окажется в твоих руках. Надеюсь, что теперь ты понял что такое задачи параллельных вычислений, чрезвычайная параллельность и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Высоконагруженные проекты.Паралельные вычисления. Суперкомпьютеры. Распределенные системы

Задачи параллельных вычислений. Параллельные вычисления. Закон Амдала, Чрезвычайная параллельность

задачи параллельных вычислений

Примеры чрезвычайно параллельных задач

Реализации чрезвычайно параллельных задач

Способы синхронизации параллельного взаимодействия

Типичные задачи, допускающие параллельные вычисления

Закон Амдала

Математическое выражение

Иллюстрация

Идейное значение

Программные инструменты параллелизма

Вау!! 😲 Ты еще не читал? Это зря!

Комментарии

Оставить комментарий

Высоконагруженные проекты.Паралельные вычисления. Суперкомпьютеры. Распределенные системы

Термины: Высоконагруженные проекты.Паралельные вычисления. Суперкомпьютеры. Распределенные системы