Вычислительные системы - понятие, виды, классификация и режимы работы. Высокопроизводительные вычислительные системы

Лекция

Сразу хочу сказать, что здесь никакой воды про вычислительные системы, и только нужная информация. Для того чтобы лучше понимать что такое вычислительные системы, высокопроизводительные вычислительные системы, вычислительная система, вычислительная система с распределенной памятью , настоятельно рекомендую прочитать все из категории Высоконагруженные проекты.Паралельные вычисления. Суперкомпьютеры. Распределенные системы.

вычислительная система , - это совокупность аппаратно-программных средств, образующих единую среду, предназначенную для решения задач обработки информации (вычислений). Первоначально универсальные вычислительная система создавались на основе однопроцессорных компьютеров с целью увеличения их быстродействия. В первых компьютеров процессоры сами управляли операциями ввода-вывода. Однако скорость работы внешнего устройства значительно меньше скорости работы процессора, поэтому во время операций ввода-вывода процессор фактически простаивал. Чтобы сбалансировать их работу, в кон. 1950-х – нач. 1960-х гг. компьютеров начали комплектовать независимыми процессорами ввода-вывода для параллельного выполнения вычислений и операций обмена данными, тогда и появился термин «вычислительная система». Осн. преимуществами вычислительная система по сравнению с однопроцессорной компьютеров являются: значительное повышение производительности за счет статического или динамического распараллеливания процесса решения задачи (напр., выполнение отд. частей задачи на разл. процессорах); увеличение эффективности использования оборудования за счет более полной его загрузки; повышение надежности системы и др.

Вычислительная система (ВС) - это взаимосвязанная совокупность аппаратных средств вычислительной техники и программного обеспечения, предназначенная для обработки информации.

Иногда под ВС понимают совокупность технических средств компьютера, в которую входит не менее двух процессоров, связанных общностью управления и использования общесистемных ресурсов (память, периферийные устройства, программное обеспечение и т.п.).

Постоянное увеличение степени интеграции и быстродействия элементов совр. микропроцессоров, высокий уровень их надежности и относительная дешевизна позволяют строить вычислительная система путем объединения необходимого числа микропроцессоров и организации параллельной обработки данных. Параллелизм в вычислениях в значит. степени усложнил управление вычислит. процессом, а также распределение аппаратных и программных ресурсов. Поэтому важная роль в вычислительная система стала отводиться операционной системе, выполняющей функции планирования вычислит. процесса и распределения ресурсов (оперативной и внешней памяти, процессоров, периферийного оборудования и др.), а также оптимизирующим компиляторам с языков высокого уровня, позволяющим в наибольшей степени использовать архит. особенности микропроцессоров. Большую роль в достижении высокой эффективности работы вычислительная система играет система коммутации, связывающая процессоры между собой или с модулями оперативной памяти. Как правило, для этого применяют общую шину, с которой соединены процессоры и модули памяти. В вычислительная система, состоящих из нескольких процессоров, обычно используют матричные коммутаторы, а также топологию связи – кольцо, звезда и др. При объединении большого числа процессоров применяют более сложные топологии связи – тор, гиперкуб и др.

Современные вычислительная система сильно отличаются друг от друга своими возможностями и характеристиками, и этим обусловлено разнообразие признаков, по которым классифицируют вычислительная система (напр., по типам и числу компьютеров или процессоров, архитектуре системы, режимам работы, методам управления элементами системы). Так, вычислительная система бывают разделимые (включающие неск. ЭВМ, которые способны работать независимо друг от друга) и неразделимые (или многопроцессорные, состоящие из процессоров, каждый из которых может выполнять свои функции только в составе вычислительная система). Одним из видов неразделимых вычислительная система являются кластеры, состоящие из нескольких связанных между собой ЭВМ, которые находятся в едином корпусе или соединены скоростным каналом связи.

вычислительная система делят также на однородные и неоднородные. Однородная вычислительная система строится на базе однотипных процессоров или ЭВМ, а неоднородная состоит из компьютеров или процессоров разл. типов. Выделяют многомашинные и многопроцессорные вычислительная система В многомашинных вычислительная система каждый из процессоров имеет свою локальную оперативную память и работает, как правило, под управлением своей операционной системы, а в многопроцессорных вычислительная система процессоры работают с общей оперативной памятью под управлением единой операционной системы. Также выделяют классы параллельных вычислительная система: SMP (симметричная мультипроцессорная обработка данных – группа процессоров работает с общей памятью), MPP (вычислительная система с массовым параллелизмом – процессоры, число которых практически не ограничено, работают каждый со своей памятью), NUMA (промежуточная архитектура, сочетающая свойства классов SMP и MPP).

Если в состав вычислительная система кроме цифровых вычислительных машин входят аналоговые вычислительные машины, то она относится к гибридным вычислительная система Эти вычислительная система обычно используются при моделировании сложных систем, динамич. процессов и др., напр. при разработке геолого-технологич. моделей нефтяных и газовых месторождений, систем управления полетом самолета.

В 1966 М. Флинн (США) предложил классифицировать вычислительная система по числу потоков команд и потоков данных. Он выделил 4 класса: SISD (один поток команд – один поток данных), к которому относятся системы с одним процессором; SIMD (один поток команд – много потоков данных), включающий однородные векторные и матричные вычислительная система; MISD (много потоков команд – один поток данных); MIMD (много потоков команд – много потоков данных), в котором каждый процессор работает по своей программе и со своими данными. Эта классификация до сих пор актуальна, однако она не позволяет достаточно полно и точно охарактеризовать все виды вычислительная система (напр., потоковые), поэтому попытки более точно систематизировать все разнообразие вычислительная система продолжаются. Напр., классификация Базу (США, 1987) основана на последовательном определении принятых при проектировании вычислительная система решений: уровня параллелизма (данные, команды или задачи), метода реализации алгоритмов (аппаратный или программный), способа параллельного выполнения команд (конвейеризация или одновременное независимое), а также способа управления процессом выполнения команд (синхронный или асинхронный). Кришнамурти (Индия, 1989) предложил классифицировать вычислительная система по четырем характеристикам: уровню параллелизма; способу реализации параллелизма (аппаратный или аппаратно-программный), топологии (матрица, линейный массив, тор, дерево, звезда и др.), степени связи процессоров (сильная, слабая, средняя) и механизму взаимодействия процессоров (посредством передачи сообщений, разделяемых переменных или по готовности операндов), способу управления (синхронный, асинхронный, потоком данных).

Важными вехами в развитии вычислительная система стало создание таких систем, как ILLIAC IV (сдана в эксплуатацию в 1974; матричная вычислительная система из 64 процессоров), векторно-конвейерные «Cray-1» (1976, США), «Cyber 205» (1981, США), «Cray C90» (1991, США), вычислительная система с массовым параллелизмом «Connection Machine-1» (объединяла 65 536 одноразрядных процессоров, связанных через гиперкуб, 1985), «Cray T3E» (1995) и др. В России выпускались вычислительная система ПС-2000 (произ-во с 1981) и ПС-3000 (произ-во в 1984–87), многопроцессорные вычислит. комплексы «Эльбрус-1» (1980), «Эльбрус-2» (1985). Самая быстродействующая вычислительная система в России на середину 2015 – «Ломоносов-2» производства компании «Т-Платформы», установленная в МГУ им. М. В. Ломоносова. Она занимает 31-е место в июньском выпуске международного рейтинга суперкомпьютеров TOP500, достигая производительности 1,8 Пфлопс (1 Пфлопс=1015 операций над вещественными числами в секунду) в тесте LINPACK при теоретическом пределе используемого оборудования в 2,6 Пфлопс. Первое место в TOP500 c рекордной производительностью в 33,8 Пфлопс занимает вычислительная система «Тяньхэ-2», спроектированная Оборонным научно-техническим университетом Народно-освободительной армии КНР.

радиционные серверные архитектуры х86 на базе центрального процессора не всегда способны эффективно поддерживать новые рабочие нагрузки. Характерно, что в то время как поставки серверов с архитектурой х86 в четвертом квартале 2018 г. увеличились год к году на 18,7%, достигнув $21,1 млрд, продажи оборудования с другими архитектурами за этот же срок выросли на 21,6%, составив приблизительно $2,5 млрд (данные IDC).

Ускорители вычислений

На смену универсальным вычислениям приходят гетерогенные: обычные ЦП дополняются специализированными процессорами или ускорителями, повышающими производительность и энергоэффективность серверов при ресурсоемких рабочих нагрузках, которые становятся обычным явлением в современном дата-центре. В качестве таких ускорителей вычислений используются графические процессоры (GPU), программируемые пользователем вентильные матрицы (FPGA) и интегральные схемы специального назначения (ASIC).

Новые рабочие нагрузки определяют новые системные требования и функции, способствуют развитию и внедрению таких технологий, как NVMe, FPGA и базы данных в оперативной памяти (in-memory). По мнению аналитиков Forrester, специализированные ускорители, такие как FGPA и GPU, будут использоваться все шире. Применение графических процессоров может примерно в 25 раз ускорить выполнение отдельных видов вычислений, отмечают в 451 Research.

В иерархии процессоров – от ЦП общего назначения до ASIC – существует компромисс между гибкостью и эффективностью. Причем, как утверждают в Accenture, когда какое-либо конкретное приложение реализуется с помощью специализированных решений, производительность может увеличиться на порядки (табл. 1).

Табл. 1. Относительная иерархия аппаратных ускорителей

GPU, FPGA и ASIC могут использоваться для ускорения задач виртуализации и облачных вычислений, 3D/2D-графики, высокопроизводительных вычислений (HPC), искусственного интеллекта и машинного обучения, анализа больших данных, виртуализации сетевых функций (NFV) и др. Например, их можно с успехом применять в приложениях машинного обучения, предназначенных для распознавания голоса и изображений или анализа текста.

Комбинирование универсальных процессорных ядер со специализированными блоками вычислений по нейросетевым алгоритмам – актуальная тенденция. Специализированные микросхемы для систем искусственного интеллекта – еще один новый и быстроразвивающийся рынок. В 2018 г., по оценке Deloitte, инвестиции в разработку «нейрочипов» составили $1,5 млрд – вдвое больше, чем в 2017 г.

Свой ASIC – Edge TPU – для задач ИИ выпустила и Google. Однако сейчас в сфере обработки данных с применением ИИ наиболее известны продукты NVIDIA с ее графическими процессорами и решения Intel, такие как Nervana Neural Network Processor (NNP-I), заявленная производительность которого в части искусственного интеллекта в 10 раз выше, чем у графических карт, а также линейка FPGA Agilex для задач ИИ.

Самый распространенный тип аппаратных ускорителей, графические процессоры, нередко применяются для неграфических задач. Например, система NVIDIA DGX-1 с графическим процессором Volta разработана специально для поддержки приложений ИИ, глубокого обучения и аналитики.

Ресурсы вычислительной системы

К ресурсам вычислительной системы относят такие средства вычислительной системы, которые могут быть выделены процессу обработки данных на определенный квант времени. Основными ресурсами ВС являются процессоры, области оперативной памяти, наборы данных, периферийные устройства, программы.

Виды вычислительных систем

В зависимости от ряда признаков различают следующие вычислительные системы (ВС):
однопрограммные и многопрограммные (в зависимости от количества программ, одновременно находящихся в оперативной памяти);
индивидуального и коллективного пользования (в зависимости от числа пользователей, которые одновременно могут использовать ресурсы ВС);
с пакетной обработкой и разделением времени (в зависимости от организации и обработки заданий);
однопроцессорные, многопроцессорные и многомашинные (в зависимости от числа процессоров);
сосредоточенные, распределенные (вычислительные сети) и ВС с теледоступом (в зависимости от территориального расположения и взаимодействия технических средств);
работающие или не работающие в режиме реального времени (в зависимости от соотношения скоростей поступления задач в ВС и их решения);
универсальные, специализированные и проблемно-ориентированные (в зависимости от назначения).
гетерогенные

вычислительная система с распределенной памятью (: Вычислительная система с распределенной памятью; Вычислительные системы с распределенной памятью;)

Вычислительная система с распределенной памятью (distributed memory) – система, в которой каждый процессор обладает собственной локальной памятью, а общая память отсутствует. Обмен информацией между составляющими системы обеспечивается с помощью коммуникационной сети посредством обмена сообщениями.

Часто такие системы объединяют отдельные ВМ. Данный вид ВС называют слабо связанными (loosely coupled systems). Слабо связанные системы встречаются как в классе SIMD, так и в классе MIMD. Подобное построение ВС снимает ограничения, свойственные для общей шины, но приводит к дополнительным издержкам на пересылку сообщений между процессорами или машинами. Многопроцессорность ВС приводит еще к одной проблеме - проблеме одновременного доступа к памяти со стороны нескольких процессоров.

Режимы работы вычислительных систем

Мультипрограммирование

Мультипрограммирование - это режим обработки данных, при котором ресурсы вычислительной системы предоставляются каждому процессу из группы процессов обработки данных, находящихся в ВС, на интервалы времени, длительность и очередность предоставления которых определяется управляющей программой этой системы с целью обеспечения одновременной работы в интерактивном режиме.

Режим реального времени

Режим реального времени - режим обработки данных, при котором обеспечивается взаимодействие вычислительной системы с внешними по отношению к ней процессами в темпе, соизмеримом со скоростью протекания этих процессов.

Этот режим обработки данных широко используется в системах управления и информационно-поисковых системах.

Однопрограммный режим работы вычислительной системы (ВС)

Аппаратные средства ЭВМ совместно с программным обеспечением образуют ВС. В зависимости от класса ЭВМ и вида операционной системы ВС могут работать в режимах однопрограммном и мультипрограммном.

В однопрограммном режиме работы в памяти ЭВМ находится и выполняется только одна программ. Такой режим обычно характерен для микро-ЭВМ и персональных ЭВМ, то есть для ЭВМ индивидуального пользования.

Мультипрограммный (многопрограммном) режим работы вычислительной системы (ВС)

В мультипрограммном (многопрограммном) режиме работы в памяти ЭВМ находится несколько программ, которые выполняются частично или полностью между переходами процессора от одной задачи к другой в зависимости от ситуации, складывающейся в системе.

В мультипрограммном режиме более эффективно используются машинное время и оперативная память, так как при возникновении каких-либо ситуаций в выполняемой задаче, требующих перехода процессора в режим ожидания, процессор переключается на другую задачу и выполняет ее до тех пор, пока в ней не возникает подобная ситуация, и т.д.

При реализации мультипрограммного режима требуется определять очередность переключения задач и выбирать моменты переключения, чтобы эффективность использования машинного времени и памяти была максимальной.

Мультипрограммный режим обеспечивается аппаратными средствами ЭВМ и средствами операционной системы. Он характерен для сложных ЭВМ, где стоимость машинного времени значительно выше, чем у микро-ЭВМ. Разработаны также мультипрограммные ОС, позволяющие одновременно следить за решением нескольких задач и повышать эффективность работы пользователя.

Режим пакетной обработки

В зависимости от того, в каком порядке при мультипрограммном режиме выполняются программы пользователей, различают режимы пакетной обработки задач и коллективного доступа.

В режиме пакетной обработки задачи выстраиваются в одну или несколько очередей и последовательно выбираются для их выполнения.

Режим коллективного доступа

В режиме коллективного доступа каждый пользователь ставит свою задачу на выполнение в любой момент времени, то есть для каждого пользователя в такой ВС реализуется режим индивидуального пользования. Это осуществляется обычно с помощью квантования машинного времени, когда каждой задаче, находящейся в оперативной памяти ЭВМ, выделяется квант времени. После окончания кванта времени процессор переключается на другую задачу или продолжает выполнение прерванной в зависимости от ситуации в ВС. Вычислительные системы, обеспечивающие коллективный доступ пользователей с квантованием машинного времени, называют ВС с разделением времени.

Классификация вычислительных систем

Классификация определяется набором признаков, которые характеризуют внутренние параметры объектов классификации. При этом выбираются наиболее важные признаки, определяющие внешние параметры этих объектов.

В том случае, когда объектами классификации являются вычислительные системы (ВС), задача классификации усложняется из-за многообразия областей применения ВС и, следовательно, многообразия видов ВС, поскольку ВС являются специализированными в соответствии с классом решаемых задач.

Однако есть два фактора, которые надо принимать во внимание какие бы виды ВС не рассматривались. Это

- какие задачи должны решаться с помощью ВС,
- какие понадобятся вычислительные средства и как они должны быть взаимосвязаны, чтобы требуемые задачи можно было решить за заданное время (или в другой постановке – определяется время, необходимое для решения требуемых задач на выбранных вычислительных средствах).

Решаемые задачи весьма условно можно разделить по характеру взаимодействия между частями задачи (вычислительными процессами) на: сильно связанные и с ослабленными связями.

Вычислительные средства, предназначенные для решения отмеченных выше задач, назовем соответственно:

- многопроцессорными вычислительными системами (МПВС),
- многомашинными вычислительными системами (ММВС).

Состав вычислительных средств и связи между этими средствами – это основные классификационные признаки, характеризующие любую техническую структуру, в том числе и ВС, поскольку вычислительная система является технической структурой.

Отметим, что здесь рассматриваются ВС, которые по классификации М. Дж. Флинна относятся к группе «много команд, много данных».

Что касается используемых далее терминов, то среди возможных синонимов выбираются, во-первых, русские, если они есть (например, многомашинные, а не мультикомпьютерные), во-вторых, наиболее простые (например, коммутатор, а не средства коммутации или коммуникационная сеть). Рекомендуемые термины далее выделяются курсивом .

Классификация ВС по основным признакам, характеризующим структуру этих технических объектов, приведена в таблице 1. В таблицу включены дополнительные признаки, отражающие особенности организации памяти, передачи данных, управления и конструктивной реализации ВС.

Таблица 1 – Классификация ВС

Признак

классификации

Многопроцессорная ВС

Многомашинная ВС

Состав

структуры

CP*, PM,

BM, EM, I/O, SW

ВМ (ЭВМ, МПВС),

EM, I/O, SW

Вид связи между

элементами структуры

(вид коммутатора)

Матричный SW,

многоступенчатый SW,

общая шина

Шинные (многошинный SW и др.) или линковые ( SW с регулярными связями и др. )

Организация памяти

Общая память

Распределенная память

Способ

передачи данных

Параллельный

(сильная связь)

Параллельно-последовательный

(ослабленная связь)

Приемник передаваемых данных

–

Кэш-память или

оперативная память

Инициатор

передачи данных

–

Процесс-последователь или

процесс-предшественник

Операционная

система (ОС),

управление

Общая,

централизованное

Копии ОС и общая надстройка,

смешанное

Пространственное размещение

элементов структуры

На одной плате

или

в одном блоке

В одном блоке,

в одной стойке и т.д.

(в одном помещении)

* CP – центральный процессор (не содержит кэш-памяти СМ); PM – процессорный модуль, т.е. Об этом говорит сайт https://intellect.icu . CP+СМ, при этом СМ может быть двухуровневой; BM – оперативная память, которая может состоять из одного или нескольких модулей ММ (2, 4, 8 …);
ММ – модуль оперативной памяти, который представляет собой секционированную память с числом секций, равным числу слов в блоке СМ (обычно 4), ЕМ – внешняя память на магнитных или оптических носителях информации; I/O – устройства ввода/вывода; SW – коммутатор, т.е. совокупность средств, обеспечивающих взаимодействие между элементами структуры. В состав SW помимо ключевых элементов входит устройство управления, выполняющее функции маршрутизации, арбитража и т.п., ВМ – вычислительный модуль (это компьютеров или МПВС).

Образ единой ВС поддерживается совокупностью как аппаратных, так и программных средств (операционной системой). Однако приводимая классификация ориентирована главным образом на организацию аппаратных средств.

Схема классификации ВС приведена на рисунке 1.

Вычислительные системы - понятие, виды, классификация и режимы работы. Высокопроизводительные вычислительные системы

Рисунок 1 – Схема классификации ВС

Рассмотрим каждый вид ВС более подробно.

Многопроцессорные ВС характеризуются сильными связями и общей памятью.

Особенностью МПВС является то, что время обращения любого процессора к памяти одинаковое. В зарубежной литературе такие МПВС называют UMA (Uniform Memory Access) – ВС с однородным доступом к памяти. Работа МПВС характеризуется также аббревиатурой SMP (Symmetrical Multiprocessor Processing) – однородная (симметричная) многопроцессорная обработка, которая достигается за счет циклического изменения приоритетов процессоров.

Многопроцессорные ВС с различными коммутаторами показаны на рисунке 2.

Рисунок 2 – Многопроцессорные ВС с различными коммутаторами

а – МПВС с матричным коммутатором; б – двухступенчатый коммутатор 16х4;
в – МПВС с общей шиной (коммутатор «размазан» по РМ).

Многомашинные ВС (ММВС) характеризуются ослабленными связями и распределенной памятью (рисунок 3).

Связи в ММВС могут быть в виде шин или в виде линков, т.е. двух групп линий, по которым сигналы могут передаваться независимо в двух противоположных направлениях (рисунок 4).

Рисунок 3 – Многомашинная вычислительная система (ММВС).

COM – вычислительный узел, SW – коммутатор.

Рисунок 4 – Коммутационный узел (4 × 4) со связями в виде шин(а) и в виде линков (б)

На рисунках 5 –7 показаны ММВС с шинными связями.

Рисунок 5 – ММВС с общей шиной. COM – вычислительный модуль

Рисунок 6 – Схема многошинной ММВС (а) и узел ключевых элементов, входящих в состав каждого ВМ (б)

Рисунок 7 – ММВС с шинными связями иерархического типа.

COM – вычислительный модуль первого уровня,

МРМ – вычислительный модуль второго уровня,

Некоторые ММВС со связями в виде линков могут быть названы регулярными: кольцевые, матричные (решетка, тор, витой тор), трехмерные, гиперкуб. Коммутационные узлы, используемые для построения таких связей, имеют особый вход/выход для подключения к ВМ и несколько линков для соединения с соседними узлами (рисунок 8).

Рисунок 8 – Коммутационный модуль для регулярной ММВС в виде кольца, , L = 2.

Бывают с L = 4, 6 и др. SC – коммутационные (ключевые) элементы

На рисунке 9 показаны ММВС в виде кольца и матрицы (в виде тора).

Рисунок 9 – Регулярные ММВС в виде кольца (а) и в виде тора (б)

Коммутационные узлы, используемые для полносвязных и составных (в том числе древовидных) ММВС, имеют одинаковые (линковые) входы/выходы (рисунок 10). Все связи однотипные (линки) и могут использоваться как для подключения ВМ, так и для подключения других коммутационных узлов.

Рисунок 10 – Узел ключевых элементов 4×4 для составных ММВС.

Бывают 8×8, 16×16, 22×22, 64×64, 128×128 и др.

Составные коммутационные модули 16×16, собранные из коммутационных узлов 4×4 показаны на рисунке 11.На рисунке 12 показан коммутационные модули 16×16, собранные из коммутационных узлов 4×4.

Рисунок 11 – Двухступенчатый коммутатор 16×16, построенный из коммутационных узлов 4×4. Слева – входные линки, справа – соответствующие выходные линки. Слева блокируемый SW (а).

Неблокируемый SW (б) может быть получен добавлением еще одного столбца из коммутационных узлов 4×4 (коммутатор Клоза)

Рисунок 12 – Составной коммутатор 64×64 из 4-х коммутационных узлов 32×32.

Здесь каждая линия – это пара линков (входной и выходной)

На рисунке 13 показана полносвязная ММВС с матричным коммутатором N×N. Для ясности рисунка цепи входных линков вычислительных узлов не соединены (точки 1… N соответственно). Коммутатор может быть выполнен так как показано на рисунках 11 (N = 16) или 12 (N = 64).

Рисунок 13 – ММВС с матричным коммутатором

Во всех рассмотренных выше структурах ММВС оперативная память распределена по ВМ, причем время обращения процессора к оперативной памяти «своего» ВМ существенно меньше, времени обращения к памяти «чужого» (удаленного) ВМ. В зарубежной литературе такие ММВС называют NUMA (Non-Uniform Memory Access) – системы с неоднородным доступом к памяти, а саму память – распределенной (distributed memory).

Поскольку число ВМ в ММВС обычно велико (≥64), то работа ММВС характеризуется также аббревиатурой MPP (Massively Parallel Processing) – ВС с массовой параллельной обработкой.

По способу организации передачи данных, т.е. способу обращения процессора одного ВМ к памяти другого (удаленного или «чужого») ВМ можно выделить ММВС с организацией CCNUMA, COMA и RMA .

CCNUMA (Cache Coherent NUMA) – организация [архитектура] ММВС, в которой передача строки данных производится по инициативе процесса-последователя. Данные передаются из оперативной памяти ВМ, в котором они были получены, в кэш-память ВМ, на котором будет выполняться процесс-последователь. Передача производится тогда, когда эти данные потребуются.

COMA (Cache Only Memory Architecture) – организация [архитектура] ММВС, в которой передача страницы данных производится по инициативе процесса-последователя. Данные передаются из оперативной памяти ВМ, в котором они были получены, в оперативную память ВМ, на котором будет выполняться процесс-последователь. Передача производится тогда, когда эти данные потребуются. Память ВМ называется притягивающей (AM – Attraction Memory), поскольку данные при необходимости как бы притягиваются в эту память.

RMA (Reflector Memory Architecture) – организация [архитектура] ММВС, в которой передача страницы данных производится по инициативе процесса-предшественника. Данные передаются из оперативной памяти того ВМ, в котором они были получены, в оперативные памяти тех ВМ, на которых будут выполняться процессы-последователи (при статическом распределении) или в оперативной памяти всех ВМ (при динамическом распределении процессов по процессорам). Память ВМ называется отражающей (RM – Reflector Memory), поскольку данные после их получения отображаются в памятях других ВМ.

Аван-проект вычислительной системы М-9

В 1966 г. в Институте электронных управляющих машин по руководством М. А. Карцева был разработан аван-проект вычислительной системы М-9. Исполнители проекта: Е. В. Гливенко, В. А. Брик, Л. З. Либуркин, Л. В. Иванов, Ю. И. Галкин. В 1967 г. на основании решения Комиссии Президиума Совета Министров СССР и приказа Минприбора СССР был разработан эскизный проект М-9 (“Октябрь”), выполненный в рамках эскизного проекта системы “Аврора” — комплекса радиоэлектронных средств, в том числе средств обработки больших потоков радиолокационной информации.

Исполнители эскизного проекта М-9: М. А. Карцев (главный конструктор), Р. М. Акчурин, В. А. Брик, Е. В. Гливенко, Л. Н. Коваленко, В. П. Кузнецова, Л. З. Либуркин, В. П. Филиппов.

В проект М-9 М. А. Карцевым были заложены передовые идеи в области параллельной обработки информации. Многие решения этого проекта были изобретениями, многие плодотворные идеи не реализованы до сих пор. Перед разработчиками М-9 была поставлена задача на элементной и технологической базе уровня конца 60-х — начала 70-х годов создать вычислительные средства с производительностью порядка 108-109 операций/с. С потребностью в таких средствах столкнулись разработчики систем наблюдения за искусственными спутниками Земли с помощью радиолокационных станций (академик А. Л. Минц и руководимый им коллектив Радиотехнического института АН СССР). Существовавшие в то время в стране вычислительные средства обеспечивали производительность порядка 105-106 операций/с.

Таким образом, М. А. Карцев еще в 1966-67 гг. ставил задачу повышения производительности вычислительных систем на 2-3 порядка и намечал пути решения этой задачи. Он предложил новую архитектуру и структуру вычислительной системы, которые могли бы использовать естественный параллелизм исходной информации, подлежащей обработке.

Докладывая о проекте М-9 в 1967 г. на симпозиуме по вычислительным системам и средам в Новосибирске, М. А. Карцев в шутливой форме объяснил, что “машина М-220 называется так потому, что имеет производительность 220 тысяч операций/с, а М-9 называется так потому, что обеспечивает производительность 109 операций/с”.

Идеи функциональной арифметики для параллельных вычислений, сформулированные в проекте М-9, являлись обобщением принципов векторного и матричного процессоров. Архитектура М-9 предусматривала выполнение арифметических и логических операций над новым классом операндов — не над числами, а над функциями одной или двух переменных, заданных в дискретных точках. Система команд функциональной арифметики предусматривала операторы, выполняемые структурой многоразрядных процессоров, в которой паре функций, заданных во входных регистрах, соответствовала функция-результат, получаемая в выходных регистрах. Были также предусмотрены операторы, результат выполнения которых являлся числом, а не функцией. Операторы второго типа имели дело с функциями, записанными в регистрах структуры одноразрядных процессоров. Эти функции, принимающие значения 0 или 1, служили для выделения какого-либо множества из обрабатываемой информации (т. е. были введены операторы характеристических функций множеств). В операторах третьего типа были задействованы как функции, так и множества, являющиеся операндами или результатами выполнения. Эти операторы служили для того, чтобы преобразовывать функцию на некотором множестве или получать в виде результата некоторое множество, связанное с заданной функцией.

Структура вычислительной системы М-9, предложенная М. А. Карцевым, состояла из нескольких крупных блоков, объединенных мощными магистральными связями. Эти блоки М. А. Карцев называл “связками”.

Основную вычислительную мощность М-9 должна была обеспечить “функциональная связка” в виде “решетки” 32в32 процессоров, выполняющих операторы над 16-разрядными операндами. В каждой горизонтальной линии этой матрицы, имеющей 32 процессора, предусматривались дополнительные общие арифметические цепи, позволяющие выполнять за один машинный такт действия типа “сумма парных произведений” (скалярное произведение векторов, имеющих по 32 компонента). При умножении двух матриц за один такт работы функциональной связки можно было получить сразу 32 элемента результирующей матрицы. Общие арифметические цепи могли производить суммирование с накоплением результата, что позволяло при необходимости обрабатывать векторы большей длины, чем 32 компонента. На операторы, выполняемые “решеткой” процессоров функциональной связки, могла накладываться “маска” в виде матрицы булевых переменных, которая разрешала выполнение действий элементарным процессорам, отмеченным в маске единицами.

Работу с матрицами булевых переменных для маски должно было выполнять специальное устройство из 32в32 элементарных одноразрядных вычислителей, названное “картинной арифметикой”. “Картины” могли не только преобразовываться, но и сдвигаться по осям координат. Массивы булевых переменных на “картине” могли расширяться и сужаться. Между процессорами функциональной “решетки” и процессорами картинной арифметики предусматривались прямые связи. Это предоставляло дополнительные возможности управления вычислительным процессом.

Кроме функциональной связки в виде “решетки” процессоров, удобной для решения двумерных задач, в проекте М-9 предусматривалась функциональная линейка — структура, работающая с функциями от одного переменного. Такая линейка, названная “числовой связкой”, состояла из 32 процессоров. Эти процессоры должны были выполнять операторы над одной функцией или над парой функций, заданных в 32 точках, либо операторы над двумя функциями или над двумя парами функций, заданных в 16 точках. То есть по одному коду оператора числовая связка могла выполнять одно действие (или 2, 4, 8 разных действий) над парами операндов длиной 128 (или 16, 32, 16 разрядов), в том числе арифметические вычисления с плавающей точкой.

Векторные операции числовой связки дополнялись “картинной арифметикой” в виде линейки 32 элементарных вычислителей булевых переменных — “арифметики признаков”.

В составе М-9 была предусмотрена “ассоциативная связка”, представляющая собой линию элементарных вычислителей, выполняющих операторы сравнения операндов (“больше”, “меньше”, “равно”, “больше или равно” и т. п.), а также узел обработки результирующих булевых переменных и маскирования элементарных вычислителей этой связки. Ассоциативная связка предназначалась для обработки больших массивов входной информации с рассортировкой ее на подмассивы по содержанию. Операторы ассоциативной связки определяли не одно число, а векторы, каждый компонент которого связывался с одной из характеристик объекта, описываемого этим вектором.

Архитектуру М-9 по принципу организации параллельных вычислений можно отнести к классу SIMD (один поток команд — много потоков данных). Многопроцессорная функциональная арифметика каждой связки должна была работать с общей оперативной памятью и постоянной памятью для хранения программ.

Различные комбинации указанных выше связок (от 1 до 8) М-9 должны были позволить создавать многопроцессорные вычислительные системы с производительностью от 20 млн. операций/с до 1-2 млрд. операций/с. В частности предполагалось, что М-10 реализует числовую связку, а М-11 содержит 2 функциональные связки, 1 ассоциативную связку, 1 числовую связку (М-10) и внешний вычислитель для связи с объектом.

Кроме перехода от традиционной архитектуры ЭВМ, работающей с числами, к функционально-операторной архитектуре, о чем говорилось выше, дополнительный выигрыш в повышении производительности на 1-2 десятичных порядка мог быть получен за счет второй основной идеи, предложенной в проекте М-9. Она заключалась в синхронном объединении нескольких машин в одну вычислительную систему. При таком синхронном объединении все машины должны были работать от одного тактового генератора, выполнять операции за 1-2 такта. В конце операции и в начале следующей операции был возможен обмен между любыми арифметическими и запоминающими устройствами машин, объединенных в систему.

М-9 представляла собой вычислительную систему широкого назначения, существенно отличающуюся от известных в то время универсальных ЭВМ (в том числе многопроцессорных) и пригодную для решения самых разнообразных классов вычислительных и логических задач, а также задач управления.

Такие задачи, требующие производительности супер-ЭВМ, возникали в связи с необходимостью обработки больших потоков информации от измерительных устройств крупных технологических объектов, оборонных объектов управления, крупномасштабных научных экспериментов. Многопроцессорные вычислительные структуры, такие, как М-9, открывали возможности решения геометрических задач, связанных, например, с автоматической обработкой снимков пузырьковых и искровых камер в ядерной физике, обработки снимков, получаемых с искусственных спутников Земли, обработки и анализа геологических карт.

Проект М-9, богатый новыми в то время идеями, не был реализован в полном объеме по ряду технических и организационных причин. Прежде всего из-за уровня доступной в конце 60-х годов элементной базы и технологии. М. А. Карцев на собрании, посвященном 15-летию НИИ вычислительных комплексов (НИИВК), в 1982 г. говорил: “В 1967 г. мы вышли с довольно дерзким проектом вычислительного комплекса М-9. Это было в год 50-й годовщины Октябрьской революции, поэтому вычислительный комплекс назывался «Октябрь». Для Минприбора СССР, где мы тогда пребывали, этот проект оказался уж слишком (за пределами задач этого министерства). Нам сказали: идите вы к В. Д. Калмыкову (Министру радиопромышленности СССР), раз уж вы работаете на него. Проект М-9 остался неосуществленным. Но в 1969 г. началась разработка М-10, первый образец которой появился в 1973 г. В течение ряда лет эта машина была мощнейшей в Союзе и сейчас продолжает выпускаться и эксплуатироваться. На М-10 удалось получить уникальные научные результаты, особенно в области физики”.

Числовая связка проекта М-9 — машина М-10 — выпускалась серийно с 1974 г. Загорским электромеханическим заводом. Ее разработка была отмечена Государственной премией СССР в области науки и техники.

Из представленной здесь краткой характеристики проекта М-9 можно видеть, что еще в конце 60-х годов М. А. Карцевым были предложены принципиальные новшества в архитектуре ЭВМ и вычислительных систем: архитектура типа RISC с сокращенным набором команд, выполняемых за 1 машинный такт, и архитектура типа VLIW с длинным командным словом, задающим коды операций над векторами той или иной длины, выполняемых одновременно в двух или более многопроцессорных арифметических устройствах.

Гетерогенные вычисления

Гетерогенные вычислительные системы — электронные системы, использующие различные типы вычислительных блоков. Вычислительными блоками такой системы могут быть процессор общего назначения (GPP), процессор специального назначения (например, цифровой сигнальный процессор (DSP) или графический процессор (GPU)), сопроцессор, логика ускорения (специализированная интегральная схема (ASIC) или программируемая пользователем вентильная матрица (FPGA)).

В общем, гетерогенная вычислительная платформа содержит процессоры с разными наборами команд (ISA). Спрос на повышение гетерогенности в вычислительных системах, частично связан с необходимостью в высоко-производительных, высоко-реакционных системах, которые взаимодействуют с другим окружением (аудио/видео системы, системы управления, сетевые приложения и т. д.).

ЦП отвечает за обработку логических транзакций и последовательные вычисления, в то время как ГП фокусируется на выполнении задач параллельной обработки с большим числом потоков (задачи крупномасштабных вычислений).

640?wx_fmt=jpeg

(Сравнение исходной сети, архитектуры CPU и GPU)

Более популярным,Процессор похож на ручку, с его помощью можно рисовать все, что угодно. Графический процессор похож на принтер, и печать определенно выполняется быстрее, но требует взаимодействия со стороны центрального процессора.

Гетерогенные вычислительные платформы стали новыми фаворитами, а среди разнородных вычислений также есть мощные силы, и есть три разных типа.

Тип CPU + GPU, тип CPU + FPGA и типCPU + ASIC.

В прошлом, технологические достижения и масштабируемость частоты позволяли большинству компьютерных приложений увеличивать производительность без структурных изменений или аппаратного ускорения. Хотя эти достижения сохраняются, их влияние на современные прикладное ПО не так значительно, как влияние некоторых препятствий, таких как стена памяти[en] и стена мощности

Теперь, с этими дополнительными ограничениями, основным методом получения дополнительной производительности вычислительных систем является введение дополнительных специализированных ресурсов, в результате чего вычислительная система становится гетерогенной . Это позволяет разработчику использовать несколько типов вычислительных элементов, каждый из которых способен выполнять задачи, которые лучше всего для него подходят .

Добавление дополнительных, независимых вычислительных ресурсов неизбежно приводит к тому, что большинство гетерогенных систем рассматриваются как параллельные вычислительные системы или многоядерные системы.

Еще один термин, который иногда используется для этого типа вычислений «гибридные вычисления» . Hybrid-core computing[en] — форма гетерогенных вычислений, в которой асимметричные вычислительные устройства сосуществуют в одном процессоре.

Что такое высокопроизводительные вычислительные системы ?

Высокопроизводительные вычислительные системы (HPC) — это приложения и рабочие задачи, связанные с выполнением ресурсоемких вычислительных операций с использованием различных ресурсов.

Специализированные решения для высокопроизводительных вычислений помогают организациям совершать открытия, преобразующие бизнес. Высокопроизводительные вычисления стали доступнее, чем когда-либо ранее, как на одиночных локальных системах, так и в кластерах, в том числе и с использованием облака.

.

Как работают высокопроизводительные вычисления?

Ученые, инженеры и исследования используют высокопроизводительные вычислительные системы для выполнения невероятно ресурсоемких задач, в том числе для прогнозирования погоды, разведки нефтегазовых запасов, физических исследований, исследований квантовой механики и т. д.

Хотя высокопроизводительные вычисления можно выполнять на одной системе, действительно мощные возможности открываются при использовании кластеров из нескольких высокопроизводительных вычислительных узлов, которые также называют суперкомпьютерами. Они открывают возможности крупномасштабного моделирования, которое нецелесообразно или даже невозможно проводить на одиночных системах.

Многие первые и самые знаменитые суперкомпьютеры были разработаны компанией Cray, которая сегодня является партнером программы Intel® Datacenter Builders. Современные суперкомпьютеры представляют собой большие кластеры узлов, включающих процессоры, ускорители, высокопроизводительную инфраструктуру связи и комплексные системы памяти и хранения данных. Все эти ресурсы доступны разным узлам, что помогает предотвратить возникновение узких мест и обеспечить оптимальную производительность.

Вертикальное масштабирование производительности
Приложения для высокопроизводительных вычислений используют возможности аппаратных и программных архитектур, распределяющих вычисления между ресурсами одной системы (обычно сервера). Такая форма параллельной обработки называется вертикальным масштабированием. Прирост производительности очень значительный, но ограничивается возможностями одной системы.

Горизонтальное масштабирование производительности
Также приложения для высокопроизводительных вычислений могут распределять вычислительные задачи по разным системам, настроенным для работы в комплексе. Такой комплекс называется высокопроизводительным вычислительным кластером и позволяет приложениям распределять вычислительные задачи для параллельного выполнения на нескольких системах.

Стоимость и преимущества высокопроизводительных вычислительных систем

Высокопроизводительные вычислительные системы все больше используются организациями. Также они становятся более доступными. Ученые и инженеры могут выполнять рабочие задачи высокопроизводительных вычислений на локальной инфраструктуре, а также масштабировать вычислительные мощности без значительных капиталовложений, используя ресурсы поставщиков облачных услуг.

Примеры использования высокопроизводительных вычислительных систем
Современные предприятия используют высокопроизводительные вычислительные системы для симуляции и моделирования во многих важных областях, включая разработку моделей автономного вождения, проектирование и производство продукции, анализ сейсмических волн и их воздействия на сооружения, оценку стратегий добычи нефти и газа и т. д. Высокопроизводительные вычислительные системы также полезны для развития высокоточной медицины, оценки финансовых рисков, обнаружения мошенничества, гидродинамических расчетов и т. д.

Компоненты высокопроизводительных вычислительных систем
Самые эффективные высокопроизводительные вычислительные системы построены на основе идеально подобранного сочетания аппаратного и программного обеспечения. Аппаратное обеспечение обычно включает высокопроизводительные процессоры, инфраструктуру связи, память, ресурсы хранения данных, сетевые компоненты и ускорители для специальных рабочих задач. Платформенное программное обеспечение, библиотеки, оптимизированные инфраструктуры больших данных и глубокого обучения и другие программные инструменты для высокопроизводительных вычислительных систем помогают добиться наибольшей отдачи от высокопроизводительных вычислительных кластеров.

Intel и высокопроизводительные вычислительные системы

Корпорация Intel предлагает полный ассортимент аппаратного и программного обеспечения для высокопроизводительных вычислительных систем. Это высокопроизводительные вычислительные системы на базе технологий Intel.

В основе всего лежат процессоры Intel® Xeon® Scalable, позволяющие создавать революционные высокопроизводительные вычислительные системы с рекордными уровнями гибкости и масштабируемости. Их дополняют решения Intel® для сетей Ethernet и инфраструктура Intel® Omni-Path Fabric (Intel® OP Fabric) для оптимизации масштабирования. Технологии Intel® Optane™ DC обеспечивают инновации в области памяти и хранения данных, а устройства Intel® FPGAs обеспечивают ускорение определенных рабочих задач. Программное обеспечение Intel® и инструменты для разработчиков помогают наиболее эффективно использовать возможности архитектуры и технологий Intel®.

Корпорация Intel представляет широкий ассортимент продуктов и технологий для высокопроизводительных вычислительных систем различного масштаба. Корпорация Intel помогает реализовать вычислительные решения, оперирующие эксабайтами данных, для работы над наиболее сложными научными задачами и предлагает основанный на стандартах подход к решениям для наиболее распространенных задач высокопроизводительных вычислений, реализованный в спецификации Intel® HPC Platform Specification. Высокопроизводительные вычислительные системы становятся все более доступными, и корпорация Intel помогает пользователям осознать преимущества новых технологий высокопроизводительных вычислений.

Конвергенция высокопроизводительных вычислительных систем и искусственного интеллекта
Сочетание возможностей высокопроизводительных вычислительных систем и решений машинного и глубокого обучения дает огромный потенциал в самых разных сферах от лингвистики до геномного секвенирования и моделирования мирового климата. Корпорация Intel поддерживает конвергенцию высокопроизводительных вычислительных систем и искусственного интеллекта, сотрудничая с партнерами по экосистеме в работе над созданием эталонных архитектур и решений, ориентированных на практическое применение в конкретных областях.

Поддержка достижений в сфере высокопроизводительных вычислений

Последние достижения в области вычислительной техники и программного обеспечения способствуют развитию высокопроизводительных вычислительных систем. Корпорация Intel будет и дальше сотрудничать с предприятиями экосистемы высокопроизводительных вычислительных систем с целью оптимизации производительности аппаратного обеспечения, объединения возможностей высокопроизводительных вычислений, ИИ и аналитики и подбора оптимального плана перехода на вычислительные задачи, использующие эксабайты данных.

Для высокопроизводительных вычислительных систем количество имеет значение, поскольку вычисления могут параллельно выполняться на множестве узлов кластера.

Вау!! 😲 Ты еще не читал? Это зря!

mpp , smp , numa , pvp ,
Микропроцессор
кластер
нода
компилятор
транслятор
Распределенная память
Распределенные вычисления
архитектура компьютера
GPGPU
Accelerated Processing Unit
Гибридная интеллектуальная система
суперкомпьютер , суперкомпьютеры , параллельные вычислительные системы , параллельная вычислительная система ,

Пожалуйста, пиши комментарии, если ты обнаружил что-то неправильное или если ты желаешь поделиться дополнительной информацией про вычислительные системы Надеюсь, что теперь ты понял что такое вычислительные системы, высокопроизводительные вычислительные системы, вычислительная система, вычислительная система с распределенной памятью и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Высоконагруженные проекты.Паралельные вычисления. Суперкомпьютеры. Распределенные системы

Вычислительные системы - понятие, виды, классификация и режимы работы. Высокопроизводительные вычислительные системы

Ресурсы вычислительной системы

Виды вычислительных систем

вычислительная система с распределенной памятью (: Вычислительная система с распределенной памятью; Вычислительные системы с распределенной памятью;)

Режимы работы вычислительных систем

Классификация вычислительных систем

Аван-проект вычислительной системы М-9

Гетерогенные вычисления

Что такое высокопроизводительные вычислительные системы ?

.

Как работают высокопроизводительные вычисления?

Стоимость и преимущества высокопроизводительных вычислительных систем

Intel и высокопроизводительные вычислительные системы

Поддержка достижений в сфере высокопроизводительных вычислений

Вау!! 😲 Ты еще не читал? Это зря!

Комментарии

Оставить комментарий

Высоконагруженные проекты.Паралельные вычисления. Суперкомпьютеры. Распределенные системы

Термины: Высоконагруженные проекты.Паралельные вычисления. Суперкомпьютеры. Распределенные системы