Закон Мура: количество



Pdf просмотр
Дата17.11.2016
Размер1.03 Mb.
Просмотров171
Скачиваний0

Введение
Архитектура параллельных вычислительных
ЭВМ
Кулаков Кирилл Александрович
2016
Петрозаводск
Методы и алгоритмы параллельных вычислений

2
Список литературы

Параллельные вычисления (курс): http://bigor.bmstu.ru/?cnt/?doc=Parallel/base.cou

Информационно-аналитический центр по параллельным вычислениям: https://parallel.ru/

Теория и практика параллельных вычислений: http://www.intuit.ru/studies/courses/1156/190/info

Основы параллельного программирования
(курс): http://www.edu.kspu.ru/course/view.php?id=899


3
https://habrahabr.ru/company/intel/blog/174719/

Закон Мура: количество транзисторов, размещаемых на кристалле интегральной схемы, удваивается каждые 24 месяца

Рост энергопотребления и тепловыделения

Прекращение бурного роста тактовой частоты процессора
История развития вычислительной техники

4
История развития вычислительной техники: параллельные вычисления

Многоядерные процессоры

Внедрение параллельных вычислений

Закон Амдаля: В случае, когда задача разделяется на несколько частей, суммарное время её выполнения на параллельной системе не может быть меньше времени выполнения самого длинного фрагмента https://habrahabr.ru/company/intel/blog/174719/

5
История развития вычислительной техники: суперкомпьютеры

Решение сложных задач с помощью кластеров/суперкопьютеров

Производительность суперкомпьютеров в
FLOPS (количество операций с плавающей точкой в секунду):

1964 год: 1 Мегафлопс (CDC 6600)

1983 год: 1 Гигафлопс (NEC SX-2, М-13)

1996 год: 1 Тетафлопс (ASCI Red)

2008 год: 1 Петафлопс (IBM Roadrunner)

2020 год: 1 Экзафлопс (1 квинтиллион операций)

6
История развития вычислительной техники: суперкомпьютеры

Суперкомпьютеры применяются в:

Стратегических исследованиях (управляемый термоядерный синтез, моделирование взрывов и ядерных испытаний, разработка военной и авиакосмической техники, системы ПВО)

Биологии (моделирование микроструктур), медицине
(использование суперкомпьютера и мед. аппаратуры)

Нанотехнологиях

Астрономии (моделирование поведения звезд, рождения звезд)

Авиастроении

Космологии (моделирование структуры галактики)

7
История развития вычислительной техники: суперкомпьютеры
Стойка ПВС «Скиф» (МГУ) изнутри
Блок процессоров
Процессорный элемент

8
История развития вычислительной техники: ТОП 500
№ п/п
Названи е
Архитек тура
ОС
1
Sunway
TaihuLig ht
NRCPC
ShenWei
Linux
(Raise)
2
Tianhe-2 Xeon
E5-2692,
Xeon Phi
Linux
(Kylin)
3
Titan
Opteron
6274,
Tesla
K20X,
Linux
(CLE,
SLES based)
4
Sequoia
Blue
Gene/Q
PowerP
C A2
Linux
(RHEL,
CNK)
5
K compute r
RIKEN
SPARC6 4 VIIIfx
Linux https://ru.wikipedia.org/wiki/TOP500
Оценка стандартным тестом LINPACK

9
Классификация параллельных вычислительных систем

Архитектура вычислительной системы:

основные форматы представления данных;

способы адресации данных в программе;

состав аппаратных средств вычислительной машины, характеристики этих средств, принципы организации вычислительного процесса.

Структура вычислительной системы: совокупность аппаратных средств ЭВМ с указанием основных связей между ними.

10
Классификация Флинна

Одиночный поток команд (SI): один момент времени = одна команда

Множественный поток команд (MI): один момент времени = несколько команд

Одиночный поток данных (SD): одно устройство оперативной памяти

Множественный поток данных (MD): набор зависимых или независимых потоков данных

11
Классификация Флинна

SISD: классическая однопроцессорная ЭВМ фон- неймановской архитектуры

MISD: нет убедительных примеров

SIMD: одновременное выполнение одной команды над несколькими объектами данных (вектором)

векторно-конвейерные вычислительные системы;

векторно-параллельные вычислительные системы или матричные вычислительные системы.

MIMD: многопроцессорные системы с
(а)синхронным выполнением разных команд над разными данными

12
Классификация по типу строения оперативной памяти

Общая (разделяемая) память: записанные данные доступны всем процессорам

Распределенная память: каждый процессор имеет свою локальную память с локальным адресным пространством

Гибридная память: физически распределенная по различным частям системы, но логически разделяемая память

13
Классификация по типу коммуникационной сети

Общая шина: работа в режиме разделения времени (передача только от одного модуля)

Перекрестная (матричная) коммутация: использование шин и управляющих ключей для связи «каждый с каждым»

14
Классификация по степени однородности

Однородные (гомогенные) системы: одинаковые процессоры

Неоднородные (гетерогенные) системы: процессоры разных типов

15
Векторно-конвейерные вычислительные системы (SIMD)

конвейерная организация обработки потока команд

операции с массивами данных

длина вектора обычно 128 или 256 элементов

Основное назначение: распараллеливание операторов цикла

Иерархическая структура: система = набор узлов, узел = набор конвейеров

16
Векторно-параллельные системы (SIMD)

Иерархическая структура:

система = набор векторно-параллельных процессов + общая память + коммуникационная сеть

векторно-параллельный процесс = набор процессорных элементов + коммуникационная сеть + синхронное выполнение

17
MIMD-системы

Мультипроцессоры:

единое адресное пространство

единая ОС

синхронизация процессов

NUMA-системы: системы с гибридной памятью

SMP-системы: системы с симметричной памятью

Мультикомпьютеры:

нет общей памяти

коммуникационная сеть

MPP-системы: однородные мультикомпьютеры с распределенной памятью

Кластеры: разнородные ЭВМ

18
SMP-системы

Симметричный доступ к памяти

равные права всех процессоров на доступ к памяти

одна и та же адресация для всех элементов памяти

равное время доступа всех процессоров системы к памяти

Проблема синхронизации кэш- памяти и основной памяти

19
MPP-системы

Процессорный узел:

процессор

блок оперативной памяти

коммуникационный процессор

сетевой адаптер

другие устройства ввода/вывода

Взаимодействие узлов через коммуникационную среду

Управление:

Полная ОС на управляющем узле, урезанные ОС на вычислительных узлах

Полноценные ОС на каждом узле

20
NUMA-системы

Логически общий доступ к данным при физически распределенной памяти

Разное время доступа к различным участкам памяти

Основа: однородные (обычно) процессорные узлы

21
Кластеры

Наличие локальной оперативной памяти

Взаимодействие с помощью сообщений

Поддержка работы разнородных узлов с разными ОС

Вычислительная сеть
(GRID): объединение узлов разных организаций/стран

22
Оценка параллельных вычислительных систем

Производительность (performance): количество операций, выполняемых на данной вычислительной системе в единицу времени

миллионы команд в секунду MIPS (millions instructions per second)

миллионы операций с плавающей запятой в секунду MFLOPS
(millions floating point operations per second)

Быстродействие (speed): величина, обратная среднему времени выполнения одной операции

Масштабируемость (scalability): способность вычислительной системы к наращиванию и сокращению ресурсов

Реконфигурируемость (programmability): варьирование числа узлов и графа их связей, надежность и живучесть вычислительной системы

Document Outline

  • Страница 1
  • Страница 2
  • Страница 3
  • Страница 4
  • Страница 5
  • Страница 6
  • Страница 7
  • Страница 8
  • Страница 9
  • Страница 10
  • Страница 11
  • Страница 12
  • Страница 13
  • Страница 14
  • Страница 15
  • Страница 16
  • Страница 17
  • Страница 18
  • Страница 19
  • Страница 20
  • Страница 21
  • Страница 22


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2019
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал