Решение вопросов онлайн-теста по подам прошлых лет



Скачать 418.82 Kb.

Дата14.02.2017
Размер418.82 Kb.
Просмотров283
Скачиваний1

Решение вопросов онлайн-теста по ПОДам прошлых лет
Дорогие друзья. В этом документе мы совместными усилиями определили прояснили ответы на многие из вопросов тестов прошлых лет. Я хочу выразить благодарность всем, кто привнёс свой вклад в разрешение вопросов и прояснение сложных моментов. Мы (Я, Саня Казаков, Коля Ульянов и вся группа СА) рады, что нам удалось так быстро и качественно организоваться и столь многое сделать.
С данного момента наша информационная политика немного изменится, а именно:
- Данный документ будет оставаться в доступе по этому адресу для тех, кто уже имеет к нему доступ
- Доступ на запись будет закрыт всем без исключения, документ сохранится в текущей версии
- В связи с наличием конкуренции по среднему балу за тест группа СА удалится для обсуждения варианта этого года в свое информационное пространство.
Мы предлагаем остальным группам поступить подобным образом. Мы рады, что нам удалось внести свой вклад в понимание предмета многими из нас и других групп и создать полезный документ для решения теста этого года. Надеемся на ваше понимание!
PS. Для удобства вы можете воспользоваться функцией “Загрузить документ в PDF формате”.
Работает полнотекстовый поиск по Ctrl+F. Есть спец. удобный режим Ctrl+Shift+F.
Чат для обсуждений доступен там --------------->
Credits
Изначальные вопросы и варианты ответов были собраны Колей Ульяновым.
Идея и реализация создания этого документа принадлежит Сане Казакову.
В редактировании и улучшении этого документа принимали участие: большая часть группы СА, Ермаков
Игорь и многие другие с 4го курса факультета ВМиК от 2010 года.
Цвета комментариев участников:
Фатеев Кирилл
Саня Казаков
Коля Ульянов
Леша Чугунов
Данил Кузин
Небера Антон - все просмотрел кроме 39,41-44
Степанович Валентин
Дроздова Ольга
Ермаков Игорь
Сорокин Игорь
Одиноковы Данила&Наташа
----------------------------------------------------------------------
Вопросы, с которыми ещё НЕ все понятно

Вопрос 7 что такое s в законе Амдала s<1/(a+(1-a)/p)? Выберите максимально точный ответ:
- ускорение свободного падения
Нет
- ускорение работы программы при увеличении числа процессов с одного до 'p'
Нет, т.к. не процессов, а параллельных вычислительных единиц
- ускорение работы процесса
См ниже
- величина, равная отношению времени работы программы на одном процессоре ко времени её исполнения на системе из 'p' процессоров
См ниже
- ускорение работы процессора при изменении его тактовой частоты в 'p' раз
Нет.

Комментарии:
“ускорение работы процесса”
Есть мнение, что понятие “ускорение” не совсем тривиальное и не является простым отношением времени работы. Про ускрение много чего написано в книжке Воеводина и вводится оно как-то не очень просто(я не разобрался). В разделе 2.3. Так что, возможно, правильный ответ все-таки 3.
Вызывает вопрос краткость формулировки. Есть ли общеупотребимое значение термина ускорение?
“величина, равная отношению времени работы программы на одном процессоре ко времени её исполнения на системе из 'p' процессоров”
Степанович В.А.: величина, равная отношению времени работы программы на одном процессоре ко времени её исполнения на системе из 'p' процессоров во всех формулировках закона Амдала за s обозначают какое-то ускорение, но ты прав, что речь должна идти о процессорах
Выглядит весьма точно
Вызывает вопрос то, что s даёт только лишь некоторую теоретическую оценку
Страница 83 книги: “будем называть отношение R=r/pi_s ускорением” (в вопросе s означает то же, что R в книге), а чуть выше видим, что r - производительность на системе из нескольких процессоров, а pi_s - на системе из одного процессора. Т.е. этот ответ верен, т.к. производительность и время работы зависят обратно пропорционально. Остается отметить, что R=T1/Ts, только если система состоит из простых устройств.см. Книга стр 84 первый абзац.
Вопрос 9
Отметьте, какие из следующих утверждений являются верными:
- Пиковая производительность компьютера может измеряться в Mflop/s, но не в MIPS. нет
- Для большинства современных компьютеров пиковая производительность не достижима на практике. да
Да
- Пиковая производительность конвейерного устройства равна сумме пиковых производительностей его ступеней. нет
Точно?
Не решили пока что Точно нет.
- Эффект суперлинейного ускорения позволяет превысить пиковую производительность многопроцессорного компьютера. нет
Точно?
Точно
- Реальная производительность компьютера не может быть меньше 1% его пиковой производительности. нет
Нет
- Для VLIW-компьютеров понятие пиковой производительности не определено нет
- Пиковая производительность суперскалярного процессора всегда равна пиковой производительности самого быстрого устройства, входящего в его состав
Нет
- Реальная производительность 32-х процессорного SMP-сервера может быть меньше пиковой производительности одного входящего в его состав процессора. да
Да.
Ответы:
! Пиковая производительность конвейерного устройства равна сумме пиковых производительностей его ступеней. Имхо, это не есть правда.
(+1)
Имхо правда. Над утверждением 2.2., стр 81 Там все-таки написано про независимые ФУ(даже оговорка --- простые или конвейерные). На странице 79 сказано, что конвейерное
ФУ можно считать последовательностью элементарных ФУ, так что все ок
Там сказано, что линейную последовательность ФУ можно считать конвейером, а это немного разные вещи.
> надо решить это вопрос!

----------------------------------------------------------------------
Вопросы с проверенными ответами
Вопрос 1
Со сколькими вычислительными узлами имеет непосредственную связь узел в массивно-параллельных компьютерах Cray T3E и XT5, расположенный на ребре, но не в вершине отвечающего коммуникационной решётке прямоугольного параллелепипеда:
Варианты:
- 2
- 3

- 4
- 5
- 6
Верный ответ (Антон, Валя, Коля)
- 7
“Это означает, что каждый узел имеет шесть непосредственных соседей вне зависимости от того, где он расположен: внутри параллелепипе­да, на ребре, на грани или в его вершине.” ­­ ответ 6!
Вопрос 2
Какие утверждения о структуре памяти CRAY C90 верны:
- выборка данных с шагом 640 приведёт к максимальному числу конфликтов на уровне секций и подсекций
Да
(Можно любое кратное 64 число, Валентин подтвердил)
- выборка элементов массивов из памяти, выполняющаяся с шагом 1, 5 или 15, проходит без конфликтов как на уровне секций, так и на уровне подсекций
Да
(Нет конфликтов по секциям знач все ок, Валентин подтвердил)
- конфликты при доступе в память могут возникать только при одновременной работе двух и более процессоров
Нет, пример - векторная операция?
- в максимальной конфигурации память компьютера разбивается на 1024 банка
Да, точно
+1
- вся память разделена на секции, каждый процессор имеет доступ только к своей секции
Нет, точно
Вопрос 3
Для некоторого фрагмента программы построили четыре модели. Может ли оказаться несвязным графом:
- информационный граф
Да
- информационная история
Да
- операционная история
Нет
(в книге написано, что операционно-логической историей называется ориентированный граф, который представляет из себя единственный путь от начальной вершины к конечной)
- граф управления
Нет
Комментарии:
Граф управления всегда связен
Операционная история может быть несвязной?
В принципе, я полагаю информационный граф тоже может быть несвязным.
Пример: for(k=0; k<100; k++){a[k]=b[k]+c[k]; d[k]=e[k]+f[k];}. Он несвязен будет. Когда данные записываются, они потом уже не читаются. Т.е. информационный граф ---- две точки.
Вопрос 4
Отметьте верные утверждения о компьютере CRAY C90:
- если во фрагменте используется простая переменная, то фрагмент нельзя векторизовать
Нет.
Типа логика: если там есть векторизуемый цикл, то наличие рядом простой переменной не мешает?

- Существует программа, на которой компьютер CRAY C90 может показать, что заявленная его пиковая производительность точно достижима на практике
Вероятно нет, иначе был бы пример
Судя по фразе, что пиковая производительность любого конвейерного устройства никогда недостижима на практике, ответ нет рация, тем хуже, так как на векторном регистре может поместиться лишь 128 элементов
Точно нет поместиться и правда может 128, но от увеличения размера хуже не будет, а будет даже лучше, если это вместо скалярных операций.
- при возникновении конфликтов при доступе в память нет необходимости в секционировании векторных команд
Нет? я тоже думаю, что тут нет связи. секционирование век
- время начального разгона конвейера не зависит от длины вектора
Да
- работа с многомерными массивами может служить источником конфликтов при доступе в память Да
­да
- для выполнения векторных операций необходимо использовать векторные регистры
Да
- чем длиннее вектора, над которыми выполняется векторная опе торных команд - деление на части по 128
- секционирование векторных операций вызвано делением оперативной памяти на секции и подсекции
Нет.
Комменты:
“Если время разгона влияет только при старте, то секционирова­ние немного снижает производительность во всех точках, кратных 128. Это снижение небольшое и с увеличением длины векторов его относительное влияние становится все меньше и меньше”
Вопрос 5
Для расчета реальной производительности в тесте Linpack предполагается, что при решении системы линейных алгебраических уравнений с матрицей размера N*N было выполнено
- N^2 арифметических операций
- N^3+(2*N^2)/3 арифметических операций
- N^3+N^2 арифметических операций
- N^3+N арифметических операций
- (2*N^3)/3+2*N^2 арифметических операций
Верный ответ
Так сказано в книге.
Вопрос 6
Как порождаются параллельные процессы в системе Linda?
- при запуске программы
- при вычислении аргументов функции eval
Верный ответ
Так сказано в книге.
И на сайте
- никак
- верного ответа нет
- при входе в параллельную секцию
Вопрос 8
Отметьте правильные утверждения о наборе тестов STREAM:
- форма записи тестов STREAM исключает повторное использование данных
Да
- основное назначение тестов STREAM состоит в оценке сбалансированности скорости работы процессора и скорости доступа к памяти
Да
- во всех четырех тестах используются массивы вещественных чисел
Да
- размеры используемых массивов подбираются так, чтобы ни один из них целиком не помещался в кэш- памяти, но все они помещались бы в оперативной памяти
Да (см снизу)
- во всех четырех тестах используются арифметические операции
Нет, в первом тесте просто присвоение
Ответы:

!+ размеры используемых массивов подбираются так, чтобы ни один из них целиком не помещался в кэш- памяти, но все они помещались бы в оперативной памяти
Где сказано, что должны влезать в оперативку? вроде не обязат.
А как с ними работать тогда?В книге сказано, что тест работает с векторами, хранящимися в основной оперативной памяти.
Вообще, да, это тоже верный ответ. Стрим вроде предназначен для теста вычислительной части, а не скорости ввода-вывода и устройства хранения.
Вопрос 10
В каких графовых моделях количество вершин не зависит от значений входных переменных:
- граф управления
Верный ответ
- во всех моделях всегда зависит
- информационный граф
Верный ответ
- информационная история
- операционная история
- во всех моделях никогда не зависит
Суть в том, что графы (управления и информационный) не зависят от поступаемых на вход данных, а всякие-разные истории - зависят.
Вопрос 11
Умножение двух квадратных плотных вещественных матриц компьютер выполнил за 5 сек с производительностью 50 Gflop/s. Какого размера были матрицы?
- 500*500
- 700*700
- 1000*1000
- 5000*5000
Если считать, что уходит 2*N^3, то это так
А если считать: N^3+(N-1)*N^2 --- то 5000.17..
- 7000*7000
- верного ответа нет
Вопрос 12
Отметьте верные утверждения:
- возврат процесса из функции, реализующей коллективную операцию, не означает, что операция уже завершена;
Да, некоторые процессы могут еще даже не начать
- в коллективных операциях участвуют все процессы некоторого коммуникатора;
Да, просто да
- функция, соответствующая коллективной операции, должна быть вызвана каждым процессом, быть может, со своим набором параметров;
Да
Да
- в коллективных операциях участвуют все процессы приложения;
Нет, только из одного коммуникатора
- использование функций MPI_Send и MPI_Recv может привести к тупиковой ситуации (deadlock);
Да хоть эти операции и не являются коллективными, они могут вызвать дедлок
(разобрались уже)
- MPI_Barrier - это пример коллективной операции.
Да
Машечкин
Машечкин --?
Ответы: использование функций MPI_Send и MPI_Recv может привести к тупиковой ситуации (deadlock); я посмотрел на стр. 284 на рис. 5.5, вроде оно Да, я тоже посмотрел. В методичке Антонова. Там есть.
+ возврат процесса из функции, реализующей коллективную операцию, не означает, что операция уже завершена;
Но и про коллективные операции такое тоже написано
+ функция, соответствующая коллективной операции, должна быть вызвана каждым процессом, быть может, со своим набором параметров;
> точно?
Точно см. методичку стр. 36

Вопрос 13
Какие утверждения о регистровой структуре одного процессора CRAY C90 верны:
- векторный регистр может хранить одновременно 128*64=8192 элемента массива вещественных чисел
Нет
Там “V-регистры, 8 штук на 128 64-разрядных слова каждый.” Откуда взялось 128 * 64?? (+1) действительно похоже на неправду
- один набор из восьми векторных регистров разделяется всеми процессорами данного компьютера
??? Он же один - процессор??? Получается, это верно?
Нет. У каждого процесса свой набор.
- все регистры в процессоре представлены в виде двух наборов: основной набор и вспомогательный набор
Нет, ибо “
Для регистров A и S существуют промежуточные наборы регистров B и T играющие роль буферов для основных регистров

- регистры наборов A, B, S, T и V имеют прямую связь с оперативной памятью
Да
В методичке сказано, что
A,S,V имеют связь с памятью и ФУ, а B,T - буферные регистры...Тогда у них нет ПРЯМОЙ связи.
Смотрите картинку в методичке!
- функциональные устройства процессора связаны с регистрами основных наборов A, S, V, но не связаны с регистрами промежуточных наборов B и T
Да
Вопрос 14
Какие утверждения относительно теста Linpack, используемого при составлении списка Top500 самых мощных компьютеров мира, верны:
- чем меньше матрица, тем быстрее выполнится тест, и тем выше окажется компьютер в списке Top500
Нет
- тест рассматривает решение системы линейных алгебраических уравнений с плотной матрицей
Да
- матрицы, используемые в тесте Linpack для современных компьютеров, могут достигать размера 10^6*10^6 и больше.
Да
- можно использовать матрицы любого размера
Да.
- нельзя менять внешнюю, вызывающую часть теста, но можно вносить изменения и в программу, и в алгоритм решения системы линейных алгебраических уравнений
Да
Вопрос 15
Отметьте, какие утверждения об операционной истории (ОИ) программы верны:
- ОИ - это линейный ориентированный граф, каждая вершина которого имеет не более одной входной дуги и не более одной выходной дуги
Да
- число вершин в ОИ зависит от входных данных программы
Да
- ОИ фрагмента программы не может совпадать с его графом управления
Нет
- ОИ любой программы можно построить с помощью статического анализа
Нет
Вопрос 16
В какой момент порождаются параллельные процессы в OpenMP:
- при входе в параллельную секцию
Да. Единственный верный ответ
- при запуске программы
- при вычислении аргументов функции eval
- не порождаются
- верного ответа нет
Вопрос 17
В конвейерном устройстве есть 5 ступеней, срабатывающих за 2, 1, 5, 4 и 3 единицы времени соответственно. При обработке массива данных (в режиме максимальной загрузки конвейера) это устройство будет выдавать результат:
- каждую 5-ю единицу времени
Единственный верный ответ

- каждую 3-ю единицу времени
- каждую 2-ю единицу времени
- каждую единицу времени
- верного ответа нет
- каждую (2+1+5+4+3=15)-ю единицу времени
Вопрос 18
Отметьте верные утверждения:
- MPI - это сокращение от My Personal Identifier.
НЕТ
- MPI - это сокращение от Message Passing Interface
.ДА
- MPI - это сокращение от Multiple Parallel Interface. НЕТ
- Функция MPI_Comm_rank определяет число линейно независимых строк матрицы инцидентности параллельных процессов.
НЕТ
:-) (то есть правда нет)
- Каждый параллельный процесс в MPI имеет номер.
ДА
- SPMD - это сокращение от Single Program Multiple Data.
ДА
- Использовать функции MPI можно только после вызова MPI_Init.
ДА
- Функция MPI_Comm_size определяет общее число запущенных параллельных процессов приложения.
НЕТ, она возвращает число параллельных процессов в коммуникаторе
Вопрос 19
Посылка сообщения с блокировкой (MPI_Send) означает, что возврат из функции произойдёт тогда, когда:
- сообщение принято адресатом;
- сообщение покинет процесс;
- можно повторно использовать параметры данной функции;
ДА
Единственный верный ответ.
- адресат инициировал приём данного сообщения.
- сообщение покинет процессор;
Вопрос 20
В программе лишь 40% операций может выполняться параллельно. Какова, согласно закону Амдала, верхняя грань для ускорения, которое может быть получено для этой же программы на 5 процессорах?
- 40
- верного ответа нет
- 5/3
- 3/5
- 5
- 25/17
ДА, т.к:
s = 1/(0.6 + 0.4/5) = 25/17
Вопрос 21
В компьютере есть 7 параллельно работающих устройств, каждое из которых может выполнить операцию за
7 единиц времени. За какое минимальное время этот компьютер обработает 7 независимых операций?
- 13
- 1
- 8
- 7 Да Спасибо, Кэп
- 14
- 3
- верного ответа нет

Вопрос 22
За какое время можно сложить 512 чисел на 1000 процессорах по схеме сдваивания, если два числа складываются за 1с, а временем на передачу данных между процессорами можно пренебречь:
- 1c
- 10с
- верного ответа нет
- 9c
ДА
- 511c
- 1000c
- 11с
Вопрос 23
Производительность компьютера, достигнутая при выполнении некоторой программы, выражена в Tflop/s.
Это значение говорит о:
- средней скорости выполнения данным компьютером арифметических операций над вещественными числами, представленными в форме с плавающей запятой
- среднем количестве операций над вещественными данными, представленными в форме с фиксированной запятой, выполненных за секунду в процессе обработки данной программы
- общем числе команд, выполненных за время работы программы
- средней скорости выполнения данным компьютером арифметических операций над вещественными числами, представленными в форме с плавающей запятой, достигнутой при выполнении данной программы
Да. Единственный ответ.
- высокой реальной производительности данного компьютера
Вопрос 24
На некотором компьютере отработала программа, и определена реальная производительность в Mflop/s и
MIPS. Какие соотношения между Mflop/s и MIPS могут оказаться верными:
- Mflop/s = MIPS
Нет, т.к. в программе обязательно есть операции кроме арифметики с F.P
- Mflop/s < MIPS
Да
- Mflop/s < 10*MIPS
Да
- Mflop/s > MIPS
Нет
- Mflop/s = 0
Да, если в программе нет работы с вещ. арифметикой
Вопрос 25
Сколько устройств, реализующих операцию логического "И", нужно задействовать для организации в массивно-параллельных компьютерах Cray T3E и XT5 барьерной синхронизации 16 процессов?
- 7
- 16
- 15
Да, единственный верный ответ
- ни одного
- 8
- 1
Вопрос 26
Процессы параллельной программы в рамках MPI:
- обязательно выполняются на одном процессоре.
- могут выполняться на разных процессорах, на одном процессоре могут располагаться несколько
процессов,
Да, этот ответ, т.к. нужно было выбрать только один вариант ответа
- могут выполняться только на разных процессорах,
Вопрос 27
Технология программирования OpenMP расширяет язык за счёт:
- новых директив и специальных комментариев
Да
- новых ключевых слов
Нет
Обсуждался пример: guided Разве это ключевое слово? Имхо, ключевые слова отслеживает стандартный компилятор, а guided размещен в комментариях, кроме того, он имеет смысл одного из возможный значений текстового параметра одной функции. см http://www.intuit.ru/department/
supercomputing/modswms/2/4.html
Так что в итоге?
- новых библиотечных функций и переменных
Да (например
OMP_GET_THREAD_NUM()
)
Вопрос 28
Отметьте верные утверждения об OpenMP:
- Весь параллелизм приложения реализуется с помощью параллельных циклов
Нет
Очевидно, что нет
- OpenMP ориентирован в первую очередь на написание программ для векторно-конвейерных компьютеров нет, она рассчитана на многопроцессорные SMP
- Все переменные программы делятся на два класса: локальные и общие
Да
Это верно только для параллельного участка? Переменные есть в программе незвисимо от участка, данные классы просто характеризуют обращение с переменными при вхождении в параллельный участок, имхо. Имхо, да. Так в методичке написано
- Большинство конструкций OpenMP реализуется с помощью спецкомментариев
Да
- Число параллельных процессов OpenMP приложения определяется переменной окружения
Нет???
Как я помню в OMP процесс один, нитей много. И вот как раз число нитей определяется переменной окружения.Разве нет?
“при входе в параллельную область порождается ещё некоторое число процессов, между которыми в дальнейшем распределяются части кода.”
Откуда эта цитата? В методичке всюду говорится про нити.
Вопрос 29
В конвейерном устройстве есть 7 ступеней, срабатывающих за одну единицу времени каждая. За сколько единиц времени это устройство обработает 7 пар аргументов?
- 14
- 13 7+7-1=13 (подробнее в 31ом вопросе)
- 1
- 3
- 7
- верного ответа нет
- 8
Вопрос 30
Под параллельной программой в рамках MPI понимается:
- множество одновременно работающих процессоров.
- множество одновременно выполняемых процессов,
- множество одновременно выполняемых потоков,
Ответ:
!+ множество одновременно выполняемых процессов,
Согласен

Вопрос 31
Конвейерное ФУ деления состоит из пяти ступеней, срабатывающих за 2, 3, 5, 1 и 1 такт соответственно.
Чему равно наименьшее число тактов, за которое можно обработать 40 пар аргументов на данном устройстве?
- 212
- 5
- 12
- верного ответа нет
- 207
- 40
- 200
- 1
- 480
Ответ:
!+ 207
= (2 + 3) + 5*40 + (1 + 1), где (2+3) тратится на первую пару, а (1+1) на последнюю Собственно не важно. Проще считать: 1 аргумент проходит весь конвейер: 2+3+1+1+5, а остальные только наиболее длительную фазу: +39*5. Запутаться так невозможно.
Вопрос 32
Компьютер CRAY C90 называется векторно-конвейерным потому, что (выберите верные варианты):
- все вектора (массивы) обрабатываются только в векторном режиме
- предусмотрена аппаратная поддержка выполнения векторных команд на конвейерных устройствах
- отсутствует режим обработки скаляров
- он работает либо в векторном, либо в конвейерном режиме
Ответы:
!+ предусмотрена аппаратная поддержка выполнения векторных команд на конвейерных устройствах
Вопрос 33
Отметьте верные утверждения о кластерных вычислительных системах:
- на каждом узле кластера исполняется свой экземпляр операционной системы
ДА
- все процессоры кластера должны работать на одной частоте
Нет?
- один кластер может строиться с использованием нескольких коммуникационных технологий
ДА
- Gigabit Ethernet значительно превосходит по скорости передачи данных все другие коммуникационные сети, используемые для построения кластеров
Нет, т.к. есть всякие Fibre Channel
- кластерные системы строятся на базе серийных процессоров
Могут строиться
- максимально возможное число процессоров кластерной системы равно 128 Нет
- CRAY 1 - первый компьютер, построенный по кластерной технологии
Нет, в документации из Wiki написано, что в нём один процессор с векторными операциями
Вопрос 34
Критерии декомпозиции сеточных графов при решении задач на неадаптивных сетках на кластерных вычислительных системах включают в себя:
- связность множества размещённых в каждом из доменов элементов графа
- равномерность распределения элементов графа по доменам
- Близость геометрических координат узлов, размещённых в одном домене
- минимальность времени выполнения декомпозиции
- минимальность максимального числа ребер, соединяющих вершины каждого из доменов с вершинами других доменов

- минимальность числа смежных доменов
Ответы:
=)
Вопрос 35
Пиковая производительность компьютера увеличится, если:
- увеличить степень суперскалярности процессоров
Да
- увеличить число процессоров ДА
- увеличить размер кэш-памяти
Нет
- увеличить тактовую частоту компьютера
ДА
- уменьшить латентность при передачи сообщений по коммуникационной сети
Нет
- добавить еще один уровень кэш-памяти
Нет
- увеличить число ступеней в конвейерных функциональных устройствах
Да
Вроде бы кэш и латентность просто не учитываются при расчете пиковой, а вот производительность конвейера при увеличении его длины вырастет => и производительность компа, так же вырастет пр­ть и при увеличении суперскалярности
?
Вопрос 36
Иерархический алгоритм рациональной декомпозиции графов предполагает:
- Этап первичного огрубления графа без потерь данных
- Этап первичного огрубления графа с потерей данных
- Наличие информации о координатах узлов сетки
- этап локального уточнения, на котором узлы перераспределяются между соседними доменами
- Наличие информации о предварительном распределении узлов сетки по доменам
- Этап записи в файл результатов декомпозиции
Ответы: см.34
Вопрос 37
Топология типа тор в MPI является частным видом топологии типа:
- декартовой топологии,
ДА, методичка страница 56
Странные у них понятия о топологии (59 стр., кстати =)
- полного графа.
- графа произвольного вида,
НЕТ
Ответ:
декартовой топологии
Вопрос 38
Применение неблокирующего способа выполнения обменов позволяет:
- уменьшить потери эффективности параллельных вычислений из-за медленных по сравнению с быстродействием процессоров коммуникационных операций,
- уменьшить нагрузку на коммуникационную сеть,
- уменьшить нагрузку на процессоры системы.

Ответ(ы):
Предполагаю, что первое.
Вопрос 39
Сортировка данных. Отметьте верные утверждения
- При больших объёмах сортируемых данных алгоритм сортировки слиянием менее чувствителен к размеру кэш памяти, чем алгоритм пирамидальной сортировки
- блоки данных размещенные на каждом из процессоров при упорядочивании сетью сортировки со слиянием
Бэтчера должны быть одинакового размера
- Известен алгоритм построения минимальных по числу шагов сетей сортировки для любого числа процессоров
- Последовательность выполнения операций компараторов-слияния в сети сортировки не зависит от упорядоченности элементов исходного массива
- Из того, что оценки времён выполнения двух алгоритмов A1 и A2 находятся в отношении O(A1)
- В общем случае сети сортировки эффективны при выполнении на одном процессоре
- Объем данных сортируемых с помощью алгоритма сдваивания ограничен объемом оперативной памяти одного вычислительного узла
- Сети сортировки обеспечивают возможность построения эффективных параллельных алгоритмов сортировки
Ответы:
Вопрос 40
Что называется латентностью коммуникационной сети?
- время от окончания инициализации посылки до окончания приёма сообщения
- время от начала инициализации посылки сообщения до окончания его приема
- время от начала инициализации посылки до начала приёма сообщения
- верного ответа нет
- скорость передачи данных по сети
Ответ(ы):
- верного ответа нет , это на самом деле это время начальной задержки при посылке сообщений.ДА
Вопрос 41
Отметьте утверждения справедливые при применении метода геометрического параллелизма
- масштабируемость метода выше при решении задач, алгоритмы решения которых, обладают свойством локальности по данным, чем при решении сильно связанных задач, например, при решении систем линейных уравнений
- метод является методом динамической балансировки загрузки нет
- теоретически достигаемое при использовании метода ускорение ограничено числом узлов расчетной сетки
- может обеспечить эффективное решение множества независимых друг от друга задач, каждая из которых требует для своей обработки разного времени нет, вроде
Ответы:
Вопрос 42
Отметьте утверждения справедливые при применении метода коллективного решения

- может обеспечить эффективное решение множества независимых друг от друга задач, каждая из которых требует для своей обработки разного времени
- максимальное число процессоров, использование которых обеспечивает минимальное время обработки всех элементарных заданий, ограничено общим числом последних
- метод используется при решении сильно связанных задач, например, при решении систем линейных уравнений
- достигаемое при использовании метода ускорение ограничено латентностью каналов межпроцессорной связи
- метод является методом динамической балансировки загрузки да
- теоретически достигаемое при использовании метода ускорение ограничено отношением времени решения элементарного задания к суммарному времени передачи соответствующих ему данных
Ответы:
Вопрос 43
Диффузная балансировка загрузки процессоров
- Является развитием метода коллективного решения
- Применима, если вычислительная сложность элементарных заданий априори неизвестна и непредсказуемо меняется от шага к шагу вычислений
- Приводит к росту накладных расходов обусловленному затратами на передачу данных
- Является развитием метода геометрического параллелизма
- Способствует сокращению времени выполнения вычислений на системах в которых эффективная вычислительная мощность процессоров меняется в ходе выполнения расчетов
- Направлена на сокращение простоев процессоров
- Является методом динамической балансировки загрузки
- Приводит к росту накладных расходов, обусловленному затратами на организацию управление вычислительным процессом
- Требует предварительного распределения данных между процессорами на основе принципов равенства объёмов вычислений и минимизации объёмов передаваемых данных между процессорами
Ответы:
Вопрос 44
Отметьте правильные утверждения об архитектуре суперкомпьютера IBM BlueGene/P:
- IBM BlueGene/P построен на базе четырехядерных процессоров Intel.
- IBM BlueGene/P может содержать более 100 тысяч процессорных ядер.
- IBM BlueGene/P имеет воздушное охлаждение.
- В IBM BlueGene/P нет аппаратной поддержки барьерной синхронизации.
- Основная сеть IBM BlueGene/P для передачи данных между процессами параллельной программы имеет топологию трехмерного тора.
- Для программирования IBM BlueGene/P можно использовать и MPI, и OpenMP, и комбинацию MPI+OpenMP.
Ответы:
1, 3 и 6
Вопрос 45
Фрагмент, приведённый ниже:
MPI_Comm_size( comm, &size);

MPI_Send( buf, 15, MPI_INT, size+1, 8, comm);
Это неверно, т.к.отправлено сообщение процессу size+1 хотя их макс size-1
MPI_Send( buf, 8, MPI_INT, size-1, 15, comm);
Как насчёт MPI_INIT?
int MPI_Comm_size ( MPI_Comm comm, int *size ) int MPI_Send( void *buf, int count, MPI_Datatype datatype, int dest,
int tag, MPI_Comm comm )
- может быть правильным;
- заведомо содержит одну ошибку;
Да
- заведомо содержит три ошибки;
- заведомо содержит четыре ошибки;
- заведомо содержит две ошибки;
Ответ(ы):


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал