Скорость
работы разреженного прямого решателя
(sparse direct solver)
в системе ИСПА.
часть 3
Александр
Александрович Мухин
Принцип работы разреженного прямого решателя в системе ИСПА
описан в первой части данной статьи. В данной статье рассмотрим скорость работы
нового разреженного метода факторизации матриц, реализованного в системе ИСПА,
на больших реальных моделях. Модели созданы в ANSYS и импортированы в систему ИСПА.
Решение будем проводить на двух компьютерах. Первый
компьютер с процессором Intel I7 – 990, 24 Гб оперативной памяти. Второй компьютер с процессором Intel I7 – 3930, 64 Гб оперативной памяти.
Операционная система WINDOWS 7 (64 разряда). Полную
численную факторизацию будем проводить
на одном, двух и четырех ядрах.
Рассмотрим модель
представленную на рис. 1. Модель
содержит 698 346 узлов и 484 494 элементов (3 135 807 уравнений).
Модель состоит из
3-х, 4-х узловых оболочек и 20-ти узловых объемных элементов.
Рис 1.
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти для компьютера с процессором Intel I7 – 990 приведены в таблице 1:
Таблица 1.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
171.2 |
10.8 |
15.1 |
два ядра |
89.4 |
20.7 |
15.2 |
четыре ядра |
51.7 |
35.8 |
15.5 |
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти для компьютера с процессором Intel I7 – 3930 приведены в таблице 2:
Таблица 2.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
96.8 |
19.2 |
15.1 |
два ядра |
50.2 |
36.9 |
15.2 |
четыре ядра |
31.7 |
58.1 |
15.5 |
Рассмотрим модель представленную
на рис. 2. Модель содержит 430 857 узлов
и 372 234 элементов (2 188 544 уравнений).
Модель состоит из 3-х, 4-х узловых оболочек и 20-ти
узловых объемных элементов.
Рис 2.
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти для компьютера с процессором Intel I7 – 990 приведены в таблице 3:
Таблица 3.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
63.7 |
10.4 |
8.2 |
два ядра |
33.0 |
20.1 |
8.3 |
четыре ядра |
18.4 |
35.9 |
8.5 |
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти для компьютера с процессором Intel I7 – 3930 приведены в таблице 4:
Таблица 4.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
37.6 |
17.7 |
8.2 |
два ядра |
19.2 |
34.6 |
8.3 |
четыре ядра |
11.0 |
60.0 |
8.5 |
Теперь рассмотрим
модель представленную на рис. 3. Модель создана в конечно-элементном
редакторе GEOPROF системы ИСПА. Решение будем
проводить на компьютере с процессором Intel I7 – 3930, 64 Гб оперативной памяти, так как для решения потребуется 40 Гб
оперативной памяти.
Модель содержит 1 926
732 узлов и 1 960 996 элементов (10 419 832 уравнений).
Модель состоит из
3-х и 4-х узловых оболочечных
элементов.
Рис 3.
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти для
компьютера с процессором Intel I7 – 3930 приведены в таблице
5:
Таблица 5.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
199.1 |
18.4 |
38.2 |
два ядра |
102.5 |
35.6 |
38.8 |
четыре ядра |
60.6 |
60.3 |
39.6 |
шесть ядер |
48.4 |
75.0 |
40.4 |
Хочется отметить хороший коэффициент ускорения при увеличении
количества ядер и большую скорость полной численной
факторизации разреженных матриц в системе ИСПА.
У процессора Intel I7 – 990 тактовая частота 3.5 Ггц, а у процессора Intel I7 – 3930 тактовая частота 3.2 Ггц , однако скорость работы
процессора Intel I7 – 3930 в 1.9 раза быстрее.
Связано это с тем, что расчеты в системе ИСПА проводятся не только на сопроцессоре,
но и с использованием дополнительных расширенных регистров.
Октябрь