Скорость
работы разреженного прямого решателя
(sparse direct
solver) в системе ИСПА.
часть 2
Александр
Александрович Мухин
Принцип работы разреженного прямого решателя в системе ИСПА
описан в первой части данной статьи. Но время идет программа развивается и
ускоряется. За последнее время существенно ускорен полный метод факторизации разреженных матриц.
И поэтому, в данной статье рассмотрим скорость работы нового разреженного метода
факторизации матриц, реализованный в системе ИСПА.
Решение будем проводить на компьютере с процессором Intel I7 – 990, 24 Гб оперативной памяти. Операционная система WINDOWS 7 (64 разряда). Полную численную факторизацию будем проводить на одном, двух и четырех
ядрах.
Рассмотрим модель
представленную на рис. 1. Модель
содержит 203 217 узлов и 226 574 элементов (1 158 710 уравнений).
Модель состоит из
3-х 4-х узловых оболочек и 2-х узловых стержневых элементов.
Рис 1.
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти приведены в таблице
1:
Таблица 1.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
23.2 |
10.0 |
3.8 |
два ядра |
12.0 |
19.2 |
3.9 |
четыре ядра |
6.5 |
35.2 |
4.0 |
Рассмотрим модель
представленную на рис. 2. Модель
содержит 473 543 узлов и 1 519 040 элементов (1 435 691 уравнений).
Модель состоит из 4-х узловых объемных элементов, 4-х узловых
оболочек и 2-х узловых стержневых элементов.
Рис 2.
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти приведены в таблице
2:
Таблица 2.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
132. |
10.9 |
7.3 |
два ядра |
69.2 |
20.7 |
7.4 |
четыре ядра |
39.7 |
40.4 |
7.5 |
Рассмотрим модель
представленную на рис. 3. Модель состоит из 20-ти узловых объемных элементов и
содержит 671 448 уравнений.
Рис 3.
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти приведены в таблице
3:
Таблица 3.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
33.8 |
10.8 |
4.4 |
два ядра |
17.5 |
20.7 |
4.4 |
четыре ядра |
9.7 |
37.1 |
4.5 |
Рассмотрим модель
представленную на рис. 1. Модель
содержит 895 646 узлов и 912 530 элементов (4 860 330 уравнений).
Модель состоит из
3-х 4-х узловых оболочек и 2-х узловых стержневых элементов.
Рис 4.
Время полной численной факторизации матрицы жесткости,
скорость работы и количество требуемой оперативной памяти приведены в таблице
4:
Таблица 4.
|
Время, cек |
Скорость, Гфл/cек |
Память, Гб |
одно ядро |
113. |
10.2 |
17.0 |
два ядра |
58.2 |
19.8 |
17.2 |
четыре ядра |
31.7 |
36.4 |
17.6 |
Наверное нет смысла особенно комментировать полученные
результаты. Но хочется отметить хороший коэффициент ускорения при увеличении
количества ядер и большую скорость полной численной факторизации разреженных
матриц. в системе ИСПА.
Апрель