Скорость работы разреженного прямого решателя

(sparse direct solver) в системе ИСПА.

часть 2

Александр Николаевич Мухин

Александр Александрович Мухин

 

 

Принцип работы разреженного прямого решателя в системе ИСПА описан в первой части данной статьи. Но время идет программа развивается и ускоряется. За последнее время существенно ускорен  полный метод факторизации разреженных матриц. И поэтому, в данной статье рассмотрим скорость работы нового разреженного метода факторизации матриц, реализованный в системе ИСПА.

Решение будем проводить на компьютере с процессором Intel I7 – 990, 24 Гб оперативной памяти. Операционная система WINDOWS 7 (64 разряда). Полную численную факторизацию  будем проводить на одном, двух и четырех ядрах.

 

Рассмотрим  модель представленную на рис. 1. Модель  содержит 203 217 узлов и 226 574 элементов (1 158 710 уравнений).

 Модель состоит из 3-х 4-х узловых оболочек и 2-х узловых стержневых элементов. 

 

 

Рис 1.

 

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти приведены в таблице 1:

 

Таблица 1.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

23.2

10.0

3.8

два ядра

12.0

19.2

3.9

четыре ядра

6.5

35.2

4.0

 

Рассмотрим  модель представленную на рис. 2. Модель  содержит 473 543 узлов и 1 519 040 элементов (1 435 691 уравнений).

Модель состоит из 4-х узловых объемных элементов, 4-х узловых оболочек и 2-х узловых стержневых элементов. 

 

Рис 2.

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти приведены в таблице 2:

 

Таблица 2.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

132.

10.9

7.3

два ядра

69.2

20.7

7.4

четыре ядра

39.7

40.4

7.5

 

Рассмотрим  модель представленную на рис. 3. Модель состоит из 20-ти узловых объемных элементов и содержит 671 448 уравнений.

 

Рис 3.

 

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти приведены в таблице 3:

 

Таблица 3.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

33.8

10.8

4.4

два ядра

17.5

20.7

4.4

четыре ядра

9.7

37.1

4.5

 

Рассмотрим  модель представленную на рис. 1. Модель  содержит 895 646 узлов и 912 530 элементов (4 860 330 уравнений).

 Модель состоит из 3-х 4-х узловых оболочек и 2-х узловых стержневых элементов.

 

Рис 4.

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти приведены в таблице 4:

 

Таблица 4.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

113.

10.2

17.0

два ядра

58.2

19.8

17.2

четыре ядра

31.7

36.4

17.6

 

Наверное нет смысла особенно комментировать полученные результаты. Но хочется отметить хороший коэффициент ускорения при увеличении количества ядер и большую скорость полной численной факторизации разреженных матриц. в системе ИСПА.

 

Апрель 2012 г.