Скорость работы разреженного прямого решателя

(sparse direct solver) в системе ИСПА.

часть 3

Александр Николаевич Мухин

Александр Александрович Мухин

 

Принцип работы разреженного прямого решателя в системе ИСПА описан в первой части данной статьи. В данной статье рассмотрим скорость работы нового разреженного метода факторизации матриц, реализованного в системе ИСПА, на больших реальных моделях. Модели созданы в ANSYS и импортированы в систему ИСПА.

Решение будем проводить на двух компьютерах. Первый компьютер  с процессором Intel I7 – 990, 24 Гб оперативной памяти. Второй компьютер  с процессором Intel I7 – 3930, 64 Гб оперативной памяти.  Операционная система WINDOWS 7 (64 разряда). Полную численную факторизацию  будем проводить на одном, двух и четырех ядрах.

Рассмотрим  модель представленную на рис. 1. Модель  содержит 698 346 узлов и 484 494 элементов (3 135 807 уравнений).

 Модель состоит из 3-х, 4-х узловых оболочек и 20-ти узловых объемных  элементов. 

 

 

Рис 1.

 

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти для компьютера  с процессором Intel I7 – 990 приведены в таблице 1:

Таблица 1.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

171.2

10.8

15.1

два ядра

89.4

20.7

15.2

четыре ядра

51.7

35.8

15.5

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти для компьютера  с процессором Intel I7 – 3930 приведены в таблице 2:

Таблица 2.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

96.8

19.2

15.1

два ядра

50.2

36.9

15.2

четыре ядра

31.7

58.1

15.5

 

Рассмотрим  модель представленную на рис. 2. Модель  содержит 430 857 узлов и 372 234 элементов (2 188 544 уравнений).

Модель состоит из 3-х, 4-х узловых оболочек и 20-ти узловых объемных  элементов. 

 

 

Рис 2.

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти для компьютера  с процессором Intel I7 – 990 приведены в таблице 3:

Таблица 3.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

63.7

10.4

8.2

два ядра

33.0

20.1

8.3

четыре ядра

18.4

35.9

8.5

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти для компьютера  с процессором Intel I7 – 3930 приведены в таблице 4:

Таблица 4.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

37.6

17.7

8.2

два ядра

19.2

34.6

8.3

четыре ядра

11.0

60.0

8.5

 

Теперь рассмотрим  модель представленную на рис. 3. Модель создана в конечно-элементном редакторе GEOPROF системы ИСПА. Решение будем проводить на  компьютере с процессором Intel I7 – 3930, 64 Гб оперативной памяти, так как для решения потребуется 40 Гб оперативной памяти. 

Модель  содержит 1 926 732 узлов и 1 960 996 элементов (10 419 832 уравнений).

 Модель состоит из 3-х и 4-х узловых оболочечных  элементов. 

 

Рис 3.

Время полной численной факторизации матрицы жесткости, скорость работы и количество требуемой оперативной памяти для компьютера  с процессором Intel I7 – 3930 приведены в таблице 5:

Таблица 5.

 

Время, cек

Скорость, Гфл/cек

Память, Гб

одно ядро

199.1

18.4

38.2

два ядра

102.5

35.6

38.8

четыре ядра

60.6

60.3

39.6

шесть ядер

48.4

75.0

40.4

 

Хочется отметить хороший коэффициент ускорения при увеличении количества ядер и большую скорость полной численной факторизации разреженных матриц в системе ИСПА.

У процессора Intel I7 – 990 тактовая частота 3.5 Ггц, а у процессора Intel I7 – 3930 тактовая частота 3.2 Ггц , однако скорость работы  процессора Intel I7 – 3930 в 1.9 раза быстрее. Связано это с тем, что расчеты в системе ИСПА проводятся не только на сопроцессоре, но и с использованием дополнительных расширенных регистров.

 

Октябрь 2012 г.