Скорость работы разреженного прямого решателя

(sparse direct solver) в системе ИСПА

при решении задач большой размерности.

Часть 2

Александр Николаевич Мухин

Александр Александрович Мухин

 

Принцип работы разреженного прямого решателя в системе ИСПА описан в  статье “Новый разреженный прямой решатель (sparse direct solver) в системе ИСПА”.

Но время идет и программа развивается. В данной статье рассмотрим скорость работы нового разреженного метода факторизации матриц, реализованный в системе ИСПА для задач большой размерности.

Решение будем проводить на компьютере с процессором Intel I7 – 6900, 128 Гб оперативной памяти. Операционная система WINDOWS 10 (64 разряда). Для проверки точности и правильности проведенных расчетов будем рассчитывать энергию деформации.

Геометрическая модель колеса на рис. 1. Генерацию  конечно-элементных моделей будем проводить используя автоматический генератор 4-х узловых тетраэдров.

 

Рис 1.

 Конечно-элементная модель представлена на рис. 2        . Модель  содержит 800 258 узлов и  3 492 949 элементов (2 394 705 уравнений). Количество закрепленных степеней свободы – 6 069.

 

 

Рис 2.

 

На рисунке 3, 4 показаны фрагменты данной модели, чтобы читатель смог понять подробность конечно-элементной сетки.

 

 

Рис 3.

 

 

Рис 4.

Время полной численной факторизации матрицы жесткости составляет - 17 сек. Для решения потребовалось 12.4 Гбайт оперативной памяти. Скорость решения – 206 Гфл/cек.  Энергия деформации = 3.779465e+006.

 

Сгенерируем более подробную конечно-элементную  модель используя автоматический генератор 4-х узловых тетраэдров.  Модель  содержит  1 487 297 узлов и  6 969 588   элементов (4 450 320 уравнений).

На рисунке 5 показан фрагмент конечно-элементной сетки.

 

 

Рис 5.

Время полной численной факторизации матрицы жесткости составляет – 62  сек. Для решения потребовалось 30.4 Гбайт оперативной памяти. Скорость решения – 228 Гфл/cек.  Энергия деформации = 3.797183e+006.

 

 

Теперь сгенерируем ту же самую модель используя автоматический генератор 10-ти узловых тетраэдров.  Модель  содержит  2 390 568 узлов и  1 438 639   элементов (7 169 667 уравнений).

На рисунке 6 показан фрагмент данной модели, чтобы читатель смог понять подробность конечно-элементной сетки.

 

Рис 6.

Время полной численной факторизации матрицы жесткости составляет - 1 мин 35 сек. Для решения потребовалось 52 Гбайт виртуальной памяти. Скорость решения – 223 Гфл/cек. Энергия деформации = 3.831667e+006.

 

Подведем итоги. Энергия деформации проведенных расчетов совпадает. Это означает, что численная факторизация, в системе ИСПА, проводится без потери точности решения.

Тактовая частота процессора Intel I7 – 6900 составляет 3.2 Ггц. Восемь физических ядер в сумме дают – 25.6 Ггц. Если за один такт делать одну операцию с плавающей точкой, на каждом ядре, то скорость   вычислений составит 25.6 Гфл/cек.  А скорость численной факторизации в системе ИСПА, для этих задач составляет 228 Гфл/cек (228 миллиардов операций с плавающей точкой в секунду). Это означает, в системе ИСПА используется расширение системы команд x86 для микропроцессоров Intel и AMD. Для данного процессора стандарт AVX2 (Advanced Vector Extensions 2).

 

Вывод.

Система ИСПА позволяет проводить расчеты большой размерности с большой скоростью и без потери точности решения.

 

Октябрь 2016 г.