Скорость
работы разреженного прямого решателя
(sparse direct solver)
в системе ИСПА
при решении задач большой размерности.
Александр
Николаевич Мухин
Александр
Александрович Мухин
Принцип работы разреженного прямого решателя в системе
ИСПА описан в статье “Новый разреженный прямой решатель (sparse direct solver) в системе ИСПА”.
Но время идет и программа развивается. В данной статье
рассмотрим скорость работы нового разреженного метода факторизации матриц, реализованный в системе ИСПА для задач большой размерности.
Решение будем проводить на компьютере с процессором Intel I7 – 6900, 128 Гб оперативной памяти. Операционная система WINDOWS 10 (64 разряда). Для проверки точности и правильности проведенных расчетов
будем рассчитывать энергию деформации.
Геометрическая модель колеса на рис. 1. Генерацию конечно-элементных моделей будем проводить используя автоматический генератор 4-х узловых
тетраэдров.
Рис 1.
Конечно-элементная
модель представлена на рис. 2 .
Модель содержит 800 258 узлов
и 3 492 949 элементов (2
394 705 уравнений). Количество закрепленных степеней свободы – 6 069.
Рис 2.
На рисунке 3, 4 показаны фрагменты данной модели, чтобы
читатель смог понять подробность конечно-элементной сетки.
Рис 3.
Рис 4.
Время полной численной факторизации матрицы жесткости
составляет - 17 сек. Для решения потребовалось 12.4 Гбайт оперативной памяти.
Скорость решения – 206 Гфл/cек.
Энергия деформации = 3.779465e+006.
Сгенерируем более подробную конечно-элементную модель используя
автоматический генератор 4-х узловых тетраэдров. Модель
содержит 1 487 297 узлов
и 6 969 588 элементов (4 450 320 уравнений).
На рисунке 5 показан фрагмент конечно-элементной сетки.
Рис 5.
Время полной численной факторизации матрицы жесткости
составляет – 62 сек. Для решения потребовалось
30.4 Гбайт оперативной памяти. Скорость решения – 228 Гфл/cек.
Энергия деформации = 3.797183e+006.
Теперь сгенерируем ту же самую модель
используя автоматический генератор 10-ти узловых тетраэдров. Модель
содержит 2 390 568 узлов
и 1 438 639 элементов (7 169 667 уравнений).
На рисунке 6 показан фрагмент данной модели, чтобы
читатель смог понять подробность конечно-элементной сетки.
Рис 6.
Время полной численной факторизации матрицы жесткости
составляет - 1 мин 35 сек. Для решения потребовалось 52 Гбайт виртуальной
памяти. Скорость решения – 223 Гфл/cек. Энергия деформации =
3.831667e+006.
Подведем итоги. Энергия деформации проведенных расчетов
совпадает. Это означает, что численная факторизация, в системе ИСПА, проводится
без потери точности решения.
Тактовая частота процессора Intel I7 – 6900 составляет 3.2 Ггц. Восемь физических
ядер в сумме дают – 25.6 Ггц. Если за один такт
делать одну операцию с плавающей точкой, на каждом ядре, то скорость вычислений составит 25.6 Гфл/cек. А
скорость численной факторизации в системе ИСПА, для этих задач составляет 228 Гфл/cек (228 миллиардов операций с
плавающей точкой в секунду). Это означает, в системе ИСПА используется расширение
системы команд x86 для микропроцессоров Intel и AMD. Для данного процессора стандарт AVX2 (Advanced Vector Extensions 2).
Вывод.
Система ИСПА позволяет проводить расчеты большой
размерности с большой скоростью и без потери точности решения.
Октябрь