Китайский алгоритм, как утверждается, увеличивает производительность графических процессоров Nvidia до 800 раз для передовых научных приложений

Китайский алгоритм, как утверждается, увеличивает производительность графических процессоров Nvidia до 800 раз для передовых научных приложений:

Исследователи из Университета Шэньчжэнь МГУ-ПИТ, совместного проекта Московского государственного университета имени М.В. Ломоносова и Пекинского технологического института, 
как сообщается, разработали новый вычислительный алгоритм, который может значительно повысить эффективность перидинамики (ПД), нелокальной теории, используемой для моделирования трещин и повреждений материалов. Новый метод увеличивает производительность до 800 раз, значительно повышая скорость крупномасштабного моделирования материалов.

Перидинамика широко используется для прогнозирования разрушения материалов в аэрокосмической, гражданской инженерии и военных приложениях. Однако традиционное моделирование PD требует значительных вычислительных ресурсов, что делает крупномасштабные исследования медленными и непрактичными. Доцент Ян Ян и ее команда решили эту проблему, используя технологию CUDA от Nvidia для оптимизации проектирования алгоритмов и управления памятью.

Их фреймворк PD-General достиг 800-кратного прироста скорости на Nvidia RTX 4070 по сравнению с традиционными последовательными программами и 100-кратного повышения производительности по сравнению с параллельными программами на основе OpenMP. В крупномасштабных симуляциях с миллионами частиц он завершил 4000 итерационных шагов за пять минут. Для крупномасштабных двумерных одноосных задач растяжения он обработал 69,85 миллионов итераций менее чем за две минуты с использованием одинарной точности.

Повышенная вычислительная эффективность означает, что исследователи теперь могут проводить моделирование на потребительских графических процессорах вместо того, чтобы полагаться на дорогостоящие высокопроизводительные вычислительные кластеры. Это имеет широкие последствия для отраслей, которым требуется подробный анализ материалов, включая:

  • Аэрокосмическая и оборонная промышленность: Улучшенное моделирование напряжений материалов и разрушений в конструкциях самолетов.
  • Проектирование и производство: более эффективное тестирование материалов для строительства и промышленного применения.
  • Военные исследования: ускоренная разработка ударопрочных материалов для оборонных систем.

Возможность достижения высокопроизводительных симуляций на широко доступных графических процессорах также снижает зависимость от ограниченных иностранных технологий. Учитывая продолжающиеся торговые ограничения и санкции, этот прорыв позволяет Китаю и России потенциально продвигать исследования, не завися от высокопроизводительного вычислительного оборудования из западных стран.

Эта разработка также знаменует собой значительный шаг в вычислительной механике, позволяя проводить более быстрые и доступные симуляции для материаловедения, инженерии и оборонных приложений. Исследование было опубликовано в китайском журнале Computational Mechanics 8 января 2025 года, и исследовательская группа считает, что эта оптимизация может выйти за рамки перидинамики, улучшив производительность GPU для других научных вычислений.

Читайте нашу главную страницу —  Взгляд в будущееИнновацииТехнологииНаукаНовые открытияИзобретения

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *