Now showing items 1-1 of 1

    • Стратегии параллелизма как ключевой фактор развертывания Large Language Models на базе потребительских GPU 

      Курочка, К. С.; Башаримов, Ю. С.; Ёвженко, Ю. Д. (БНТУ, 2026)
      Экспоненциальный рост размеров больших языковых моделей (LLM) создает существенные барьеры для их локального развертывания, обусловленные нехваткой видеопамяти (VRAM) на одиночных устройствах. Целью работы является выявление и обоснование наиболее эффективной стратегии параллелизма для инференса LLM на кластерах из потребительских графических процессоров (GPU), объединенных ...
      2026-04-22