Белорусский национальный технический университет
Repository of the Belarusian National Technical University
ISSN: 2310-7405
Repository of the Belarusian National Technical University
View Item 
  •   Repository BNTU
  • Сериальные издания
  • Системный анализ и прикладная информатика
  • 2026
  • № 1
  • View Item
  •   Repository BNTU
  • Сериальные издания
  • Системный анализ и прикладная информатика
  • 2026
  • № 1
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Сравнительный анализ методов оптимизации нейронных сетей

Thumbnail
DOI
10.21122/2309-4923-2026-1-49-53
Authors
Гаврик, Д. Н.
Date
2026
Publisher
БНТУ
Another Title
Comparative analysis of neural network optimization methods
Bibliographic entry
Гаврик, Д. Н. Сравнительный анализ методов оптимизации нейронных сетей = Comparative analysis of neural network optimization methods / Д. Н. Гаврик // Системный анализ и прикладная информатика. – 2026. – № 1. – С. 49-53.
Abstract
Проведено прикладное сравнительное тестирование ускорений вывода Stable Video Diffusion (image-to-video). Для всех методов использован фиксированный вход и параметры (1024×576, 25 кадров), базовый вариант FP16/25 шагов. Описано восемь сравниваемых подходов: стандартный запуск SVD в FP16, INT8 weight-only квантование UNet, torch.compile+TF32, снижение шагов, подстановка дистиллированных весов (AnimateLCM), 2:4 разреженность, LCM-режим, а также генерация ключевых кадров с последующей интерполяцией RIFE. Измерялись время и VRAM, качество / плавность оценивались прокси-метриками CLIP similarity, tSSIM, tLPIPS. Ключевые кадры+RIFE дает наибольшее ускорение при сохранении сильной привязки к исходнику, LCM обеспечивает сбалансированное ~2× ускорение; агрессивное снижение шагов ухудшает динамику.
Abstract in another language
We benchmark practical ways to accelerate Stable Video Diffusion (SVD) inference for image-to-video. All methods use a fixed setup (1024×576 input, 25 frames) with an FP16 baseline at 25 denoising steps. We compare eight techniques: UNet INT8 weight-only quantization, torch.compile+TF32, step reduction, distilled weights (AnimateLCM), semi-structured 2:4 sparsity, LCM mode/scheduler, and keyframe generation with RIFE interpolation as post-processing. We measure latency and peak VRAM, and track quality/motion via CLIP similarity, tSSIM, and tLPIPS. Keyframes+RIFE achieves the highest speedup while preserving strong conditioning to the input. LCM provides a balanced ~2× speedup, whereas aggressive step cuts (and untuned 2:4) can degrade motion.
URI
https://rep.bntu.by/handle/data/166927
View/Open
49-53.pdf (1.657Mb)
Collections
  • № 1[10]
Show full item record
CORE Recommender

Belarusian National Technical University | Science Library | About Repository | Размещение в Репозитории | Contact Us
Яндекс.МетрикаIP Geolocation by DB-IP
Science Library | About Repository | Размещение в Репозитории | Contact Us
 

Browse

All of Repository BNTUCommunities & CollectionsAuthorsTitlesBy Issue DatePublisherBy Submit DateTypeThis CollectionAuthorsTitlesBy Issue DatePublisherBy Submit DateType

My Account

LoginRegister

Belarusian National Technical University | Science Library | About Repository | Размещение в Репозитории | Contact Us
Яндекс.МетрикаIP Geolocation by DB-IP
Science Library | About Repository | Размещение в Репозитории | Contact Us