МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ Белорусский национальный технический университет Кафедра «Организация упаковочного производства» И. И. Карпунин МОДЕЛИРОВАНИЕ И ОПТИМИЗАЦИЯ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ ПРИМЕНИТЕЛЬНО К УПАКОВОЧНОМУ ПРОИЗВОДСТВУ Учебно-методическое пособие Минск БНТУ 2013 1 МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ Белорусский национальный технический университет Кафедра «Организация упаковочного производства» И. И. Карпунин МОДЕЛИРОВАНИЕ И ОПТИМИЗАЦИЯ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ ПРИМЕНИТЕЛЬНО К УПАКОВОЧНОМУ ПРОИЗВОДСТВУ Учебно-методическое пособие для студентов специальности 1-36 20 02 «Упаковочное производство» Рекомендовано учебно-методическим объединением Республики Беларусь по образованию в области машиностроительного оборудования и технологий Минск БНТУ 2013 2 УДК 621.798-047.58-048.34 (075.8) ББК 30.61я7 К26 Р е ц е н з е н т ы : кафедра «Основы научных исследований и проектирования» учреждения образования «Белорусский государственный аграрный технический университет» (зав. кафедрой доктор технических наук, профессор В. Н. Дашков); доктор физико-математических наук, профессор кафедры Юнеско «Энергосбережение и возобновляемые источники энергии» Белорусского национального технического университета А. Г. Рекс Карпунин, И. И. Моделирование и оптимизация технологических процессов при- менительно к упаковочному производству : учебно-методическое пособие для студентов специальности 1-36 20 02 «Упаковочное производство» / И. И. Карпунин. – Минск : БНТУ, 2013. – 124 с. ISBN 978-985-550-217-4. Предназначено для студентов специальности 1-36 20 02 «Упаковочное производство». На основе литературных источников в пособии изложены процессы моделирования технологических процессов применительно к упа- ковочной отрасли. УДК 621.798-047.58-048.34 (075.8) ББК 30.61я7 ISBN 978-985-550-217-4 © Карпунин И. И., 2013 © Белорусский национальный технический университет, 2013 Admin [Введите аннотацию документа. К26 3 Содержание 1. Введение в моделирование технологии производства в упаковочной отрасли ........................................................................... 6 2. Цели моделирования и задачи оптимизации ................................... 7 3. Математическое и физическое моделирование ............................... 9 4. Особенности математического моделирования в упаковочном производстве ............................................................... 13 4.1. Простейшие механические модели вязкоупругого поведения .......................................................................................... 15 4.2. Две корректные постановки начально-краевых задач в обобщенной модели Кельвина–Фойгта ...................................... 17 5. Составление математического описания объекта применительно к упаковочному производству ................................. 18 5.1. Классификация математических моделей .............................. 18 5.2. Параметры моделей и фазовые переменные .......................... 23 6. Основные понятия системного подхода к созданию математических моделей ..................................................................... 25 7. Метод линейного программирования ............................................. 31 7.1. Математическая формулировка ............................................... 31 7.2. Примеры задач о максимальном парасочетании .................... 32 7.2.1. Максимальное сочетание пар ........................................ 32 7.2.2. Максимальный поток ..................................................... 32 7.2.3. Понятие минимизации функции .................................... 33 7.2.4. Игра с нулевой суммой ................................................... 34 7.3. Решение задач оптимизации .................................................... 35 7.4. Условия Каруша–Куна–Таккера .............................................. 38 Постановка задачи ..................................................................... 39 8. Моделирование и оптимизация экструзионных процессов в упаковочном производстве ............................................................... 40 8.1. Планирование модельных экспериментов для упаковочного производства ...................................................... 42 8.2. Использование пакета MATLAB для моделирования технологических процессов упаковочного производства ............ 43 8.3. Дифференциальное уравнение теплопроводности конечного цилиндра для составления алгоритма .......................... 43 8.3.1. Особенность построения математических моделей для описания термодинамических процессов ........................ 43 8.3.2. Составление алгоритма .................................................. 44 4 8.4. Составление программы ........................................................... 46 8.5. Анализ моделирования и расчетов .......................................... 47 8.6. Методы, применяемые для анализа и моделирования экструзионных процессов................................................................ 47 Описание и моделирование процесса движения полимера в одношнековом экструдере ................................... 48 8.7. Численные методы .................................................................... 52 8.7.1. Метод конечных разностей ........................................... 53 8.7.2. Метод конечных элементов ........................................... 54 8.7.3. Метод граничных элементов ......................................... 54 8.8. Методы построения сеток для задач с движущимися границами.......................................................................................... 55 8.9. Моделирование трехмерных потоков двумерными моделями ........................................................................................... 55 8.9.1. Моделирование течения в периодических смесителях при помощи двумерных моделей ....................... 55 8.9.2. Моделирование потоков в экструдере с помощью двумерных моделей ............................................. 56 8.9.3. О моделировании течения в экструзионной головке с помощью двумерных моделей ............................... 57 8.10. Трехмерное моделирование .................................................... 58 9. Основные виды математических моделей ..................................... 59 10. Условия моделирования объекта модели и объекта оригинала ............................................................................. 62 11. Общие положения метода неопределенных множителей Лагранжа .......................................................................... 64 Критерий оптимальности .............................................................. 65 Ограничения ................................................................................... 66 Оптимизирующие факторы........................................................... 67 Целевая функция ............................................................................ 68 Примеры применения метода ....................................................... 68 12. Целевая функция как критерий оптимальности .......................... 74 13. Оптимизация методом дифференциального исчисления ........... 75 Моделирование и оптимизация упаковки для наименьшего расхода материала при ее производстве ...................................... 77 14. Моделирование и модели .............................................................. 78 15. Составление математического описания объекта ....................... 80 Методы составления математического описания ....................... 80 5 16. Выбор метода решения и его реализация в виде алгоритма и моделирующей программы .............................................................. 85 17. Блочный принцип построения математических моделей ........... 88 18. Численные методы оптимизации нулевого порядка ................... 90 19. Классификация методов................................................................. 94 20. Общая характеристика методов нулевого порядка ..................... 97 21. Метод прямого поиска (метод Хука–Дживса) ............................. 97 22. Метод деформированного многогранника (метод Нелдера–Мида) ....................................................................... 100 23. Метод вращающихся координат (метод Розенброка) ............... 102 24. Метод параллельных касательных (метод Пауэлла) ................. 105 25. Численные методы безусловной оптимизации первого порядка .................................................................................. 107 Минимизация функций многих переменных. Основные положения ................................................................... 107 26. Метод наискорейшего спуска ...................................................... 109 27. Метод сопряженных градиентов ................................................. 112 28. Численные методы безусловной оптимизации второго порядка .................................................................................. 115 Особенности методов второго порядка ...................................... 115 29. Метод Ньютона ............................................................................. 117 Выводы ................................................................................................ 118 Литература .......................................................................................... 120 6 1. ВВЕДЕНИЕ В МОДЕЛИРОВАНИЕ ТЕХНОЛОГИИ ПРОИЗВОДСТВА В УПАКОВОЧНОЙ ОТРАСЛИ Современные методы проектирования и исследования в упаковоч- ном производстве основываются на системном подходе к рассматри- ваемому объекту. С целью устранения проблемы, т. е. для решения вопросов и задач, связанных с исследованием, разработкой и эксплуа- тацией оборудования и различных устройств в упаковочном произ- водстве, системным анализом, используют обширный спектр средств и возможности различных наук и практических сфер деятельности. Системный подход имеет методологическую основу – моделиро- вание, что позволяет использовать его в упаковочном производстве. Это представляет собой способ изучения процессов, явлений и уст- ройств, применимых к различным процессам, которые можно ис- пользовать на упаковочном производстве. При этом исследуется не сам объект – оригинал, а какая-то промежуточная вспомогательная система, которая находится в некотором объективном соответствии с познаваемым объектом и способна в процессе познания на извест- ных этапах в определенных отношениях замещать изучаемый объект и также в процессе ее исследования в конечном итоге давать ин- формацию о самом объекте. Такая промежуточная вспомогательная система называется моделью реальной системы – оригинала. В наше время (при появлении ЭВМ и Интернета) широкое рас- пространение получила идея математического моделирования. В ре- зультате математическая модель объекта является исходной базой для проведения его оптимизации. Использование методов моделирования и оптимизации приме- нительно к упаковочному производству позволяет: повысить качество технологических расчетов и проектирования в целом, целенаправленно переходить к автоматизированному про- ектированию оборудования для упаковочного производства и по- следующему качественному его изготовлению; улучшить стабильность работы технологического оборудования в оптимальном режиме по энерготехнологическим и экономическим показателям; организовать производство с применением кибернетики с целью его устойчивого самоуправления; 7 рассчитать и обеспечить надежность работы установок в техно- логическом процессе упаковочного производства; решить проблему создания безотходных, экологически чистых технологий в упаковочной отрасли. Целью пособия является облегчение учебной работы студентов при изучении дисциплины «Моделирование и оптимизация техно- логических процессов в упаковочном производстве». 2. ЦЕЛИ МОДЕЛИРОВАНИЯ И ЗАДАЧИ ОПТИМИЗАЦИИ Воспроизведение моделью функций или свойств оригинала мо- жет преследовать различные цели: - практические, прикладные (обычно связаны с разработкой, проектированием оригинала); - научные (изучаются закономерности процессов, явлений, осо- бенности функционирования новых и сложных объектов, систем); - учебные (демонстрационные модели, к которым относятся ма- кеты, схемы, чертежи и другие наглядные пособия). В инженерной деятельности моделирование имеет целью реше- ние творческих вопросов и используется:  для раскрытия и углубленного исследования механизма явле- ний и взаимодействия их частей;  установления технологических режимов и создания инженер- ных методов расчета;  определения конструктивных параметров машин и аппаратов;  оптимизации процессов и аппаратов, их режима работы;  определения переходных характеристик, выбора средств авто- матизации и создания систем управления. Процессы химической технологии – это сложные физико-хими- ческие системы, имеющие двойственную детерминированно-стохас- тическую природу, переменные в пространстве и во времени. Участ- вующие в них потоки вещества, как правило, многофазные и мно- гокомпонентные. В ходе протекания процесса в каждой точке фазы и на границах раздела происходит перенос импульса, энергии, мас- сы. Весь процесс в целом протекает в аппарате с конкретными геометрическими характеристиками, в свою очередь оказывающи- ми влияние на характер этого процесса [1, 2]. 8 Существенная особенность химико-технологических процессов состоит в том, что совокупность составляющих их явлений носит детерминированно-стохастическую природу, проявляющуюся в на- ложении стохастических особенностей гидродинамической обста- новки в аппарате на процессы массо- и теплопереноса и химичес- кого превращения. Это объясняется случайным взаимодействием составляющих компонентов фаз (соударением частиц, их дробле- нием, коалесценцией, случайным блужданием по объему аппарата) или случайным характером геометрии граничных условий в аппа- рате (случайное расположение элементов беспорядочно уложенной насадки, зерен катализатора, производственная ориентация межфаз- ной границы движущихся сред и т. п.). Подобного рода системы характеризуются чрезвычайно слож- ным взаимодействием составляющих их фаз и компонентов, вслед- ствие чего их изучение с позиций классических детерминированных законов переноса и сохранения становится невозможным. Ключ к решению этой проблемы дает метод математического модели- рования, базирующийся на стратегии системного анализа, сущность которой заключается в представлении процесса как сложной взаимо- действующей иерархической системы с последующим качествен- ным анализом ее структуры, разработкой математического описа- ния и оценкой неизвестных параметров. Так, например, при рас- смотрении явлений, возникающих в процессе движения частиц, капель или пузырьков газа в сплошной жидкой среде, выделяют пять уровней иерархии эффектов: 1. Совокупность явлений на атомарно-молекулярном уровне; 2. Эффекты в масштабе надмолекулярных или глобулярных структур; 3. Множество физико-химических явлений, связанных с движе- нием единичного включения дисперсной фазы, с учетом химиче- ских реакций и явлений межфазного энерго- и массопереноса; 4. Физико-химические процессы при включениях, перемещаю- щихся в сплошной фазе; 5. Совокупность процессов, определяющих макрогидродинами- ческую обстановку в аппарате. Такой подход позволяет наиболее полно установить совокупность явлений всего процесса и связей между ними. 9 Под математическим моделированием понимают изучение свойств объекта на математической модели. Его целью является опреде- ление оптимальных условий протекания процесса, управление им на основе математической модели и перенос результатов на объект. Метод математического моделирования применяют при изуче- нии свойств процессов, для которых имеется достаточно точное математическое описание [2]. В зависимости от степени полноты математического описания можно выделить два предельных случая: 1) известна полная система уравнений, описывающая все основ- ные стороны моделируемого процесса, и все числовые значения параметров этих уравнений. Построенная на основе физических представлений модель долж- на верно, качественно и количественно описывать свойства моде- лируемого процесса, т. е. она должна быть адекватна моделируе- мому процессу; 2) полное математическое описание процесса отсутствует. Этот второй случай типичен для решения кибернетических задач, в ко- торых приходится иметь дело с управлением процессами при на- личии неполной информации об объекте и действующих на него возмущениях. При отсутствии достаточной информации об иссле- дуемых явлениях их изучение начинается с построения простейших моделей, но без нарушения основной (качественной) специфики исследуемого процесса. 3. МАТЕМАТИЧЕСКОЕ И ФИЗИЧЕСКОЕ МОДЕЛИРОВАНИЕ Моделирование – это создание модели проектируемой или ис- следуемой системы или объекта с целью изучения их свойств или поведения в тех или иных условиях. Применение моделей обус- ловлено тем, что эксперименты с реальными системами обычно требуют слишком больших затрат средств и времени. Моделирование можно подразделить: - на физическое; - математическое. Физические модели – одинаковые или сходные по физической природе с оригиналом. Исследования проводятся на стендах, уста- новках, макетах. Физические модели строят на основании теории 10 подобия. Самый простой пример подобия – пространственное по- добие, когда модель отличается от оригинала только размерами. Пространственное моделирование широко применяется в строи- тельстве и архитектуре, при расстановке оборудования в цехах, изучении условий освещения. Достоинством физического моделирования является более полное, по сравнению с математическим моделированием, воспроизведение свойств исследуемого процесса, системы или объекта. Недостатки – высокая стоимость моделей сложных объектов, меньшая универсаль- ность метода, так как при изменении параметров исследуемого процесса необходимо переделывать или заново создавать модель, что связано с большими материальными и временными затратами. Построение любой математической модели начинают с физиче- ского описания объекта моделирования. При этом выделяют эле- ментарные процессы, протекающие в объекте моделирования и под- лежащие отражению в модели, и формулируют основные допуще- ния, принимаемые при их описании. В свою очередь, перечень учитываемых элементарных процессов определяет совокупность явлений, которые включают в математическую модель. Обычно при математическом моделировании объектов химиче- ской технологии принимаются во внимание следующие элементар- ные процессы: 1) движение потоков фаз; 2) массообмен между фазами; 3) теплопередача; 4) изменение агрегатного состояния (испарение, конденсация, растворение и т. д.); 5) химические превращения. Полнота математического описания элементарных процессов в модели зависит от их роли во всем химико-технологическом про- цессе, степени изученности, глубины взаимосвязи элементарных процессов в объекте и желаемой точности всего описания. Взаимо- связь элементарных процессов может быть чрезвычайно сложной. Поэтому на практике часто делают различные допущения относи- тельно характера связей, что позволяет избежать необходимости введения в модель недостаточно изученных зависимостей и, следо- вательно, излишнего усложнения описания. 11 Математическое моделирование представляет собой метод ис- следования объектов и процессов реального мира с помощью их приближенных математических описаний – математических моде- лей [3, 15, 16]. При математическом моделировании физика иссле- дуемого процесса при переходе к модели не сохраняется. Матема- тическое моделирование основывается на изоморфизме уравнений, т. е. их способности описывать различные по своей природе явле- ния. Метод математического моделирования основан на идентич- ности математических описаний процессов, протекающих в модели- руемой системе и модели. Потребность в моделировании возникает, когда исследование самого объекта в реальности невозможно, например, при его разра- ботке, когда объект слишком мал или велик, расположен очень да- леко, когда продолжительность исследуемого процесса превышает продолжительность жизни исследователя и т. д., а также затрудни- тельно и дорого, требует много времени. От модели не требуется, чтобы она повторяла поведение объекта во всех деталях; она долж- на удовлетворительно воспроизводить те характеристики оригина- ла, которые подлежат изучению. Модель может быть принципиаль- но более простой, чем оригинал. Основная особенность моделирования как метода познания со- стоит в том, что сведения, необходимые для предсказания характе- ристик одних объектов, получают путем изучения других, имеющих иные размеры, параметры и в некоторых случаях – даже иную фи- зическую природу. Первые объекты называют при этом оригинала- ми, а вторые – моделями. Модель должна быть сходна с оригиналом и в то же время от- лична от него. Степень соответствия (СС) может меняться в преде- лах от нуля до единицы. Значение СС = 0 указывает на отсутствие какой бы то ни было связи между моделью и оригиналом. Значение СС = 1 свидетельствует о полной тождественности модели и ориги- нала. В обоих случаях нельзя говорить о моделировании. Количе- ственное определение степени соответствия весьма сложно и не всегда возможно, но это понятие позволяет производить сопостав- ление разных моделей для одного объекта [1]. Математическое моделирование включает три взаимосвязанных этапа: 12 1. Составление математического описания изучаемого объекта; 2. Выбор метода решения системы уравнений математического описания и реализация его в форме моделирующей программы; 3. Установление соответствия (адекватности) модели объекту. На этапе составления математического описания предварительно выделяют основные явления и элементы в объекте и затем устанав- ливают связи между ними. Далее для каждого выделенного эле- мента и явления записывают уравнения (или систему уравнений), отражающие его функционирование. Кроме того, в математическое описание включают уравнения связи между различными выделен- ными явлениями. В зависимости от процесса математическое опи- сание может быть представлено в виде системы алгебраических, дифференциальных, интегральных и интегродифференциальных уравнений [3, 4]. Этап выбора метода решения и разработки моделирующей про- граммы подразумевает выбор наиболее эффективного метода реше- ния из имеющихся (под эффективностью имеют в виду быстроту получения и точность решения) и реализацию его сначала в форме алгоритма решения, а затем – в форме программы, пригодной для расчета на ЭВМ. Для проверки адекватности математической модели реальному процессу нужно сравнить результаты измерений на объекте в ходе процесса с результатами предсказания модели в идентичных усло- виях. Этап установления адекватности модели является заключитель- ным в последовательности этапов, выполняемых при ее разработке. На рис. 3.1 изображена общая схема разработки математической модели. При построении математической модели реальное явление упрощается, схематизируется и полученная схема, в зависимости от сложности явлений, описывается с помощью того или иного мате- матического аппарата. От правильности учета в модели характерных черт рассматри- ваемого процесса зависят успех исследования и ценность получен- ных результатов моделирования. В модели должны быть учтены все наиболее существенные факторы, влияющие на процесс, и вместе с тем она не должна быть загромождена множеством мелких, второ- степенных факторов, учет которых только усложнит математиче- ский анализ и сделает исследование либо чрезмерно громоздким, либо вообще нереализуемым. 13 Рис. 2.1. Этапы разработки математической модели 4. ОСОБЕННОСТИ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ОБЪЕКТА В УПАКОВОЧНОМ ПРОИЗВОДСТВЕ Наличие математической модели объекта дает возможность про- вести его оптимизацию. Оптимизацией называется операция получения наилучших ре- зультатов в данных условиях. С математической точки зрения задача оптимизации заключается в отыскании таких значений регулируемых параметров объекта, которые при наложенных ограничениях дают экстремум некоторого критерия эффективности. Целью инженерной оптимизации технических систем и объектов является определение условий, обеспечивающих наивысшую эф- фективность проектных решений и эксплуатационных приемов. 14 Постановка задачи оптимизации в упаковочном производстве предполагает существование конкурирующих свойств объекта: коли- чество продукции — качество продукции; капитальные затраты — эксплуатационные затраты и т. п. При оптимизации определяются сочетания значений параметров и свойств объекта, которые соот- ветствуют наилучшему варианту из числа возможных. Для количе- ственной оценки и сравнения различных вариантов используется критерий оптимальности (целевая функция). Критерий оптимальности — это главный признак, по которому судят о том, насколько хорошо функционирует данная система, работает данный процесс, насколько хорошо решена задача опти- мизации [4, 5]. В общем случае формулировка задачи оптимизации включает выбор критерия оптимальности, установление ограничений, выбор оптимизирующих факторов в запись целевой функции. Для современного подхода к оптимизации характерна формали- зация задачи. Задача формулируется стандартным образом, после чего дальнейшее ее решение проводится на основе четкого одно- значного алгоритма. Формализация, во-первых, позволяет единообразно решать зада- чи из самых различных областей. Во-вторых, формализованные задачи приспособлены для решения на электронно-вычислительных машинах. Применение вычислительной техники обеспечивает воз- можность перебора большого числа вариантов и выбора из них наилучшего, поэтому формализация приводит к резкому повыше- нию эффективности процедуры решения задачи. В результате задача распадается на три основных этапа: 1) формулирование задачи, приведение ее к одной из стандарт- ных форм; 2) нахождение оптимальных условий на основе алгоритма опти- мизации; 3) реализация оптимальных условий на практике. Эти методы решения на первом и втором этапах взаимно про- тивоположны: второй этап, как правило, целиком формализован на основе алгоритма решения, а первый этап неформален и связывает конкретные особенности объекта с общим методом решения. Если задача оптимизации плохо сформулирована, то совершенно правильное ее решение даст результат неверный для практики. 15 Иногда именно хорошая формулировка задачи определяет успех оптимизации в целом. Таким образом, на этапе формулирования задачи применительно к упаковочному производству приходится учитывать физико-химические особенности процесса, его эконо- мичность, общее развитие промышленности, рыночную конъюнк- туру и множество других обстоятельств. 4.1. Простейшие механические модели вязкоупругого поведения Известно, что упругие тела и вязкие жидкости при деформиро- вании существенно различаются своими свойствами. Упругие де- формируемые тела после снятия приложенных нагрузок возвраща- ются к своему естественному, или недеформированному, состоя- нию. В отличие от них несжимаемые вязкие жидкости совсем не имеют тенденции после снятия нагрузки возвращаться в исходное состояние. Кроме того, напряжения в упругом теле связаны непо- средственно с деформациями, в то время как напряжения в вязкой жидкости зависят (за исключением гидростатической составляю- щей) от скоростей деформации, что следует учитывать при перера- ботке полимеров в упаковочном производстве. Поведение материала, которое объединяет в себе оба эти свой- ства – и упругости и вязкости, называют вязкоупругим. Упругое тело и вязкая жидкость занимают крайние противоположные точки в широком спектре вязкоупругих сред. Линейную вязкоупругость для одномерного состояния удобно трактовать при помощи механических моделей, которые наглядно демонстрируют поведение различных вязкоупругих материалов [40–42]. Эти модели строятся из таких механических элементов, как линейно-упругая пружина с модулем упругости E (массой этой пружины пренебрегают) и вязкий элемент (демпфер) с коэффици- ентом вязкости h (вязкий элемент представляет собой поршень, движущийся в цилиндре с вязкой жидкостью). Как показано на рис. 4.1, сила G, растягивающая пружину, свя- зана с ее удлинением  формулой G   . 16 Рис. 4.1. Линейный упругий элемент Подобное же соотношение существует и для демпфера: ,   где d d .t   Можно придать общность этим моделям и устранить размерные эффекты, если в качестве  рассматривать напряжение, а в качестве  – относительную деформацию. Модель Максвелла вязкоупругого тела является комбинацией пру- жины и вязкого элемента (демпфера), соединенных последовательно. Модель Кельвина или Фойгта представляет собой параллельное соединение тех же элементов. Соотношение между напряжением и деформацией (фактически содержащее также и их скорости) для модели Максвелла дается формулой . E       Для модели Кельвина соотношение между напряжением и де- формацией задается формулой .E   По существу эти уравнения являются определяющими уравнени- ями вязкой упругости в одномерном случае. 17 Простые модели Максвелла и Кельвина не дают точного полного описания поведения реальных сред. Усложненные модели обладают большей гибкостью в отражении процессов в фактических материалах. Четырехпараметрическая модель состоит из двух упругих и двух вязких элементов и представляет собой последовательно соединен- ные узел Максвелла и узел Кельвина. Данная модель способна описать все три основных типа поведе- ния вязкоупругой среды. Так, она объединяет в себе мгновенную упругую реакцию (за счет свободного элемента Gм), вязкое течение (за счет свободного вязкого элемента hм) и, наконец, запаздывающую упругую реакцию (за счет узла Кельвина). Предполагается, что для описания вязкоупругих свойств плавающей ледяной пластины можно использовать данную линейную четырехпараметрическую модель. 4.2. Две корректные постановки начально-краевых задач в обобщенной модели Кельвина–Фойгта Об обобщенной модели Кельвина–Фойгта. Как уже отмечалось ранее, движение несжимаемой жидкости в ограниченной области Ω ⊂ Rn, n = 2, 3, с локальной границей ∂Ω на промежутке времени [0, T], T > 0, описывается с системой урав- нений в форме Коши [41–44]. В данной системе v(x, t) – вектор скорости частицы в точке x в момент времени t и v1, ..., vn – компоненты v; p = p(x, t) – давление жидкости в точке x в момент времени t; f = f(x, t) – вектор внешних сил (их также называют объемными), действующих на жидкость. Через div σ обозначен вектор, координаты которого являются дивергенцией строк матрицы: σ = (σij(x)), где σ – девиатор тензора напряжений. В литературных источниках [40, 42–44] рассматриваются среды, удовлетворяющие обобщенной математической модели Кельвина– Фойгта (порядка L = 1, 2, ...). Она описывается определяющим со- отношением. 18 Предполагается, что корни многочлена вещественны, отрица- тельны и различны. Требование вещественности и отрицательности продиктовано физическим смыслом задачи, а требование различно- сти корней наложено исключительно ради простоты и сокращения вычислений. 5. CОСТАВЛЕНИЕ МАТЕМАТИЧЕСКОГО ОПИСАНИЯ ОБЪЕКТА ПРИМЕНИТЕЛЬНО К УПАКОВОЧНОМУ ПРОИЗВОДСТВУ 5.1. Классификация математических моделей Математические (с использованием компьютеров) модели, в силу своей логичности и строго формального характера, позволяют вы- явить основные факторы, определяющие свойства изучаемых сис- тем, и исследовать их реакции на внешние воздействия и изменения параметров. Часто математические модели использовать проще и удобнее, чем натуральные (физические). Они позволяют проводить вычислительные эксперименты, реальная постановка которых за- труднена или невозможна. Изучение основных принципов матема- тического моделирования является неотъемлемой частью подготов- ки специалистов в технических областях деятельности. Дисциплины, связанные с изучением основных аспектов моделирования объектов и систем, в обязательном порядке входят в соответствующие учеб- ные планы, являясь компонентами образовательных стандартов. Задачей любого исследования, выполненного научными метода- ми, является установление связей между воздействием на некото- рый объект природы или техники и его реакцией на это воздейст- вие. Этому предшествует выделение объекта из окружающего мира, с которым он связан очень большим числом связей, и выявление тех связей или воздействий, которые наиболее существенны с точки зрения предпринимаемого исследования. Именно поэтому оно явля- ется отправной точкой моделирования применительно к упаковоч- ному производству. При исследовании некоторого природного явления очень важен выбор причин и следствий. Это предполагает первичный анализ яв- ления и его замену более упрощенным объектом – моделью явления. Важность предварительного анализа особенно проявляется, когда 19 явление воспроизводится в лабораторных условиях и связи, кажу- щиеся не очень важными, не просто игнорируются, а исключаются. Модель – это упрощенный образ изучаемого явления, создавае- мый для исследования связей между такими его характеристиками, которые нас интересуют в данный момент. Иногда переход к ис- следованию других характеристик приводит к целесообразности использования совершенно не похожих моделей, хотя исследуемое явление остается одним и тем же. Классификация математических моделей представлена на рис. 5.1. МОДЕЛИРОВАНИЕ Физическое Математическое Аналитическое Статистическое Рис. 5.1. Классификация видов моделирования Принято различать физическое и математическое моделирова- ние. Первое из них требует создания, обычно в специальных лабо- раториях, опытной установки, имитирующей объективность про- цесса. При этом физическая модель обычно имеет меньшие разме- ры, чем натуральный объект, но не исключено и обратное поло- жение. Помимо пространственного масштабирования возможно и масштабирование времени, т. е. на модели можно за сравнительно короткое время изучить явление, протекающее в природе долгие годы, и, наоборот, внимательно рассмотреть мгновенно протекаю- щий процесс. Таким образом, при физическом моделировании в упаковочном производстве используется сама система либо подобная ей. Однако физическому моделированию присущи недостатки прежде всего экономического характера. Созданию физической модели пред- шествуют работы по ее проектированию, изготовлению узлов и деталей, монтажу и наладке, оснащению вспомогательным оборудо- ванием. Любая лабораторная установка требует площадей для ее Имитационное 20 размещения и персонала для обслуживания, потребляет энергети- ческие и материальные ресурсы при эксплуатации. Кроме того, диа- пазон изменений исследуемых характеристик на физических моде- лях обычно невелик и ограничивается не только разумностью за- трат на проведение опытов, но и возможностями конструкционных материалов, из которых изготовлена модель. Математическое моделирование в упаковочном производстве пред- полагает эксперименты с математическими моделями явлений. В от- личие от физической модели, которая материальна, математическая модель является логическим объектом. Математическая модель – это упрощенный образ изучаемого явления, записанный с помощью математической символики. Процесс моделирования состоит из математических экспериментов, сущность которых основана на выполнении различных операций над математическими моделями. Обычно это решение систем уравнений или логических задач различного вида и сложности. Таким образом, математическое моделирование – процесс уста- новления соответствия математической модели M реальной систе- ме S и исследование полученной модели с целью изучения харак- теристик реальной системы. Применение математического моделирования позволяет иссле- довать объекты, реальные эксперименты над которыми затруднены или невозможны, т. е. дороги и требуют сложного дорогостоящего оборудования и много времени. В свою очередь, выделяют следующие виды математического моделирования: аналитическое, статистическое, имитационное. На основе протекания различных технологических процессов в упако- вочном производстве к нему применимы указанные виды математи- ческого моделирования. Аналитическое моделирование заключается в том, что процессы функционирования элементов системы записываются в виде мате- матических соотношений (алгебраических, интегральных, диффе- ренциальных, логических и т. д.). Аналитическая модель может быть исследована аналитическим методом, когда устанавливаются явные зависимости, получаются точные решения. Если математиче- ские зависимости, составляющие модель, сложно или невозможно решить аналитически, то прибегают к численным методам, когда получаются приближенные решения. В самых сложных случаях 21 аналитическую модель исследуют качественно, т. е. в явном виде находят не само решение, а его некоторые свойства. Статистическое моделирование – это обработка статистических данных о системе (модели) с целью получения ее искомых харак- теристик. Имитационное моделирование – это воспроизведение на ЭВМ (имитация) процесса функционирования исследуемой системы с со- блюдением логической и временной последовательности протекания процессов, что позволяет узнать данные о состоянии системы или от- дельных ее элементов в определенные моменты времени. Для имита- ции процесса обычно формулируется алгоритм (программа для ЭВМ), что позволяет проводить вычислительные эксперименты. В соответ- ствии с указанными видами моделирования различают и математи- ческие модели – аналитические, статистические и имитационные. Часто вместо термина «статистические» употребляют понятие «эмпирические модели». Математическое моделирование получило особенно широкое распространение в связи с возросшими вычисли- тельными возможностями современных компьютеров. Этот вид мо- делирования свободен от многих недостатков, которыми страдает физическое моделирование. Прежде всего это гораздо более эко- номичный и удобный способ познания. Все эксперименты прохо- дят над нематериальным объектом, существующим в виртуальной действительности. Затратами здесь можно считать использование вычислительных ресурсов и умственного труда человека-исследователя. При математи- ческом моделировании диапазон изменения исследуемых параметров лимитируется только здравым смыслом и правилами математики. Безусловно, создание математической модели и работа с ней тре- буют определенных затрат, но их объем обычно не идет ни в какое сравнение с затратами на создание и эксплуатацию лабораторных установок. Однако следует отметить, что в настоящее время все еще не удается полностью отказаться от услуг физического моделирова- ния, особенно в естественных науках, поскольку некоторые параметры исследуемых процессов могут быть определены только эксперимен- тально. Однако полагают, что при использовании математического моделирования затраты уменьшаются в среднем в несколько раз. В целом при математическом моделировании более развита тео- ретическая основа. Если при физическом моделировании она про- 22 является, как правило, при выдвижении исходной гипотезы и осмыс- лении полученных опытных данных, то при математическом моде- лировании, кроме того, необходимо формализовать (перевести на язык математики и логики) изучаемые свойства, теоретически обос- новать аналогию между моделью и реальным явлением, правильно интерпретировать и обобщить результаты математического экспе- римента. Без этого математическое моделирование перестает быть достоверным источником информации о реальных явлениях. Математическая модель – это совокупность математических объектов – чисел, переменных, матриц, множеств и т. д., а также соотношений между ними. Эта совокупность отражает наиболее важные, с точки зрения исследователя, свойства описываемого объ- екта. Математическое моделирование заключается в математиче- ских экспериментах, сущность которых основана на выполнении различных операций над математическими моделями. В результате моделирования прогнозируются характеристики исследуемого объекта (процесса, вещества, технического устрой- ства, системы), проводится его оптимизация, оцениваются возмож- ности вариантов и т. д. Помимо разделения моделей на приведенные выше классы по принципиальным методам работы с ними (аналитические, статисти- ческие и имитационные) существуют иные виды классификации. В зависимости от целей дальнейшего использования все матема- тические модели можно отнести к одному из двух крупных видов. При исследовании принципов работы исследуемого объекта, характера протекающих процессов, как правило, используются математические модели, отображающие закономерности функционирования объектов. Такие модели называются функциональными. Обычно они представ- ляют собой системы уравнений различного типа. Функциональные модели используются при проектировании объектов и систем. Однако при конструкторских разработках наиболее важными яв- ляются расположение объектов в пространстве, геометрические формы объектов, связи отдельных частей объектов между собой и др. Здесь преобладают математические модели, отражающие струк- турные характеристики. Такие модели называются структурными. Они чаще всего представляются в виде матриц, таблиц, списков, графов и пр. Структурные модели используются при конструиро- вании объектов. 23 При разработках информационных систем преобладают матема- тические модели первого вида, поэтому в дальнейшем мы будем рассматривать именно такие модели. Структурные модели [36] обыч- но используются в системах автоматизированного проектирования. Все функциональные математические модели можно отнести к одному из двух классов по свойствам моделируемых объектов и виду используемого для анализа математического аппарата. Объекты, процессы или системы, на функционирование которых существенное влияние оказывают случайные возмущающие факторы и воздействия, описываются стохастическими (вероятностными) моделями. При работе с такими моделями обычно используют мате- матический аппарат теории вероятностей, информационно-статис- тический или информационно-энтропийный подходы. Объекты (системы), для которых предполагается, что их поведе- ние можно описать однозначно или где можно игнорировать влия- ние случайных факторов, анализируются с помощью детермини- рованных моделей. При работе с ними, как правило, используют методы классической математики и математической физики. 5.2. Параметры моделей и фазовые переменные Среди свойств объекта, отражаемых в математических моделях, следует различать воздействия на объект и его реакцию на эти воздействия. Количественное выражение этих величин осуществ- ляется с помощью параметров. Любой процесс или объект исходя из внешних признаков может быть условно изображен в виде, пред- ставленном на рис. 5.2. Pис. 5.2. Условное изображение объекта моделирования 24 При этом воздействия описываются входными параметрами xi, а реакция объекта моделирования – выходными параметрами уj. Последние характеризуют состояние объекта исследования и опре- деляются суммарным воздействием входных параметров. Среди входных параметров, в свою очередь, можно выделить: – внешние параметры; их значения могут быть измерены, но возможность воздействовать на них отсутствует; – управляющие параметры; на них можно оказывать прямое воздействие в соответствии с теми или иными требованиями, что позволяет управлять процессом; – возмущающие параметры; они изменяются случайным обра- зом и недоступны для измерения. Можно привести следующий пример. Для аудиосистемы внеш- ним параметром является уровень (напряжение) входного сигнала, который можно измерить, но обычно нельзя регулировать. Управ- ляющими параметрами здесь являются коэффициенты усиления, которые можно произвольно менять в некоторых пределах. Возму- щающими параметрами в данном примере следует считать появле- ние случайных помех в канале передачи. В качестве выходных па- раметров аудиосистемы выступают, например, выходная мощность сигнала, потребляемая мощность, величина искажений выходного сигнала и прочее. Пусть объект характеризуют n входных и m выходных параметров. Тогда векторы этих параметров можно обозначить таким образом: X = (x1, x2, ..., xn); Y = (yI, y2, ..., ym). Поскольку свойства объекта зависят от входных параметров, имеет место зависимость Y = F(X). (5.1) Приведенная система соотношений является примером мате- матической модели объекта. Наличие математической модели вида (5.1) позволяет легко оце- нивать выходные параметры по известным значениям вектора X. Однако существование данной зависимости не означает, что она из- вестна и может быть представлена именно в таком явном относи- 25 тельно вектора Y виде. Как правило, такую математическую модель удается получить только для очень простых объектов. Типичной является ситуация, когда математическое описание процессов в ис- следуемом объекте задается в форме системы уравнений, в которой фигурирует вектор фазовых переменных V. Фазовые переменные характеризуют физическое состояние объ- екта, а их изменения во времени выражают переходные процессы в объекте. Наиболее типичным примером фазовых переменных (для упомянутой выше аудиосистемы) являются величины электрическо- го тока и напряжения, поскольку с их помощью можно описать все входные и выходные параметры данного устройства. При моделиро- вании механических систем фазовыми переменными являются силы и скорости, для гидравлических систем – давления и расходы и т. д. На практике довольно часто встречаются случаи, когда объект настолько сложен, что его структура либо неизвестна совсем, либо ее корректное математическое описание невозможно. В таких слу- чаях исследователь вынужден игнорировать внутренние процессы, протекающие в объекте, и анализировать лишь влияние входных параметров на выходные. При этом модели получаются путем об- работки статистических данных и относятся к классу статистиче- ских. Однако в литературе имеется еще одно название для таких математических моделей – модели типа черного ящика. 6. ОСНОВНЫЕ ПОНЯТИЯ СИСТЕМНОГО ПОДХОДА К СОЗДАНИЮ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ Системный подход как новая методология науки и практики сло- жился ко второй половине XX столетия. Он является качественно новым подходом в изучении, проектировании и создании систем. Формирование системного подхода в качестве самостоятельного ис- следовательского направления обусловлено общей тенденцией разви- тия науки и общества, которая сложилась к настоящему времени. Центральным понятием системного анализа является понятие система. При построении математических моделей принципиальное значе- ние имеют свойства систем. Помимо рассмотренных выше видов клас- сификации систем на детерминированные и стохастические, дискрет- ные и непрерывные следует выделить еще ряд характерных признаков. 26 Динамические системы характеризуются тем, что их выходные параметры в данный момент времени определяются характером входных воздействий в прошлом и настоящем (зависит от предысто- рии). В противном случае системы называют статическими [4, 6]. Если параметры системы изменяются во времени, то она называ- ется нестационарной, противоположным понятием является поня- тие стационарной системы. Различают системы линейные и нелинейные. Для линейных сис- тем реакция на сумму двух или более различных воздействий экви- валентна сумме реакций на каждое возмущение в отдельности, для нелинейных это условие не выполняется. Можно выделить следующие основные определения и свойства системы:  система есть совокупность элементов (подсистем); при опре- деленных условиях элементы сами могут рассматриваться как си- стемы, а исследуемая система – как элемент более сложной систе- мы;  связи между элементами в системе превосходят по силе связи этих элементов с элементами, не входящими в систему; это свой- ство позволяет выделить систему из среды;  для любой системы характерно существование интеграцион- ных качеств, которые присущи системе в целом, но не свойственны ни одному ее элементу в отдельности: систему нельзя сводить к простой совокупности элементов;  система всегда имеет цели, для которых она функционирует и существует. В качестве примера можно привести следующее. Если в качестве системы рассматривать экструдер, то входящие в него детали явля- ются элементами системы (подсистемами), т. е. состоят из элемен- тов – подсистем более низкого уровня. Методология системного подхода при решении задач анализа систем состоит в следующем. Задача расчленяется на подзадачи анализа элементов системы. Причем каждый из элементов должен рассматриваться не сам по себе, а во взаимодействии с другими элементами. Решение подзадач должно происходить при условии обеспечения общих целей функ- ционирования всей системы. 27 При создании математических моделей использование систем- ного подхода предполагает выделение нескольких уровней абстрак- ции при описании объекта (системы). Объединение уровней, родст- венных по характеру используемого математического аппарата, приводит к образованию нескольких уровней в иерархии функцио- нальных моделей. Наиболее наглядно это можно продемонстриро- вать на примере моделирования технических объектов. В качестве примера моделей разного уровня, описывающих один и тот же процесс, рассмотрим нагрев твердого тела. Если некоторое твердое тело рассматривать как единую систему, нагревающуюся под действием теплового потока, то процесс можно описать с помощью простого балансового уравнения 0 1 , p T T Q C    (6.1) где Т – конечная температура тела; Т0 – его начальная температура; Ср,  – теплоемкость и плотность материала тела; Q – количество теплоты, полученной телом, отнесенное к его объему. Будем считать модель (6.1) моделью верхнего, самого общего уровня абстракции. Допустим, нас интересует не только конечная температура объ- екта, но и ее изменение во времени, т. е. кинетика процесса нагрева. Тогда следует перейти к более подробному описанию процесса, например, в таком виде: d 1 ( ), d p T q C     (6.2) где q(x) – тепловой поток, отнесенный к единице объема тела;  – время. Для решения приведенного уравнения следует указать закон из- менения во времени теплового потока q() и задать начальную тем- пературу тела: 28 00 .T T   Полученное решение позволит определить изменение темпера- туры тела во времени. Заметим, что модели (6.1) и (6.2) рассматривают тело как единое целое и в них не входят пространственные координаты. Наконец, если исследователю важно провести анализ изменения температуры не только во времени, но и в различных точках про- странства, то следует перейти к еще более подробной детализации процесса. Примем для простоты, что тело имеет форму длинного тонкого стержня. Если пренебречь всеми размерами стержня, кроме его длины, модель можно представить в виде следующего уравнения: 2 2 , p T T C x            (6.3) которое следует дополнить начальными и граничными условиями, описывающими протекание процесса, например такими: 10 ( ); x T f    2( );x lT f   0 ( ),T x    где х – пространственная координата;  – время; 1 – длина стержня. Решение данной модели позволит определить температуру в лю- бой точке стержня в любой момент времени. Проследим, как изменяется вид уравнений математической моде- ли процесса при переходе от одного уровня абстракции к другому. Модель процесса, представленная на верхнем уровне простей- шим алгебраическим уравнением (6.1), усложняется на втором уровне абстракции и принимает вид обыкновенного дифференци- 29 ального уравнения (6.2). Переход к третьему, самому подробному, уровню приводит к необходимости использовать дифференциаль- ное уравнение с частными производными (6.3). Однако за счет усложнения модели мы получаем дополнительную информацию о процессе. Если в первом случае мы можем определить лишь ко- нечную температуру моделируемого объекта, то во втором имеем возможность проследить процесс во времени, считая температуру одинаковой во всем объеме тела. Модель третьего уровня уже позволяет исследовать распределение температуры и во времени, и в пространстве. Безусловно, в данном примере дается чрезвычайно упрощенный подход к описанию процесса, т. е. не рассматривается отдача тепла нагретым телом в окружающую среду. В модели (6.3) процесс рас- сматривается лишь по одной координате, а реальные тела имеют конечные размеры по всем пространственным координатам. Можно добавить и другие условия, не учтенные в примере. Учет этих усло- вий должен привести к появлению новых членов в уравнениях и значительно усложнить их. Однако усложнение математической мо- дели делает ее более адекватной, более приближенной к реальности, хотя и ухудшает ее экономичность [20, 21]. При моделировании технических объектов часто рассмотренные выше модели и уровни абстракции называются следующим обра- зом. Модель вида (6.3) называют моделью микроуровня, вида (6.2) – моделью макроуровня, вида (6.1) – мегауровня. При этом характер- но следующее. 1. На микроуровне абстракции используют математические мо- дели, описывающие физическое состояние и процессы в сплошных средах. Для моделирования применяют аппарат математической физики. Особенностью этих математических моделей является от- ражение процессов, протекающих в непрерывных пространстве и времени. Типичными математическими моделями этого уровня яв- ляются уравнения гидродинамики, теплопереноса, диффузии, упру- гости. Они представляют собой системы дифференциальных урав- нений с частными производными. В них независимыми перемен- ными являются время и пространственные координаты. Такие мате- матические модели часто называют моделями с распределенными параметрами, поскольку в них параметры и фазовые переменные зависят от координат точек пространства. Если в таких уравнениях 30 время как независимая переменная отсутствует, то они описывают стационарный процесс и называются стационарными. Исследова- ние таких моделей сводится к решению краевых задач. Следует за- метить, что, несмотря на полноту описания процесса, возможности применения таких моделей ограничены. Попытки исследовать с их помощью процессы в многокомпонентных средах не всегда успешны из-за чрезмерных вычислений [18, 22, 23]. 2. На макроуровне производится укрупнение дискретизации про- странства по функциональному признаку, т. е. выделяются харак- терные зоны, в которых процесс можно считать не зависящим от пространственных координат. Математические модели на этом уровне представляются в виде систем обыкновенных дифференциальных уравнений [24], где в качестве независимой переменной присут- ствует только время. Данные модели называют моделями с сосре- доточенными параметрами. При рассмотрении стационарного процесса на данном уровне математические модели получают вид систем алгебраических уравнений. Математические модели данного уровня являются универсальными и пригодными к исследованию как динамических, так и статических режимов процесса. 3. На мегауровне с помощью дальнейшего абстрагирования от характера физических процессов удается еще более упростить мо- дель. Обычно в ней фигурируют только фазовые переменные, отно- сящиеся к внешним связям объекта. Типичными моделями этого уровня являются балансовые соотношения в виде систем алгебраи- ческих уравнений [19]. Таким образом, системный подход, как новая методология науки и практики, является качественно новым подходом в изучении, проектировании и создании систем. Формирование системного под- хода в качестве самостоятельного исследовательского направления обусловлено общей тенденцией развития науки и общества, которая сложилась к настоящему времени. При этом особым значением сис- темного анализа является понятие система. При построении математических моделей принципиальное зна- чение имеют свойства систем [18]. Помимо рассмотренного выше деления систем на детерминированные и стохастические, дискрет- ные и непрерывные еще существует классификация по ряду харак- терных признаков. 31 7. МЕТОД ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Линейное программирование — математическая дисциплина, посвященная теории и методам решения экстремальных задач на множествах n-мерного векторного пространства, задаваемых систе- мами линейных уравнений и неравенств [5]. Линейное программирование является частным случаем выпук- лого программирования, которое, в свою очередь, является частным случаем математического. Одновременно оно — основа нескольких методов решения задач целочисленного и нелинейного программи- рования. Одним из обобщений линейного программирования явля- ется дробно-линейное программирование. Многие свойства задач линейного программирования можно ин- терпретировать также как свойства многогранников и таким обра- зом геометрически формулировать и доказывать их. 7.1. Математическая формулировка Нужно определить максимум линейной целевой функции (ли- нейной формы) 1 1 2 2 1 ( ) ... n j j n n j f x c x c x c x c x       при условиях 1 n ij j i j a x b   при i = 1, 2, ..., m. Иногда на xi также накладывается некоторый набор ограничений в виде равенств, но от них можно избавиться, последовательно вы- ражая одну переменную через другие и подставляя ее во всех остальных равенствах и неравенствах (а также в функции f). Такую задачу называют «основной» или «стандартной» в линей- ном программировании. 32 7.2. Примеры задач о максимальном парасочетании 7.2.1. Максимальное сочетание пар Рассмотрим задачу о максимальном парасочетании в двудольном графе: есть несколько значений а и с. Нужно объединить макси- мальное число пар. Введем переменные xij, которые соответствуют паре из i-го зна- чения и j-го значения и удовлетворяют ограничениям: 0 1;ijx  1 2 ... 1;i i nix x x    1 2 ... 1i i imx x x    с целевой функцией 11 12 ... .nmf x x x    Можно показать, что среди оптимальных решений этой задачи найдется целочисленное. Переменные, равные 1, будут соответ- ствовать парам, которые следует объединить. 7.2.2. Максимальный поток Пусть имеется граф (с ориентированными ребрами), в котором для каждого ребра указана его пропускная способность и заданы две вершины: сток и исток. Для каждого ребра нужно указать, сколько через него будет протекать жидкости (не больше его про- пускной способности), так чтобы максимизировать суммарный по- ток из истока в сток (жидкость не может появляться или исчезать во всех вершинах, кроме стока и истока). В качестве переменных xi возьмем количество жидкости, проте- кающей через i-е ребро. Тогда 0 ,i ix c  где ci – пропускная способность i-го ребра. 33 Это неравенство надо дополнить равенством количества втекаю- щей и вытекающей жидкости для каждой вершины, кроме стока и истока. В качестве функции f естественно взять разность между количеством вытекающей и втекающей жидкости в истоке. Обобщение предыдущей задачи — максимальный поток мини- мальной стоимости. В этой задаче даны стоимости для каждого ре- бра и нужно среди максимальных потоков использовать поток с минимальной стоимостью. Задача сводится к двум задачам линей- ного программирования: сначала нужно решить задачу о макси- мальном потоке, а потом добавить к ней ограничение ( ) ,f x m где m – величина максимального потока, и решить задачу с новой функцией f(x) – стоимостью потока. Эти задачи могут быть решены быстрее, чем общими алгорит- мами решения задач линейного программирования, за счет особой структуры уравнений и неравенств. 7.2.3. Понятие минимизации функции Для понятия смысла минимизации целевой функции приведем следующий пример. Имеется некий однородный груз, который нуж- но перевести с n складов на m заводов. Для каждого склада i извест- но, сколько в нем находится груза ai, а для каждого завода известна его потребность bj в грузе. Стоимость перевозки пропорциональна расстоянию от склада до завода (все расстояния cij от i-го склада до j-го завода известны). Требуется составить наиболее дешевый план перевозки. Решающими переменными в данном случае являются xij – коли- чество груза, перевезенного из i-го склада на j-й завод. Они удовле- творяют ограничениям 1 2 ... ;i i im ix x x a    1 2 ... .j j nj jx x x b    34 Целевая функция, которую надо минимизировать, имеет вид 11 11 12 12( ) ... .nm nmf x x c x c x c    7.2.4. Игра с нулевой суммой Есть матрица A размера n  m. Первый игрок выбирает число от 1 до n, второй – от 1 до m. Затем они сверяют числа и первый игрок получает aij очков, а второй ( –aij) очков (i – число, выбранное пер- вым игроком, j – вторым). Нужно найти оптимальную стратегию первого игрока. Пусть в оптимальной стратегии, например первого игрока, число i нужно выбирать с вероятностью pi. Тогда оптимальная стратегия яв- ляется решением следующей задачи линейного программирования: 0 1;ip  1 ... 1;np p   1 1 2 2 ... ( 1, ..., ),i i ni na p a p a p c i m     в которой нужно максимизировать функцию 1( , ... , , ) .nf p p c c Значение c в оптимальном решении будет математическим ожи- данием выигрыша первого игрока в наихудшем случае. Алгоритмы решения Наиболее известным и широко применяемым на практике для решения общей задачи линейного программирования (ЛП) является симплекс-метод. Несмотря на то, что симплекс-метод является до- статочно эффективным алгоритмом, показавшим хорошие резуль- таты при решении прикладных задач ЛП, он является алгоритмом с экспоненциальной сложностью [5, 7]. Причина этого состоит в ком- бинаторном характере симплекс-метода, последовательно переби- 35 рающего вершины многогранника допустимых решений при поиске оптимального решения. Первый полиномиальный алгоритм, метод эллипсоидов, был пред- ложен в 1979 году советским математиком Л. Хачияном, разрешив- шим таким образом проблему, долгое время остававшуюся нере- шенной. Метод эллипсоидов имеет совершенно другую, некомби- наторную природу, нежели симплекс-метод. Однако в вычисли- тельном плане этот метод оказался неперспективным. Тем не менее сам факт полиномиальной сложности задач привел к созданию це- лого класса эффективных алгоритмов ЛП — методов внутренней точки, первым из которых был алгоритм Н. Кармаркара, предло- женный в 1984 году. Алгоритмы этого типа используют непрерыв- ную трактовку задачи ЛП, когда вместо перебора вершин много- гранника решений задачи ЛП осуществляется поиск вдоль траекто- рий в пространстве переменных задачи, не проходящих через вер- шины многогранника. Метод внутренних точек, который в отличие от симплекс-метода обходит точки из внутренней части области допустимых значений, использует методы логарифмических барь- ерных функций нелинейного программирования, разработанные в 1960-х годах Фиако (Fiacco) и МакКормиком (McCormick). 7.3. Решение задач оптимизации При решении ряда технических задач выражение для критерия оптимальности может быть представлено в виде линейной функции от входящих в него оптимизирующих переменных. При этом на оп- тимизирующие переменные также могут быть наложены некоторые ограничивающие условия в форме линейных равенств или нера- венств. Для решения оптимизационных задач в такой постановке используется метод линейного программирования [7]. Целевая функция записывается в виде линейной зависимости от оптимизирующих параметров F = с1х1 + c2х2 + … + сnх n 1 , n i i i c x   (7.1) где сi – заданные постоянные коэффициенты. 36 Накладываемые ограничения в виде равенств и неравенств также должны быть представлены в линейной форме: 11 1 12 2 1 1 21 1 22 2 2 2 1 1 2 2 ... ; ... ; ... . n n n n m m mn n m a x a x a x b a x a x a x b a x a x a x b               (7.2) В сокращенной записи имеем 1 , n ji i j i a x b   i = 1, 2, …, n; j = 1, 2, …, m. Коэффициенты ci и aji в системе (7.2) являются действительными числами и могут быть положительными и отрицательными, среди них могут быть и равные нулю. Число ограничений типа равенств не должно превышать общего числа оптимизирующих переменных. Число неравенств может быть произвольным. В задачах линейного программирования обычно предполагают, что оптимизирующие переменные неотрицательны, т. е. xi ≥ 0, i = 1, 2, ..., n. Также считают, что все величины bm в выражениях (7.2) отличны от нуля и положительны. Если какое-либо значение bm окажется отрицательным, то умножая правую и левую части соот- ветствующего выражения на –1, его приводят к виду, когда правая часть становится положительной. Если какая-либо величина bm ока- зывается равной нулю, то в левую и правую части соответствующего выражения (7.2) добавляется слагаемое хn + 1, что делает величину bm отличной от нуля. При этом считают, что добавленное слагаемое вошло и в выражение (7.1), но c нулевым коэффициентом (сn+1 = 0), что не изменяет выражения для целевой функции. Оптимальным решением задачи линейного программирования является такая совокупность значений независимых переменных, которая удовлетворяет условиям (7.2) и обеспечивает, в зависи- мости от постановки задачи, минимальное или максимальное значе- ние целевой функции (7.1). Обычно считают, что оптимум достигается при максимальном значении функции (7.1). Случай, когда требуется найти минималь- 37 ное значение функции (7.1), может быть сведен к задаче максими- зации путем изменения знаков у всех коэффициентов ci, т. е. max (c1x1 + c2x2 + … + cnxn) = –min (–c1x1 – c2x2 – … – cnxn). Решение задачи оптимизации целевой функции (7.1) при двух оп- тимизирующих параметрах x1 и x2 наиболее просто и может быть осу- ществлено графически. В качестве примера рассмотрим функцию F = 3х1 + 5х2, которую нужно максимизировать при ограничении 2х1 + 4x2 ≤ 8 и х1 ≥ 0, х2 ≥ 0. Очевидно, что при наложенных ограничениях оптимальные значе- ния х1 и x2, соответствующие максимуму целевой функции, не могут находиться за пределами заштрихованной области (рис. 7.1), ограни- ченной прямой 2х1 + 4х2 = 8 и координатными осями. Минимальная величина целевой функции для координат заштрихованной области F = 3х1 + 5х2 = 0, что соответствует показанной на рис. 7.1 пунктирной прямой, про- ходящей через начало координат. Рис. 7.1. Решение задачи оптимизации целевой функции 38 Имеется семейство прямых, параллельных данной, каждая из ко- торых соответствует различным значениям функции F. Как показа- но на рис. 7.1, наибольшее возможное значение F соответствует пунктирной прямой, проходящей через точку с координатами x2 = 0 и х1 = 4. Таким образом, окончательно имеем Fmax = 3 . 4 + 5  0 = 12. В рассмотренном примере максимальное значение функция при- нимает на одной из вершин контура, ограничивающего область допу- стимых значений оптимизирующих параметров. Данное обстоятель- ство является характерным для такого типа задач. Иногда возможны случаи, когда решению задачи соответствует бесконечный набор зна- чений оптимизирующих переменных. Геометрическая интерпретация таких вариантов заключается в том, что одна из границ многоугольни- ка области возможных изменений переменных параллельна линии F, определяемой выражением критерия оптимальности. При числе оптимизирующих параметров свыше трех получить графическое решение невозможно [5, 8]. Для таких случаев разра- ботаны различные итерационные приемы расчета, которые реали- зуются на ЭВМ. 7.4. Условия Каруша–Куна–Таккера В теории оптимизации условия Каруша–Куна–Таккера – необ- ходимые условия решения задачи нелинейного программирова- ния. Чтобы решение было оптимальным, должны быть выполнены некоторые условия регулярности. Метод является обобщением метода множителей Лагранжа. В отличие от него ограничения, накладываемые на переменные, представляют собой не уравнения, а неравенства. Кун и Таккер обобщили метод множителей Лагранжа (для ис- пользования при построении критериев оптимальности для задач с ограничениями в виде равенств) на случай общей задачи нелиней- ного программирования с ограничениями как в виде равенств, так и неравенств. 39 Постановка задачи Рассмотрим задачу нелинейной оптимизации min ( ) x X f x  при условиях ( ) 0, 1... .g x i m  Вильям Каруш в своей дипломной работе нашел необходимые условия в общем случае, когда накладываемые условия могут со- держать и уравнения и неравенства. Независимо от него к тем же выводам пришли Гарольд Кун и Альберт Таккер. Необходимые условия минимума функции. Если ˆ arg minx f при наложенных ограничениях — решение задачи, то найдется ненулевой вектор множителей Лагранжа mR такой, что для функции Лагранжа 1 ( ) ( ) ( ) m i i i L x f x g x     выполняются условия: стационарности ˆmin ( ) ( ); x L x L x дополняющей нежесткости ˆ( ) 0, 1... ;i ig x i m   неотрицательности 0, 1... .i i m   40 Достаточные условия минимума функции: перечисленные необ- ходимые условия минимума функции в общем случае не являются достаточными. Существует несколько вариантов дополнительных условий, которые делают их достаточными. Простая формулировка: если для допустимой точки xˆ выполня- ются условия стационарности, дополняющей нежесткости и неот- рицательности, а также λ1 > 0, то ˆ arg min .x f Более слабые условия: если для допустимой точки xˆ выполня- ются условия стационарности, дополняющей нежесткости и неот- рицательности, а также : ( ) 0,ix g x  1...i m (условие Слейтера), то ˆ arg min .x f 8. МОДЕЛИРОВАНИЕ ЭКСТРУЗИОННЫХ ПРОЦЕССОВ В УПАКОВОЧНОМ ПРОИЗВОДСТВЕ Известно, что качество конечного целевого продукта в упаковоч- ном производстве зависит от процессов плавления, течения и сме- шения полимера. Совершенствование оборудования и процесса про- изводства сегодня требует больших затрат времени и средств. Обычно при моделировании технологических процессов важной задачей является описание поведения полимера с помощью моде- лей. В настоящее время в технологии переработки полимеров про- исходящие процессы в основном смоделированы и связаны с запол- нением литьевой формы, оценкой ориентации, усадки и коробле- нием изделия и экструзией с учетом вязкости. При этом только небольшое число трехмерных моделей было применено к изучению реальных процессов. 41 В настоящее время удачно смоделировано значительное число процессов переработки полимерных материалов для изготовления упаковки, начиная от заполнения литьевой формы, оценки ориента- ции, усадки и коробления изделия, а также экструзии полимеров с учетом вязкоупругих эффектов. Оказалось, что применительно к реальным условиям процесса было изучено лишь небольшое число трехмерных моделей. Суще- ственный недостаток моделирования трехмерного процесса состоит в том, что при точном представлении геометрической формы устрой- ства требуется большой объем вычислений и хранения полученных данных [10]. Возникают задачи, которые связаны с движущимися свободными границами и характерны для загрузки расплава, разбухания экстру- дата, нанесения покрытий и т. д. При условии полного заполнения устройства движущиеся твердые границы появляются в тех местах, где полости, содержащие полимер, во время процесса изменяют форму. Это относится к местам, где находятся вращающиеся лопасти в сме- сителе периодического действия, или шнек и перемешивающие эле- менты в одношнековом экструдере. Очень сложным процессом явля- ется смешение в двухшнековом экструдере, так как полимер постоян- но меняет форму при вращении шнеков, смесительных элементов и головок. Для предсказания конечной морфологии полимеров необхо- димо рассматривать полное моделирование протекающих процессов в одношнековом и двухшнековом экструдерах. К таким процессам от- носятся плавление, движение расплава, смешение и течение в головке, что представляет самую сложную задачу при переработке полимеров. Необходимо учитывать теплотехнические процессы. Такие процессы происходят в технической термодинамике [36]. При этом следует включать сварку при соединении потоков и частично заполнение объемов. Моделирование этих указанных протекающих процессов является одной из самых сложных задач при переработке полимеров. Для решения подобных задач сложные геометрические формы и условия переработки следует упрощать до вида, который уже можно смоделировать при использовании двумерных моделей. В на- стоящее время использование более мощных компьютеров и техни- ки, новых эффективных методик вычислений делает возможным моделирование трехмерных задач для сложных геометрических форм со сложным (нелинейным) поведением полимеров. 42 8.1. Планирование модельных экспериментов для упаковочного производства Известно, что для производства упаковки используется различ- ное оборудование. Причем технологический процесс при изготов- лении упаковки включает различное воздействие на полимеры: тер- мическую деструкцию, особенности реологического поведения рас- плава, изменение структуры. При этом моделирование процессов в условиях управления технологическими процессами, с целью эко- номии энергии, имеет определенное значение. Особое значение эко- номии энергетических ресурсов следует уделять в упаковочном производстве, когда для изготовления упаковки используется пере- работка полимеров в процессе экструзии. Для того чтобы планировать указанные выше особенности упа- ковочного производства, необходимо на этапе планирования экс- перимента знать, к какому классу относится моделируемая система: она динамическая, стохастическая или детерминированная и т. п. Кроме того, необходимо знать режим работы: стационарный или нестационарный, в течение какого промежутка времени следует наблюдать за функционированием системы. Следует также знать объем испытаний (объем повторных экспериментов), который смо- жет обеспечить требуемую точность оценок исследуемых харак- теристик. Планирование модельных экспериментов преследует следующие основные цели: уменьшение количества испытаний при соблюдении требований к достоверности, точности и воспроизводимости полученных ре- зультатов; повышение информации каждого из экспериментов в отдельности. Из всех допустимых вариантов плана следует выбирать такой, который: позволил бы получить наиболее достоверное значение функции отклика при фиксированном числе опытов (стратегическое плани- рование); имеет статистическую оценку функции отклика, полученную при минимальном количестве испытаний (тактическое планирование). 43 8.2. Использование пакета MATLAB для моделирования технологических процессов упаковочного производства Одним из важных преимуществ пакета MATLAB является то, что в простейшем случае для его использования достаточно исполь- зовать знаки математических операций. Один из важных факторов MATLAB – средство математического моделирования, которое обес- печивает проведение исследований и в упаковочном производстве. Сама же структура пакета позволяет рационально и более эффек- тивно сочетать два основных подхода к созданию аналитической и имитационной моделей. Моделирование MATLAB представляет средство математиче- ского моделирования, позволяющее сполна использовать все совре- менные достижения компьютерных технологий [11, 12, 27]. При этом используются средства визуализации и аудификации данных, имеется возможность обмена полученных данных через Интернет. Из названия пакета следует, что он ориентирован в основном на обработку массивов данных (векторов и матриц). Так как MATLAB [13] предоставляет в распоряжение пользователя универсальный язык объектно-ориентированного программирования в сочетании с интерактивными средствами отладки программ, его использова- ние для моделирования технологических процессов в упаковочном производстве весьма перспективно [25, 26]. 8.3. Диффренциальное уравнение теплопроводности конечного цилиндра для составления алгоритма 8.3.1. Особенность построения математических моделей для описания термодинамических процессов Разработанные методы анализа термодинамики процессов позво- ляют устанавливать определенную связь между основными пара- метрами технологии, такими как температура, давление, плотность [28–31, 36]. Математические модели процессов теплопередачи бази- руются на основе математического аппарата, разработанного в ис- следованиях теплопроводности в твердых телах [28, 29, 38]. Из- вестно, что все термодинамические функции и теплофизические 44 характеристики полимеров существенно зависят от температуры и давления [10, 34], a поэтому при построении моделей реальных процессов особое внимание необходимо обращать на правильный выбор средних значений соответствующих характеристик. 8.3.2. Cоставление алгоритма Для решения дифференциального уравнения теплопроводности бесконечного цилиндра воспользуемся методом сеток, суть которо- го заключается в разбиении координатной плоскости на равные части и вычислении значения искомой функции в узлах образуемой сетки [14, 15]. Используя значения функции в крайних точках, можно последовательно вычислить ее значение в любой части ко- ординатной плоскости. В общем случае, когда температура зависит от координат x, y, z, дифференциальное уравнение теплопроводно- сти конечного цилиндра имеет вид 2 2 1 . T T T a t r rr            Заменим частный дифференциал разностным отношением       , , ,1 . T t r rT t r T t r a t r r r                      Осуществим следующее преобразование функции    , , :i if t r f t r       , , ,1 . i i i i T t r rT t r T t r a t r r r                      45             1 1 1 1 1 , , , , , ,1 i i i i i i i i i i i i i T t r T t r rT t r T t r T t r T t r a t r r r                                        2 1 1 1 , , , , , ,1 i i i i i i i i i i i i i T t r T t r T t r T t r T t r T t rra r r r                               2 1 1 2 , 2 , , , ,1 ; i i i i i i i i i i i T t r T t r T t r T t r T t r a r rr               1 1 1, ,i i i iT t r T t r    (8.1)          2 1 1, 2 , , , , . i i i i i i i i i i i T t r T t r T t r T t r T t ra t r r r            Затем уравнение (8.1) подготавливают для рекуррентного вычис- ления в MATLAB V6 и проводят переобозначения. В результате последовательных вычислений можно получить мас- сив Т, характеризующий температурное поле неограниченного ци- линдра в любой момент времени. 1. Сама программа начинается с задания следующих перемен- ных: начального и конечного моментов времени, радиуса цилиндра и числа его разбиений, констант, которые характеризуют тепловые и физические свойства полимера. 2. Вторым этапом является вычисление шага аргументов, исполь- зуемого для вычисления исходной функции. 3. Третьим этапом являются краевые условия, когда значения искомой функции в начальный момент времени t0 = 0 изменяются в зависимости от радиуса, при этом температуры стенки литнико- вого канала задаются циклом For. 46 4. Следует иметь в виду, что каждый элемент вектора, который характеризует температурное поле в начальный момент времени, обозначает значение температуры, вычисленное как значение функ- ции распределения, относящейся к циклу. При этом число циклов присвоения значений вектору возрастает вдвое, так как его элемен- тов на один должно быть больше, чем число интервалов разбиений, и на одно значение больше, чтобы можно было вычислить значение массива в центре цилиндра после перехода от внутреннего цикла к внешнему. 5. Пятым условием является то, что каждому элементу вектора, который характеризует температуру стенки канала в любой момент времени, присваивается постоянное значение температуры. Причем число циклов присвоения значений вектору увеличивают на один, так как его элементов должно быть на один больше, чем число интервалов разбиений. 6. С целью вычисления матрицы, определяющей температуру цилиндра по радиусу в любой момент времени, используют два вло- женных цикла For. При этом во внутреннем цикле предусматривают изменение радиуса цилиндра с вычислением температурного поля в заданный момент времени. 7. С переходом к внешнему циклу отсчет времени возрастает на единицу, а значение производной температуры по радиусу в любой момент времени равно 0, и поэтому для учета еще одного краевого условия при переходе от внешнего цикла к внутреннему значение последней температуры принимается большим в два раза. 8. После получения матрицы строят график. Для удобства поль- зования необходимо, чтобы координатные оси были проградуиро- ваны соответствующим образом переставлением столбцов в матри- це температур, что осуществляется при использовании двух пере- менных циклов. Затем осуществляется построение графика с гра- дуировкой его осей. 8.4. Составление программы Программа для MATLAB V 6.0 R 12 начинается с очищения переменных графических окон функций и окна вывода результата. Для простоты программы в использовании и приспособлении к любым задачам покажем порядок вычисления: 47 задаются переменные; рассчитываются интервалы изменения температуры и радиуса; присваиваются начальные значения температуры стенки в цик- ле For; присваиваются начальные значения температурного поля поли- мера в цикле; рассчитывается матрица температурного поля Т во вложенном цикле For; изменяется порядок расположения столбцов путем обработки массива в двойном цикле For; строится поверхность, описывающая полученную функциональ- ную зависимость Т (t, r); подписываются координатные оси: х, y, z (label). 8.5. Анализ моделирования и расчетов В результате численного решения дифференциального уравне- ния с помощью составленной программы полученные данные хоро- шо согласуются с его аналитическим решением. Результаты, полученные с помощью данной программы, можно использовать для моделирования реальных технологических про- цессов, связанных с нагреванием и охлаждением цилидрических каналов применительно к упаковочному производству. 8.6. Методы, применяемые для анализа и моделирования экструзионных процессов При полном описании исследуемого явления задача может иметь аналитическое решение, если некоторое уравнение почти полностью описывает исследуемое явление. С помощью некоторых допущений при ограничении области исследуемой задачи при наличии более реальных положений могут применяться аналитические методы. Для технологии в упаковочном производстве важны предполагаемые значения параметров получаемого изделия, температуры расплава и изменения давления вдоль длины шнека. Однако компьютерное моделирование может дать большую информацию, т. е., например, содержание твердого материала в расплаве и ширину твердой проб- ки. По мере плавления материала твердая пробка занимает все боль- 48 шую часть канала. В результате в идеальном случае на выходе из экструдера не должно оставаться твердого полимера. Из литературных данных известно, что изменение конструкции шнека, материала или условий переработки может привести к cовер- шенно иному профилю границ твердой пробки. Использование про- цесса моделирования для данного случая указывает на то, что шири- на области, занимаемой твердым материалом, снижается значительно медленнее, а само плавление не заканчивается почти до самого конца шнека. Это менее желательный вариант, так как есть вероятность того, что часть материала может не расплавиться и не перемешаться с остальной его массой до самого выхода из экструдера. Если умень- шение содержания твердого материала происходит медленнее, чем снижение давления в шнеке, то в этом случае объем канала умень- шается быстрее, чем объем твердой фазы материала. В результате происходит закупорка канала и резкое ускорение перемещения или разрывы в твердой фазе. Поэтому в настоящее время при конструи- ровании экструзионных систем чаще всего используют аналитиче- ские методы для моделирования процесса экструзии. Описание и моделирование процесса движения полимера в одношнековом экструдере Рассмотрим трехмерную математическую модель процессов те- чения и теплообмена расплавленного полиэтилена в зоне дозирования одношнекового экструдера, учитывая нелинейные свойства материала, вынужденную конвекцию расплава и распространение тепла. Переработка полимеров и создание для этого оборудования, не- обходимого для производства упаковки, является одним из важней- ших направлений в упаковочной отрасли современной промыш- ленности. При этом особое значение это имеет для переработки пластических масс методом экструзии, основным преимуществом которой является непрерывность процесса и возможность его сов- мещения с другими технологиями. Наиболее применяемыми маши- нами для переработки полимеров в технологическом процессе яв- ляются одночервячные пластифицирующие экструдеры. В соответствии с технологическим процессом в зоне пластици- рующего экструдера находится только жидкая фаза. Для построе- ния математической модели процессов течения и теплового обмена 49 полимера в расплавленном состоянии в зоне дозирования винтового канала экструдера (рис. 8.1) применяют следующие упрощающие предположения. Предполагают, что процесс является стационарным при постоянном массовом расходе; винтовой канал разворачивается на плоскость с использованием принципа обращенного движения (рис. 8.2), причем силами массы в сравнении с силами вязкого тре- ния, а также утечками жидкости через зазор пренебрегают. В резуль- тате процесс движения и теплообмена полимера в винтовом канале экструдера упрощается, и его можно моделировать тепломассопере- носом материала в длинном прямоугольном канале, верхняя стенка которого движется с постоянной скоростью 0, равной окружной скорости червяка, под углом нарезки винтовой линии к оси канала. Рис. 8.1. Схема винтового канала экструдера Рис. 8.2. Схема развернутого винтового канала 50 С учетом указанных выше допущений составляется система диф- ференциальных уравнений в декартовой системе координат, кото- рая описывает движение и теплообмен полимера в канале червяка и получена на основании законов сохранения массы, количества движении и энергии [45]. Cвязь тензора напряжений и тензора скоростей деформаций оп- ределяется реологическим уравнением состояния. При этом компо- ненты тензора напряжений для несжимаемой жидкости расположе- ны в декартовой системе координат. Решение системы в виде полей скорости и температуры осу- ществляется при заданной геометрии исследуемой области и совокуп-ности краевых условий. На входе в канал задается известное распределение температуры, а на внутренней поверхности корпуса и на шнеке – распределение температуры, которая определяется условиями технологии при пе- реработке полимерного материала [45–47]. Граничные условия для составляющих скоростей определяются из условия прилипания жидкости к твердым непроницаемым поверх- ностям: стенкам канала и поверхности раздела фаз (см. рис. 8.2). Сами же расчеты проводятся в режиме заданного расхода. Задача решается численным методом конечных элементов с по- мощью программного комплекса ANSYS FLUENT, a разбивка на ко- нечные элементы была произведена в программе ICEM CED [40–43]. Геометрические размеры канала приведены в табл. 8.1. Таблица 8.1 Геометрические размеры канала п µ0 Т0 β Р λ С – Пасn оС 1/°С кг/м3 Вт/(м°С) Дж/(кг°С) 0,44 10825 160 0,018 779,0 0,182 2400 Температура расплава полиэтилена на входе в канал составляет 180 С, а на границах канала – 200 С при скорости вращения шнека 51 60 об/мин. Согласно данным, приведенным в [46, 47], исследования были проведены для переменной производительности экструдера G0 c ее изменением в диапазоне от 0,05 до 0,2 кг/с. На рис. 8.3 приведена напорно-расходная характеристика одно- шнекового экструдера, из которой видно, что с увеличением давле- ния на выходе возрастает его расход. При этом поле компоненты скорости z cостоит из суммы напорной и вынужденной состав- ляющей расходов. Возрастание производительности экструдера при неизменной вынужденной составляющей расхода приводит к увели- чению напорной составляющей расхода и к снижению градиента давления, а поэтому давление на выходе уменьшается. Давление на выходе, МПА Рис. 8.3. Зависимость изменения давления на выходе из канала при изменении расхода Изменение температуры расплава полиэтилена на выходе пред- ставлено на рис. 8.4, т. е. температура полимера на выходе больше заданной на границе канала. Это может быть связано с тем, что большую роль в разогреве материала играет диссипация тепла в результате влияния работы сил вязкого трения. С возрастанием про- изводительности экструдера снижается среднее время пребывания полимера в канале, и в результате этого температура на выходе уменьшается. Р ас х о д , к г/ с 52 Расход, кг/с Рис. 8.4. Зависимость изменения температуры на выходе при изменении расхода Таким образом, рассмотренную трехмерную математическую модель можно использовать для моделирования технологических процессов на основе исследования процессов тепло- и массопере- носа в винтовых каналах зоны дозирования пластицирующих экст- рудеров и шнековых насосов. 8.7. Численные методы Для предсказания и моделирования сложных полимерных пото- ков необходимо понимание основных математических законов, которым подчиняется движение потока. При этом независимо от их сложности перемещение потока материала должно подчиняться не- которым общим физическим законам, которые могут быть выраже- ны в математической форме (как условия сохранения массы, энер- гии и момента). Здесь (в дополнение к этим законам сохранения) может быть составлено одно или несколько уравнений состояния, описывающих свойства материала, например вязкость и текучесть. В связи с тем что данные уравнения могут быть зависимыми (на- пример, вязкость и текучесть зависят от температуры), их решение усложняется. Для проведения моделирования следует четко сфор- мулировать физическую задачу, использовать в ней математические уравнения и решить их для предсказания поведения потока. Не- Т ем п ер ат у р а н а в ы х о д е, С 53 смотря на наличие уравнений сохранения некоторых простых дву- мерных форм, для которых имеются аналитические решения, для решения более сложных двумерных задач и при необходимости трехмерного анализа используют численные методы. Кроме использования аналитических решений существуют три основных численных метода, которые часто используются для ре- шения сложных задач течения жидкостей (применительно к рас- плаву материала) [16, 17]. Это метод конечных разностей, конечных элементов, граничных элементов. Указанные методы имеют свои преимущества и недостатки, а поэтому может быть выбран для конкретного типа процесса или материала и в той или иной форме применен для конкретных задач при переработке полимеров. 8.7.1. Метод конечных разностей Вначале создается сетка, а затем определяющие дифференциаль- ные уравнения записывают в дискретной форме и применяют к каж- дой точке узла. В результате полученная система алгебраических уравнений решается стандартным методом Гаусса или с помощью более сложных численных алгоритмов. Метод конечных разностей хорошо поддается программированию при малом времени вычис- лений. В связи с дискретизацией используемых определяющих урав- нений в начале анализа (при их дифференцировании) возникают ошибки, сказывающиеся на процессе вычислений. Поэтому при по- лучении сходящегося решения методом конечных разностей в про- цессе решения нелинейных задач могут возникать определенные сложности. При этом метод конечных разностей плохо подходит для моделирования задач с движущимися твердыми границами. Для решения дифференциального уравнения теплопроводности исполь- зуют метод сеток, суть которого заключается в разбиении коорди- натной плоскости на равные части и вычислении значения искомой функции в узлах образуемой сетки. Используя значения функции в крайних точках, можно последовательно вычислить ее значение в любой части координатной плоскости. В результате получают уравнение для рекуррентного вычисления в МATLAB V 6,0, а затем составляется программа для МАTLAB V 6,0 R 12, которая начина- ется с очищения переменных графических окон функций и окна вывода результата (для практических занятий студентов). 54 8.7.2. Метод конечных элементов Как и метод конечных разностей, метод конечных элементов используется для дискретизирования области, в которую входит геометрическая форма, подлежащая моделированию, на узлы и эле- менты. Сетка представляет дискретизацию, которая необходима для метода конечных элементов при моделировании двумерной геомет- рической области [30]. В литературе имеются данные по моделированию формы при литьевом прессовании, когда для представления начальной стадии процесса используется сетка конечных элементов. Эту же самую сетку использовали после каждого временного шага заполнения формы, что было выполнено путем вычисления методом конечных элементов, который использовался для перемещения узлов свободных фронтов потока в качестве граничных условий. В литературных источниках также имеются данные о разработке других схем создания сетки. 8.7.3. Метод граничных элементов В отличие от методов конечных разностей и конечных элементов метод граничных элементов требует дискретизации только поверхно- стей геометрических форм. Причем двумерная форма требует дис- кретизации только кривой, образующей границу изделия. Метод граничных элементов получил распространение, как и метод конеч- ных элементов, но требует использования относительно сложных математических средств. Использование метода граничных элементов начинается с формулировки определяющих уравнений различной формы, выраженных в виде различных интегралов по области. Затем эти интегралы преобразуют по Грину–Гауссу для приведения к ин- тегралам по контуру. В свою очередь, интегралы представляются в численной форме для получения системы алгебраических уравнений. Основное преимущество этого метода при моделировании течения полимера в сложных геометрических формах заключается в сниже- нии размерности. Однако используемое точное решение зависит от используемой модели материала, что ограничивается ньютоновским течением. В литературе имеются данные о разработке разновидности метода граничных элементов, который способен учитывать нелиней- ности при использовании только условий на границах. 55 8.8. Методы построения сеток для задач с движущимися границами Особая основная сложность появляется при моделировании про- цесса смешения, обусловленная изменяющейся свободной поверх- ностью или проблемой движения твердых границ в процессе, когда материал непрерывно изменяет форму, заставляя на каждом вре- менном шаге вновь определять геометрию интересующей нас об- ласти. Вновь определять сетки конечных элементов или решетки конечных разностей – наиболее трудная и утомительная часть мо- делирования при решении задач с движущимися границами. В литературе изложена процедура редактирования решетки (ее динамический генератор) при моделировании процесса литья под давлением. Моделирование заполнения формы при литьевом прес- совании использует сетку конечных элементов для представления стадии процесса, происходящего в начальной стадии. Исследователи модифицировали метод сетки для анализа потока при моделировании неизотермического течения неньютоновских жидкостей внутри трехмерных областей с использованием конеч- ных элементов. При этом используются стандартные методы сборки конечных элементов при записи системы линейных алгебраических уравнений. 8.9. Моделирование трехмерных потоков двумерными моделями Тепло- и массоперенос в полимерных процессах по существу трехмерный. При отбрасывании или аппроксимации одного из из- мерений происходит некоторая потеря точности. Однако, несмотря на это, моделирование подобного типа дает вполне удовлетвори- тельное понимание процесса, которое в течение многих лет исполь- зуется при конструировании полимерных изделий и для оптимиза- ции операций переработки. 8.9.1. Моделирование течения в периодических смесителях при помощи двумерных моделей Известно, что в смесителе Бенбери содержатся устройства, имею- щие вид спиральных лопастей. При работе такого смесителя создается 56 сложное нестандартное течение расплавленного полимера. В указан- ном смесителе течение расплавленного полимера происходит в на- правлении оси двух роторов. При этом основное перемешивание происходит при перетекании полимера из одной камеры в другую. Для характеристики и анализа перемешивания, происходящего в процессах данного типа, в указанных аппаратах обычно исполь- зуют двумерную модель. С целью характеристики потока и оценки эффективности перемешивания использовали показатель , опреде- ляемый как  = скорость деформации / скорость деформации + вращения. При этом величина  = 0,5 соответствует простому сдвигу, а значения 0 и 1 – чистому вращению и одноосному удлинению. При смешении жидкостей с высокими значениями отношения вязкостей продольные течения полимеров более эффективны, чем сдвиговые потоки. Таким образом, в результате моделирования было установлено, что в области высоких значений  реализуется эффективное раз- рушение агломератов в жидкости. 8.9.2. Моделирование потоков в экструдере с помощью двумерных моделей В технологическом процессе производства на определенном эта- пе практически все полимеры несколько раз проходят через экст- рудер. При исследовании процессов, происходящих в экструдере, требуется затрата времени и средств. В связи с этим для сокраще- ния затрат и времени привлекают численное моделирование. Однако экспериментальные условия порой трудно контролировать и изме- рять. Неожиданно появляются непредсказуемые переменные, кото- рые возникают из-за утечек. Экструдер может иметь один или несколько шнеков. Обычно экструдеры этого типа могут иметь шнеки, вращающиеся в одном или в противоположном направлении. Однако движение жидкости, создаваемое двумя противоположно вращающимися шнеками, – обычно сложная задача как для эксперимента, так и для моделиро- 57 вания. В этом случае для слежения за частицами может быть ис- пользовано моделирование движущихся твердых границ. Для двумерных граничных элементов использовали моделиро- вание с целью анализа поперечного течения в нескольких двухшне- ковых экструдерах с шнеками различных форм, вращающимися как в одном, так и противоположном направлениях. При моделировании смешивания нескольких жидкостей следует учитывать две важные характеристики, а именно – вязкость каждой жидкости и поверхностное натяжение. Более подробно моделиро- вание течения в периодических смесителях описано в соответству- ющей литературе. 8.9.3. О моделировании течения в экструзионной головке с помощью двумерных моделей Известно, что при переработке полимерных материалов исполь- зуют различные типы экструзионных головок: круглые, щелевые, кабельные, профильные и пр. При этом конструирование головок – самая сложная задача, которая выполняется методом проб и оши- бок, а многие особенности течения полимеров через фильеру голов- ки оказывают влияние на качество целевого продукта. Большая сложность, возникающая при создании приемлемых конструкций головки, делает моделирование и оптимизацию важным средством, которое желательно использовать до того, как спроектированная конструкция найдет воплощение в металле. Применяя моделиро- вание, можно лучше понимать процесс и контролировать парамет- ры переработки, влияющие на качество целевого продукта. В на- стоящее время имеется большое количество опубликованных работ, относящихся к оптимизации фильер. С целью оценки влияния отношения вязкостей, т. е. вязкости внешнего слоя по отношению к вязкости внутреннего, при моде- лировании течения полимеров через фильеру использовали метод конечных элементов. В результате при использовании модели нью- тоновского течения было обнаружено, что при отношении вязкостей (примерно равного 0,2) возникает обширная область циркуляции. При моделировании течений полимера с интенсивной конвен- цией наряду с элементами высшего порядка использовали специ- альный метод. В результате было установлено, что линии течения 58 для неизотермического случая были в основном идентичны изотер- мическому случаю, т. е. моделирование изотермического течения достаточно точно предсказывает ожидаемую сущность процесса. 8.10. Трехмерное моделирование Сложные трехмерные геометрические формы, которые типичны для оборудования при переработке полимерных материалов, литье- вых форм и экструзионных головок, значительно затрудняют ана- лиз полей скоростей при помощи двумерных моделей. Проведение экспериментов часто дает обоснованное понимание проблемы, но они дороги и их результаты трудно анализировать с целью количествен- ной оценки технологического процесса. Например, зачастую невоз- можно измерение температурных полей. Эти возникающие затруд- нения решаемы с помощью численных методов. Особые преиму- щества численного моделирования весьма разнообразны. В отличие от двумерных моделей, когда для оценки процесса необходимы точ- ные подробности относительно поля скоростей для действительно трехмерного течения, следует полностью применять трехмерное моделирование. При этом добавление к задаче еще одного измере- ния существенно увеличивает сложность модели и время вычис- лений. Однако с использованием более совершенных компьютеров и развитием более эффективных методов, а также с возрастанием требований к качеству продукции трехмерное моделирование ста- новится повседневной реальностью. В литературе имеются различные примеры приложения трех- мерного моделирования применительно к упаковочному производ- ству с использованием методов конечных и граничных элементов. Они дают представление о том, что можно получить, используя современные программы моделирования. В качестве примеров при- водятся случаи, представляющие большой интерес как с теоретиче- ской, так и с практической точки зрения, например: смесители периодического действия, фильеры экструдера и зоны смешения в экструдере. 59 9. ОСНОВНЫЕ ВИДЫ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ В зависимости от конкретной реализации процесса и его аппара- турного оформления все химико-технологические процессы можно разделить на четыре класса, исходя из временного и пространствен- ного признаков [2, 3]. Это процессы, переменные во времени (не- стационарные), и процессы, не меняющиеся во времени (стационар- ные); процессы, в ходе которых их параметры изменяются в прост- ранстве, и процессы без пространственного изменения параметров. Так как математические модели являются отражением соответст- вующих объектов, то для них характерны те же классы, а именно: модели, неизменные во времени, – статические модели; модели, переменные во времени, – динамические модели; модели, неизменные в пространстве, – модели с сосредоточен- ными параметрами; модели, изменяющиеся в пространстве, – модели с распределен- ными параметрами. Модели с сосредоточенными параметрами. Для данного клас- са моделей характерно постоянство переменных в пространстве. Математическое описание включает алгебраические уравнения либо дифференциальные уравнения первого порядка для нестационарных процессов. Примером объекта, описываемого данным классом мо- делей, может служить аппарат с идеальным (полным) перемеши- ванием потока. Скорость мешалки такова, что концентрация во всех точках аппарата одинакова (рис. 9.1). Рис. 9.1. Схема аппарата, реализующего модель идеального смешения 60 Модели с распределенными параметрами. Если основные пере- менные процесса изменяются как во времени, так и в пространстве или если указанные изменения происходят только в пространстве, то модели, описывающие такие процессы, называются моделями с распределенными параметрами. Их математическое описание обычно включает дифференциальные уравнения в частных произ- водных либо обыкновенные дифференциальные уравнения в случае стационарных процессов с одной пространственной переменной. Примером процесса, описываемого такими моделями, служит трубчатый аппарат с большим отношением длины к диаметру и значительной скоростью движения реагентов (рис. 9.2). Рис. 9.2 Схема аппарата, реализующего модель идеального вытеснения Статические модели. Статические модели отражают работу объекта в стационарных условиях, т. е. когда параметры процесса не меняются во времени. Соответственно математическое описание в статических моделях не включает время как переменную и со- стоит из алгебраических уравнений либо дифференциальных урав- нений в случае объектов с распределенными параметрами. Приме- ром объекта, описываемого статической моделью, служит аппарат полного смешения объемом V в установившемся режиме работы, в который непрерывно подаются реагенты А и В в заданном коли- честве и отводится продукт реакции Р. Математическое описание аппарата включает следующие урав- нения материального баланса (дня простоты тепловой баланс не рассматривается): ( ) ;AO A A BC C VkC C   ( ) .AO B A BC C VkC C   Здесь k – константа скорости реакции. 61 Динамические модели. Динамическая модель отражает измене- ние объекта во времени. Математическое описание таких моделей обязательно включает производную по времени. Часто динамиче- скую модель объекта строят в виде передаточных функций, связы- вающих входные и выходные переменные (представление динами- ческих моделей в виде передаточных функций особенно удобно для целей управления объектом). Примером динамической модели мо- жет служить модель рассмотренного выше аппарата полного сме- шения, но работающего в неустановившемся режиме. В этом случае математическое описание аппарата включает следующие уравнения материального баланса: d ( ) ; d A AO A A B C C C VkC C t V     d ( ) , d A AO A A B C C C VkC C t V     а также начальные условия A AOC C , B BOC C при t = 0. Математическая модель является системой уравнений матема- тического описания, отражающей сущность протекающих в объекте явлений, для которой определен алгоритм решения, реализованный в форме моделирующей программы. Согласно этому определению математическая модель должна рассматриваться в совокупности трех ее аспектов: смыслового, аналитического и вычислительного. Смысловой аспект представляет собой физическое описание при- роды моделируемого объекта. Аналитический аспект является математическим описанием про- цесса в виде некоторой системы уравнений, отражающей протекаю- щие в объекте явления и функциональные связи между ними. Наконец, вычислительный аспект есть метод и алгоритм реше- ния системы уравнений математического описания, реализованные как моделирующая программа на одном из языков программиро- вания. Далее рассмотрим примеры основных простых математиче- ских моделей. 62 10. УСЛОВИЯ МОДЕЛИРОВАНИЯ ОБЪЕКТА МОДЕЛИ И ОБЪЕКТА ОРИГИНАЛА Объект-модель и объект-оригинал должны удовлетворять опре- деленным требованиям при моделировании. Рассмотрим сущность этих требований. Пусть изучается объект А и конкретно его некоторая характери- стика y, зависящая от ряда факторов Х1, Х2, … , X. Предположим, что поведение этой характеристики описывается уравнением fA(y, X1, X2, … , Xn) = 0, (10.1) справедливым в области изменения аргументов аi ≤ Xi ≤ bi, где i = 1, 2, ..., n. С другой стороны, имеется объект B, характеристика которого u – зависит от факторов Z1, Z2, …, Zn, и эта зависимость выражается уравнением FB(u, Z1, Z2, … , Xn) = 0, (10.2) справедливым в области изменения аргументов ci ≤ Zi ≤ di, где i = 1, 2, ... , n. Пусть далее имеется хотя бы одна система переменных Y, Х1, Х2, … , Xm, связанная c переменными Xi соотношениями Y = P0 (y, X1, X2, … , Xn), X1 = P1 (y, X1, X2, … , Xn), X2 = P2 (y, X1,X2, … , Xn), (10.3) ………………………… Xm = Pm (y, X1, X2, … , Xn), а с переменными Zi – соотношениями 63 Y = Q0 (u, Z1, Z2, … , Zn); X1 = Q1 (u, Z1, Z2, … , Zn); X2 = Q2 (u, Z1, Z2, … , Zn); (10.4) ………………………… Xm = Qm (u, Z1, Z2, … , Zn). Пусть в новой системе координат Y, X1, X2, … , Xm характери- стики объектов А и В описываются одним и тем же уравнением Ф(Y, X1, X2, … , Xm) = 0, (10.5) справедливым в области Ni ≤ Xi ≤ Mi. В данном случае, если возможно составить уравнение (10.5), вер- но утверждение, что объект А может служить моделью объекта В, и наоборот (применительно к изучаемой характеристике). Перемен- ные Y, X1, X2, … , Xm называются обобщенными. Таким образом, модель и оригинал должны иметь одно и то же математическое описание в некоторой обобщенной системе пере- менных. Это условие моделируемости является необходимым и до- статочным. Если на модели А получено уравнение (10.1), то оно может быть преобразовано в уравнение (10.2) для объекта В следующим обра- зом: вначале с помощью преобразования (10.3) – в обобщенное уравнение (10.5), затем с помощью преобразования (10.4) – в урав- нение реального объекта (10.2). Возможность перехода по такой цепочке от (10.1) к (10.2) предопределяет достаточность сформули- рованного условия моделируемости. Необходимость данного усло- вия вытекает из того, что если бы преобразования (10.3), (10.4) не существовали, то отсутствовал бы путь для превращения уравнения модели в уравнение оригинала. Условие моделируемости допускает различие физической природы изучаемых объектов. Требуется толь- ко общность математического описания. На этом факте основыва- ются используемые при моделировании в ряде случаев методы ана- логии, где моделями изучаемого объекта служат объекты совер- шенно другой физической природы. 64 Примером обобщенных переменных можно назвать числа подо- бия (число Рейнольдса Re, число Нуссельта Nu, число Грасгофа Gz, число Эйлера Eu и др.), широко используемые при моделировании гидродинамических, тепловых процессов и процессов массоперено- са. В отличие от уравнений, связывающих первичные размерные величины вида (10.1) и (10.2), уравнения, составленные из чисел подобия вида (10.5), имеют большую общность, поскольку каждая точка описываемых ими кривых соответствует не одному, а множе- ству явлений, которые называют подобными. 11. ОБЩИЕ ПОЛОЖЕНИЯ МЕТОДА НЕОПРЕДЕЛЕННЫХ МНОЖИТЕЛЕЙ ЛАГРАНЖА Метод Лагранжа применяется для решения задач с аналитическим выражением для критерия оптимальности и при наличии ограниче- ний на независимые переменные типа равенств. Для получения ана- литического решения требуется, чтобы ограничения имели аналити- ческий вид. Применение неопределенных множителей Лагранжа поз- воляет свести задачу оптимизации с ограничениями к задаче, ре- шаемой методами исследования функций классического анализа. В этом случае порядок системы уравнений, решаемой для нахожде- ния экстремума критерия оптимизации, повышается на число огра- ничений. Применение метода эффективно при количестве перемен- ных три и менее. Метод используется и при количестве переменных более трех, если процесс описывается конечными уравнениями. Роль неопределенных множителей Лагранжа λi состоит в том, что введение их в уравнения для dφi в итоге позволяет получить за- мкнутую систему с числом уравнений n + k, соответствующих чис- лу неизвестных. Если бы выполненные выше преобразования и дей- ствия с выражением для целевой функции F и с функциями- ограничениями φi проводились без использования множителей λi, то окончательная система имела бы число уравнений, превышающее число искомых параметров xi. В этом случае решение системы урав- нений не дает однозначного результата. В методе оптимизации путем дифференцирования целевой функ- ции функции-ограничители использовались просто для уменьшения числа параметров в целевой функции. Этим достигалось равенство чисел уравнений в решаемой системе и искомых переменных, что 65 исключало неопределенность решения. Но процесс подстановки функций-ограничителей в целевую функцию и последующее диф- ференцирование не всегда целесообразны и возможны. Метод неопределенных множителей Лагранжа более универса- лен, чем метод оптимизации путем дифференцирования. Ограниче- ния типа неравенств в обоих методах одинаковы. Так же одинаково проводится исследование полученного экстремума целевой функ- ции на максимум и минимум. Критерий оптимальности В зависимости от конкретной цели оптимизации в качестве кри- терия оптимальности могут быть приняты различные величины. Выбор критерия оптимальности является одним из самых ответ- ственных моментов, так как от него зависят направленность расчета и результаты окончательного варианта. При оптимизации оборудования и технологий часто использу- ются экономические критерии, такие как прибыль, себестоимость, приведенный доход, приведенные годовые затраты и др. Выбранный критерий оптимальности должен удовлетворять трем основным требованиям. 1. Критерий оптимальности должен быть единственным, хотя желательно, чтобы объект по всем параметрам был наилучшим, но известные методики позволяют оптимизировать по одному крите- рию. Нельзя поставить задачу отыскать, например, такой аппарат, который имел бы минимальный габаритный объем и минимальную стоимость одновременно, хотя в некоторых случаях такое совпаде- ние и может быть получено. Поэтому важно хорошо выбрать крите- рий оптимальности, наиболее полно соответствующий поставлен- ной цели оптимизации. 2. Критерий оптимальности должен выражаться числом. В про- тивном случае сопоставление разных вариантов крайне затрудни- тельно. 3. Величина критерия оптимальности должна изменяться моно- тонно при изменении оптимизирующих параметров. Это позволяет оценивать объект по принципу «чем больше критерий, тем лучше» или же «чем меньше критерий, тем лучше». 66 Решая задачу оптимизации, необходимо учитывать, что регули- руемые параметры (входные параметры системы) не могут прини- мать любые значения. Например, кожухотрубный теплообменник длиной 30 м и диаметром 0,5 м не может быть принят для установки даже в том случае, если значение критерия оптимальности для него имеет экстремум. Ограничения Условия, которые необходимо соблюдать независимо от того, как их соблюдение повлияет на величину критерия оптимальности, называют ограничениями. Чаще всего ограничения возникают по следующим причинам:  по необходимости выдержать заданные параметры сырья и про- дукции;  условиям технологии, например, расход воздуха не может пре- вышать производительность вентилятора;  экономическим и конъюнктурным соображениям, например, ка- питальные затраты не должны превышать выделенной суммы;  соображениям охраны труда и окружающей среды. По формально-математическим признакам выделяют ограниче- ние типа равенств и типа неравенств. По ограничению типа равенств устанавливают определенное зна- чение того или иного его параметра ui = ai. Ограничения типа неравенств определяют пределы, в которых допустимо изменение параметров x: xi  bi; xj  bj; ak  xk  bk. Для первого и второго ограничений задают односторонние пре- делы (например, производительность – не ниже заданной, темпера- 67 тура не выше той, на которую рассчитан материал). Для третьего – двухсторонние (например, температура жидкого теплоносителя может изменяться в пределах температуры замерзания до темпера- туры кипения). Ограничения подобного типа для входных параметров называют ограничениями 1-го рода. При математическом решении задачи оп- тимизации каждый рассматриваемый вариант задается значениями входных параметров и выполнение ограничений 1-го рода проверя- ется непосредственно. В отличие от критерия оптимальности, который в задаче может быть только один, ограничений может быть любое число. Оптимизирующие факторы К оптимизирующим факторам относятся те из входных парамет- ров системы, которые в процессе оптимизации варьируются. Остальные параметры при этом не регулируются; они фигурируют в задаче в качестве ограничений типа равенств. Число оптимизирующих факторов зависит от того, на какой ста- дии разработки объекта осуществляется оптимизация. Если объект проектируется (оптимальное проектирование), то к числу оптими- зирующих целесообразно отнести как можно больше параметров. На этой стадии регулировать параметры проще всего: регулирова- ние осуществляется не в действительности, а на математической модели. Поэтому здесь желательно найти оптимальное значение максимального числа факторов. Задача оптимизации возникает и после пуска объекта в работу (оптимальное управление). Здесь число оптимизирующих воздей- ствий становится существенно меньшим, так как часть параметров (например, конструктивных) уже нельзя менять и не все другие па- раметры целесообразно регулировать, желая иметь по возможности простую систему управления. Выбор оптимизационных параметров зависит от объема и струк- туры задачи. Следует учитывать и принципиальную возможность решения задачи: при большом числе регулируемых переменных и сложной математической модели имеющиеся расчетные методы и средства могут оказаться недостаточными. 68 Целевая функция Зависимость критерия оптимальности от входных параметров объекта определяет целевая функция F. Математическая задача оптимизации формулируется как задача отыскания экстремума целевой функции, т. е. значения регулируе- мых параметров, входящих в функцию, при которых достигается экстремум, называют оптимальными значениями. Часто оптималь- ные значения соответствуют не экстремуму целевой функции, а на- ибольшей (наименьшей) ее величине в области допустимых значе- ний регулируемых параметров, за которую нельзя выйти вследствие наличия ограничений. При этом экстремум F находится за предела- ми данной области. В этом случае, если целевая функция не имеет экстремума, оптимальное значение можно получить только при наличии ограничений. В ряде задач оптимизации сложных систем требуется введение более одной целевой функции. В таких случаях можно воспользо- ваться составной целевой функцией F = a1F1 + a2F2 + … + anFn, где аn – положительные или отрицательные весовые коэффициенты, численное значение которых назначается в соответствии со степе- нью значимости в задаче отдельных целевых функций Fn. В целом ряде задач целевая функция имеет не один экстремум, а несколько, которые принято называть л о к а л ь н ы м и о п т и- м у м а м и. Поэтому при решении задачи следует предусмотреть меры, чтобы не принять малозначащий экстремум за оптимальное значение. В этом случае оптимальному значению соответствует наибольший значащий экстремум – лучшее решение среди всех ло- кальных оптимумов. Примеры применения метода Во многих инженерных задачах метод неопределенных множи- телей Лагранжа используется для оптимизации расхода ресурсов или минимизации затрат. 69 Рассмотрим п р и м е р 11.1. Математическая формулировка п р и м е р а 11.1 имеет сле- дующий вид: 1 2, 2 2 1 1 2 1 2 2 2 2 1 2 1 2 2 2 3 1 2 1 2 ( , ) ( 2) ( 4) 5; min ( , ) ( 6) ( 10) 6; ( , ) ( 10) ( 15) 10. x x f x x x x f x x x x f x x x x                   Перепишем задачу в форме е-ограничений: 1 2, 1 1 2min ( , ) x x f x x с учетом 2 1 2 2( , )f x x   ; 3 1 2 3( , )f x x   . Функция Лагранжа имеет следующий вид: 1 2 2 3 1 1 2 2 2 1 2 2 3 3 1 2 3( , , , ) ( , ) ( ( , ) ) ( ( , ) ).L x x f x x f x x e f x x e         Подставляя сюда выражения для 1 1 2 2 1 2 3 1 2( , ), ( , ), ( , )f x x f x x f x x , и используя метод неопределенных множителей Лагранжа, полу- чаем 1 2 2 1 2 11 8 10 ; 5 4 10 x x x x        1 2 3 1 2 6 4 4 . 5 4 10 x x x x         Заметим, что функция 1 1 2( , )f x x не обязательно должна быть «основной», а функции 2 1 2 3 1 2( , ), ( , )f x x f x x должны выполнять роль ограничений. Рассматриваемая задача может быть записана в ином виде, например: 1 2, 2 1 2min ( , ) x x f x x с учетом ограничений 1 1 2 2( , )f x x   , 3 1 2 3( , ) .f x x   70 Функция Лагранжа для задачи, записанной в этой форме, имеет следующий вид: 1 2 2 3 2 1 2 2 1 1 2 1 3 3 1 2 3( , , , ) ( , ) ( ( , ) ) ( ( , ) ).L x x f x x f x x e f x x e         Результаты решения рассматриваемой задачи приведены в табл. 11.1. Таблица 11.1 Решения задачи 1x 2x 1 1 2( , )f x x 2 1 2( , )f x x 3 1 2( , )f x x 1 3 4 6,88 17,29 19,73 111.93 0,42 0,19 5 8,25 32,06 10,06 80,56 0,50 0,50 6 9,63 52,70 6,14 54,84 0,70 1,00 7 11,00 79,00 8,00 35,00 1,00 2,00 8 12,38 111,22 15,66 20,86 2,17 5,17 При решении этой задачи с помощью метода неопределенных множителей Лагранжа, используя математическую формулировку примера 11.1, получим выражения (п р и м е р 11.2) 1 2 1 1 2 5 4 10 ; 11 8 10 x x x x        1 2 3 1 2 6 4 4 . 11 8 10 x x x x        Результаты решения рассматриваемой задачи приведены в табл. 11.1. 71 Пример 11.3 Найти условные экстремумы функции z = 2x2 + 9y2 при x2 + 9y2 = 1. Составим функцию Лагранжа: Ф(x, y) = (2x2 + 9y2) + (x2 + 9y2 – 1), где  – неопределенный постоянный множитель; φ(x; y) = x2 + 9y2 – 1 – некоторое условие, задаваемое уравнением связи φ(x; y) = 0; z(x; y) = 2x2 + 9y2 – исследуемая функция. Для определения множителя  и координат возможных точек экстремума решаем систему Ф 0, Ф 0, y ( ; ) 0; x x y            1 1 1 2 2 2 3 3 3 2 2 4 4 4 Ф 4 2 0, 2, 1, 0, 2, 1, 0,Ф 18 18 0, 1, 0, 1 / 3, 1, 0, 1 / 3.9 1 0, x x x yx x y y y x yy x yx y                                            Итак, найдены четыре стационарные точки: M1(–1; 0), при этом 1 = –2; M2(1; 0), при этом 2 = –2; M3(0; –1/3), при этом 3 = –1; M4(0; 1/3), при этом 4 = –1. Наличие критической точки еще не гарантирует наличие экстре- мума функции. Достаточным критерием наличия экстремума функ- ции в точке служит определенность знака квадратичной формы функции. 72 Если квадратичная форма (т. е. второй дифференциал функции Лагранжа) при выполнении условий связи: а) будет отрицательно определенная, то в точке – строгий услов- ный максимум; б) если положительно определенная, то в точке – строгий услов- ный минимум; в) если неопределенная, то точка не является точкой условного экстремума. Квадратичная форма функции определяется как 2 (0) 1 2 , 1 ( ) (d , d , ..., d ) d d n n i j i ji j f x A x x x x x x x      и фактически является вторым дифференциалом функции. Второй дифференциал функции Ф(x, y, z) 2 2 2 2 2 2 2 2 2 2 2 2 2 Ф Ф Ф Ф d Ф( , , ) d d d 2 d d Ф Ф 2 d d 2 d d x y z x y z x y x yx y z x z y z x z y z                      или в случае функции двух переменных 2 2 2 2 2 2 2 2 Ф Ф Ф d Ф( , ) d d 2 d d .x y x y x y x yx y          Вычислим второй дифференциал функции Лагранжа: Ф 4 2 ;x x x      2 2 Ф 4 2 ; x      Ф 18 18 ;y y y      2 2 Ф 18 18 ; y      2Ф 0. x y     73 2 2 2Ф 2(2 )d 18(1 )d .x y     Заметим, что dx2 = (dx)2, т. е. dx2 > 0 и dy2 > 0. Следовательно, в точках M1(–1; 0) и M2(1; 0), для которых 1,2 = –2, второй дифференциал d2Ф < 0, что означает наличие в этих точках максимума. Соответственно в точках M3(0; –1/3) и M4(0; 1/3), для которых 3,4 = –1, второй дифференциал d2Ф > 0, и это означает наличие в данных точках минимума. Ответ: функция имеет два локальных условных максимума: z (–1; 0) = 2, z (1; 0) = 2, и два локальных условных минимума: z(0; –1/3) = 1, z(0; 1/3) = 1. Таким образом, использование математических моделей в насто- ящее время стало очень актуальным вопросом в связи с постоянно развивающейся экономикой. Построение математической (символической) модели системы можно начать с перечисления всех элементов системы, которые влияют на эффективность ее работы. Если в качестве меры общей эффективности используются общие ожидаемые издержки, то можно начать с исследования изобразительной или аналоговой модели, полученной на стадии постановки задачи. Метод множителей Лагранжа позволяет отыскивать максимум или минимум функции при ограничениях-равенствах. Основная идея метода состоит в переходе от задачи на условный экстремум к задаче отыскания безусловного экстремума некоторой построенной функции Лагранжа. Метод множителей Лагранжа играет важную роль в развитии, предсказании, построении оптимального варианта. 74 12. ЦЕЛЕВАЯ ФУНКЦИЯ КАК КРИТЕРИЙ ОПТИМАЛЬНОСТИ Целевая функция — это то же самое, что критерий оптималь- ности, но это критерий, рассматриваемый как функция входных факторов. Зависимость критерия оптимальности от входных пара- метров объекта определяет целевая функция F = F(x1, x2, … , xn, u1, u2, … , um). Чем больше (или чем меньше) значение F, тем лучше. Поэтому оптимум – это экстремум (либо максимум, либо минимум) целевой функции. Те значения факторов хi, при которых достигается опти- мум, называют оптимальными значениями. Таким образом, матема- тически задача оптимизации формулируется как задача отыскания экстремума. При этом в точке экстремума должны соблюдаться все ограни- чения, поэтому во многих случаях оптимум приходится искать на краю области допустимых значений, за пределы которой нельзя выйти вследствие наличия ограничений (рис. 12.1). На рис. 12.1 отрезок ab есть область допустимых значений, определяемая огра- ничением а ≤ х ≤ b. Рис. 12.1. График, иллюстрирующий оптимум на краю области допустимых значений: а, b – границы области допустимых значений Методы отыскания точки оптимума можно разделить на три основные группы. х F 75 1. Аналитические методы, применяемые, когда можно продиф- ференцировать целевую функцию и искать экстремум, исходя из условия равенства нулю производных. 2. Численные или поисковые методы. Для их применения нужно, чтобы целевая функция была вычисляемой: должен быть известен алгоритм, по которому можно рассчитать значение критерия опти- мальности при заданных значениях факторов. 3. Методы, применяемые, если целевая функция невычисляема. Практически это значит, что вид функции неизвестен. Тогда нужно планировать и реализовать эксперимент так, чтобы в результате достичь района оптимума. Это — экспериментальная оптимизация, составляющая важный раздел планирования эксперимента. 13. ОПТИМИЗАЦИЯ МЕТОДОМ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ Если целевая функция F = F(x1, x2, … , xn, u1, u2, … , um), где x1, x2, ... , xn – оптимизирующие факторы (параметры); u1, u2, … , um – нерегулируемые (входные) параметры, непрерывна и дифференцируема (по крайней мере дважды), то оп- тимальные значения параметров x1, x2, ... , xn определяются путем нахождения частных производных от функции F по этим парамет- рам с приравниванием нулю полученных производных. В результа- те будет получена система из n уравнений: 1 2 0; 0; 0, n F x F x F x            (13.1) решение которой дает значения параметров 76 X1опт = f1(u1, u2, …, um), X2опт = f2(u1, u2, …, um), …, Xnопт = fn(u1, u2, …, um), при которых функция F имеет экстремум. Чтобы определить, минимум или максимум соответствуют най- денному экстремуму функции, нужно проводить дополнительное исследование. Для этого применяется способ сравнения значений функции, сравнения знаков производных, исследования знаков выс- ших производных. При использовании способа сравнения значений функции вычисляются величины F при параметрах XL, несколько больших и несколько меньших XLопт. Если окажется, что вычисленные величины Fxiопт – ∆xi и FxLопт + ∆xi больше FxLопт, то экстремум соответствует минимуму функции F. При другом соотношении экстремум будет соответствовать максимуму. В способе сравнения знаков производных определяются значе- ния Fxiопт – ∆xi/XL и FxLопт + ∆xi/Xi. Если первая из производных имеет положительное значение, а вторая из них — отрицательное, то экстремум соответствует максимуму функции F. При изменении знака производных с «минуса» на «плюс» — минимуму F. Исследование знаков высших производных заключается в вычис- лении второй производной 2F/xi2 при xi = xiопт. Если данная произ- водная меньше нуля, то экстремум F соответствует максимуму функ- ции, и наоборот. При равенстве нулю второй производной необходи- мо вычислить следующую производную. Если окажется, что 3F/xi3 при xi = xiопт тоже равна нулю, то вычисляется 4F/xi4, и так далее до тех пор, пока производная не станет положительной или отрицатель- ной. Здесь надо иметь в виду, что если первая производная, не обра- щающаяся в нуль, имеет нечетный порядок (3F/xi3, 5F/xi5), то в рассматриваемой точке xi функция не имеет экстремума. Если пер- вая, не обращающаяся в нуль производная имеет четный порядок (2F/xi2, 4F/xi4), то в данной точке имеется экстремум функции, который будет максимумом или минимумом в зависимости от того, отрицательна или положительна эта производная. Описанные способы исследования функции с целью определе- ния характера ее экстремума дают надежный результат для однопа- раметрических целевых функций. Если независимых переменных в исходной функциональной связи две и более, то проверки функ- ции на экстремальность по всем переменным в отдельности могут 77 оказаться недостаточными для получения надежного результата. Для этого случая разработаны другие, более сложные методики определения характера экстремума функции F с координатами Xi опт, найденными путем решения системы уравнений. Моделирование и оптимизация объема упаковки для наименьшего расхода материала при ее производстве Особенности оптимизации путем дифференцирования при нали- чии ограничений рассмотрим на примере определения конструктив- ных размеров упаковки цилиндрической формы для наименьшего расхода материала при том же объеме. Объем упаковки, которую требуется получить при наименьшем расходе материала, V = 10 см3. Здесь целевой функцией является площадь поверхности упаков- ки (в виде цилиндра) F = 2πR2 + 2πRH, где R и Н – соответственно радиус и высота цилиндра. Ограничение задано в виде равенства V = πR2H = 10 см3. Данное ограничение целесообразно объединить с зависимостью для критерия оптимальности F, что приведет к уменьшению числа независимых переменных в целевой функции. Подставив выраже- ние для V в уравнение для F, получим F = 2 πR2 + 2V/R, где независимым параметром является R. Дифференцируя F по R и приравнивая к нулю полученное выражение, получим F/R = 4πR + (–2V/R2) = 0 при 2πR3 = V. Отсюда Rопт = (V/2π)1/3 = (10/(2·3,14))1/3 = 1,167 см. 78 Так как H = V/(πR2), то после вычислений имеем Hопт = 2,334 см. В том случае, если дополнительно задается ограничение в виде неравенства, например R ≤ 1 см, то нужно принимать Rопт = 1 см, поскольку это значение является ближайшим к полученному выше Rопт = 1,167 см. Аналогичным образом оптимизируются и другие виды упаковок ( типа конуса, куба, параллелипипеда и пр.). Таким образом, классический метод отыскания экстремума за- ключается в решении системы (13.1), где левые части уравнений — функции от факторов x1, x2, ... , xn. Поэтому решение системы может дать величины x1опт, x2опт, ... , xnопт, являющиеся оптимальными зна- чениями факторов; их совокупность определяет оптимальное реше- ние задачи. Если оптимизируется технологический процесс, то это- му решению соответствует оптимальный режим. Однако чтобы убедиться в том, что полученные значения дейст- вительно оптимальны, необходимо выяснить четыре обстоятельства: 1. Действительно ли решение системы определяет экстремум: известно, что условию уравнений системы может удовлетворять и седловая точка, или точка перегиба. 2. Получен ли экстремум нужного знака (максимум, если нас интересует максимум, или минимум в противном случае). 3. Если система имеет несколько решений, то какое из них от- вечает глобальному оптимуму, а какие — локальным. Если же за- висимость имеет несколько максимумов, то глобальным будет тот из них, который выше всех остальных; остальные будут локальными. 4. Все ли ограничения соблюдаются в точке экстремума. 14. МОДЕЛИРОВАНИЕ И МОДЕЛИ В научно-технических исследованиях и технологиях упаковоч- ного производства весьма часто возникает следующая ситуация. Нас интересует некоторый объект — назовем его оригиналом. Но вместо того чтобы изучить непосредственно оригинал, мы изучаем другой объект — модель, а результаты исследования модели рас- пространяем на оригинал. 79 Основные требования к процессу моделирования. Чтобы модели- рование имело смысл, оно должно удовлетворять двум требованиям. 1. Экономичность. Исследование на модели должно быть более экономичным, чем непосредственно исследование оригинала. В про- тивном случае выгоднее было бы изготовить оригинал и проводить исследования непосредственно на нем. 2. Традуктивность (от латинского traductio — перенесение, пе- рeвод). Она означает, что мы должны знать, как по результатам ис- пытания модели определить интересующие нас параметры ориги- нала. При этом нас практически всегда интересует количественная традукция. В результате моделирования нам недостаточно узнать, что данный процесс вообще осуществим. Важно иметь возможность рассчитать и оптимизировать его. В конечном итоге целью моделирования технологического упа- ковочного производства является его наилучшая реализация, его оптимизация. Современный этап развития химической технологии, как и вообще всех технических наук, характеризуется принципи- ально новой постановкой задачи оптимизации. Разумеется, человек всегда старался организовать свою деятель- ность так, чтобы результаты ее были наилучшими. При этом в боль- шинстве случаев при решении вопроса, какой вариант, какой режим является оптимальным, огромную, часто решающую роль играли опыт и интуиция исследователя, проектировщика, эксплуатационника. Объяснялось это большой сложностью технологических процес- сов, чрезвычайным обилием и разнообразием взаимосвязей внутри каждого процесса. Для эффективного решения задачи оптимизации необходимо оценить влияние всех этих взаимосвязей и сравнить колоссальное число возможных вариантов организации технологии. Возможность такой оценки и такого сравнения на основе традици- онных методов отсутствовала, поэтому столь большая роль отводи- лась интуиции человека, из-за чего оптимизация процессов осуще- ствлялась неэффективно. Очень часто на стадии разработки выбирался далеко не лучший вариант и после пуска производства начинались бесчисленные пе- ределки: ощупью искали пути улучшения процесса. К сожалению, такой метод оптимизации полностью пока еще существует, но уже стал анахронизмом. Развитие кибернетики — науки об управлении сложными системами, широкое распростране- 80 ние быстродействующей вычислительной техники привели к фор- мированию оптимизации как целостного научного направления с едиными методами, применимыми к самым разнообразным облас- тям техники. Разработка современного технологического процесса в упаковочном производстве включает оптимизацию как совершен- но необходимый этап. 15. СОСТАВЛЕНИЕ МАТЕМАТИЧЕСКОГО ОПИСАНИЯ ОБЪЕКТА При составлении математического описания общим приемом является блочный принцип. Согласно этому принципу составлению математического описания предшествует анализ отдельных элемен- тарных процессов, протекающих в объекте моделирования. При этом эксперименты по изучению каждого такого процесса проводят в ус- ловиях, максимально приближающихся к условиям эксплуатации объекта моделирования. Сначала исследуют гидродинамическую модель процесса как ос- нову структуры математического описания. Далее с учетом гидро- динамических условий найденной модели изучают кинетику хими- ческих реакций, процессов массо- и теплопередачи и составляют математическое описание каждого из этих процессов. Заключитель- ным этапом в данном случае является объединение описаний всех исследованных элементарных процессов (блоков) в единую систему уравнений математического описания объекта моделирования. Дос- тоинством блочного принципа построения математического описа- ния является то, что его можно использовать на стадии проектиро- вания объекта, когда окончательный вариант аппаратурного оформ- ления еще неизвестен. Методы составления математического описания К указанным методам относятся аналитический, эксперимен- тальный и экспериментально-аналитический. • Аналитическими методами составления математического опи- сания обычно называют способы вывода уравнений статики и ди- намики на основе теоретического анализа физических и химических процессов, происходящих в исследуемом объекте, а также на основе 81 заданных конструктивных параметров аппаратуры и характеристик перерабатываемых веществ. При выводе этих уравнений исполь- зуются фундаментальные законы сохранения вещества и энергии, а также кинетические закономерности процессов переноса массы и теплоты, химических превращений. Для составления математического описания с помощью аналитиче- ских методов не требуется проведения каких-либо экспериментов на объекте, поэтому такие методы пригодны для нахождения статических и динамических характеристик вновь проектируемых объектов, физико-химические процессы в которых достаточно хорошо изучены. К недостаткам аналитических методов составления математи- ческого описания можно отнести сложность решения получающейся системы уравнений при достаточно полном описании объекта. Экспериментальный метод составления математического описа- ния используется для управления и исследования объектов в узком, «рабочем» диапазоне изменения входных и выходных переменных (например, при построении системы автоматической стабилизации отдельных технологических параметров). Эти методы чаще всего основываются на предположении о линейности и сосредоточенно- сти параметров объекта. Принятие этих допущений позволяет срав- нительно просто описывать наблюдаемые процессы алгебраическими или линейными дифференциальными уравнениями с постоянными коэффициентами. При экспериментальном подходе к составлению математического описания всегда требуется постановка опытов не- посредственно на изучаемом объекте. Достоинством экспериментальных методов является простота получаемого математического описания при достаточно точном описании свойств объекта в узком диапазоне изменения парамет- ров. Основной недостаток экспериментальных методов — невоз- можность установления функциональной связи между входящими в уравнения числовыми параметрами и конструктивными характе- ристиками объекта, режимными параметрами процесса, физико- химическими свойствами веществ. Кроме того, полученные экспе- риментальным методом математические описания нельзя распрост- ранять на другие однотипные объекты. Наличие сильных и слабых сторон аналитического и экспери- ментального методов составления математического описания при- вело к необходимости разработки комбинированного эксперимен- 82 тально-аналитического метода. Сущность его заключается в ана- литическом составлении уравнений описания, проведении экспери- ментальных исследований и нахождении по их результатам пара- метров уравнений. При подобном подходе к получению математи- ческого описания сохраняются многие положительные свойства экспериментальных и аналитических методов. Формально математическое описание представляет собой сово- купность зависимостей, связывающих различные переменные про- цесса в единую систему уравнений. Среди этих соотношений могут быть уравнения, отражающие общие физические законы (например, законы сохранения массы и энергии), уравнения, описывающие эле- ментарные процессы (например, химические превращения), ограни- чения на переменные процесса и т. д. Кроме того, в состав матема- тического описания также входят различные эмпирические и полу- эмпирические зависимости между разными параметрами процесса, теоретическая форма которых неизвестна или слишком сложна. В составе математического описания, разработанного на основе физической природы моделируемого объекта, можно выделить сле- дующие группы уравнений: 1. Уравнения сохранения массы и энергии, записанные с учетом гидродинамической структуры движения потоков. Данная группа уравнений характеризует распределение в пото- ках температуры, концентраций и связанных с ними свойств. Об- общенное уравнение материального баланса имеет вид Приход вещества — Расход вещества = Накопление вещества. (15.1) В стационарном режиме не могут происходить ни убыль, ни на- копление. В этом случае уравнение переходит в уравнение (15.1) материального баланса вида Приход вещества = Расход вещества. Обобщенное уравнение теплового баланса имеет вид Приход теплоты — Расход теплоты = Накопление теплоты, или для стационарных условий Приход теплоты = Расход теплоты. 83 2. Уравнения элементарных процессов для локальных элементов потоков. К этой группе относятся описания процессов массо- и теплооб- мена, химических реакций и др. 3. Теоретические, полуэмпирические или эмпирические соотно- шения между различными параметрами процесса. Таковы, например, зависимость коэффициента массопередачи от скоростей потоков фаз, зависимость теплоемкости смеси от ее со- става и т. д. 4. Ограничения на параметры процесса. Например, при модели- ровании процесса ректификации многокомпонентных смесей на любой ступени разделения должно выполняться условие, что сумма концентраций всех компонентов равна 1. Кроме того, концентрация любого компонента должна находиться в диапазоне от 0 до 1. Общим для всех математических моделей является то, что число уравнений, включаемых в математическое описание, должно быть равно числу переменных, находимых в результате моделирования. Кратко рассмотрим основные классы уравнений, встречающиеся в математических описаниях химико-технологических объектов. Для характеристики свойств разных объектов моделирования обыч- но применяют алгебраические и трансцендентные уравнения, обык- новенные дифференциальные уравнения, дифференциальные урав- нения в частных производных и интегральные уравнения. К алгебраическим уравнениям обычно сводится математическое описание стационарных режимов работы объектов с сосредоточен- ными параметрами (например, реактор полного смешения). Кроме того, уравнения этого типа применяют при описании более сложных объектов для выражения стационарных связей между разными пара- метрами. Математические описания в виде алгебраических уравне- ний наиболее просты, хотя сложность существенно зависит от числа уравнений и вида входящих в них функций. Обыкновенные дифференциальные уравнения чаще используют для математического описания нестационарных режимов объектов с сосредоточенными параметрами (например, для описания динами- ки реактора полного смешения), а также стационарных режимов объектов с распределенными параметрами по одной пространст- венной координате. В первом случае независимой переменной яв- ляется время, а во втором — пространственная координата. Следует 84 отметить общность и даже тождественность математических опи- саний, которая иногда свойственна математическим моделям раз- личных объектов. Сложность решения обыкновенных дифференциальных уравне- ний определяется рядом обстоятельств. Во-первых, она возрастает с ростом порядка уравнения (или, что практически эквивалентно этому, с ростом числа дифференциальных уравнений в системе, по- скольку уравнение т-го порядка всегда можно преобразовать в сис- тему, состоящую из т уравнений первого порядка). Дифференциальные уравнения в частных производных используют для математического описания динамики объектов с распределен- ными параметрами или стационарных режимов объектов с пара- метрами, распределенными по нескольким координатам. Для ука- занных уравнений при описании динамики объекта наряду с началь- ными условиями также нужно задавать граничные условия, в общем случае являющиеся функциями времени. Для стационарных режи- мов объектов, описываемых уравнениями в частных производных, задают только граничные условия. Задачи с уравнениями в частных производных, как правило, отличаются наибольшей сложностью, и в большинстве случаев решение каждой конкретной задачи тре- бует серьезной работы. Математические модели, в которых нестационарные дифферен- циальные уравнения, описывающие изменения во времени пере- менных с малым временем релаксации, заменены стационарны- ми уравнениями, можно назвать квазинестационарными. Нестацио- нарные модели, используемые на практике, фактически обычно являются квазинестационарными, хотя при этом, строго говоря, необходимо обоснование квазистационарности ряда внутренних переменных. С учетом сказанного математические модели можно классифи- цировать следующим образом: по пространственным признакам – модели с сосредоточенными параметрами; ячеечные модели; модели с распределенными пара- метрами; временным признакам – стационарные модели, квазинестацио- нарные модели, нестационарные модели. 85 16. ВЫБОР МЕТОДА РЕШЕНИЯ И ЕГО РЕАЛИЗАЦИЯ В ВИДЕ АЛГОРИТМА И МОДЕЛИРУЮЩЕЙ ПРОГРАММЫ После составления математического описания и постановки, в случае необходимости, соответствующих начальных и граничных условий необходимо выбрать метод решения, разработать алгоритм и составить программу решения системы уравнений математиче- ского описания. В простейших случаях, когда возможно аналитическое решение системы уравнений математического описания, необходимость спе- циальной разработки моделирующего алгоритма и программы не возникает, так как вся информация получается из соответствующих аналитических решений. Когда же математическое описание пред- ставляет собой систему конечных и дифференциальных уравнений, от возможности построения эффективного алгоритма решения мо- жет существенно зависеть практическая применимость математи- ческой модели. При выборе метода решения системы уравнений математиче- ского описания обычно руководствуются требованиями обеспече- ния максимальной быстроты получения решения, надежной сходи- мостью алгоритма решения к истинному и минимальной памяти ЭВМ. При этом должна обеспечиваться заданная точность решения. После выбора метода решения составляют последовательность вычислительных и логических действий, обеспечивающих решение, т. е. составляется алгоритм решения задачи. Основными требова- ниями к форме и содержанию записи алгоритма являются его на- глядность, компактность и выразительность. В практике математи- ческого моделирования наибольшее распространение получили гра- фический способ записи алгоритма (блок-схемы) и запись алгоритма в виде последовательности шагов. Графический способ записи алгоритма основан на представ- лении отдельных элементов алгоритма графическими символами, а всего алгоритма — в виде блок-схемы. На блок-схемах внутри графических символов производимые действия записывают словес- но или с помощью символов. Представление алгоритма в виде блок- схемы по сравнению с остальными обладает тем преимуществом, что оно более наглядно. В то же время если алгоритм очень слож- 86 ный или громоздкий, то графическое изображение может быть запу- танным и не обладать наглядностью. В этих случаях применяют простую запись алгоритма в виде последовательности шагов. Сте- пень детализации алгоритма зависит от его сложности, математи- ческого обеспечения ЭВМ и от степени использования стандартных алгоритмов. Если, например, в программе применяется библиотеч- ная подпрограмма, то ее, очевидно, нет необходимости детализиро- вать, а достаточно лишь указать ее параметры. В качестве примера рассмотрим алгоритм расчета аппарата иде- ального вытеснения, в котором протекает реакция В + А — Po. Математическое описание аппарата в стационарном режиме ра- боты имеет следующий вид: d ; d A A B C kC C s x     (16.1) d , d B A B C kC C s x     (16.2) o o,A A B BC C C C  при x = 0. Будем считать, что реакция протекает в изотермических усло- виях. Тогда система обыкновенных дифференциальных уравнений (16.1), (16.2) может быть решена с помощью метода Эйлера. Согласно методу Эйлера искомые концентрации СА и СB опре- деляются по формулам o 1( , );A A A BC C x f C C  (16.3) o 1( , ).B B A BC C x f C C  (16.4) Графический алгоритм решения (блок-схема) системы уравне- ний представлен на рис. 16.1. 87 Рис. 16.1. Блок-схема алгоритма расчета реактора идеального вытеснения Тот же алгоритм, выраженный в пошаговой форме, имеет сле- дующий вид: 1. Задаются o o, , , , , , .A BC C x k s l  2. Находится значение .x x x  3. Проверяется условие на окончание интегрирования (х > l). Ес- ли оно выполнено, то выводятся результаты и затем осуществляется переход к п. 7. 4. Рассчитываются правые части 1( , )A Bf C C , 2( , )A Bf C C . 5. Определяются новые концентрации СА и СВ. 6. Осуществляется переход к п. 2. 7. Окончание расчета. Далее на основании алгоритма записывается программа на одном из языков высокого уровня. При записи программы необходимо стремиться к ее компактности. Для этого широко используются осо- Окончание расче- та. Вывод резуль- татов Расчет СА, СВ по уравнениям (16.3), (16.4) Расчет f1, f2 Расчет x = x + x x > L Задание СА, СВ, x, k, s, v, L 88 бенности свойств функции, поскольку в данном случае повторяю- щиеся вычислительные действия будут записаны в программе один раз. При составлении программы важно стремиться к минимизации требуемой памяти ЭВМ. Логически законченные части расчета це- лесообразно записывать в виде отдельных процедур (подпрограмм). В этом случае возможно их занесение в библиотеки и использова- ние в различных расчетах. Этап программирования обычно завершается составлением опи- сания программы, в котором указываются все переменные и соот- ветствующие идентификаторы, входные и выходные переменные, порядок ввода и вывода информации. 17. БЛОЧНЫЙ ПРИНЦИП ПОСТРОЕНИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ При построении математических моделей широко используют блочный принцип, суть которого состоит в том, что модель стро- ится из отдельных логически законченных блоков, обычно отра- жающих ту или иную сторону рассматриваемого процесса. Это мо- жет быть блок кинетики массопередачи, блок гидродинамики, блок фазового равновесия и т. п. Блочный принцип построения моделей позволяет: а) разбить общую задачу построения математической модели на отдельные подзадачи и тем самым упростить ее решение; б) использовать разработанные блоки в других моделях; в) модернизировать и заменять отдельные блоки на новые, не ка- саясь при этом остальных. Представление математической модели процесса в виде совокуп- ности подсистем (блоков) позволяет представить общее математи- ческое описание как совокупность математических описаний от- дельных блоков. Тогда общая структура математической модели может иметь вид, изображенный на рис. 17.1. Применение блочного принципа построения математических мо- делей, который, в свою очередь, основан на системном подходе, по- зволяет во многих случаях принципиально решить проблему масш- табирования процессов. С точки зрения математического модели- рования масштабный переход есть не что иное, как деформация 89 математической модели при изменении геометрических размеров, характеризующих аппаратурное оформление процесса. При исполь- зовании блочного принципа построения математической модели влияние геометрических размеров на свойства процесса отражается лишь в одной подсистеме (блоке) — блоке «Гидродинамика», по- этому при наличии достаточно корректного в качественном и коли- чественном отношении математического описания этого блока мож- но осуществить масштабный переход. Рис. 17.1. Представление математического описания процесса Принципиально каждый блок математической модели может иметь различную ступень детализации математического описания. Необходимо, чтобы входные и выходные переменные всех блоков модели находились во взаимном соответствии, что обеспечит полу- чение замкнутой системы уравнений математической модели про- цесса в целом. Что касается состава внутренних переменных бло- ков, то здесь существует достаточно большая свобода выбора. В идеа- ле математическое описание каждого блока должно включать урав- нения, параметрами которых являются только физико-химические свойства веществ. 90 18. ЧИСЛЕННЫЕ МЕТОДЫ ОПТИМИЗАЦИИ НУЛЕВОГО ПОРЯДКА Основные определения Решение многих теоретических и практических задач сводится к отысканию экстремума (наибольшего или наименьшего значения) скалярной функции f(х) n-мерного векторного аргументах. В даль- нейшем под x будем понимать вектор-столбец (точку в n-мерном пространстве) 1 2 . ... n x x x x  Вектор-строка получается путем применения операции транспо- нирования: 1 2( , , ..., ). T nx x x x Оптимизируемую функцию f(x) называют целевой функцией или критерием оптимальности. В дальнейшем без ограничения общности будем говорить о по- иске минимального значения функции f(x) и записывать эту задачу следующим образом: f(x)  min. Вектор х*, определяющий минимум целевой функции, называют оптимальным. Отметим, что задачу максимизации f(x) можно заменить эквива- лентной ей задачей минимизации или наоборот. Рассмотрим это на примере функции одной переменной (рис. 18.1). Если х* – точка ми- нимума функции y = f(x), то для функции y = – f(x) она является точ- кой максимума, так как графики функций f(x) и –f(x) симметричны 91 относительно оси абсцисс. Итак, минимум функции f(x) и максимум функции –f(x) достигаются при одном и том же значении перемен- ной. Минимальное же значение функции f(x) равно максимальному значению функции –f(x), взятому с противоположным знаком, т. е. min f(x) = –max(f(x)). Рис. 18.1. Экстремум Рассуждая аналогично, этот вывод нетрудно распространить на случай функции многих переменных. Если требуется заменить за- дачу минимизации функции f(x1, …, xn) задачей максимизации, то вместо отыскания минимума этой функции достаточно найти мак- симум функции f(x1, …, xn). Экстремальные значения этих функций достигаются при одних и тех же значениях переменных. Мини- мальное значение функции f(x1, …, xn) равно максимальному значе- нию функции –f(x1, …, xn), взятому с обратным знаком, т. е. min f(x1, …, xn) = max f(x1, …, xn). В дальнейшем отмеченный факт позволяет говорить только о за- даче минимизации. 92 В реальных условиях на переменные xj, i = 1, …, n, и некоторые функции gi(х), hi(х), характеризующие качественные свойства объ- екта, системы, процесса, могут быть наложены ограничения (усло- вия) вида gi(х) = 0, i = 1, …, n; hi (х)  0, i = 1, …, n; a  x  b, где 1 1 2 2 ; . ... ... n n a b a b a b a b   Такую задачу называют задачей условной оптимизации. При от- сутствии ограничений имеет место задача безусловной оптимизации. Каждая точка х в n-мерном пространстве переменных х1, …, хn, в которой выполняются ограничения, называется допустимой точ- кой задачи. Множество всех допустимых точек называют допусти- мой областью G. Решением задачи (оптимальной точкой) называ- ют допустимую точку х*, в которой целевая функция f(х) достигает своего минимального значения. Точка х* определяет глобальный минимум функции одной пере- менной f(x), заданной на числовой прямой Х, если x  X и f(x) < f(x) для всех x*  X (рис. 18.2, а). Точка х* называется точкой строгого глобального минимума, если это неравенство выполняется как стро- гое. Если же в выражении f(х*)  f(x) равенство возможно при х, не равных х*, то реализуется нестрогий минимум, а под решением в этом случае понимают множество х* = [x*  X: f(x) = f(x*)] (рис. 18.2, б). 93 а б Рис. 18.2. Нахождение глобального минимума функции Точка х*  Х определяет локальный минимум функции f(x) на множестве Х, если при некотором достаточно малом e > 0 для всех х, не равных х*, x  X, удовлетворяющих условию е  x x , вы- полняется неравенство f(х*) < f(х). Если неравенство строгое, то х* является точкой строгого локального минимума. Все определения для максимума функции получаются заменой знаков предыдущих неравенств на обратные. На рис. 18.3 показаны экстремумы функ- ции одной переменной f(х) на отрезке [a, b]. Здесь х1, х3, х6 – точки локального максимума, а х2, х4 – локального минимума. Рис. 18.3. Экстремумы функции В точке х6 реализуется глобальный максимум, а в точке х2 – гло- бальный минимум. 94 19. КЛАССИФИКАЦИЯ МЕТОДОВ Возможны два подхода к решению задачи отыскания минимума функции многих переменных f(x) = f(x1, ..., хn) при отсутствии огра- ничений на диапазон изменения неизвестных. Первый подход ле- жит в основе косвенных методов оптимизации и сводит решение задачи оптимизации к решению системы нелинейных уравнений, являющихся следствием условий экстремума функции многих пе- ременных. Как известно, эти условия определяют, что в точке экс- тремума х* все первые производные функции по независимым пе- ременным равны нулю: 0i f x x x     , i = 1, …, n. Эти условия образуют систему п нелинейных уравнений, среди ре- шений которой находятся точки минимума. Вектор ( )f x , составлен- ный из первых производных функции по каждой переменной, т. е. 1( ) ( ( ) , ..., ( ) ) , T nf x f x x f x x      называют градиентом скалярной функции f(x). Как видно, в точке минимума градиент равен нулю. Решение систем нелинейных уравнений – задача весьма сложная и трудоемкая. Вследствие этого на практике используют второй подход к минимизации функций, составляющий основу прямых ме- тодов. Суть их состоит в построении последовательности векторов х[0], х[1], …, х[n], таких, что f(х[0]) > f(х[1]) > f(х[n])>… В качестве начальной точки x[0] может быть выбрана произ- вольная точка, однако стремятся использовать всю имеющуюся ин- формацию о поведении функции f(x), чтобы точка x[0] располага- лась как можно ближе к точке минимума. Переход (итерация) от точки х[k] к точке х[k + 1], k = 0, 1, 2, ..., состоит из двух этапов: 1) выбор направления движения из точки х[k]; 2) определение шага вдоль этого направления. 95 Методы построения таких последовательностей часто называют методами спуска, так как осуществляется переход от больших зна- чений функций к меньшим. Математически методы спуска описываются соотношением x[k + 1] = x[k] + akp[k], k = 0, 1, 2, ..., где p[k] – вектор, определяющий направление спуска; ak – длина шага. В координатной форме                   1 1 1 2 2 2 1 1 . ........................................... 1 k k n n k n x k x k a p k x k x k a p k x k x k a p k          Различные методы спуска отличаются друг от друга способами выбора двух параметров – направления спуска и длины шага вдоль этого направления. На практике применяются только методы, обла- дающие сходимостью. Они позволяют за конечное число шагов по- лучить точку минимума или подойти к точке, достаточно близкой к точке минимума. Качество сходящихся итерационных методов оце- нивают по скорости сходимости. В методах спуска решение задачи теоретически получается за бесконечное число итераций. На практике вычисления прекраща- ются при выполнении некоторых критериев (условий) останова ите- рационного процесса. Например, это может быть условие малости приращения аргумента    1x k x k e   или функции      1 .f k f x k g   96 Здесь k – номер итерации; e, g – заданные величины точности решения задачи. Методы поиска точки минимума называются детерминирован- ными, если оба элемента перехода от х[k] к x[k + l] (направление движения и величина шага) выбираются однозначно по доступной в точке х[k] информации. Если же при переходе используется какой- либо случайный механизм, то алгоритм поиска называется случай- ным поиском минимума. Детерминированные алгоритмы безусловной минимизации делят на классы в зависимости от вида используемой информации. Если на каждой итерации используются лишь значения минимизируемых функций, то метод называется методом нулевого порядка. Если, кроме того, требуется вычисление первых производных минимизи- руемой функции, то имеют место методы первого порядка, при необходимости дополнительного вычисления вторых производных – методы второго порядка. В настоящее время разработано множество численных методов для задач как безусловной, так и условной оптимизации. Естествен- ным является стремление выбрать для решения конкретной задачи наилучший метод, позволяющий за наименьшее время использова- ния ЭВМ получить решение с заданной точностью. Качество численного метода характеризуется многими фактора- ми: скоростью сходимости, временем выполнения одной итерации, объемом памяти ЭВМ, необходимым для реализации метода, клас- сом решаемых задач и т. д. Решаемые задачи также весьма разнооб- разны: они могут иметь высокую и малую размерность, быть унимо- дальными (обладающими одним экстремумом) и многоэкстремаль- ными и т. д. Один и тот же метод, эффективный для решения задач одного типа, может оказаться совершенно неприемлемым для задач другого типа. Очевидно, что разумное сочетание разнообразных ме- тодов, учет их свойств позволят с наибольшей эффективностью ре- шать поставленные задачи. Многометодный способ решения весьма удобен в диалоговом режиме работы с ЭВМ. Для успешной работы в таком режиме очень полезно знать основные свойства, специфику методов оптимизации. Это обеспечивает способность правильно ори- ентироваться в различных ситуациях, возникающих в процессе рас- четов, и наилучшим образом решить задачу. 97 20. ОБЩАЯ ХАРАКТЕРИСТИКА МЕТОДОВ НУЛЕВОГО ПОРЯДКА В методах нулевого порядка для определения направления спус- ка не требуется вычислять производные целевой функции. Направ- ление минимизации в данном случае полностью определяется по- следовательными вычислениями значений функции. Следует отме- тить, что при решении задач безусловной минимизации методы первого и второго порядков обладают, как правило, более высокой скоростью сходимости, чем методы нулевого порядка. Однако на практике вычисление первых и вторых производных функции боль- шого количества переменных весьма трудоемко. В ряде случаев они не могут быть получены в виде аналитических функций. Определе- ние производных с помощью различных численных методов осу- ществляется с ошибками, которые могут ограничить применение таких методов. Кроме того, на практике встречаются задачи, реше- ние которых возможно лишь с помощью методов нулевого порядка, например задачи минимизации функций с разрывными первыми производными. Критерий оптимальности может быть задан не в явном виде, а системой уравнений. В этом случае аналитическое или численное определение производных становится очень слож- ным, а иногда невозможным. Для решения таких практических за- дач оптимизации могут быть успешно применены методы нулевого порядка. Рассмотрим некоторые из них. 21. МЕТОД ПРЯМОГО ПОИСКА (МЕТОД ХУКА–ДЖИВСА) Суть метода прямого поиска состоит в следующем. Задаются неко- торой начальной точкой х[0]. Изменяя компоненты вектора х[0], об- следуют окрестность данной точки, в результате чего находят направ- ление, в котором происходит уменьшение минимизируемой функ- ции f(x). В выбранном направлении осуществляют спуск до тех пор, пока значение функции уменьшается. Если в данном направлении не удается найти точку с меньшим значением функции, уменьшают вели- чину шага спуска. Если последовательные дробления шага не приво- дят к уменьшению функции, от выбранного направления спуска отка- зываются и осуществляют новое обследование окрестности и т. д. 98 Алгоритм метода прямого поиска состоит в следующем. 1. Задаются значениями координат хi[0], i = 1, ..., п, начальной точки х[0], вектором изменения координат Dх в процессе обследо- вания окрестности, наименьшим допустимым значением е компо- нентов Dх. 2. Полагают, что х[0] является базисной точкой хб, и вычисляют значение f(xб). 3. Циклически изменяют каждую координату хбi, i = 1, ..., п, ба- зисной точки хб на величину хi, i = 1, ..., п, т. е. хi[k] = хб + Dх; хi[k] = хбi – Dхi. При этом вычисляют значения f(x[k]) и сравнивают их со значе- нием f(xб). Если f(x[k]) < f(xб), то соответствующая координата хi, i = 1, ..., п, приобретает новое значение, вычисленное по одному из приведенных выражений. В противном случае значение этой координаты остается неизменным. Если после изменения последней п-й координаты f(x[k]) < f(xб), то переходят к п. 4. В противном случае – к п. 7. 4. Полагают, что х[k] является новой базисной точкой хб, и вы- числяют значение f(xб). 5. Осуществляют спуск из точки х[k] > хi[k + 1] = 2хi[k] – xб, i = 1, ..., n, где xб – координаты предыдущей базисной точки. Вычисляют значение f(x[k+1]). 6. Как и в п. 3, циклически изменяют каждую координату точки х[k + 1], осуществляя сравнение соответствующих значений функ- ции f(х) со значением f (х[k + 1]), полученным в п. 5. После измене- ния последней координаты сравнивают соответствующее значение функции f(x[k]) со значением f(xб), полученным в п. 4. Если f(x[k]) < f(xб), 99 то переходят к п. 4, в противном случае – к п. 3. При этом в каче- стве базисной используют последнюю из полученных базисных то- чек. 7. Сравнивают значения Dх и е. Если Dх < е, то вычисления пре- кращаются. В противном случае уменьшают значения Dх и перехо- дят к п. 3. Достоинством метода прямого поиска является простота его про- граммирования на компьютере. Он не требует знания целевой функ- ции в явном виде, а также легко учитывает ограничения на отдель- ные переменные, а также сложные ограничения на область поиска. Недостаток метода прямого поиска состоит в том, что в случае сильно вытянутых, изогнутых или обладающих острыми углами линий уровня целевой функции он может оказаться неспособным обеспечить продвижение к точке минимума. Действительно, в слу- чаях, изображенных на рис. 21.1, а и б, каким бы малым ни брать шаг в направлении х1 или x2 из точки х, нельзя получить уменьше- ния значения целевой функции. а б Рис. 21.1. Прямой поиск: невозможность продвижения к минимуму: а – С1 > C2 > C3; б – С1 > C2 Напомним, что поверхностью уровня (на плоскости – линией уровня) является поверхность, получаемая приравниванием выра- жения функции f(х) некоторой постоянной величине С, т. е. f(х) = С. 100 Во всех точках этой поверхности функция имеет одно и то же значе- ние С. Давая величине С различные значения С1, ..., Сn, получают ряд поверхностей, геометрически иллюстрирующих характер функции. 22. МЕТОД ДЕФОРМИРУЕМОГО МНОГОГРАННИКА (МЕТОД НЕЛДЕРА–МИДА) Данный метод состоит в том, что для минимизации функции п переменных f(х) в n-мерном пространстве строится многогранник, содержащий (п + 1) вершину. Очевидно, что каждая вершина соот- ветствует некоторому вектору х. В каждой из вершин многогранника вычисляются значения целевой функции f(х), определяется макси- мальное из этих значений и соответствующая ему вершина х[h]. Че- рез эту вершину и центр тяжести остальных вершин проводится проецирующая прямая, на которой находится точка х[q] с меньшим значением целевой функции, чем в вершине х[h] (рис. 22.1). Затем исключается вершина х[h]. Из оставшихся вершин и точки x[q] строится новый многогранник, с которым повторяется описанная процедура. В процессе выполнения данных операций многогранник изменяет свои размеры, что и обусловило название метода. Рис. 22.2. Геометрическая интерпретация метода деформируемого многогранника 101 Введем следующие обозначения: x[i, k] = (x1[i, k], …, xj[i, k], …, xn[i, k]) T, где i = 1, ..., п + 1; k = 0, 1, ... – i-я вершина многогранника на k-м этапе поиска; х[h, k] – вершина, в которой значение целевой функции макси- мально, т. е. f(х[h, k] = max{f(x[1, k]), …, f(x[n + 1, k])}; х[l, k] – вершина, в которой значение целевой функции мини- мально, т. е. f(х[l, k]) = min{f(x[1, k]), …, f(x [n + 1, k])}; х[п + 2, k] – центр тяжести всех вершин, за исключением х[h, k]. Координаты центра тяжести вычисляются по формуле       1 1 1 2, , , , 1, ..., . n i j j jx n k x i k x n k j n n             Алгоритм метода деформируемого многогранника состоит в сле- дующем. 1. Осуществляют проецирование точки х[h, k] через центр тяжести: x[n + 3, k] = x[n + 2, k] + a(x[n + 2, k] – x[h, k]), где а > 0 – некоторая константа. Обычно а = 1. 2. Выполняют операцию растяжения вектора х[n + 3, k] – х[n + 2, k]: x[n + 4, k] = x[n + 2, k] + g(x[n + 3, k] – x[n + 2, k]), где g > 1 – коэффициент растяжения. Наиболее удовлетворительные результаты получают при 2,8  g  3. Если f(x[n + 4, k]) < f(х[l, k]), то х[h, k] заменяют на x[n + 4, k] и продолжают вычисления с п. 1 при k = k + 1. В противном случае х[h, k] заменяют на х[n + 3, k] и переходят к п. 1 при k = k + 1. 3. Если f(x[n + 3, k]) > f(х[i, k]) для всех i, не равных h, то сжи- мают вектор x[h, k] – x[n + 2, k]: x[n + 5, k] = x[n + 2, k] + b (х[h, k] – x[n + 2, k]), 102 где b > 0 – коэффициент сжатия. Наиболее хорошие результаты по- лучают при 0,4  b  0,6. Затем точку х[h, k] заменяют на х[n + 5, k] и переходят к п. 1 при k = k + 1. 4. Если f(x[n + 3, k]) > f(x[h, k]), то все векторы х[i, k] – х[l, k], i = 1, ..., п + 1, уменьшают в два раза: x[i, k] = x[l, k] + 0,5(x[i, k] – x[l, k]). Затем переходят к п. 1 при k = k + 1. В диалоговой системе оптимизации выход из подпрограммы, ре- ализующей метод деформируемого многогранника, осуществляется при предельном сжатии многогранника, т. е. при выполнении усло- вия     2 2 1 1 max , 2, , n n j j j j j x i k x n k e       где e = (е1, ..., еn) – заданный вектор. С помощью операции растяжения и сжатия размеры и форма де- формируемого многогранника адаптируются к топографии целевой функции. В результате многогранник вытягивается вдоль длинных наклонных поверхностей, изменяет направление в изогнутых впа- динах, сжимается в окрестности минимума, что определяет эффек- тивность рассмотренного метода. 23. МЕТОД ВРАЩАЮЩИХСЯ КООРДИНАТ (МЕТОД РОЗЕНБРОКА) Суть метода состоит во вращении системы координат в соответ- ствии с изменением скорости убывания целевой функции. Новые направления координатных осей определяются таким образом, что- бы одна из них соответствовала направлению наиболее быстрого убывания целевой функции, а остальные находятся из условия ор- тогональности. Идея метода состоит в следующем (рис. 23.1). 103 Рис. 23.1. Геометрическая интерпретация метода Розенброка Из начальной точки х[0] осуществляют спуск в точку х[1] по направлениям, параллельным координатным осям. На следующей ите-рации одна из осей должна проходить в направлении y1 = х[1] – х[0], а другая – в направлении, перпендикулярном к у1. Спуск вдоль этих осей приводит в точку х[2], что дает возможность построить новый вектор х[2] – х[1] и на его базе – новую систему направлений поиска. В общем случае данный метод эффективен при минимиза- ции овражных функций, так как результирующее направление по- иска стремится расположиться вдоль оси оврага. Алгоритм метода вращающихся координат состоит в следующем. 1. Через р1[k], ..., рn[k] обозначают направления координатных осей в некоторой точке х[k] (на k-й итерации). Выполняют пробный шаг h1 вдоль оси р1[k], т. е. x[kl] = x[k] + h1p1[k]. Если при этом f(x[kl]) < f(x[k]), то шаг h умножают на величину b > 1. Если f(x[kl]) > f(x[k]), – то на величину (–b), 0 < |b| < 1; x[kl] = x[k] + b h1p1[k]. 104 Полагая h1 = а1, получают x[kl] = x[k] + a1p1[k]. 2. Из точки х[k1] выполняют шаг h2 вдоль оси р2[k]: x[k2] = x[k] + a1p1[k] + h2p2[k]. Повторяют операцию п. 1, т. е. x[k2] = x[k] + а1р1[k] + а2p2[k]. Эту процедуру выполняют для всех остальных координатных осей. На последнем шаге получают точку х[kn] = х[k + 1] = х[k] +   1 . n i i i a p k   3. Выбирают новые оси координат p1[k + 1], …, рn[k + 1]. В каче- стве первой оси принимается вектор р1[k + 1] = x[k + l] – x[k]. Остальные оси строят ортогональными к первой оси с помощью процедуры ортогонализации Грама–Шмидта. Повторяют вычисле- ния с п. 1 до удовлетворения условий сходимости. Коэффициенты b подбираются эмпирически. Хорошие результа- ты дают значения b = –0,5 при неудачных пробах (f(x[ki]) > f(x[k])) и b = 3 при удачных пробах (f(x[ki]) < f(x[k])). В отличие от других методов нулевого порядка алгоритм Розен- брока ориентирован на отыскание оптимальной точки в каждом направлении, а не просто на фиксированный сдвиг по всем направ- лениям. Величина шага в процессе поиска непрерывно изменяется в зависимости от рельефа поверхности уровня. Сочетание вращения координат с регулированием шага делает метод Розенброка эффек- тивным при решении сложных задач оптимизации. 105 24. МЕТОД ПАРАЛЛЕЛЬНЫХ КАСАТЕЛЬНЫХ (МЕТОД ПАУЭЛЛА) Этот метод использует свойство квадратичной функции, заклю- чающееся в том, что любая прямая, которая проходит через точку минимума функции х*, пересекает под равными углами касатель- ные к поверхностям равного уровня функции в точках пересечения (рис. 24.1). Рис. 24.1. Геометрическая интерпретация метода Пауэлла Этот метод использует свойство квадратичной функции, заклю- чающееся в том, что любая прямая, которая проходит через точку минимума функции х*, пересекает касательные к поверхностям рав- ного уровня функции в точках пересечения (см. рис. 24.1) под рав- ными углами. Сущность метода. Выбирается некоторая начальная точка х[0] и выполняется одномерный поиск вдоль произвольного направле- ния, приводящий в точку х[1]. Затем выбирается точка х[2], не ле- жащая на прямой х[0] – х[1], и осуществляется одномерный поиск вдоль прямой, параллельной х[0] – х[1]. Полученная в результате точка х[3] вместе с точкой х[1] определяет направление x[1] – х[3] одномерного поиска, дающее точку минимума х*. В случае квадра- тичной функции n переменных оптимальное значение находится за 106 п итераций. Поиск минимума при этом в конечном счете осуществ- ляется во взаимно сопряженных направлениях. В случае неквадра- тичной целевой функции направления поиска оказываются сопря- женными относительно матрицы Гессе. Алгоритм метода парал- лельных касательных состоит в следующем. 1. Задаются начальной точкой x[0]. За начальные направления поиска р[1], ..., р[0] принимают направления осей координат, т. е. р[i] = е[i], i = 1, ..., n (здесь e[i] = (0, ..., 0, 1, 0, … 0)T). 2. Выполняют n одномерных поисков вдоль ортогональных направлений р[i], i = 1, ..., п. При этом каждый следующий поиск производится из точки минимума, полученной на предыдущем ша- ге. Величина шага аk находится из условия f(x[k] + аkр[k]) = min a f(x[k] + ар[k]). Полученный шаг определяет точку х[k + 1] = х[k] + аkр[k]. 3. Выбирают новое направление p = –x[n] – х[0] и заменяют направления р[1], ..., р[n] на р[2], ..., р[n], р. Последним присваивают обозначения р[1], ..., р[n]. 4. Осуществляют одномерный поиск вдоль направления р = р[n] = х[n] – х[0]. Заменяют х[0] на х[n + 1] = х[n] + аnр[п] и принимают эту точку за начальную точку х[0] для следующей итерации. Переходят к п. 1. Таким образом, в результате выполнения рассмотренной проце- дуры осуществляется поочередная замена принятых вначале направлений поиска. В итоге после n шагов они окажутся взаимно сопряженными. 107 25. ЧИСЛЕННЫЕ МЕТОДЫ БЕЗУСЛОВНОЙ ОПТИМИЗАЦИИ ПЕРВОГО ПОРЯДКА Минимизация функций многих переменных. Основные положения Градиентом дифференцируемой функции f(x) в точке х[0] называет- ся n-мерный вектор f(x[0]), компоненты которого являются частными производными функции f(х), вычисленными в точке х[0], т. е. f'(x[0]) = (дf(х[0])/дх1, …, дf(х[0])/дхn) T. Этот вектор перпендикулярен к плоскости, проведенной через точку х[0], и касательной к поверхности уровня функции f(x), про- ходящей через точку х[0]. В каждой точке такой поверхности функ- ция f(x) принимает одинаковое значение. Приравнивая функцию различным постоянным величинам С0, С1, ..., получим серию по- верхностей, характеризующих ее топологию (рис. 25.1). Рис. 25.1. Градиент дифференцируемой функции Вектор-градиент направлен в сторону наискорейшего возраста- ния функции в данной точке. Вектор, противоположный градиенту (–f(х[0])), называется антиградиентом и направлен в сторону наискорейшего убывания функции. В точке минимума градиент функ-ции равен нулю. На свойствах градиента основаны методы первого порядка, называемые также градиентным и методами ми- нимизации. Использование этих методов в общем случае позволяет определить точку локального минимума функции. 108 Очевидно, что если нет дополнительной информации, то из начальной точки х[0] разумно перейти в точку х[1], лежащую в направлении антиградиента – наискорейшего убывания функции. Выбирая в качестве направления спуска р[k] антиградиент –f(х[k]) в точке х[k], получаем итерационный процесс вида х[k + 1] = x[k] – akf(x[k]), аk > 0; k = 0, 1, 2, ... В координатной форме этот процесс записывается следующим образом: xi[k + 1] = хi[k] – akf(x[k])/xi, i = 1, ..., n; k = 0, 1, 2, ... В качестве критерия останова итерационного процесса исполь- зуют либо выполнение условия малости приращения аргумента || x[k + l] – x[k] ||  e, либо выполнение условия малости градиента || f(x[k + l]) ||  g. Здесь e и g – заданные малые величины. Возможен и комбинированный критерий, состоящий в одновре- менном выполнении указанных условий. Градиентные методы от- личаются друг от друга способами выбора величины шага аk. При методе с постоянным шагом для всех итераций выбирается некоторая постоянная величина шага. Достаточно малый шаг аk обеспечит убывание функции, т. е. выполнение неравенства f(х[k + 1]) = f(x[k] – akf(x[k])) < f(x[k]). Однако это может привести к необходимости проводить непри- емлемо большое количество итераций для достижения точки мини- мума. С другой стороны, слишком большой шаг может вызвать неожиданный рост функции либо привести к колебаниям около точки минимума (зацикливанию). Из-за сложности получения необ- 109 ходимой информации для выбора величины шага методы с посто- янным шагом на практике применяются редко. Более экономичны в смысле количества итераций и надежности градиентные методы с переменным шагом, когда в зависимости от результатов вычислений величина шага некоторым образом меняет- ся. Рассмотрим применяемые на практике варианты таких методов. 26. МЕТОД НАИСКОРЕЙШЕГО СПУСКА При использовании метода наискорейшего спуска на каждой итерации величина шага аk выбирается из условия минимума функ- ции f(x) в направлении спуска, т. е. f(x[k] – akf(x[k])) = 0 min a f(x[k] – af(x[k])). Это условие означает, что движение вдоль антиградиента проис- ходит до тех пор, пока значение функции f(x) убывает. С математи- ческой точки зрения на каждой итерации необходимо решать задачу одномерной минимизации по а функции: j(a) = f(x[k] – af(x[k])). Алгоритм метода наискорейшего спуска состоит в следующем. 1. Задаются координаты начальной точки х[0]. 2. В точке х[k], k = 0, 1, 2, ..., вычисляется значение градиента f(x[k]). 3. Определяется величина шага ak, путем одномерной минимиза- ции по а функции j(a) = f(x[k] – af(x[k])). 4. Определяются координаты точки х[k+1]: хi[k + 1] = xi[k] – аkfi(х[k]), i = 1, ..., п. 5. Проверяются условия останова итерационного процесса. Если они выполняются, то вычисления прекращаются. В противном слу- чае осуществляется переход к п. 1. В рассматриваемом методе направление движения из точки х[k] касается линии уровня в точке x[k + 1] (рис. 26.1). Траектория спус- ка зигзагообразная, причем соседние звенья зигзага ортогональны 110 друг другу. Действительно, шаг ak выбирается путем минимизации по а функции (a) = f(x[k] – af(x[k])). Необходимое условие миниму- ма функции dj(a)/da = 0. Вычислив производную сложной функции, получим условие ортогональности векторов направлений спуска в соседних точках: dj(a)/da = –f’(x[k + 1] f(x[k]) = 0. Рис. 26.1. Геометрическая интерпретация метода наискорейшего спуска Градиентные методы сходятся к минимуму с высокой скоростью (со скоростью геометрической прогрессии) для гладких выпуклых функций. У таких функций наибольшее М и наименьшее m – соб- ственные значения матрицы вторых производных (матрицы Гессе) 2 2 2 1 1 1 2 1 2 2 2 2 1 2 2 2 2 2 2 1 2 ( ) ( ) ( ) ... ( ) ( ) ( ) ... ( ) ... ... ... ( ) ( ) ( ) ... n n n n n n f x f x f x x x x x x x f x f x f x H x x x x x x x f x f x f x x x x x x x                             мало отличаются друг от друга, т. е. матрица Н(х) хорошо обуслов- лена. Напомним, что собственными значениями li, i = 1, …, n, мат- рицы являются корни характеристического уравнения 111 2 2 2 1 1 1 2 1 2 2 2 2 1 2 2 2 2 2 2 1 2 ( ) ( ) ( ) ... ( ) ( ) ( ) ... ( ) 0. ... ... ... ( ) ( ) ( ) ... n n n n n n f x f x f x x x x x x x f x f x f x H x x x x x x x f x f x f x x x x x x x                             Однако на практике, как правило, минимизируемые функции име- ют плохо обусловленные матрицы вторых производных (т/М << 1). Значения таких функций вдоль некоторых направлений изменяются гораздо быстрее (иногда на несколько порядков), чем в других направлениях. Их поверхности уровня в простейшем случае сильно вытягиваются (рис. 26.2), а в более сложных случаях изгибаются и представляют собой овраги. Рис. 26.2. Овражная функция Функции, обладающие такими свойствами, называют овражны- ми. Направление антиградиента этих функций (см. рис. 27.2) суще- ственно отклоняется от направления в точку минимума, что приво- дит к замедлению скорости сходимости. Скорость сходимости градиентных методов также существенно за- висит от точности вычислений градиента. Потеря точности, а это обычно происходит в окрестности точек минимума или в овражной ситуации, может вообще нарушить сходимость процесса градиентного 112 спуска. Вследствие перечисленных причин градиентные методы зача- стую используются в комбинации с другими, более эффективными методами на начальной стадии решения задачи. В этом случае точка х[0] находится далеко от точки минимума и шаги в направлении анти- градиента позволяют достичь существенного убывания функции. 27. МЕТОД СОПРЯЖЕННЫХ ГРАДИЕНТОВ Рассмотренные выше градиентные методы отыскивают точку ми- нимума функции в общем случае лишь за бесконечное число итера- ций. Метод сопряженных градиентов формирует направления поис- ка, в большей мере соответствующие геометрии минимизируемой функции. Это существенно увеличивает скорость их сходимости и позволяет, например, минимизировать квадратичную функцию f(x) = (х, Нх) + (b, х) + а с симметрической положительно определенной матрицей Н за конеч- ное число шагов п, равное числу переменных функции. Любая гладкая функция в окрестности точки минимума хорошо аппроксимируется квадратичной, поэтому методы сопряженных градиентов успешно применяют для минимизации и неквадратичных функций. В таком случае они перестают быть конечными и становятся итеративными. По определению, два n-мерных вектора х и у называют сопря- женными по отношению к матрице H (или H-сопряженными), если скалярное произведение (x, Ну) = 0. Здесь Н – симметрическая по- ложительно определенная матрица размером п  п. Одной из наиболее существенных проблем в методах сопряжен- ных градиентов является проблема эффективного построения направ- лений. Метод Флетчера–Ривса решает эту проблему путем преобра- зования на каждом шаге антиградиента –f(x[k]) в направление p[k], H – сопряженное с ранее найденными направлениями р[0], р[1], ..., р[k – 1]. Сначала рассмотрим этот метод применительно к задаче минимизации квадратичной функции. Направления р[k] вычисляют по формулам p[k] = –f(x[k]) + bk–1p[k – l], k  1; p[0] = –f’(x[0]). 113 Величины bk–1 выбираются так, чтобы направления p[k], р[k – 1] были H-сопряженными: (p[k], Hp[k – 1]) = 0. В результате для квадратичной функции 1 ( ( [ ], ( [ ] ( ( [ 1], ( [ 1]) k f x k f x k f x k f x k         итерационный процесс минимизации имеет вид x[k + l] = x[k] + akp[k], где р[k] – направление спуска на k-м шаге; аk – величина шага. Последняя выбирается из условия миниму- ма функции f(х) по а в направлении движения, т. е. в результате ре- шения задачи одномерной минимизации: f(х[k] + аkр[k]) = 0 min a f(x[k] + а [k]). Для квадратичной функции ( ( [ ]), [ ]) . ( [ ], [ ]) k f x k p k a p k Hp k    Алгоритм метода сопряженных градиентов Флетчера–Ривса сле- дующий. 1. В точке х[0] вычисляется p[0] = –f(x[0]). 2. На k-м шаге по приведенным выше формулам определяются шаг аk и точка х[k + 1]. 3. Вычисляются величины f(x[k + 1]) и f(x[k + 1]). 4. Если f(x[k + 1]) = 0, то точка х[k + 1] является точкой миниму- ма функции f(х). В противном случае определяется новое направле- ние p[k + l] из соотношения ( ( [ 1]), ( [ 1])) [ 1] ( [ 1]) [ ] ( ( [ ]), ( [ ])) f x k f x k p k f x k p k f x k f x k           114 и осуществляется переход к следующей итерации. Эта процедура найдет минимум квадратичной функции не более чем за п шагов. При минимизации неквадратичных функций метод Флетчера–Ривса из конечного становится итеративным. В таком случае после (п + 1)-й итерации процедуры 1–4 циклически повторяются с заменой х[0] на х[п + 1], а вычисления заканчиваются при ( [ ]) ,f x k   где  – заданное число. При этом применяют следующую модификацию метода: x[k + l] = x[k] + akp[k]; p[k] = –f(x[k]) + bk–1p[k – l], k  1; p[0] = –f(x[0]); f(х[k] + akp[k]) = 0 min a f(x[k] + ap[k]; 1 ( ( [ ]), ( [ ]) ( [ 1])) , . ( ( [ ], ( [ ])) 0, k f x k f x k f x k k I f x k f x k k I             Здесь I – множество индексов: I = {0, n, 2п, 3п, ...}, т. е. обновле- ние метода происходит через каждые п шагов. Геометрический смысл метода сопряженных градиентов состоит в следующем (рис. 27.1). Из заданной начальной точки х[0] осу- ществляется спуск в направлении р[0] = –f(x[0]). В точке х[1] опре- деляется вектор-градиент f(x [1]). Поскольку х[1] является точкой минимума функции в направлении р[0], то f(х[1]) ортогонален век- тору р[0]. Затем отыскивается вектор р [1], H-сопряженный к р[0]. Далее отыскивается минимум функции вдоль направления р[1] и т. д. 115 Рис. 27.1. Траектория спуска в методе сопряженных градиентов Методы сопряженных направлений являются одними из наиболее эффективных для решения задач минимизации. Однако следует от- метить, что они чувствительны к ошибкам, возникающим в процессе счета. При большом числе переменных погрешность может настоль- ко возрасти, что процесс придется повторять даже для квадратичной функции, т. е. процесс для нее не всегда укладывается в п шагов. 28. ЧИСЛЕННЫЕ МЕТОДЫ БЕЗУСЛОВНОЙ ОПТИМИЗАЦИИ ВТОРОГО ПОРЯДКА Особенности методов второго порядка Методы безусловной оптимизации второго порядка используют вторые частные производные минимизируемой функции f(х). Суть этих методов состоит в следующем. Необходимым условием экстремума функции многих переменных f(x) в точке х* является равенство нулю ее градиента в этой точке: ( )f x = 0. Разложение ( )f x в окрестности точки х[k] в ряд Тейлора с точ- ностью до членов первого порядка позволяет переписать предыду- щее уравнение в виде f(x) = f(x[k]) + f >> (x[k]) (х – х[k]) = 0. Здесь f >> (x[k]) = Н(х[k]) – матрица вторых производных (мат- рица Гессе) минимизируемой функции. Следовательно, итерацион- ный процесс для построения последовательных приближений к ре- шению задачи минимизации функции f(x) описывается выражением 116 x[k + l] = x[k] – H–1(x[k]) f(x[k]), где H–1(x[k]) – обратная матрица для матрицы Гессе; H–1(x[k])f(x[k]) = р[k] – направление спуска. Полученный метод минимизации называют методом Ньютона. Очевидно, что в данном методе величина шага вдоль направления р[k] полагается равной единице. Последовательность точек {х[k]}, получаемая в результате применения итерационного процесса, при определенных предположениях сходится к некоторой стационарной точке х* функции f(x). Если матрица Гессе Н(х*) положительно определена, точка х* будет точкой строгого локального минимума функции f(x). Последовательность x[k] сходится к точке х* только в том случае, когда матрица Гессе целевой функции положительно определена на каждой итерации. Если функция f(x) является квадратичной, то, независимо от начального приближения х[0] и степени овражности, с помощью метода Ньютона ее минимум находится за один шаг. Это объясня- ется тем, что направление спуска р[k] = H–1(x[k])f’(x[k]) в любых точках х[0] всегда совпадает с направлением в точку ми- нимума х*. Если же функция f(x) не квадратичная, но выпуклая, ме- тод Ньютона гарантирует ее монотонное убывание от итерации к итерации. При минимизации овражных функций скорость сходи- мости метода Ньютона более высока по сравнению с градиентными методами. В таком случае вектор р[k] не указывает направление в точку минимума функции f(x), однако имеет большую составля- ющую вдоль оси оврага и значительно ближе к направлению на ми- нимум, чем антиградиент. Существенным недостатком метода Ньютона является зависимость сходимости для невыпуклых функций от начального приближения х[0]. Если х[0] находится достаточно далеко от точки минимума, то метод может расходиться, т. е. при проведении итерации каждая сле- дующая точка будет более удаленной от точки минимума, чем преды- дущая. Сходимость метода, независимо от начального приближения, обеспечивается выбором не только направления спуска р[k] = H–1(x[k])f(x[k]), 117 но и величины шага а вдоль этого направления. Соответствующий алгоритм называют методом Ньютона с регулировкой шага. Ите- рационный процесс в таком случае определяется выражением x[k + l] = x[k] – akH –1(x[k])f(x[k]). Величина шага аk выбирается из условия минимума функции f(х) по а в направлении движения, т. е. в результате решения задачи од- номерной минимизации f(x[k] – akH –1(x[k])f(x[k]) = 0 min a (f(x[k] – aH–1(x[k])f(x[k])). Вследствие накопления ошибок в процессе счета матрица Гессе на некоторой итерации может оказаться отрицательно определен- ной или ее нельзя будет обратить. В таких случаях в подпрограммах оптимизации полагается H–1(x[k]) = Е, где Е – единичная матрица. Очевидно, что итерация при этом осуществляется по методу наискорейшего спуска. 29. МЕТОД НЬЮТОНА Алгоритм метода Ньютона состоит в следующем. 1. В начальной точке х[0] вычисляется вектор p[0] = –H–1(x[0])f([0]). 2. На k-й итерации определяются шаг аk и точка х[k + 1]. 3. Вычисляется величина f(х[k + 1]). 4. Проверяются условия выхода из подпрограммы, реализующей данный алгоритм. Эти условия аналогичны условиям выхода из под- программы при методе наискорейшего спуска. Если эти условия выполняются, то вычисления прекращаются. В противном случае вычисляется новое направление р[k + 1] = –H–1(x[k])f([k]) и осуществляется переход к следующей итерации. 118 Количество вычислений на итерации методом Ньютона, как пра- вило, значительно больше, чем в градиентных методах. Это объяс- няется необходимостью вычисления и обращения матрицы вторых производных целевой функции. Однако для получения решения с достаточно высокой степенью точности с помощью метода Нью- тона обычно требуется намного меньше итераций, чем при исполь- зовании градиентных методов. В силу этого метод Ньютона гораздо эффективнее. Он обладает сверхлинейной или квадратичной скоро- стью сходимости в зависимости от требований, которым удовлетво- ряет минимизируемая функция f(x). Тем не менее в некоторых зада- чах трудоемкость итерации методом Ньютона может оказаться очень большой за счет необходимости вычисления матрицы вторых про- изводных минимизируемой функции, что потребует затрат значи- тельного количества машинного времени. В ряде случаев целесообразно комбинированное использование градиентных методов и метода Ньютона. В начале процесса мини- мизации, когда точка х[0] находится далеко от точки экстремума х*, можно применять какой-либо вариант градиентных методов. Далее при уменьшении скорости сходимости градиентного метода можно перейти к методу Ньютона. В ы в о д ы Процесс моделирования технологических процессов в упаковоч- ном производстве имеет большое преимущество и делает этот под- ход незаменимым для их дальнейшего совершенствования. Моделирование и усовершенствование конструкции оборудова- ния и процессов в упаковочном производстве с использованием компьютеров позволяет перейти к систематическому конструирова- нию, а не к случайным разработкам, в значительной степени осно- ванным на опыте. Несмотря на то, что традиционная разработка технологических процессов в упаковочном производстве на основе экспериментов ориентирована на производство необходимого качественного целе- вого продукта, отсутствует ясное понимание того, что параметры процесса взаимосвязаны друг с другом и как они влияют на каче- ство конечного продукта (упаковки). 119 Оптимизация и моделирование обеспечивает понимание того, как переменные процессы влияют на технологический процесс и качество конечного целевого продукта. При этом следует иметь в виду, что моделирование предлагает и обратную связь для пере- менных величин, которые не могут быть легко измеряемы. Это относится к измерению температуры в канале во время реального процесса экструзии. Особенно важно то, что моделирование и опти- мизация дают инженеру возможность количественно оценить влия- ние изменения одной переменной величины на качество конечного целевого продукта. Моделирование и оптимизация предоставляют также существен- ные преимущества при конструировании оборудования (например, шнеков экструдера и смесителей) в упаковочном производстве. Са- мо же компьютерное моделирование дает возможность оценки но- вых конструкций на компьютере, экономя время и средства на раз- работку и тестирование прототипов. Особенно важны подобные виртуальные разработки, которые дают возможность инженеру при малом количестве попыток тщательно оптимизировать конструк- цию до того, как она будет изготовлена. В связи с возрастанием требований к снижению затрат, улучше- нию качества целевой продукции упаковочного производства и по- вышению производительности автоматизированное моделирование и оптимизация становятся важными средствами повышения каче- ства целевой продукции и производительности, в результате чего рентабельность процесса значительно возрастает. При этом важна экспериментальная проверка рассчитанных ре- зультатов. Только сочетание компьютерного моделирования и опти- мизации с результатами экспериментальных работ может значи- тельно улучшить и усовершенствовать процесс производства изде- лий в упаковочном производстве. Это надежный путь к улучшению и совершенствованию технологического процесса. 120 Л и т е р а т у р а 1. Варфоломеев, В. И. Моделирование элементов экономических систем / В. И. Варфоломеев. – М., 2000. 2. Бусленко, Н. П. Моделирование сложных систем / Н. П. Бус- ленко. – М., 1999. 3. Черчмен, У. Введение в исследование операций / У. Черчмен, Р. Акоф, Л. Артоф. – М. : Наука, 1968. 4. Будылин, А. Элементарные задачи / А. Будылин. – М., 2002. 5. Ванько, В. И. Вариационное исчисление и оптимальное управ- ление / В. И. Ванько, О. В. Ермошина, Г. Н. Кувыркин. – М., 1999. 6. Ашманов, С. А. Теория оптимизации в задачах и упражнениях / С. А. Ашманов, А. В. Тимохов. – М., 1991. 7. Коваленко, А. Г. Лабораторный практикум по методам опти- мизации / А. Г. Коваленко, И. А. Власова, А. Ф. Федечев. – Самара, 1998. 8. Закгейм, А. Ю. Введение в моделирование химико-технологи- ческих процессов / А. Ю. Закгейм. – 2-е изд., перераб. и доп. – М. : Химия, 1982. – 288 с. – (Серия Химическая кибернетика). 9. Кафаров, В. В. Математическое моделирование основных про- цессов химических производств : учебное пособие для вузов / В. В. Кафаров, М. Б. Глебов. – М. : Высшая школа, 1991. – 400 с. 10. Аоки, М. Введение в методы оптимизации / М. Аоки. – М. : ГОУВПО «МГУС», 1989. – 415 с. 11. Аттетков, А. В. Методы оптимизации : учеб. для вузов / А. В. Аттетков ; под ред. B. C. Зарубина, А. П. Крищенко. – 2-е изд., стереотип. – М. : МГТУ им. Н. Э. Баумана, 2003. – 440 с. 12. Ашманов, С. А. Линейное программирование / С. А. Ашма- нов. – М. : Наука. 1981. – 340 с. 13. Пирогова, И. Н. Линейное программирование : методическое руководство по дисциплине «Высшая математика» для студентов всех специальностей и всех форм обучения / И. Н. Пирогова. – Ека- теринбург : Изд-во УрГУПС, 2004. – 34 с. 14. Бояринов, A. И. Методы оптимизации в химической техноло- гии / А. И. Бояринов, В. В. Кафаров. – М. : Химия, 1975. – 378 с. 15. Кутателадзе, С. С. Анализ подобия в теплофизике / С. С. Ку- тателадзе. – Новосибирск : Наука, 1982. – 280 с. 121 16. Пасконов, В. М. Численное моделирование процессов тепло- и массообмена / В. М. Пасконов, В. И. Полежаев, Л. А. Чудов. – М. : Наука, 1984. – 288 с. 17. Банди, Б. Методы оптимизации. Вводный курс / Б. Банди. – М. : Радио и связь. 1988. – 220 с. 18. Курицкий, Б. Я. Поиск оптимальных решений средствами Excel 7.0 / Б. Я. Курицкий. – К., 1997. 19. Дьяконов, В. П. MATLAB : учебный курс / В. П. Дьяконов. – СПб. : Питер. – 2001. 20. Гультяев, А. Визуальное моделирование в среде МАТЛАБ : учебный курс / А. Гультяев. – СПб. : Питер, 2000. – 432 с. 21. Кафаров, В. В. Оптимизация теплообменных процессов и сис- тем / В. В. Кафаров, В. П. Мешалкин, Л. В. Гурьева. – М. : Энерго- атомиздат, 1988. – 122 с. 22. Методы оптимизации параметров теплообменных аппаратов АЭС / А. Н. Иоселиани [и др.]. – Минск : Наука и техника, 1981. – 144 с. 23. Построение математических моделей химико-технологиче- ских объектов / Е. Г. Дудников [и др.]. – М. : Химия, 1970. – 312 с. 24. Роуч, П. Вычислительная гидродинамика / П. Роуч. – М. : Мир, 1980. – 616 с. 25. Ши, Д. Численные методы в задачах теплообмена / Д. Ши. – М. : Мир, 1988. – 544 с. 26. Долголаптев, В. Работа в Excel 7.0 для Windows'95 на приме- рах / В. Долголаптев. – М. : БИНОМ, 1997. 27. Орвис, В. Excel для ученых, инженеров и студентов / В. Ор- вис. – Киев, 1999. 28. Потемкин, В. Г. Система MATLAB : справочное пособие / В. Г. Потемкин. – М. : ДИАЛОГ-МИФИ, 1998. 29. Печенегов, Ю. Я. Моделирование и оптимизация тепло- и массообменных процессов и установок / Ю. Я. Печенегов. – Саратов, 1994. – 59 с. 30. Раувендаль, К. Экструзия полимеров : пер. с англ. / К. Рау- вендаль ; под ред. А. Я. Малкина. – СПб. : Профессия, 2008. – 768 с. 31. Лыков, А. В. Теория теплопроводности / А. В. Лыков. – М. : ГИТТЛ, 1952. – 391 с. 32. Карслоу, Г. Теплопроводность твердых тел / Г. Карслоу, Д. Егерь. – М. : Наука, 1964. – 487 с. 122 33. Кирпичев, М. В. Моделирование тепловых устройств / М. В. Кирпичев, М. А. Михеев. – М. : Изд-во АН СССР, 1936. – 255 с. 34. Теплообмен / Н. В. Тябин [и др.]. – М. : Наука, 1975. – С. 195–198. 35. Торнер, Н. Технология переработки пластмасс / Н. Торнер. – М. : Моск. политехн. ин-т, 1965. – С. 138–143. 36. Хрусталев, Б. М. Техническая термодинамика : учебник для строительных и энергетических специальностей вузов : в 2 ч. / Б. М. Хрусталев, А. П. Несенчук, В. Н. Романюк. – Минск : Техно- принт, 2004. – 486 с. 37. Седнин, В. А. Теория и практика создания автоматизирован- ных систем управления теплоснабжением / В. А. Седнин. – Минск : БНТУ, 2005. – 191 с. 38. Воронова, Н. П. Математическое моделирование и управле- ние теплотехнологиями промышленных производств / Н. П. Воро- нова. – Минск : БНТУ, 2009. – 260 с. 39. Рапопорт, Э. Я. Структурное моделирование объектов и сис- тем управления с распределенными параметрами : учебное пособие / Э. Я. Рапопорт. – М. : Высшая школа, 2003. – 299 с. 40. Турбин, М. В. Исследование обобщенной математической модели движения жидкости Кельвина–Фойгта / М. В. Турбин // Вестн. ВГУ. Сер. физ.-мат. наук. – 2004. – № 1. – С. 163–179. 41. Турбин, М. В. О корректной постановке начально-краевых задач для обобщенной модели Кельвина–Фойгта / М. В. Турбин // Изв. вузов. Сер. мат. наук. – 2006. – № 3. – С. 50–58. 42. Zvyagin, V.G. On weak solutions of the equations of motion of a viscoelastic medium with variable boundary / V. G. Zvyagin, V. P. Orlov // Bound. Value Probl. – 2005. – No 3. – P. 215–245. 43. Zvyagin, V.G. Approximating-topological methods in some prob- lems of hydrodynamics / V. G. Zvyagin, D. A. Vorotnikov // J. Fixed Point Theor. Appl. – 2008. – V. 3, No 1. – P. 23–49. 44. Zvyagin, V. Topological approximation methods for evolutionary problems of nonlinear hydrodinamics / V. Zvyagin, D. Vorotnikov. – Berlin–New York : Walter de Gruyter, 2008. – 248 p. 45. Тадмор, З. Теоретические основы переработки полимеров / З. Тадмор, К. Гогос. – М. : Химия, 1984. – 632 с. 46. Янков, В. И. Неизотермическое течение полимерных жид- костей в винтовых уплотнениях с продольной циркуляцией / 123 В. И. Янков, Н. М. Труфанова, А. Г. Щербинин // Химическое и нефтегазовое машиностроение. – 2006. – № 6. – С. 3–5. 47. Янков, В. И. Изотермическое течение аномально-вязких жид- костей в винтовых уплотнениях с продольной циркуляцией / В. И. Янков, Н. М. Труфанова, А. Г. Щербинин // Химическое и нефтегазовое машиностроение. – 2006. – № 6. – С. 3–5. 124 Учебное издание КАРПУНИН Иван Иванович МОДЕЛИРОВАНИЕ И ОПТИМИЗАЦИЯ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ ПРИМЕНИТЕЛЬНО К УПАКОВОЧНОМУ ПРОИЗВОДСТВУ Учебно-методическое пособие для студентов специальности 1-36 20 02 «Упаковочное производство» Редактор Т. Н. Микулик Компьютерная верстка Н. А. Школьниковой Подписано в печать 27.05.2013. Формат 6084 1/16. Бумага офсетная. Ризография. Усл. печ. л. 7,21. Уч.-изд. л. 5,64. Тираж 100. Заказ 417. Издатель и полиграфическое исполнение: Белорусский национальный технический университет. ЛИ № 02330/0494349 от 16.03.2009. Пр. Независимости, 65. 220013, г. Минск.