Умовний екстремум за допомогою методу Лагранжа Excel. Умовні екстремуми та метод множників лагранжу

  • Tutorial

Всім доброго дня. У цій статті хочу показати один із графічних методів побудови математичних моделей для динамічних систем, який називається Бонд граф(«bond» – зв'язки, «graph» – граф). У російській літературі, описи даного методу, я знайшов лише у Навчальному посібнику Томського політехнічного університету, А.В. Воронін «МОДЕЛЮВАННЯ МЕХАТРОННИХ СИСТЕМ» 2008 р. Також показати класичний метод через рівняння Лагранжа 2 роду.

Метод Лагранжа

Я не розписуватиму теорію, покажу етапи розрахунків і з невеликими коментарями. Особисто мені легше вчитися на прикладах, ніж 10 разів читати теорію. Як мені здалося, в російській літературі, пояснення цього методу, та й взагалі математики чи фізики, дуже насичене складними формулами, що потребує серйозного математичного бекграунду. Під час вивчення методу Лагранжа (навчаюся в Туринському політехнічному університеті, Італія), я вивчав російську літературу, щоб зіставити методики розрахунків, і мені було важко стежити за ходом вирішення даного методу. Навіть згадуючи курси з моделювання у «Харківському авіаційному інституті», виведення подібних методів було дуже громіздким, і ніхто не ускладнював себе у спробі розібратися в цьому питанні. Ось цьому я вирішив написати, методичку для побудови мат моделей по Лагранжу, як виявилося це зовсім не складно, достатньо знати як вважати похідні за часом і приватні похідні. Для моделей складніше ще додаються матриці повороту, але в них теж немає нічого складного.

Особливості методів моделювання:

  • Ньютона-Ейлера: векторні рівняння, що базуються на динамічній рівновазі. сил (force)і моментів (moments)
  • Лагранжа: скалярні рівняння, засновані на функціях стану пов'язаних з кінетичною та потенційною енергією (energies)
  • Бонд-граф: метод заснований на перебігу потужності (power)між елементами системи

Почнемо з простого прикладу. Маса з пружиною та демпфером. Нехтуємо силою тяжіння.


Рис 1. Маса з пружиною та демпфером

Насамперед позначаємо:

  • початкову систему координат(НСК) або нерухому ск R0(i0,j0,k0). Де? Можна тицьнути пальцем у небо, але посмикавши кінчиками нейронів у мозку, проходить ідея поставити НСК на лінії руху тіла М1.
  • системи координат для кожного тіла з масою(у нас М1 R1(i1,j1,k1)), орієнтація може бути довільною, але навіщо ускладнювати собі життя, ставимо з мінімальною відмінністю від НСК
  • узагальнені координати q_i(Мінімальна кількість змінні якими можна описати рух), в даному прикладі одна узагальнена координата, рух тільки вздовж осі j


Рис 2. Проставляємо системи координат та узагальнені координати


Рис 3. Позиція та швидкість тіла М1

Після знайдемо кінетичну (С) та потенційну (Р) енергії та дисипативну функцію (D) для демпфера за формулами:


Рис 4. Повна формулакінетичної енергії

У прикладі обертання немає, друга складова дорівнює 0.




Рис 5. Розрахунок кінетичної, потенційної енергії та дисипативної функції

Рівняння Лагранжа має такий вигляд:


Рис 6. Рівняння Лагранжа та Лагранжіан

Дельта W_iце віртуальна робота виконана прикладеними силами та моментами. Знайдемо її:


Рис 7. Розрахунок віртуальної роботи

Де дельта q_1віртуальне переміщення.

Підставляємо все в рівняння Лагранжа:


Рис 8. Отримана модель маси з пружинною та демпфером

На цьому метод Лагранжа закінчився. Як видно не так складно, але це все ж таки дуже простий приклад, для якого швидше за все метод Ньютона-Ейлера навіть був би простіше. Для більш складних систем, де буде кілька тіла, повернених один до одного на різні кут, метод Лагранжа буде легшим.

Метод Bond graph

Відразу покажу так виглядає модель у bond-graph для прикладу з масою пружиною та демпфером:


Рис 9. Bond-graph маси з пружинною та демпфером

Тут доведеться розповісти трохи теорії, якої вистачить для побудови простих моделей. Якщо хтось зацікавлений можете почитати книгу ( Bond Graph Methodology) або ( Воронін А.В. Моделювання мехатронних систем: навчальний посібник. - Томськ: Вид-во Томського політехнічного університету, 2008).

Визначимо для початку, що складні системи складаються з кількох доменів. Наприклад електродвигун складається з електричної та механічної частин або доменів.

Бонд графґрунтується на обміні потужності між цими доменами, підсистемами. Зауважимо, що обмін потужністю будь-якої форми завжди визначається двома змінними ( змінні потужності) за допомогою яких ми можемо вивчати взаємодію різних підсистем у складі динамічної системи (див. таблицю).

Як видно з таблиці, вираз потужності скрізь практично однаковий. В узагальненні, Потужність- це твір « потоку - f» на « зусилля - e».

Зусилля(англ. effort) в електричному домені це напруга (e), в механічному - сила (F) або момент (T), у гідравліці – тиск (p).

Потік(англ. flow) в електричному домені це струм (i), в механічному - швидкість (v) або кутова швидкість (omega), у гідравліці - потік або витрата рідини (Q).

Приймаючи дані позначення, отримуємо вираз для потужності:


Рис 10. Формула потужності через потужнісні змінні

У мові bond-graph з'єднання між двома підсистемами, які обмінюються потужністю, представлено зв'язком (англ. bond). Тому і називається даний метод bond-graphабо г раф-зв'язків, зв'язковий граф. Розглянемо блок-діаграмузв'язків у моделі з електродвигуном (це ще не bond-graph):


Рис 11. Блок-діарама потоку потужності між доменами

Якщо у нас джерело напруги, то відповідно він генерує напругу і віддає його двигуну на відмотки (з цього стрілка направлена ​​у бік двигуна), залежно від опору обмотки з'являється струм за законом Ома (направлений від двигуна джерела). Відповідно одна змінна є входом у підсистему, а друга необхідна має бути виходоміз підсистеми. Тут напруга ( effort) - Вхід, струм ( flow) - Вихід.

Якщо використовувати джерело струму, як зміниться діаграма? Правильно. Струм буде спрямований до двигуна, а напруга до джерела. Тоді струм ( flow) – вхід, напруга ( effort) - Вихід.

Розглянемо приклад у механіці. Сила, що діє масу.


Рис 12. Сила додана до маси

Блок-Діаграма буде наступним:


Рис 13. Блок-діаграма

У цьому прикладі, Сила ( effort) - вхідна змінна для маси. (Сила додана до маси)
За другим законом Ньютона:

Маса відповідає швидкістю:

У цьому прикладі якщо одна змінна ( сила - effort) є входомв механічний домен, то інша потужна змінна ( швидкість - flow) – автоматично стає виходом.

Щоб розрізняти, де вхід, а де вихід, використовується вертикальна лінія на кінці стрілки (зв'язку) між елементами, цю лінію називають знак причинності або причинний зв'язок (causality). Виходить: прикладена сила – причина, а швидкість – слідство. Цей знак дуже важливий для правильної побудови моделі системи, оскільки причинність - це наслідок фізичної поведінки та обміну потужностями двох підсистем, тому вибір розташування знака причинності не може бути довільним.


Рис 14. Позначення причинного зв'язку

Ця вертикальна лінія показує, яка підсистема отримує зусилля ( effort) і як наслідок виробляти потік ( flow). У прикладі з масою буде так:


Рис 14. Причинний зв'язок для сили, що діє на масу

За стрілкою зрозуміло, що на вхід для маси - сила, а вихід - швидкість. Це робиться, щоб не захаращувати стрілками схему і систематизації побудови моделі.

Наступний момент. Узагальнений імпульс(кількість руху) та переміщення(енергетичні змінні).

Таблиця потужних та енергетичних змінних у різних доменах



Таблиця вище вводить дві додаткові фізичні величини, які у методі bond-graph. Вони називаються узагальнений імпульс (р) та узагальнене переміщення (q) або енергетичні змінні, і отримати їх можна інтегруванням потужних змінних за часом:


Рис 15. Зв'язок між потужнісними та енергетичними змінними

В електричному домені :

Виходячи із закону Фарадея, напругана кінцях провідника дорівнює похідній від магнітного потоку через цей провідник.


А Сила струму - фізична величина, Рівна відношенню кількості заряду Q, що пройшов за деякий час t через поперечний переріз провідника, до величини цього проміжку часу.

Механічний домен:

З 2 закону Ньютона, Сила- Похідна за часом від імпульсу


І відповідно, швидкість- похідна за часом від переміщення:

Узагальним:

Базові елементи

Всі елементи в динамічних системах, можна розділити на двополюсні та чотириполюсні компоненти.
Розглянемо двополюсні компоненти:

Джерела
Джерела бувають як зусилля, і потоку. Аналогія в електричному домені: джерело зусилляджерело напруги, джерело потокуджерело струму. Причинні знаки для джерел мають бути лише такі.


Рис 16. Причинні зв'язки та позначення джерел

Компонент R – дисипативний елемент

Компонент І - Інерційний елемент

Компонент C – ємнісний елемент

Як видно з малюнків, різні елементи одного типу R, C, Iописуватись однаковими рівняннями. ТІЛЬКИ є відмінність для електричної ємності, це потрібно просто запам'ятати!

Чотириполюсники компоненти:

Розглянемо два компоненти трансформатор та гіратор.

Останніми важливими компонентами методу bond-graph виступають сполуки. Існує два типи вузлів:




На цьому із компонентами закінчили.

Основні етапи для проставлення причинних зв'язків після побудови bond-graph:

  1. Проставити причинні зв'язки всім джерел
  2. Пройтись по всіх вузлах та проставити причинні зв'язки після пункту 1
  3. Для компонентів Iприсвоїти вхідний причинний зв'язок (зусилля входить у цей компонент), для компонентів Спривласнюємо вихідний причинний зв'язок (зусилля виходить із цього компонента)
  4. Повторити пункт 2
  5. Проставити причинні зв'язки для компонентів R
На цьому міні-курс з теорії закінчимо. Тепер ми маємо все необхідне для побудови моделей.
Давайте вирішимо кілька прикладів. Почнемо з електричного ланцюга, краще зрозуміти аналогію побудови bond-graph.

Приклад 1


Почнемо побудову bond-graph із джерела напруги. Просто пишемо Se та ставимо стрілку.


Бачите просто! Дивимося далі, R і L з'єднані послідовно, значить в них тече однаковий струм, якщо говорити в потужних змінних - однаковий потік. Який вузол має однаковий потік? Правильна відповідь 1-вузол. Приєднуємо до 1-вузла джерело, опір (компонент – R) та індуктивність (компонент – I).


Далі у нас ємність та опір у паралелі, значить вони мають однакову напругу чи зусилля. 0-вузол підійде як ніхто інший. З'єднуємо ємність (компонент С) та опір (компонент R) до 0-вузла.


Вузли 1 та 0 теж з'єднуємо між собою. Напрямок стрілок вибирається довільний, напрямок зв'язку впливає лише на знак рівняннях.

Вийде наступний граф зв'язків:

Тепер слід проставити причинні зв'язки. Дотримуючись вказівок щодо послідовності їх проставлення, почнемо з джерела.

  1. Ми маємо джерело напруги (зусилля), таке джерело має лише один варіант причинності – вихідну. Ставимо.
  2. Далі є компонент I, дивимося, що рекомендують. Ставимо
  3. Проставляємо для 1-вузла. Є
  4. 0-вузол повинен мати один вхід і всі вихідні причинні зв'язки. У нас є поки що одна вихідна. Шукаємо компоненти З чи I. Знайшли. Ставимо
  5. Проставляємо що залишилося


От і все. Bond-graph побудовано. УРА товариші!

Залишилося справа за малим, написати рівняння, що описують нашу систему. Для цього складемо таблицю із 3 стовпцями. У першому будуть всі компоненти системи, у другому вхідна змінна кожному за елемента, а третьому – вихідна змінна, такого самого компонента. Вхід і вихід ми вже визначили причинними зв'язками. Тож проблем виникнути не повинно.

Пронумеруємо кожен зв'язок для зручності запису рівнів. Рівняння кожного елемента беремо з переліку компонентів C,R,I.



Склавши таблицю визначимо змінні стани, в даному прикладі 2, p3 і q5. Далі потрібно записати рівняння стану:


Ось і вся модель готова.

Приклад 2. Відразу хочу вибачитись за якість фото, головне що можна прочитати

Вирішимо ще один приклад для механічної системи, той же, що ми вирішували методом Лагранжа. Я покажу рішення без коментарів. Перевіримо який із даних методів простіше, легше.

У матболі були складені обидві мат моделі з однаковими параметрами, отримані методом Лагранжа та bond-graph. Результат нижче: Додати теги

Метод множниківЛагранжа(в англ. літературі "LaGrange"s method of undetermined multipliers") - це чисельний метод вирішення оптимізаційних завдань, який дозволяє визначити "умовний" екстремум цільової функції (мінімальне або максимальне значення)

за наявності заданих обмежень на її змінні у вигляді рівностей (тобто визначено область допустимих значень)

˗ це значення аргументу функції (керовані параметри) на речовій області при якому значення функції прагне екстремуму. Застосування назви «умовний» екстремум пов'язане з тим, що на змінні накладено додаткову умову, яка обмежує область допустимих значень під час пошуку екстремуму функції.

Метод множників Лагранжа дозволяє задачу пошуку умовного екстремуму цільової функції на множині допустимих значень перетворити до завдання без умовної оптимізаціїфункції.

Якщо функції і безперервні разом зі своїми приватними похідними, то існують такі змінні λ не рівні одночасно нулю, за яких виконується така умова:

Таким чином, відповідно до методу множників Лагранжа для пошуку екстремуму цільової функції на множині допустимих значень становлю функцію Лагранжа L(х, λ), яку надалі оптимізують:

де λ ˗ вектор додаткових змінних, які називають невизначеними множниками Лагранжа.

Таким чином, завдання знаходження умовного екстремуму функції f(x) звелося до пошуку безумовного екстремуму функції L(x, λ).

і

Необхідна умова екстремуму функції Лагранжа визначається системою рівнянь (система складається з «n + m» рівнянь):

Рішення даної системи рівнянь дозволяє визначити аргументи функції (Х), у яких значення функції L(x, λ), і навіть значення цільової функції f(x) відповідають екстремуму.

Величина множників Лагранжа (λ) має практичний інтерес у разі, якщо обмеження представлені у формі з вільним членом рівняння (константою). І тут можна розглядати подальше (збільшення/зменшення) значення цільової функції з допомогою зміни значення константи у системі рівняння . Таким чином, множник Лагранжа характеризує швидкість зміни максимуму цільової функції при зміні константи, що обмежує.

Існує кілька способів визначення характеру екстремуму отриманої функції:

Перший спосіб: Нехай координати точки екстремуму, а - відповідне значення цільової функції. Береться точка, близька до точки, і обчислюється значення цільової функції:

Якщо , то в точці має місце максимум.

Якщо , то у точці має місце мінімум.

Другий спосіб: Достатня умова, з якої можна з'ясувати характер екстремуму, є знак другого диференціалу функції Лагранжа. Другий диференціал функції Лагранжа визначається так:

Якщо у заданій точці мінімум, якщо ж , то цільова функція f(x) має у цій точці умовний максимум.

Третій спосіб: Також характер екстремуму функції можна з'ясувати, розглянувши гесіан функції Лагранжа. Матриця Гессе є симетричною квадратною матрицею других приватних похідних функції в точці , в якій елементи матриці симетричні щодо головної діагоналі.

Для визначення типу екстремуму (максимум або мінімум функції) можна скористатися правилом Сильвестра:

1. Для того, щоб другий диференціал функції Лагранжа був позитивним необхідно, щоб кутові мінори функції були позитивними. За таких умов функція у цій точці має мінімум.

2. Для того, щоб другий диференціал функції Лагранжа був від'ємним. , Необхідно, щоб кутові мінори функції чергувалися, причому перший елемент матриці повинен бути негативним. За таких умов функція у цій точці має максимум.

Під кутовим мінором розуміємо мінор, розташований в перших рядках k і стовпцях вихідної матриці.

Основне практичне значення методу Лагранжа полягає в тому, що він дозволяє перейти від умовної оптимізації до безумовної та, відповідно, розширити арсенал доступних методів вирішення задачі. Однак завдання вирішення системи рівнянь, до якої зводиться даний метод, загальному випадкуне простіше вихідного завдання пошуку екстремуму. Такі методи називаються непрямими. Їх застосування пояснюється необхідністю отримати рішення екстремальної задачі в аналітичній формі (припустимо, для тих чи інших теоретичних викладок). При вирішенні конкретних практичних завданьзазвичай використовуються прямі методи, засновані на ітеративних процесах обчислення та порівняння значень оптимізованих функцій.

Методика розрахунку

1 крок: Визначаємо функцію Лагранжа із заданої цільової функції та системи обмежень:

Вперед

Для того, щоб додати коментар до статті, будь ласка, зареєструйтесь на сайті.

Метод множників Лагранжа.

Метод множників Лагранжа є одним із методів, які дозволяють вирішувати задачі не лінійного програмування.

Нелінійне програмування - це розділ математичного програмування, що вивчає методи вирішення екстремальних завдань з нелінійною цільовою функцією та областю допустимих рішень, визначеною нелінійними обмеженнями. В економіці це відповідає тому, що результати (ефективність) зростають або зменшуються непропорційно до зміни масштабів використання ресурсів (або, що те саме, масштабів виробництва): напр., через розподіл витрат виробництва на підприємствах на змінні та умовно-постійні; через насичення попиту товари, коли кожну наступну одиницю продати важче, ніж попередню тощо.

Завдання нелінійного програмування ставиться як завдання знаходження оптимуму певної цільової функції

F(x 1 ,...x n), F (x) → max

при виконанні умов

g j (x 1 ... x n)≥0, g (x) ≤ b , x ≥ 0

де x-Вектор шуканих змінних;

F (x) -цільова функція;

g (x) - функція обмежень (безперервно диференційована);

b - Вектор констант обмежень.

Розв'язання задачі нелінійного програмування (глобальний максимум або мінімум) може належати або межі, або внутрішній частині допустимої множини.

На відміну від завдання лінійного програмування, завдання програмування нелінійного оптимум необов'язково лежить межі області, певної обмеженнями. Інакше висловлюючись, завдання полягає у виборі таких неотрицательных значень змінних, підпорядкованих системі обмежень у вигляді нерівностей, у яких досягається максимум (чи мінімум) цієї функції. При цьому не обумовлюються форми цільової функції, ні нерівностей. Можуть бути різні випадки: цільова функція нелінійна, а обмеження – лінійні; цільова функція лінійна, а обмеження (хоча одне з них) нелінійні; і цільова функція, та обмеження нелінійні.

Завдання нелінійного програмування зустрічається в природничих науках, техніці, економіці, математиці, у сфері ділових відносин та у науці управління державою.



Нелінійне програмування, наприклад, пов'язане з основним економічним завданням. Так, у задачі про розподіл обмежених ресурсів максимізують або ефективність, або, якщо вивчається споживач, споживання за наявності обмежень, що виражають умови нестачі ресурсів. У такій загальній постановці математичне формулювання завдання може виявитися неможливим, але в конкретних застосуваннях кількісний вид усіх функцій може бути визначений безпосередньо. Наприклад, промислове підприємствовиробляє вироби із пластмаси. Ефективність виробництва оцінюється прибутком, а обмеження інтерпретуються як готівкова робоча сила, виробничі площі, продуктивність устаткування тощо.

Метод "витрати - ефективність" також укладається у схему нелінійного програмування. Цей методбув розроблений для використання при ухваленні рішень в управлінні державою. Загальною функцієюефективності є добробут. Тут виникають дві задачі нелінійного програмування: перше - максимізація ефекту при обмежених витратах, друге - мінімізація витрат за умови, щоб ефект був вищим за деякий мінімальний рівень. Зазвичай це завдання добре моделюється за допомогою нелінійного програмування.

Результати розв'язання задачі нелінійного програмування є підмогою для прийняття державних рішень. Отримане рішення є, звичайно, рекомендованим, тому необхідно дослідити припущення та точність постановки задачі нелінійного програмування, перш ніж ухвалити остаточне рішення.

Нелінійні завдання складні, часто їх спрощують тим, що призводять до лінійних. Для цього умовно приймають, що на тій чи іншій ділянці цільова функція зростає чи зменшується пропорційно до зміни незалежних змінних. Такий підхід називається методом шматково-лінійних наближень, він застосовний, однак, лише до деяких видів нелінійних завдань.

Нелінійні завдання у певних умовах вирішуються з допомогою функції Лагранжа: знайшовши її сідлову точку, цим знаходять рішення завдання. Серед обчислювальних алгоритмів Н. п. велике місце займають градієнтні методи. Універсального методу для нелінійних завдань немає і, мабуть, може не бути, оскільки вони надзвичайно різноманітні. Особливо важко вирішуються багатоекстремальні завдання.

Одним із методів, які дозволяють звести завдання нелінійного програмування до вирішення системи рівнянь, є метод невизначених множниківЛагранжа.

За допомогою методу множників Лагранжа по суті встановлюються необхідні умови, що дозволяють ідентифікувати точки оптимуму задач оптимізації з обмеженнями у вигляді рівностей. При цьому завдання з обмеженнями перетворюється на еквівалентну задачу безумовної оптимізації, в якій фігурують деякі невідомі параметри, які називаються множниками Лагранжа.

Метод множників Лагранжа полягає у зведенні завдань на умовний екстремум до завдань на безумовний екстремум допоміжної функції – т.з. функції Лагранжа.

Для завдання про екстремум функції f(х 1 , x 2 ,..., x n) за умов (рівняння зв'язку) φ i(x 1 , x 2 , ..., x n) = 0, i= 1, 2,..., m, функція Лагранжа має вигляд

L(x 1, x 2… x n ,λ 1, λ 2 ,…λm)=f(x 1, x 2… x n)+∑ i -1 m λ i φ i (x 1, x 2… x n)

Множителі λ 1 , λ 2 , ..., λmзв. множниками Лагранжа.

Якщо величини x 1 , x 2 , ..., x n , λ 1 , λ 2 , ..., λmсуть розв'язання рівнянь, що визначають стаціонарні точки функції Лагранжа, а саме, для функцій, що диференціюються, є рішеннями системи рівнянь

то при досить загальних припущеннях x 1 x 2 ... x n доставляють екстремум функції f.

Розглянемо задачу мінімізації функції n змінних з урахуванням одного обмеження у вигляді рівності:

Мінімізувати f(x 1, x 2… x n) (1)

при обмеженнях h 1 (x 1, x 2 ... x n) = 0 (2)

Відповідно до методу множників Лагранжа це завдання перетворюється на наступне завдання безумовної оптимізації:

мінімізувати L(x,λ)=f(x)-λ*h(x) (3)

де Функція L(х;λ) називається функцією Лагранжа,

λ - невідома постійна, яка зветься множника Лагранжа. На знак λ жодних вимог не накладається.

Нехай при заданому значенні λ=λ 0 безумовний мінімум функції L(x,λ) х досягається в точці x=x 0 і x 0 задовольняє рівняння h 1 (x 0)=0. Тоді, як неважко бачити, x 0 мінімізує (1) з урахуванням (2), оскільки для всіх значень х, що задовольняють (2), h 1 (x) = 0 і L (x, λ) = min f (x).

Зрозуміло, необхідно підібрати значення = 0 таким чином, щоб координата точки безумовного мінімуму х 0 задовольняла рівності (2). Це можна зробити, якщо, розглядаючи як змінну, знайти безумовний мінімум функції (3) у вигляді функції, а потім вибрати значення, при якому виконується рівність (2). Проілюструємо це конкретному прикладі.

Мінімізувати f(x)=x 1 2 +x 2 2 =0

при обмеженні h 1 (x) = 2x 1 + x 2 -2 = 0 = 0

Відповідне завдання безумовної оптимізації записується у такому вигляді:

мінімізувати L(x,λ)=x 1 2 +x 2 2 -λ(2x 1 +x 2 -2)

Рішення. Прирівнявши два компоненти градієнта L до нуля, отримаємо

→ х 1 0 =λ

→ х 2 0 =λ/2

Щоб перевірити, чи відповідає стаціонарна точка х° мінімуму, обчислимо елементи матриці Гессе функції L(х;u), що розглядається як функція х,

яка виявляється позитивно визначеною.

Це означає, що L(х,u) – опукла функція х. Отже, координати x 1 0 = λ, x 2 0 = λ/2 визначають точку глобального мінімуму. Оптимальне значенняλ знаходиться шляхом підстановки значень x 1 0 і x 2 0 рівняння2x 1 +x 2 =2, звідки 2λ+λ/2=2 або λ 0 =4/5. Таким чином, умовний мінімум досягається при x 1 0 =4/5 та x 2 0 =2/5 і дорівнює min f(x)=4/5.

При розв'язанні задачі з прикладу ми розглядали L(х;λ) як функцію двох змінних x 1 і x 2 і, крім того, припускали, що значення параметра вибрано так, щоб виконувалося обмеження. Якщо ж рішення системи

J=1,2,3,…,n

у вигляді явних функцій одержати не можна, то значення х і λ знаходяться шляхом вирішення наступної системи, що складається з n+1 рівнянь з n+1 невідомими:

J=1,2,3,…,n., h 1 (x)=0

Для пошуку всіх можливих рішень даної системи можна використовувати чисельні методи пошуку (наприклад, метод Ньютона). Для кожного з рішень () слід обчислити елементи матриці Гессе функції L, що розглядається як функція х, і з'ясувати, чи ця матриця є позитивно визначеною (локальний мінімум) або негативно визначеною (локальний максимум).

Метод множників Лагранжа можна поширити у разі, коли завдання має кілька обмежень як рівностей. Розглянемо загальне завдання, в якому потрібно

Мінімізувати f(x)

при обмеженнях h k =0, k = 1, 2, ..., До.

Функція Лагранжа набуває такого вигляду:

Тут λ 1 , λ 2 , ..., λk-множники Лагранжа, тобто. невідомі параметри, значення яких потрібно визначити. Прирівнюючи приватні похідні L по х до нуля, отримуємо таку систему n рівнянні з n невідомими:

Якщо знайти рішення наведеної вище системи у вигляді функцій вектора виявляється скрутним, то можна розширити систему шляхом включення до неї обмежень у вигляді рівностей

Рішення розширеної системи, що складається з n+К рівнянь з n+К невідомими, визначає стаціонарну точку функції L. Потім реалізується процедура перевірки на мінімум або максимум, яка проводиться на основі обчислення елементів матриці Гессе функції L, що розглядається як функція х, подібно до того, як це було зроблено у разі завдання з одним обмеженням. Для деяких завдань розширена система n+К рівнянь з n+K невідомими може мати рішень, і метод множників Лагранжа виявляється неприменимым. Слід, проте, відзначити, що такі завдання практично зустрічаються досить рідко.

Розглянемо окремий випадок загальної задачі нелінійного програмування, припускаючи, що система обмежень містить тільки рівняння, відсутні умови невід'ємності змінних і функції безперервні разом зі своїми приватними похідними. Отже вирішивши систему рівнянь (7), одержують усі точки, у яких функція (6) може мати екстремальні значення.

Алгоритм методу множників Лагранжа

1.Складаємо функцію Лагранжа.

2. Знаходимо приватні похідні від функції Лагранжа за змінними x J ,λ i і прирівнюємо їх нулю.

3. Вирішуємо систему рівнянь (7), знаходимо точки, в яких цільова функція завдання може мати екстремум.

4. Серед точок, підозрілих на екстремум, знаходимо такі, в яких досягається екстремум, та обчислюємо значення функції (6) у цих точках.

приклад.

Початкові дані:За планом виробництва продукції підприємству необхідно виготовити 180 виробів. Ці вироби можуть бути виготовлені двома технологічними методами. При виробництві x 1 виробів 1 способом витрати дорівнюють 4x 1 +x 1 2 руб., А при виготовленні x 2 виробів 2 способом вони становлять 8x 2 +x 2 2 руб. Визначити, скільки виробів кожним із способів слід виготовити, щоб витрати на виробництво продукції були мінімальними.

Цільова функція для поставленого завдання має вигляд
® minза умов x1+x2=180, x2≥0.
1.Складаємо функцію Лагранжа
.
2. Обчислюємо приватні похідні x 1 , x 2, λ і прирівнюємо їх нулю:

3. Вирішуючи отриману систему рівнянь, знаходимо x 1 = 91, x 2 = 89

4. Зробивши заміну в цільовій функції x 2 =180-x 1, отримаємо функцію від однієї змінної, а саме f 1 =4x 1 +x 1 2 +8(180-x 1)+(180-x 1) 2

Обчислюємо або 4x 1 -364=0

звідки маємо x 1 * = 91, x 2 * = 89.

Відповідь: Кількість виробів виготовлених першим способом дорівнює х1 = 91, другим способом х2 = 89 при цьому значення цільової функції дорівнює 17 278 руб.

Спочатку розглянемо випадок функції двох змінних. Умовним екстремумом функції $z=f(x,y)$ у точці $M_0(x_0;y_0)$ називається екстремум цієї функції, досягнутий за умови, що змінні $x$ і $y$ в околиці цієї точки задовольняють рівняння зв'язку $\ varphi (x, y) = 0 $.

Назва «умовний» екстремум пов'язана з тим, що на змінні накладено додаткову умову $ Varphi (x, y) = 0 $. Якщо з рівняння зв'язку можна виразити одну змінну через іншу, то завдання визначення умовного екстремуму зводиться до завдання на звичайний екстремум функції однієї змінної. Наприклад, якщо з рівняння зв'язку випливає $y=\psi(x)$, то підставивши $y=\psi(x)$ $z=f(x,y)$, отримаємо функцію однієї змінної $z=f\left (x, \ psi (x) \ right) $. У загальному випадку, однак, такий метод є малопридатним, тому потрібно введення нового алгоритму.

Метод множників Лагранжа для функцій двох змінних.

Метод множників Лагранжа полягає в тому, що для відшукання умовного екстремуму складають функцію Лагранжа: $F(x,y)=f(x,y)+lambda\varphi(x,y)$ (параметр $lambda$ називають множником Лагранжа ). Необхідні умови екстремуму задаються системою рівнянь, з якої визначаються стаціонарні точки:

$$ \left \( \begin(aligned) & \frac(\partial F)(\partial x)=0;\\ & \frac(\partial F)(\partial y)=0;\\ & \varphi (x, y) = 0. \end(aligned) \right.$$

Достатньою умовою, з якої можна з'ясувати характер екстремуму, є знак $d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("" )dy^2$. Якщо стаціонарної точці $d^2F > 0$, то функція $z=f(x,y)$ має у цій точці умовний мінімум, якщо $d^2F< 0$, то условный максимум.

Є й інший спосіб визначення характеру екстремуму. З рівняння зв'язку отримуємо: $\varphi_(x)^(")dx+\varphi_(y)^(")dy=0$, $dy=-\frac(\varphi_(x)^("))(\varphi_ (y)^("))dx$, тому в будь-якій стаціонарній точці маємо:

$$d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=F_(xx)^( "")dx^2+2F_(xy)^("")dx\left(-\frac(\varphi_(x)^("))(\varphi_(y)^("))dx\right)+ F_(yy)^("")\left(-\frac(\varphi_(x)^("))(\varphi_(y)^("))dx\right)^2=\\ =-\frac (dx^2)(\left(\varphi_(y)^(") \right)^2)\cdot\left(-(\varphi_(y)^("))^2 F_(xx)^(" ")+2\varphi_(x)^(")\varphi_(y)^(")F_(xy)^("")-(\varphi_(x)^("))^2 F_(yy)^ ("") \right)$$

Другий помножувач (розташований у дужці) можна представити у такій формі:

Червоним кольором виділено елементи визначника $ \ left | \begin(array) (cc) F_(xx)^("") & F_(xy)^("") \\ F_(xy)^("") & F_(yy)^("") \end (array) \right|$, який є гесіаном функції Лагранжа. Якщо $H > 0$, то $d^2F< 0$, что указывает на условный максимум. Аналогично, при $H < 0$ имеем $d^2F >0 $, тобто. маємо умовний мінімум функції $ z = f (x, y) $.

Примітка щодо форми запису визначника $H$. показати\сховати

$$ H=-\left|\begin(array) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_ (xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \ end(array) \right| $$

У цій ситуації сформульоване вище правило зміниться так: якщо $H > 0$, то функція має умовний мінімум, а при $H< 0$ получим условный максимум функции $z=f(x,y)$. При решении задач следует учитывать такие нюансы.

Алгоритм дослідження функції двох змінних на умовний екстремум

  1. Скласти функцію Лагранжа $F(x,y)=f(x,y)+lambda\varphi(x,y)$
  2. Вирішити систему $ \left \( \begin(aligned) & \frac(\partial F)(\partial x)=0;\\ & \frac(\partial F)(\partial y)=0;\\ & \ varphi (x, y) = 0. \end(aligned) \right.$
  3. Визначити характер екстремуму у кожній із знайдених у попередньому пункті стаціонарних точок. Для цього застосувати будь-який із зазначених способів:
    • Скласти визначник $H$ та з'ясувати його знак
    • З урахуванням рівняння зв'язку обчислити знак $d^2F$

Метод множників Лагранжа для функцій n змінних

Допустимо, ми маємо функцію $n$ змінних $z=f(x_1,x_2,\ldots,x_n)$ і $m$ рівнянь зв'язку ($n > m$):

$ $ \ Varphi_1 (x_1, x_2, \ ldots, x_n) = 0; \; \varphi_2(x_1,x_2,\ldots,x_n)=0,\ldots,\varphi_m(x_1,x_2,\ldots,x_n)=0.$$

Позначивши множники Лагранжа як $lambda_1, lambda_2, ldots, lambda_m $, складемо функцію Лагранжа:

$$F(x_1,x_2,\ldots,x_n,\lambda_1,\lambda_2,\ldots,\lambda_m)=f+\lambda_1\varphi_1+\lambda_2\varphi_2+\ldots+\lambda_m\varphi_m$$

Необхідні умови наявності умовного екстремуму задаються системою рівнянь, з якої знаходяться координати стаціонарних точок та значення множників Лагранжа:

$$\left\(\begin(aligned) & \frac(\partial F)(\partial x_i)=0; (i=\overline(1,n))\\ & \varphi_j=0; (j=\ overline(1,m)) \end(aligned) \right.$$

З'ясувати, умовний мінімум чи умовний максимум має функція у знайденій точці, можна, як і раніше, за допомогою символу $d^2F$. Якщо знайденої точці $d^2F > 0$, то функція має умовний мінімум, якщо $d^2F< 0$, - то условный максимум. Можно пойти иным путем, рассмотрев следующую матрицу:

Визначник матриці $ \ left | \begin(array) (ccccc) \frac(\partial^2F)(\partial x_(1)^(2)) & \frac(\partial^2F)(\partial x_(1)\partial x_(2) ) & \frac(\partial^2F)(\partial x_(1)\partial x_(3)) &\ldots & \frac(\partial^2F)(\partial x_(1)\partial x_(n)) \\ \frac(\partial^2F)(\partial x_(2)\partial x_1) & \frac(\partial^2F)(\partial x_(2)^(2)) & \frac(\partial^2F )(\partial x_(2)\partial x_(3)) &\ldots & \frac(\partial^2F)(\partial x_(2)\partial x_(n))\\ \frac(\partial^2F )(\partial x_(3) \partial x_(1)) & \frac(\partial^2F)(\partial x_(3)\partial x_(2)) & \frac(\partial^2F)(\partial x_(3)^(2)) &\ldots & \frac(\partial^2F)(\partial x_(3)\partial x_(n))\\ \ldots & \ldots & \ldots &\ldots & \ ldots\\ \frac(\partial^2F)(\partial x_(n)\partial x_(1)) & \frac(\partial^2F)(\partial x_(n)\partial x_(2)) & \ frac(\partial^2F)(\partial x_(n)\partial x_(3)) &\ldots & \frac(\partial^2F)(\partial x_(n)^(2))\\ \end( array) \right|$, виділеної в матриці $L$ червоним, є гессиан функції Лагранжа. Використовуємо таке правило:

  • Якщо символи кутових мінорів $H_(2m+1),\; H_(2m+2),\ldots,H_(m+n)$ матриці $L$ збігаються зі знаком $(-1)^m$, то досліджувана стаціонарна точка є точкою умовного мінімуму функції $z=f(x_1,x_2 , x_3, \ ldots, x_n) $.
  • Якщо символи кутових мінорів $H_(2m+1),\; H_(2m+2),\ldots,H_(m+n)$ чергуються, причому знак мінору $H_(2m+1)$ збігається зі знаком числа $(-1)^(m+1)$, то досліджувана стаціонарна точка є точкою умовного максимуму функції $ z = f (x_1, x_2, x_3, \ ldots, x_n) $.

Приклад №1

Знайти умовний екстремум функції $z(x,y)=x+3y$ за умови $x^2+y^2=10$.

Геометрична інтерпретація цього завдання така: потрібно знайти найбільше і найменше значенняаплікати площини $z=x+3y$ для точок її перетину з циліндром $x^2+y^2=10$.

Виразити одну змінну через іншу з рівняння зв'язку і підставити її у функцію $z(x,y)=x+3y$ дещо важко, тому будемо використовувати метод Лагранжа.

Позначивши $\varphi(x,y)=x^2+y^2-10$, складемо функцію Лагранжа:

$$ F(x,y)=z(x,y)+\lambda \varphi(x,y)=x+3y+\lambda(x^2+y^2-10);\\frac(\partial F)(\partial x)=1+2\lambda x; \frac(\partial F)(\partial y)=3+2\lambda y. $$

Запишемо систему рівнянь визначення стаціонарних точок функції Лагранжа:

$$ \left \( \begin(aligned) & 1+2\lambda x=0;\\ & 3+2\lambda y=0;\\ & x^2+y^2-10=0. \end (aligned) \right.$$

Якщо припустити $\lambda=0$, перше рівняння стане таким: $1=0$. Отримане протиріччя свідчить, що $lambdaneq 0$. За умови $\lambda\neq 0$ з першого та другого рівнянь маємо: $x=-\frac(1)(2\lambda)$, $y=-\frac(3)(2\lambda)$. Підставляючи отримані значення третє рівняння, отримаємо:

$$ \left(-\frac(1)(2\lambda) \right)^2+\left(-\frac(3)(2\lambda) \right)^2-10=0;\\ \frac (1) (4 lambda ^ 2) + frac (9) (4 lambda ^ 2) = 10; \lambda^2=\frac(1)(4); \left[ \begin(aligned) & \lambda_1=-\frac(1)(2);\\ & \lambda_2=\frac(1)(2). \end(aligned) \right.\\ \begin(aligned) & \lambda_1=-\frac(1)(2); \; x_1=-\frac(1)(2\lambda_1)=1; \; y_1=-\frac(3)(2\lambda_1)=3;\\ & \lambda_2=\frac(1)(2); \; x_2=-\frac(1)(2\lambda_2)=-1; \; y_2=-\frac(3)(2\lambda_2)=-3.\end(aligned) $$

Отже, система має два рішення: $ x_1 = 1; \; y_1=3;\; \lambda_1=-\frac(1)(2)$ і $x_2=-1;\; y_2=-3;\; \lambda_2=\frac(1)(2)$. З'ясуємо характер екстремуму у кожній стаціонарній точці: $M_1(1;3)$ і $M_2(-1;-3)$. І тому обчислимо визначник $H$ у кожному з точок.

$$ \varphi_(x)^(")=2x;\; \varphi_(y)^(")=2y;\; F_(xx)^("")=2\lambda;\; F_(xy)^("")=0;\; F_(yy)^("")=2\lambda. \ H = \ left | \begin(array) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_(xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \end(array) \right|= \left| \begin(array) (ccc) 0 & 2x & 2y\\ 2x & 2\lambda & 0 \\ 2y & 0 & 2\lambda \end(array) \right|= 8\cdot\left| \begin(array) (ccc) 0 & x & y\ x & \lambda & 0 \\ y & 0 & \lambda \end(array) \right| $$

У точці $ M_1 (1; 3) $ отримаємо: $ H = 8 \ cdot \ left | \begin(array) (ccc) 0 & x & y\ x & \lambda & 0 \\ y & 0 & \lambda \end(array) \right|= 8\cdot\left| \begin(array) (ccc) 0 & 1 & 3\\ 1 & -1/2 & 0 \\ 3 & 0 & -1/2 \end(array) \right|=40 > 0$, тому в точці $M_1(1;3)$ функція $z(x,y)=x+3y$ має умовний максимум, $z_(\max)=z(1;3)=10$.

Аналогічно, у точці $M_2(-1;-3)$ знайдемо: $H=8\cdot\left| \begin(array) (ccc) 0 & x & y\ x & \lambda & 0 \\ y & 0 & \lambda \end(array) \right|= 8\cdot\left| \begin(array) (ccc) 0 & -1 & -3\ -1 & 1/2 & 0 \\ -3 & 0 & 1/2 \end(array) \right|=-40$. Оскільки $H< 0$, то в точке $M_2(-1;-3)$ имеем условный минимум функции $z(x,y)=x+3y$, а именно: $z_{\min}=z(-1;-3)=-10$.

Зазначу, що замість обчислення значення визначника $H$ у кожній точці набагато зручніше розкрити його в загальному вигляді. Щоб не захаращувати текст подробицями, цей спосіб приховую під примітку.

Запис визначника $H$ у загальному вигляді. показати\сховати

$$ H=8\cdot\left|\begin(array)(ccc)0&x&y\x&\lambda&0\y&0&lambda\end(array)\right| =8\cdot\left(-\lambda(y^2)-\lambda(x^2)\right) =-8\lambda\cdot\left(y^2+x^2\right). $$

У принципі, очевидно, який знак має $H$. Оскільки жодна з точок $M_1$ або $M_2$ не збігається з початком координат, $y^2+x^2>0$. Отже, знак $H$ протилежний символу $\lambda$. Можна і довести обчислення до кінця:

$$ \begin(aligned) &H(M_1)=-8\cdot\left(-\frac(1)(2)\right)\cdot\left(3^2+1^2\right)=40;\ \ &H(M_2)=-8\cdot\frac(1)(2)\cdot\left((-3)^2+(-1)^2\right)=-40. \end(aligned) $$

Питання характер екстремуму в стаціонарних точках $M_1(1;3)$ і $M_2(-1;-3)$ можна вирішити без використання визначника $H$. Знайдемо знак $d^2F$ у кожній стаціонарній точці:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=2\lambda \left( dx^2+dy^2\right) $$

Зазначу, що запис $dx^2$ означає саме $dx$, зведений на другий ступінь, тобто. $ \ left (dx \ right) ^ 2 $. Звідси маємо: $dx^2+dy^2>0$, тому при $\lambda_1=-\frac(1)(2)$ отримаємо $d^2F< 0$. Следовательно, функция имеет в точке $M_1(1;3)$ условный максимум. Аналогично, в точке $M_2(-1;-3)$ получим условный минимум функции $z(x,y)=x+3y$. Отметим, что для определения знака $d^2F$ не пришлось учитывать связь между $dx$ и $dy$, ибо знак $d^2F$ очевиден без дополнительных преобразований. В следующем примере для определения знака $d^2F$ уже будет необходимо учесть связь между $dx$ и $dy$.

Відповідь: у точці $(-1;-3)$ функція має умовний мінімум, $z_(\min)=-10$. У точці $(1;3)$ функція має умовний максимум, $z_(\max)=10$

Приклад №2

Знайти умовний екстремум функції $z(x,y)=3y^3+4x^2-xy$ за умови $x+y=0$.

Перший спосіб (метод множників Лагранжа)

Позначивши $\varphi(x,y)=x+y$ складемо функцію Лагранжа: $F(x,y)=z(x,y)+lambda \varphi(x,y)=3y^3+4x^2 -xy+\lambda(x+y)$.

$$ \frac(\partial F)(\partial x)=8x-y+\lambda; \; \frac(\partial F)(\partial y) = 9y^2-x+\lambda.\\ \left \( \begin(aligned) 8x-y+\lambda=0;\\ & 9y^2-x+\ lambda = 0; \ \ & x + y = 0. \end (aligned) \right.

Вирішивши систему, отримаємо: $x_1=0$, $y_1=0$, $\lambda_1=0$ і $x_2=\frac(10)(9)$, $y_2=-\frac(10)(9)$ , $ \ lambda_2 = -10 $. Маємо дві стаціонарні точки: $M_1(0;0)$ і $M_2 \left(\frac(10)(9);-\frac(10)(9) \right)$. З'ясуємо характер екстремуму у кожній стаціонарній точці з використанням визначника $H$.

$ $ H = \ left | \begin(array) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_(xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \end(array) \right|= \left| \begin(array) (ccc) 0 & 1 & 1\\ 1 & 8 & -1 \\ 1 & -1 & 18y \end(array) \right|=-10-18y $$

У точці $M_1(0;0)$ $H=-10-18\cdot 0=-10< 0$, поэтому $M_1(0;0)$ есть точка условного минимума функции $z(x,y)=3y^3+4x^2-xy$, $z_{\min}=0$. В точке $M_2\left(\frac{10}{9};-\frac{10}{9}\right)$ $H=10 >0$, тому у цій точці функція має умовний максимум, $z_(\max)=\frac(500)(243)$.

Досліджуємо характер екстремуму в кожній з точок іншим способом, виходячи з знаку $d^2F$:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=8dx^2-2dxdy+ 18ydy^2 $$

З рівняння зв'язку $x+y=0$ маємо: $d(x+y)=0$, $dx+dy=0$, $dy=-dx$.

$$ d^2 F=8dx^2-2dxdy+18ydy^2=8dx^2-2dx(-dx)+18y(-dx)^2=(10+18y)dx^2 $$

Оскільки $ d^2F \Bigr|_(M_1)=10 dx^2 > 0$, то $M_1(0;0)$ є точкою умовного мінімуму функції $z(x,y)=3y^3+4x^ 2-xy $. Аналогічно $d^2F \Bigr|_(M_2)=-10 dx^2< 0$, т.е. $M_2\left(\frac{10}{9}; -\frac{10}{9} \right)$ - точка условного максимума.

Другий спосіб

З рівняння зв'язку $x+y=0$ отримаємо $y=-x$. Підставивши $y=-x$ у функцію $z(x,y)=3y^3+4x^2-xy$, отримаємо деяку функцію змінної $x$. Позначимо цю функцію як $u(x)$:

$$u(x)=z(x,-x)=3cdot(-x)^3+4x^2-xcdot(-x)=-3x^3+5x^2. $$

Таким чином, задачу про знаходження умовного екстремуму функції двох змінних ми звели до завдання визначення екстремуму функції однієї змінної.

$$ u_(x)^(")=-9x^2+10x;\ -9x^2+10x=0; \;x\cdot(-9x+10)=0;\\ x_1=0; \\ y_1=-x_1=0;\\x_2=\frac(10)(9);\;y_2=-x_2=-\frac(10)(9).

Отримали точки $M_1(0;0)$ і $M_2\left(\frac(10)(9); -\frac(10)(9)\right)$. Подальше дослідження відоме з курсу диференціального обчислення функцій однією зміною. Досліджуючи знак $u_(xx)^("")$ у кожній стаціонарній точці або перевіряючи зміну знака $u_(x)^(")$ у знайдених точках, отримаємо ті самі висновки, що і при вирішенні першим способом. Наприклад, перевіримо знак $u_(xx)^("")$:

$$u_(xx)^("")=-18x+10;\u_(xx)^("")(M_1)=10;\;u_(xx)^("")(M_2)=- 10.$$

Оскільки $u_(xx)^("")(M_1)>0$, то $M_1$ - точка мінімуму функції $u(x)$, у своїй $u_(\min)=u(0)=0$ . Оскільки $u_(xx)^("")(M_2)<0$, то $M_2$ - точка максимума функции $u(x)$, причём $u_{\max}=u\left(\frac{10}{9}\right)=\frac{500}{243}$.

Значення функції $u(x)$ за заданої умови зв'язку збігаються зі значеннями функції $z(x,y)$, тобто. знайдені екстремуми функції $u(x)$ і є умовні екстремуми функції $z(x,y)$, що шукаються.

Відповідь: у точці $(0;0)$ функція має умовний мінімум, $z_(\min)=0$. У точці $\left(\frac(10)(9); -\frac(10)(9) \right)$ функція має умовний максимум, $z_(\max)=\frac(500)(243)$.

Розглянемо ще один приклад, у якому характер екстремуму з'ясуємо у вигляді визначення знака $d^2F$.

Приклад №3

Знайти найбільше та найменше значення функції $z=5xy-4$, якщо змінні $x$ і $y$ позитивні та задовольняють рівняння зв'язку $\frac(x^2)(8)+\frac(y^2)(2) -1 = 0 $.

Складемо функцію Лагранжа: $ F = 5xy-4 + lambda \ left (\ frac (x ^ 2) (8) + frac (y ^ 2) (2) -1 \ right) $. Знайдемо стаціонарні точки функції Лагранжа:

$$ F_(x)^(")=5y+\frac(\lambda x)(4); \; F_(y)^(")=5x+\lambda y.\\ \left \( \begin(aligned) & 5y+\frac(\lambda x)(4)=0;\ & 5x+\lambda y=0;\\ & \frac(x^2)(8)+\frac(y^2)(2)- 1 = 0; \ \ & x > 0; \;y > 0. \end(aligned) \right.$$

Усі подальші перетворення здійснюються з урахуванням $x>0; \; y > 0$ (це обумовлено за умови завдання). З другого рівняння виразимо $\lambda=-\frac(5x)(y)$ і підставимо знайдене значення в перше рівняння: $5y-\frac(5x)(y)\cdot \frac(x)(4)=0$ , $4y^2-x^2=0$, $x=2y$. Підставляючи $x=2y$ у третє рівняння, отримаємо: $\frac(4y^2)(8)+\frac(y^2)(2)-1=0$, $y^2=1$, $y = 1 $.

Оскільки $y=1$, то $x=2$, $\lambda=-10$. Характер екстремуму у точці $(2;1)$ визначимо, з знаку $d^2F$.

$$ F_(xx)^("")=\frac(\lambda)(4); \; F_(xy)^("")=5; \; F_(yy)^("")=\lambda. $$

Оскільки $\frac(x^2)(8)+\frac(y^2)(2)-1=0$, то:

$$ d\left(\frac(x^2)(8)+\frac(y^2)(2)-1\right)=0; \; d\left(\frac(x^2)(8) \right)+d\left(\frac(y^2)(2) \right)=0; \; \frac(x)(4)dx+ydy=0; \; dy=-\frac(xdx)(4y). $$

В принципі, тут можна відразу підставити координати стаціонарної точки $x=2$, $y=1$ та параметра $\lambda=-10$, отримавши при цьому:

$$ F_(xx)^("")=\frac(-5)(2); \; F_(xy)^("")=-10; \; dy=-\frac(dx)(2).\\d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^(" ")dy^2=-\frac(5)(2)dx^2+10dx\cdot \left(-\frac(dx)(2) \right)-10\cdot \left(-\frac(dx) (2) \right)^2=\\ =-\frac(5)(2)dx^2-5dx^2-\frac(5)(2)dx^2=-10dx^2. $$

Однак в інших завданнях на умовний екстремум стаціонарних точок може бути декілька. У таких випадках краще $d^2F$ уявити в загальному вигляді, а потім підставляти в отриманий вираз координати кожної зі знайдених стаціонарних точок:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=\frac(\lambda) (4)dx^2+10\cdot dx\cdot \frac(-xdx)(4y) +\lambda\cdot \left(-\frac(xdx)(4y) \right)^2=\\=\frac (\lambda)(4)dx^2-\frac(5x)(2y)dx^2+\lambda \cdot \frac(x^2dx^2)(16y^2)=\left(\frac(\lambda) )(4)-\frac(5x)(2y)+\frac(\lambda \cdot x^2)(16y^2) \right)\cdot dx^2 $$

Підставляючи $x=2$, $y=1$, $\lambda=-10$, отримаємо:

$$ d^2 F=\left(\frac(-10)(4)-\frac(10)(2)-\frac(10 \cdot 4)(16) \right)\cdot dx^2=- 10dx^2. $$

Оскільки $d^2F=-10\cdot dx^2< 0$, то точка $(2;1)$ есть точкой условного максимума функции $z=5xy-4$, причём $z_{\max}=10-4=6$.

Відповідь: у точці $(2;1)$ функція має умовний максимум, $z_(\max)=6$.

У наступній частині розглянемо застосування методу Лагранжа для функцій більшої кількостізмінних.

Метод Множників Лагранжає класичним методом розв'язання задач математичного програмування (зокрема опуклого). На жаль, при практичному застосуванніСпособу можуть зустрітися значні обчислювальні проблеми, що звужують сферу його використання. Ми розглядаємо тут метод Лагранжа головним чином тому, що він є апаратом, що активно використовується для обґрунтування різних сучасних чисельних методівшироко застосовуються на практиці. Що ж до функції Лагранжа і множників Лагранжа, всі вони грають самостійну і виключно важливу роль теорії і додатках як математичного програмування.

Розглянемо класичне завдання оптимізації

max (min) z=f(x) (7.20)

Це завдання виділяється із завдання (7.18), (7.19) тим, що серед обмежень (7.21) немає нерівностей, немає умов невід'ємності змінних, їх дискретності, і функції f(x) і безперервні і мають приватні похідні Крайній мірідругого порядку.

Класичний підхід до розв'язання задачі (7.20), (7.21) дає систему рівнянь (необхідні умови), яким повинна задовольняти точка х*, що доставляє функції f(x)локальний екстремум на безлічі точок, що задовольняють обмеженням (7.21) (для задачі опуклого програмування точка х* відповідно до теореми 7.6 буде одночасно і точкою глобального екстремуму).

Припустимо, що у точці х* функція (7.20) має локальний умовний екстремум і ранг матриці дорівнює . Тоді необхідні умови запишуться у вигляді:

(7.22)

є функція Лагранжа; - множники Лагранжа.

Існують також і достатні умови, при виконанні яких розв'язок системи рівнянь (7.22) визначає точку екстремуму функції f(x). Це питання вирішується виходячи з дослідження знака другого диференціала функції Лагранжа. Однак достатні умови становлять головним чином теоретичний інтерес.

Можна вказати наступний порядок розв'язання задачі (7.20), (7.21) методом множників Лагранжа:

1) скласти функцію Лагранжа (7.23);

2) знайти приватні похідні функції Лагранжа за всіма змінними та прирівняти їх нулю. Тим самим буде отримано систему (7.22), що складається з рівнянь. Вирішити отриману систему (якщо це виявиться можливим!) і знайти таким чином усі стаціонарні точки функції Лагранжа;

3) зі стаціонарних точок, взятих без координат , вибрати точки, у яких функція f(x) має умовні локальні екстремуми за наявності обмежень (7.21). Цей вибір здійснюється, наприклад, із застосуванням достатніх умов локального екстремуму. Часто дослідження спрощується, якщо використати конкретні умови завдання.



Приклад 7.3. Знайти оптимальний розподілобмеженого ресурсу в a од. між n споживачами, якщо прибуток, одержуваний при виділенні j-го споживача x j одиниць ресурсу, обчислюється за формулою .

Рішення.Математична модель завдання має такий вигляд:


Складаємо функцію Лагранжа:

.

Знаходимо приватні похідні функції Лагранжа та прирівнюємо їх нулю:

Вирішуючи цю систему рівнянь, отримуємо:

Таким чином, якщо j-му споживачеві буде виділено од. ресурсу, то сумарна прибуток досягне максимальної величини і становитиме ден. од.

Ми розглянули метод Лагранжа стосовно класичної задачі оптимізації. Можна узагальнити цей метод у разі, коли змінні неотрицательны і деякі обмеження задані у вигляді нерівностей. Однак це узагальнення має переважно теоретичне значення та не призводить до конкретних обчислювальних алгоритмів.

На закінчення дамо множникам Лагранжа економічну інтерпретацію. Для цього звернемося до найпростішого класичного завдання оптимізації.

max (min) z=f(x 1 , х 2); (7.24)

𝜑(x 1, х 2) = b. (7.25)

Припустимо, що умовний екстремум досягається у точці . Відповідне екстремальне значення функції f(x)

Допустимо, що в обмеженнях (7.25) величина bможе змінюватися, тоді координати точки екстремуму, а отже, і екстремальне значення f*функції f(x) стануть величинами, що залежать від b, тобто. ,, а тому похідна функції (7.24)

Поділіться з друзями або збережіть для себе:

Завантаження...