๋ผ๊ทธ๋์ฃผ ์น์ (Lagrange multiplier)
์๋๋ [์๋ฌธ ์ํค์ โLagrange multiplierโ][lm]์ ๋ด์ฉ์ ๋ฐํ์ผ๋ก ์ด ๊ธ์ด๋ค. ------------------------------------ โ์ํ์ ์ต์ ํโ([mathematical optimization][mo])๋ผ๋ ๋ถ์ผ์์, **๋ผ๊ทธ๋์ฃผ ์น์๋ฒ**์ ์ ์ฝ ๋ฑ์([equality constraint][ec])์ ์กฐ๊ฑด์ผ๋ก ๊ฐ๋ ํจ์์ ๊ทน๋๊ฐ๊ณผ ๊ทน์๊ฐ์ ์ฐพ๋ ์ ๋ต์ด๋ค. ์๋ฅผ ๋ค์ด, ๋ค์์ ์ต์ ํ ๋ฌธ์ ๋ฅผ ๊ณ ๋ คํด๋ณด์. *g(x, y)=k ์ธ ์กฐ๊ฑด์์ f(x, y)๋ฅผ ์ต๋ํํ๋ผ.*[^1] ์ด ์ ๋ต์์ f์ g๋ ์ผ๊ณ ํธ๋ํจ์๊ฐ ์ฐ์์ด์ด์ผ ํ๋ค. ์ด์ **๋ผ๊ทธ๋์ฃผ ์น์**๋ผ๊ณ ๋ถ๋ฆฌ๋ ์๋ก์ด ๋ณ์ ฮป๋ฅผ ๋์ ํ๊ณ , **๋ผ๊ทธ๋์ฃผ ํจ์** ๋๋ ***Lagrangian***์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ ํจ์๋ฅผ ์ดํด๋ณด์. ฮ(x, y, ฮป) = f(x, y) + ฮปยท(g(x, y)-k) ***์ฌ๊ธฐ์, ์ ์ฝ(constraint) ์กฐ๊ฑด g(x, y)=k ๋ฅผ ๊ณ ๋ คํ๋ ๊ธฐ๋ฐํ ๋ฐฉ๋ฒ์ g(x, y)-k = 0 ์ผ๋ก ๋ฐ๊ฟ ์ฐ๊ณ , 0์ ์ํ๋ ๋งํผ ์ฌ๋ฌ๋ฒ f์ ๋ํด๋ f์ ์๋ฌด๋ฐ ๋ณํ๋ฅผ ์ฃผ์ง ์์ผ๋ฏ๋ก ฮป๋ฅผ ๊ณฑํด f์ ๋ํ์ฌ ์ป์ ์ ์ ฮ๊ฐ ์ต๋๊ฐ ๋๋๋ก ํ๋ ๊ฒ์ด๋ค.***[^2] ๋ง์ฝ f(x0 , y0)๊ฐ ๋ณธ๋์ ์ ์ฝ ์กฐ๊ฑด์์ f(x, y)์ ์ต๋๊ฐ์ด๋ฉด, ฮ๊ฐ ๋ชจ๋ ๋ณ์์ ๋ํ์ฌ ํธ๋ฏธ๋ถ ๊ฐ๋ฅํ๋ฏ๋ก (x0, y0, ฮป0)๊ฐ ๋ผ๊ทธ๋์ฃผ ํจ์ ฮ์ ๋ํ ์๊ณ์ ([stationary point][sp])์ด ๋๋ ฮป0๊ฐ ์กด์ฌํ๋ค. ๋ฐ๋ผ์ โฮ(x0, y0, ฮป0)=0 ์ด๋ค. ๊ทธ๋ฌ๋ ์ญ์ผ๋ก โฮ=0 ์ด ๋๋ ๋ชจ๋ ์๊ณ์ ์ด ๋ณธ๋ ๋ฌธ์ ์ ํด๋ต์ด ๋์ง๋ ์๋๋ค. ๋ฐ๋ผ์, ๋ผ๊ทธ๋์ฃผ ์น์๋ฒ์ ์ ํ๋ ๋ฌธ์ ์์ ์ต์ ํ์ ๋ํ ํ์์กฐ๊ฑด์ ์ฐพ๋ ๊ฒ์ด๋ค. ------------------------------------ ์ด์ ๋ ๊ธฐํํ์ ์๋ฏธ๋ฅผ ํตํด ๋ผ๊ทธ๋์ฃผ ์น์๋ฒ์ ์์๋ณด์. c์ ๋ค์ํ ๊ฐ์ ๋ํ์ฌ f(x, y)=c ์ ๋ฑ์น์ (contour)์ ๊ทธ๋ฆฌ๊ณ , ๋ง์ฐฌ๊ฐ์ง๋ก ์ฃผ์ด์ง g(x, y)=k ์ ๋ฑ์น์ ์ ๊ทธ๋ฆฌ์.
g=k์ ๋ฑ์น์ ์ ๋ฐ๋ผ ๊ฑท๋๋ค๊ณ ํด๋ณด์. ์ผ๋ฐ์ ์ผ๋ก f์ g์ ๋ฑ์น์ ์ ์๋ก ๋ค๋ฅด๋ค. ๋ฐ๋ผ์ g=k์ ๋ฑ์น์ ์ ๋ฐ๋ผ ๊ฑท๋ค๋ณด๋ฉด, f์ ๋ฑ์น์ ์ ๊ฐ๋ก์ง๋ฅด๊ฒ ๋๋ค. ์ด๋ g=k์ ๋ฑ์น์ ์ ๋ฐ๋ผ ์ด๋ํ๋ ๋์ f์ ๊ฐ์ด ๋ฌ๋ผ์ง๋ค๋ ๊ฒ๊ณผ ๊ฐ์ ์๋ฏธ์ด๋ค. ***์ค์ง g=k์ ๋ฑ์น์ ๊ณผ f์ ๋ฑ์น์ ์ด ์ ํ ๊ฒฝ์ฐ์๋ง, f์ ๊ฐ์ ์ฆ๊ฐํ๊ฑฐ๋ ๊ฐ์ํ์ง ์๋๋ค.*** ์ฆ, ๋ ๋ฑ์น์ ์ด ์ ํ๋ฉด, ์๋ก ๊ฐ๋ก์ง๋ฅด์ง ์๋๋ค. ๋ฑ์น์ ์ ์ ๋ฒกํฐ๊ฐ ์๋ก ํํํ ๋, f์ g์ ๋ฑ์น์ ์ด ์ ํ๋ค. ํจ์์ ๊ธฐ์ธ๊ธฐ(gradient) ๋ฒกํฐ๋ ๋ฑ์น์ ๊ณผ ์์ง์ด๋ฏ๋ก, f์ g์ ๊ธฐ์ธ๊ธฐ ๋ฒกํฐ๊ฐ ์๋ก ํํํ ๋๋ฅผ ์ฐพ์๋ ์ข๋ค. ๋ฐ๋ผ์, g(x, y)=k ์ด๊ณ , โf = -ฮปโg ๋ฅผ ๋ง์กฑํ๋ (x, y)๋ฅผ ์ฐพ์ผ๋ฉด ๋๋ค. ๋จ, ์ฌ๊ธฐ์ ๊ธฐ์ธ๊ธฐ ๋ฒกํฐ โf=(โf/โx, โf/โy) ์ด๊ณ , โg=(โg/โx, โg/โy) ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ๋ ๊ธฐ์ธ๊ธฐ ๋ฒกํฐ๋ ํํํ๊ธฐ๋ง ํ๋ฉด ๋๊ณ ๊ธธ์ด๋ ๊ฐ์ ํ์๊ฐ ์์ผ๋ฏ๋ก, ์์ ฮป๊ฐ ์๊ตฌ๋๋ค. ์ด๋ฌํ ์กฐ๊ฑด๋ค์ ํ ๋ฐฉ์ ์์ ์์ผ๋ก์, ๋ค์๊ณผ ๊ฐ์ ๋ณด์กฐ ํจ์๋ฅผ ๋์ ํ ์ ์๋ค. ฮ(x, y, ฮป) = f(x, y) + ฮปยท(g(x, y)-k) ๊ทธ๋ฆฌ๊ณ ๋์ โฮ(x, y, ฮป) = 0 ๋ฅผ ํ๋ฉด ๋๋ค. ํนํ, โฮ/โฮป=0 ๋ g(x, y)=c ๋ฅผ ํจ์ํ๋ค๋ ์ ์ ์ฃผ๋ชฉํ์. ํํธ, f์ ์ ํ๋ ๊ทน๊ฐ์ ๋ผ๊ทธ๋์ฃผ ํจ์ ฮ์ ์๊ณ์ ์ด์ง๋ง, ฮ์ ๋ชจ๋ ์๊ณ์ ์ด ฮ์ ๊ทน๊ฐ์ด ๋๋ ๊ฒ์ ์๋๋ค. ------------------------------------ ์ฐธ๊ณ ๋ชฉ๋ก - [Constrained Optimization][co] - [KarushโKuhnโTucker conditions][kkt]: ๋ผ๊ทธ๋์ฃผ ์น์๋ฒ์ ์ผ๋ฐํ๋ ๋ฐฉ๋ฒ [^1]: Maximize f(x, y) subject to g(x, y)=k [^2]: [ยซ์ต์์ ์ต์ยป][wlb] 6.7์ ์ ์๋ก๋ ๋ผ๊ทธ๋์ฃผ ์น์๋ฒ์ ์์ด๋์ด์ ๋ํ ์ค๋ช ์ ์ธ์ฉํ์๋ค. [mo]: https://en.wikipedia.org/wiki/Mathematical_optimization [ec]: https://en.wikipedia.org/wiki/Constraint_(mathematics) [co]: https://en.wikipedia.org/wiki/Constrained_optimization [kkt]: https://en.wikipedia.org/wiki/Karush%E2%80%93Kuhn%E2%80%93Tucker_conditions [lm]: https://en.wikipedia.org/wiki/Lagrange_multipliers [sp]: https://en.wikipedia.org/wiki/Stationary_point [wlb]: http://goodmath.tumblr.com/post/75699929984











