ラグランジュの乗数
極大・極小は、ローカルな意味での最大・最小である。その定義には導関数の言葉は用
いられない。 2変数関数の場合について、その定義を確認しておこう。
連続関数 z = F(x ,y) の(a ,b)に近い点(x ,y) において、常に
F(x ,y)>F(a ,b)
が成り立つとき、関数 z=F(x ,y) は、(a ,b) で極小といい、F(a ,b ) が極小値である。
同様に、連続関数 z=F(x ,y) の (a ,b) に近い点 (x ,y) において、常に
F(x ,y)<F(a ,b)
が成り立つとき、関数 z=F(x ,y) は、(a ,b ) で極大といい、F(a ,b ) が極大値である。
極小値と極大値をまとめて、極値という。
1変数関数 y=F(x) が微分可能であるとき、F(x) が x=a で極値を持てば、
F’(a) = 0 が成り立つ。
これは、平均値の定理から、簡単に示される。
1変数関数の場合と同様に、2変数関数についても、次の事実が成り立つ。
連続関数 z=F(x ,y) が偏微分できるとき、(a ,b)で極値を持てば、
Fx(a ,b)=0 、Fy(a ,b)=0
が成り立つ。
上記は、あくまでも極値を持つための必要条件であって十分条件ではない。
例 F(x)=x3 において、F’(x)= 3x2 = 0 より、x = 0
しかるに、 x = 0 では極値を持ち得ない。
実際に、 F”( x )=6x なので、F( x )−F( 0 )=(1/2)F”( hx )=3hx (0<h<1)
x=0 の近くで、F(x)−F(0) の符号が定まらないので、極値を持つとは言えない。
(別解: F( x ) = x3 のグラフを書けば明らかだろう。)
例 F(x ,y)=y2−x2 において、Fx(x ,y )=−2x 、Fy(x ,y )=2y
(0 ,0) において、Fx(0 ,0)=0 、Fy(0 ,0)=0 であるが、(0 ,0)では極値を持ち
得ない。
実際に、Fxx(x ,y)=−2 、Fxy(x ,y)=0 、Fyy(x ,y)=2 で、
F(h ,k)− F(0 ,0) = (1/2)(−2h2+2k2)
よって、(0 ,0) の近くで、F(h ,k)− F(0 ,0) の符号が定まらないので、極値を持つ
とは言えない。
(別解: F( x , y ) = y2 − x2 のグラフを書けば明らかだろう。)
したがって、偏微分できる点での極値を探すには、上式を満たす (a ,b ) を求めて、十分
性を確認する必要がある。
1変数関数における極大・極小の判定条件として、次の事実は有用である。
1変数関数 y=F(x) が微分可能、かつ、x=a で極値をもつとき、
F”(a)>0 ならば、x=a で極小 、F”(a)<0 ならば、x=a で極大
これは、2次の近似式 F(x)−F(a) ≒ (1/2)F”(a) より、明らかであろう。
このことから、第2次導関数の符号を計算することにより、極大・極小が判定できる。
2変数関数についても同様に、次の公式が知られている。
公式 関数 z=F(x ,y) が連続な第2次偏導関数を持ち、
Fx(a ,b)=0 、 Fy(a ,b)=0 とする。
また、 A= Fxx(a ,b) 、B= Fxy(a ,b) 、C= Fyy(a ,b) とおく。
このとき、 AC−B2>0 で、A>0 ならば、(a ,b) で極小
AC−B2>0 で、A<0 ならば、(a ,b) で極大
AC−B2=0 のときは、さらに詳しく精査が必要
AC−B2<0 のときは、極値にはならない
証明は、Taylor の定理を用いて容易に示される。
(略証) Δz= F(a+h ,b+k)− F(a ,b)
=(1/2)(Fxx(a+θh,b+θk)h2+2Fxy(a+θh,b+θk)hk+ Fyy(a+θh,b+θk)k2)
関数 z=F(x ,y) が連続な第2次偏導関数を持つので、h、k が十分小さいとき、
Fxx(a+θh ,b+θk)、Fxy(a+θh ,b+θk)、Fyy(a+θh ,b+θk) の符号は、それ
ぞれ A、B、C の符号に等しい。そこで、h、k が十分小さいとき、
Δz の符号は、(1/2)(Ah2+2Bhk+Ck2) の符号に等しい。
ここで、Ah2+2Bhk+Ck2=A((h+(B/A)k)2+(AC−B2)k2/A2) より、上記の
公式の成り立つことが確認される。(略証終)
ここで、関数 F(x ,y) に対して、次の行列
を、(a ,b) におけるヘッセ行列という。上記の定理の AC−B2 は、Hの行列式に等しい。
AC−B2 = det H=(Hの固有値の積)
また、 h、k が十分小さいとき、F(a+h ,b+k)−F(a ,b) ≒ (1/2)H[x]
ここで、H[x]は、Hを係数行列とする二次形式で、x は、h、k を成分とする列ベクトル。
実対称行列 H の固有値 λ 、μ はすべて実数で、適当な座標変換により、
H[x]=λs2+μt2
と書ける。 ここで、
すべての x (≠0) に対して、H[x]>0 がなりたつとき、 H は、正値であるという。
(このためには、H の固有値 λ 、μ はすべて正でなければならない。)
すべての x (≠0) に対して、H[x]<0 がなりたつとき、 H は、負値であるという。
(このためには、H の固有値 λ 、μ はすべて負でなければならない。)
よって、極大・極小の判定条件として、二次形式の言葉を用いれば、
Hが正値ならば、極値を持つ 、 Hが負値ならば、按点で極値を持たない
ということになる。
(コメント: 極値の十分性の確認の理論的背景に、二次形式の理論が絡んでくるわけで、
何か面白そう...な予感! ただ、行列の固有方程式を解くのが難しいので、
固有値を利用するのは、あまり、現実的な方法ではないかな?)
公式を、具体的な問題に適用してみよう。
例 半球体 x2+y2+z2=1 (z≧0)において、x+zzx=0、y+zzy=0 なので、
zx=zy=0 となるのは、( x , y )=( 0 , 0 ) の場合のみである。
このとき、
1+zx2+zzxx=0 、 zyzx+zzxy=0 、 1+zy2+zzyy=0
より、 A=−1 、B=0 、C=−1 なので、
AC−B2=1>0 、A<0 より、( 0 , 0 )で極大となる。
これは、確かに半球体の図形的イメージと一致している。
読者のために、演習問題をあげておこう。
練習問題 平面上に、n 個の点 A1(a1,b1)、A2(a2,b2)、・・・、An(an,bn)が与えら
れている。このとき、これらの点からの距離の平方の和が極小(かつ最小)に
なる点の座標を求めよ。
(この点は、n 個の点 A1、A2、・・・、An の重心といわれる。)
条件付極値問題 極大・極小を考える場合、何らかの条件がついている場合が多い。
例 x+y+z=3 のとき、xyz の極値を求めよ。
(解) F(x ,y)=xy(3−x−y) とおく。
Fx(x ,y)=3y−2xy−y2=y(3−2x−y)=0
Fy(x ,y)=3x−2xy−x2=x(3−2y−x)=0
これを解くと、(x ,y)=( 0 ,0 )、( 0 , 3 )、( 3 , 0 )、( 1 , 1 )
また、Fxx(x ,y)=−2y 、Fxy(x ,y)=3−2x−2y 、Fyy(x ,y)=−2x なので、
(x ,y)=( 0 ,0 )、( 0 , 3 )、( 3 , 0 )に対して、
Fxx(x ,y)Fyy(x ,y)−(Fxy(x ,y))2=−9<0 で、公式により、極値を与えない。
(x ,y)=( 1 , 1 )に対して、
Fxx(1 ,1)Fyy(1 ,1)−(Fxy(1 ,1))2=(−2)(−2)−(−1)2=3>0 で、
Fxx(1 ,1)=−2<0 なので、極大値を与える。
(コメント) 定形外郵便物の最大のサイズは、(縦)+(横)+(高さ)=90cmである。このと
き、体積の最大はいくらかという問いに上記の問題は答えてくれる。当然、1辺の
長さが30cmのとき、体積は最大となる。
幾何学的に極値の存在が分かっている場合、次の Lagrange の未定乗数法が便利
である。
Lagrange の未定乗数法(未定係数法)
条件 G(x ,y ,z)=0 のとき、関数 F(x ,y ,z) の極値があれば、それは、次のよう
にして求められる。
連立方程式 G=0 、Fx+λGx=0 、Fy+λGy=0 、Fz+λGz=0
を解くと、その解 (a ,b ,c)が、極値を与える候補となる。
( 注 ) 関数 H( x , y , z , λ )=F+λG と考えれば、上記の4式は、
Hx=0 、Hy=0 、Hz=0 、Hλ=0 ということで、条件の付かない普通の
極値の計算問題に置き換えられる。
このときの、λ のことを、Lagrange の乗数という。
実際に、G(x ,y ,z)=0 のとき、(a ,b ,c)で、関数 F(x ,y ,z) の極値を与えている
ものとする。このとき、G(x ,y ,z)=0 から、z が x , y の関数になっているとすると、関数
F は、x ,y の関数になるので、(a ,b ,c)において、
Fx+Fz・zx=0 、 Fy+Fz・zy=0
が成り立つ。ここで、zx、zy は、次の式により与えられる。
Gx+Gz・zx=0 、 Gy+Gz・zy=0
そこで、(a ,b ,c)における −Fz/Gz の値を、λ とおくと、Fz+λGz=0 が成り立ち、
さらに、Fx+λGx=0 、 Fy+λGy=0 が成り立つ。
したがって、4つの式 G=0 、Fx+λGx=0 、Fy+λGy=0 、Fz+λGz=0 を解くこと
により、極値を与える候補の点(a ,b ,c)が求められる。
上記の式は、次のように考えても得ることができる。
G(x ,y ,z )=0 で定まる曲面上において、 (a ,b ,c)を通る任意の曲線Cを考える。 C : X=X(t) 、Y=Y(t) 、Z=Z(t) このとき、(a ,b ,c)で極値を持つことから、 FxXt+FyYt+FzZt=0 が成り立つ。 よって、2つのベクトル (Fx,Fy,Fz) と (Xt,Yt,Zt) は垂直である。 |
したがって、ベクトル (Fx,Fy,Fz)は、曲面の(a ,b ,c)における接平面の法線ベクトル
(Gx,Gy,Gz)に平行である。
よって、 (Fx,Fy,Fz)+λ(Gx,Gy,Gz)=0 となる λ が存在する。
( 注 ) Lagrange の未定乗数法を用いる場合、G(x ,y ,z)=0 の勾配ベクトル
( Gx , Gy , Gz )
が零ベクトルではないということを確認する必要がある。
例 (2変数関数の場合)
G( x , y )=x2−y3=0 のときの関数 F( x , y )=y の極値を考える。
上記のグラフからも分かるように、関数 F( x , y ) は、点( 0 , 0 )で極小である。
しかしながら、この場合、Lagrange の乗数は定まらない。
実際に、点(0,0)において、Gx =2x=0、Gy =−3y2=0、Fx =0、Fy=1 なの
で、Lagrange の乗数は一意に定まらない。
勾配ベクトルが零ベクトルのときは、Lagrange の未定乗数法は使えないので、別な考
察が必要となる。(上記の例については、広島工業大学の大川研究室よりいただきました。)
(追記) 平成26年2月14日付けで、土筆の子さんからのコメントです。
S(H)さんの問題にもよく登場する、ラグランジュの未定乗数法についてです。たい
てい、頭から式が示されて、λをこう使えば、ある条件式の下で、最大最小問題が解
けると書いてあるのですが、以下の解説でよくわかりました。
放送大学講師の熊原啓作 著 「多変数の微分積分学」の第15章、P62 で出会った、
ラグランジュの未定乗数法のことが、いまひとつ判然としなかったのですが、
E.ハイラー/G.ヴァンナー著、蟹江幸博訳 「解析教程 下」
のp.180〜p.183の記述で判然としました。
g(x,y)=0 という束縛のもとで、
関数f(x,y)の局所最大値(または最小値)を求めなさい。
gのレベル集合を、A={(x,y)|g(x,y)=0} と書けば、問題は、
(x,y)∈Aに対して、f(x,y)≦f(x0,y0)となる(x0,y0)∈Aを求めなさい。
ということになる。(中略) gradf(x0,y0)がレベル曲線Aの接ベクトル(x’(t0),y’(t0))と直
交していることが分かるので、局所的な極値では、2つのベクトル
grad f(x0,y0) と grad g(x0,y0)
は同じ方向を持っている。このことで、必要条件
grad f(x0,y0)=λ・grad g(x0,y0) ・・・ (*) または、 g(x0,y0)=0
(gradf(x0,y0)≠0)
が得られます。このパラメータλをラグランジュの乗数と言います。
方程式(*)は、3つのパラメータ x0,y0,λ に対する3つの条件を表しています。
L(x,y,λ):=f(x,y)-λg(x,y) を考えると、grad L(x0,y0,λ)=0 と表されます。
すなわち、 Lx(x,y,λ)=0 、Ly(x,y,λ)=0 、Lλ(x,y,λ)=0
因みに、(中略)のなかで、(∂f/∂x)(x0,y0)*x’(t0)+(∂f/∂y)(x0,y0)*y’(t0)=0
ラグランジュの未定乗数法のことが英文で記載されている。
いくつかの例題に対して実際に、Lagrange の未定乗数法を適用してみよう。
例題1 x+y=2 のとき、x2+y2 の極値を求めよ。
(解) G( x , y )=x+y−2=0 のとき、
F( x , y )=x2+y2 の極値を与える点( a , b )は次の式を満たす。
x+y−2=0 、2x+λ=0 、2y+λ=0
よって、 −λ/2−λ/2−2=0 より、λ=−2
このとき、 ( x , y )=( 1 ,1 ) が極値を与える候補である。
幾何学的に考えて、( 1 ,1 )において、x2+y2 は極小かつ最小である。
極小値(最小値)は、2 である。
上記の解と、次の別解を是非比較してみて下さい。Lagrange の未定乗数法のエレガン
トさがヒシヒシと伝わってくることでしょう。
(別解) x2+y2=x2+(2−x)2=2x2−4x+4=2(x−1)2+2 より、x=y=1 のとき、
極小で、極小値は、2
Lagrange の未定乗数法は、変数がいくつあっても、条件がいくつあっても(←もちろん
変数の個数よりは少ない!)使えるところが素晴らしい。
例題2 x+y+z=3 のとき、x2+y2+z2 の極値を求めよ。
(解) G( x , y , z )=x+y+z−3=0 のとき、
F( x , y , z )=x2+y2+z2 の極値を与える点( a , b , c )は次の式を満たす。
x+y+z−3=0 、2x+λ=0 、2y+λ=0 、2z+λ=0
よって、 −λ/2−λ/2−λ/2−3=0 より、λ=−2
このとき、 ( x , y , z )=( 1 , 1 , 1 ) が極値を与える候補である。
幾何学的に考えて、( 1 , 1 , 1 )において、x2+y2+z2 は極小かつ最小である。
極小値(最小値)は、3 である。
(別解) x2+y2+z2=x2+y2+(3−x−y)2
=2x2+2xy+2y2−6x−6y+9
=2(x+(y−3)/2)2+(3/2)(y−1)2+3
より、x=y=z=1 のとき、極小で、極小値は、3
問題が、4変数になると、(別解)のような方法は「すごく大変になるな〜」と予想されるが、
Lagrange の未定乗数法の方は、全く解答形式を変えることなく簡明に求められる。
我々は、この解法を与えてくれた Lagrange に大いに感謝しなければならないですね!
例題3 x2+y2+z2=4 のとき、xyz の極値を求めよ。ただし、x , y , z ≧0 とする。
この問題の幾何学的意味は、「半径 1 の球に内接する直方体の体積の極値を求める」
ということで、明らかに極大値の存在がいえる。このことを踏まえて、Lagrange
の未定乗
数法を適用するのである。
(もちろん、x2+y2+z2=4 を満たす点( x , y , z )の集合は、R3 の有界閉集合だか
ら、コンパクト。よって、連続関数 xyz は、最大値・最小値をもつことからも極値の存在
は了解される。)
(解) G( x , y , z )=x2+y2+z2−4=0 のとき、
F( x , y , z )=xyz の極値を与える点( a , b , c
)は次の式を満たす。
x2+y2+z2−4=0 、yz+2λx=0 、xz+2λy=0 、xy+2λz=0
第二式、第三式、第四式から、 3xyz+2λ(x2+y2+z2)=0
すなわち、 3xyz+8λ=0 より、λ=−(3/8)xyz となる。
このとき、
yz(1−(3/4)x2)=0 、xz(1−(3/4)y2)=0 、xy(1−(3/4)z2)=0
これを解くと、
( x , y, z )=( 2 ,0 ,0 )、( 0 ,2 ,0 )、( 0 ,0
,2 )、( 2/ ,2/ ,2/ )
幾何学的に考えて、( x , y, z )=( 2/ ,2/ ,2/ )で、極大かつ最大である。
極大値(最大値)は、8/(3) である。
(追記) 平成16年12月発売の数学セミナー(2005年1月号)において、Lagrange
の未
定乗数法の話題が取り上げられている。
(当HPで取り上げたときと時を同じくして数学セミナーで紹介されたということで、
ちょっとこの偶然性に驚いています。)
(追記) 平成20年11月1日付け
当HPの掲示板「出会いの泉」に31日付けでHN「D.D.」さんが条件付き極値問題につ
いて書き込まれた。
G( x , y )=x2+y2−1=0 という条件のもとで、関数F( x , y )=xy の極値
を求めたいのだが、ラグランジュの乗数法を用い、極値の判定をするという一連の作
業がどうも上手く出来ない。
上記の問題に、 「x≧0 、 y≧0」 という条件を加味すれば、この問題は、
原点中心、半径1の円に内接する長方形の面積の変化を問う
ことに等しく、幾何学的に考えて明らかに極値を持つことが了解される。
単に極値を求めるだけだったら、次のように解けばよい。
(解) x2+y2=1 より、 x=cosθ、y=sinθ とおける。このとき、
xy=sinθcosθ=(1/2)sin2θ と書けるので、
2θ=2nπ+π/2 すなわち、 θ=nπ+π/4 のとき極大
2θ=(2n+1)π+π/2 すなわち、 θ=nπ+3π/4 のとき極小 (終)
グラフで表せば下図のようになる。
上記では媒介変数表示を用いて三角関数のグラフから極値を考察したが、次のように求
める方法があることをS(H)様より伺った。
(当HPの掲示板「出会いの泉」−平成20年10月31日付け)
(解) 円 x2+y2=1 と双曲線 xy=k が交わるための条件を求めればよい。
y=k/x を、x2+y2=1 に代入して整理すると、 x4−x2+k2=0
x2=X とおくと、 X≧0 で、2次方程式 X2−X+k2=0 を得る。
円と双曲線が交わるためには、この2次方程式が少なくとも1つの負でない実数
解を持つことが必要十分である。
2次関数 Y=X2−X+k2 の軸の方程式が、 X=1/2>0 なので、求める条件
は、判別式 D≧0 に同値である。
よって、 D=1−4k2≧0 から、 −1/2 ≦ k ≦ 1/2 となる。
上図から分かるように、
k=1/2 のとき、極大かつ最大で、k=−1/2 のとき、極小かつ最小である。
次に、極値を与える点を求める。
k=±1/2 のとき、 X2−X+1/4=0 から、 X=1/2
すなわち、 x=±1/ となる。
よって、 k=1/2 のとき、( x , y )=( 1/
,1/ )、( −1/ ,−1/ )
また、 k=−1/2 のとき、( x , y )=( 1/ ,−1/ )、( −1/ ,1/ )
以上が求めるものであった。 (終)
(コメント) 両者の解答を比較すれば、三角関数を用いた方がすこぶる簡明だろう。
また、次のような解答も可能である。(S(H)様より、ご教示いただきました。)
x2+y2=1 より、 なので、の値の変化を調
べればよい。このグラフを描くと、
この図から、極大点、極小点が考察できる。
ただ、これらの解答では、D.D.さんの悩みには答えていないような...予感。
ラグランジュの未定乗数法を用いて上記の問題を解いてみることにしよう。
Fx+λGx=y+2λx=0 、Fy+λGy=x+2λy=0 からλを消去して、
x2−y2=0 (← シルベスターの消去法による!) を得る。
また、 x2+y2=1 なので、これらを連立して解くと、
( x , y )=( 1/
,1/ )、( 1/ ,−1/ )、
( −1/ ,1/ )、( −1/ ,−1/
)
となる。この4点が極値を与える候補となる。
「x≧0 、 y≧0」 という条件では、幾何学的に考えて明らかに極大値を持つので、
( x , y )=( 1/ ,1/ )で、 F( x , y
)=xy は極大である。
また、「x≦0 、 y≦0」 という条件は、「−x≧0 、− y≧0」
という条件に同値で、
xy=(−x)(−y) より、( x , y )=( −1/ ,−1/ )で、 F( x , y )=xy
は極大である。
また、「x≧0 、 y≦0」 という条件は、「x≧0 、− y≧0」
という条件に同値で、
x(−y)が極大であるとき、xy は極小となる。
したがって、( x , y )=( 1/ ,−1/ )で、F( x , y )=xy は極小となる。
同様にして、「x≦0 、 y≧0」 という条件は、「−x≧0 、 y≧0」という条件に同値で、
(−x)y が極大であるとき、xy は極小となる。
したがって、( x , y )=( −1/ ,1/ )で、 F( x , y )=xy は極小となる。
(コメント) 上記の計算で、D.D.さんの質問の回答になっているかどうか...?
(久しぶりにラグランジュの乗数法の計算をしたので見当違いがあるかも!)
周の長さが 6 の三角形で面積が最大であるものを求めるという問題を考える。
Lagrange の未定乗数法(大学1年の微分積分学のレベル)を用いると次のように鮮やか
に解かれる。
例題4 3辺の長さ x , y , z の三角形において、 x + y + z =6 のとき、
3(3−x )(3−y )(3−z ) が最大となるのは、どんな場合か?
#3(3−x )(3−y )(3−z )の意味は、ヘロンの公式から(三角形の面積)2である。
(解) G( x , y , z )=x + y + z −6=0 のとき、
F( x , y , z )=3(3−x )(3−y )(3−z ) の極値を与える点( a , b , c )は次の
式を満たす。
x + y + z −6=0 、−3(3−y )(3−z )+λ=0 、−3(3−x )(3−z )+λ=0
−3(3−x )(3−y )+λ=0
x ≠ 3 、y ≠ 3 、z ≠ 3 としてよいので、上式から、x = y = z =2 、λ=3 で
あることが容易に分かる。
幾何学的に考えて、x = y = z =2 すなわち、正三角形のとき、面積は極大かつ
最大となる。
例題5 原点から平面 ax+by+cz+d=0までの距離を求めよ。
#x2+y2+z2の最小値を求めることに同義である。通常はベクトルを利用する解法が一
般的だろう。
(解) G( x , y , z )=ax+by+cz+d=0 のとき、
F( x , y , z )=x2+y2+z2 の極値を与える点は次の式を満たす。
ax+by+cz+d=0 、2x+λa=0 、2y+λb=0 、2z+λc=0
このとき、 2(x2+y2+z2)+λ(ax+by+cz)=0 から、x2+y2+z2=λd/2
また、2(ax+by+cz)+λ(a2+b2+c2)=0 より、λ=2d/(a2+b2+c2)
幾何学的に考えて、x2+y2+z2 の最小値は、d2/(a2+b2+c2)
よって、求める距離は、 |d|/√(a2+b2+c2) である。
(追々記) Lagrange の未定乗数法は、あくまでも極値を与える候補を教えてはくれるが、
それが本当に極値を与えるかどうかについては、何ら教えてはくれない。
したがって、Lagrange の未定乗数法は、何らかの方策により、極値の存在が
判明している場合に有効である。
当HPでも、その趣旨を最大限有効利用し、「幾何学的に考えて」という表現で、
十分性の確認を匂わせてきた。
しかし、このことは、やはり、どこかしら気持ちが悪い。しっくりこないのである。
この気分は、上記の原稿を書いているときに常に頭の片隅に居座った。
この件に関して、広島工業大学の大川研究室よりアドバイスを頂戴した。いた
だいたアドバイスを参考にしながら、「幾何学的に考えて」ではなく、解析的な手
法で、十分性の確認を行ってみたい。
例題6 xy=4 のとき、2x+2y の極値を求めよ。
(解) G( x , y )=xy−4=0 のとき、
F( x , y )= 2x+2y の極値を与える点( a , b )は次の式を満たす。
2+λy=0 、2+λx=0 、xy−4=0
よって、λ2xy=4 、xy=4 より、λ2=1 となって、λ=±1
このとき、 ( a , b )=( 2 , 2 ) 、( −2 , −2
)
いま、( a , b )=( 2 , 2 )について吟味する。
G( 2+h , 2+k )=0 を満たすような h , k を考えると、
hk < 0 である。
なぜならば、 y=4/x において、y’=−4/x2 <0 より、単調減少関数だから
である。
このとき、G( 2+h ,2+k )=(2+h)( 2+k)−4=2(h+k)+hk=0 より、
2(h+k)=−hk が成り立つ。
よって、( 2 , 2 ) に近い点 ( 2+h , 2+k ) において、常に
F( 2+h , 2+k )−F( 2 , 2 )=2(h+k)=−hk>0
が成り立つので、点( 2 , 2 )において、極小であることが分かる。
次に、( a , b )=( −2 , −2 )について吟味する。
G( −2+h , −2+k )=0 を満たすような h , k を考えると、上記と同様の
理由から、hk < 0 である。
このとき、G( −2+h ,−2+k )=(−2+h)( −2+k)−4
=−2(h+k)+hk
=0
より、 2(h+k) = hk が成り立つ。
よって、( −2 , −2 ) に近い点 ( −2+h , −2+k ) において、常に
F( −2+h , −2+k )−F( −2 , −2 )=2(h+k)
= hk<0
が成り立つので、点( −2 , −2 )において、極大であることが分かる。
上記の解答(後半部分)は、極値の定義に立ち返った証明で分かりやすいが、スマート
さに欠ける。しかも、陰関数を陽関数に直して、その導関数の性質を利用している点が一
般的でないように思う。
極値を持つための十分性の確認として、次の事実が知られている。
(慶應義塾大学商学部解析U(2003)における練習問題の解答を参考にさせていただきました。)
条件 G(x ,y)=0 のもとで、関数 F(x ,y) の極値について考える。
関数 H(x ,y ,λ)=F−λG とおき、 Hx=0 、Hy=0 、Hλ=0 を満たす点を
(a ,b ,λ0) とおく。
このとき、次の行列式 B を、 (a ,b ,λ0)での 縁付き行列式 という。
もし、 B<0 ならば、関数 F(x ,y ) は、点(a ,b)で極小
B>0 ならば、関数 F(x ,y) は、点(a ,b)で極大
上記の例題6に早速適用してみよう。
G(x ,y)=xy−4=0 、F(x ,y)= 2x+2y より、
H(x ,y ,λ)=F(x ,y)−λG(x ,y)= 2x+2y−λ(xy−4)
Lagrange の未定乗数法により、
2−λy=0 、2−λx=0 、xy−4=0
よって、λ2xy=4 、xy=4 より、λ2=1 となって、λ=±1
このとき、 (a ,b ,λ)=(2 ,2 ,1) 、(−2 ,−2 ,−1)
ここで、
Gx=y 、Gy=x 、Hx=2−λy 、Hy=2−λx
Hxx = 0 、Hxy = −λ 、Hyy = 0
であることに注意して、点(2 ,2 ,1)での縁付き行列式 B の値は、
よって、 関数 F(x ,y) は、点(2 ,2)で極小となる。(先の結果と一致!)
同様にして、点(−2 ,−2 ,−1)での縁付き行列式 B の値は、
よって、 関数 F(x ,y) は、点(−2 ,−2)で極大となる。(先の結果と一致!)
また、次のような事実も知られているらしい。
(広島工業大学 大川研究室よりいただきました。ありがとうございます。)
条件 G(x ,y)=0 のとき、点(a ,b)は、関数 F(x ,y) の極値を与える候補とす
る。 ただし、(Gx ,Gy)≠(0 ,0) とする。
さらに、関数 H(x ,y ,λ)=F−λG とおき、1階偏微分作用素 D を、
により定める。このとき、点(a ,b)において、
D2F>0 のとき、関数 F(x ,y) は、点(a ,b)で極小
D2F<0 のとき、関数 F(x ,y) は、点(a ,b)で極大
(注意) G( x , y ) が一般の二次式の場合、幾何学的に判定することが難しい場合が
あるが、( Gx , Gy ) ≠ ( 0 , 0 )という条件さえクリアすれば、必ず、この公式
で、極値をもつかどうかは判定できるとのことである。
ただし、F( x , y )=F( a , b ) と G( x , y
)=0 が高次の接触をしている場
合( 例えば、G( x , y ) = 0 が、等高線 F( x , y ) = F( a , b )の曲率円 )
は、さらに、D3F、D4F の計算が必要になるそうだ。
上記の例題6に早速適用してみよう。
G( x , y )=xy−4=0 、F( x , y )= 2x+2y より、
H( x , y ,λ )=F( x , y )−λG( x , y )= 2x+2y−λ(xy−4)
Lagrange の未定乗数法により、
2−λy=0 、2−λx=0 、xy−4=0
よって、λ2xy=4 、xy=4 より、λ2=1 となって、λ=±1
このとき、 ( a , b ,λ )=( 2 , 2 , 1 ) 、( −2
, −2 , −1 )
ここで、
Gx=y 、Gy=x 、Fx=2 、Fy=2
このとき、 DF=GyFx−GxFy=2x−2y なので、
D2F=D(DF)=2x−y(−2)=2x+2y
点( 2 , 2 )において、D2F=8>0 となるので、極小である。
点( −2 , −2 )において、D2F=−8<0 となるので、極大である。
(コメント:計算量がこちらの方が少なくて、いいですね!)
ところで、上記であげた2つの公式は、一見して無関係そうに見えるが、実は両者は密接
に関係していることが次の計算から分かる。
実際に、行列式の性質から、
B=−Gx(GxHyy−GyHxy)+Gy(GxHxy−GyHxx)
=−Gx(Gx(Fyy−λGyy)−Gy(Fxy−λGxy))+Gy(Gx(Fxy−λGxy)−Gy(Fxx−λGxx))
=−Gx2Fyy+λGx2Gyy+GxGyFxy−λGxGyGxy+GxGyFxy−λGxGyGxy−Gy2Fxx+λGy2Gxx
ここで、 Fx−λGx=0 、Fy−λGy=0 であるので、
B=−Gx2Fyy+FxGxGyy+GxGyFxy−FyGxGxy+GxGyFxy−FxGyGxy−Gy2Fxx+FyGyGxx
=−Gy2Fxx+2GxGyFxy−Gx2Fyy+FyGyGxx−FyGxGxy−FxGyGxy+FxGxGyy
一方、
DF=GyFx−GxFy なので、
D2F=D(DF)
=Gy(GyxFx+GyFxx−GxxFy−GxFyx)−Gx(GyyFx+GyFxy−GxyFy−GxFyy)
=FxGyGxy+Gy2Fxx−FyGyGxx−GxGyFxy−FxGxGyy−GxGyFxy+FyGxGxy+Gx2Fyy
=Gy2Fxx−2GxGyFxy+Gx2Fyy−FyGyGxx+FyGxGxy+FxGyGxy−FxGxGyy
以上の考察から、縁付き行列式 B と 1階偏微分作用素 D の間には、
B=−D2F
という関係が成り立つことが分かる。
ところで、関数 H( x , y , λ )(=H( λ ,x , y ) )において、
が成り立つので、縁付き行列式 B は、関数 H( λ ,x , y ) のヘッセ行列とも関係があり
そうである。
(追々々記) 1階偏微分作用素 D の公式は、大川さんが大学院時代にある講演で聴かれ
たものだそうで、文献等にも見られず、あまり一般には知られていないかも...
とのことである。大川さんより証明の骨子をいただいたので、私の理解できる範
囲でまとめてみた。
(私の理解不足で、大川さんの真意が伝わっているかどうか自信がありません。そんなわけで、
ちょっと大目にみてください!)
極値を与える候補の点( a , b )を通る曲線 C : G( x , y )=0 は、
( Gx , Gy ) ≠ ( 0 , 0 ) なので、陰関数の定理より、点( a , b )の近くで、
C : x=x(t) 、 y=y(t) (ただし、 x(0)=a 、 y(0)=b )
と書ける。 このとき、関数 F( x , y ) は、1変数 t の関数 f(t)
= F( x , y ) となる。
いま、G( x , y )=0 の両辺を t で微分すると、 Gxxt + Gyyt = 0 なので、恒等的
に零ではない t の関数 k = k( t ) を用いて、 xt = −kGy 、yt = kGx と書ける。
このとき、C の接線方向の導関数 f’(t) について、
f’(t) =dF/dt = Fxxt + Fyyt = −kGyFx + kGxFy = k(−GyFx + GxFy) = kDF
が成り立つ。よって、微分作用素として、 d/dt = kD と考えられる。
ここで、媒介変数 t を取り直すことにより、 C上の微分作用素として、D = d/dt として
よい。
実際に、常微分方程式 du/dt =1/k の解を、u とするとき、
dF/du = (dF/dt)(du/dt) = kDF・(1/k)
= DF
である。(ここで、1/k は微分可能で、その導関数も連続なので必ず解は存在する。)
したがって、媒介変数として、u を t と取り直せばよい。
このとき、 d2F/dt2 = d(dF/dt)/dt = d(DF)/dt = D(DF)=D2F
これにより、1変数関数の場合と全く同様にして、
[d2F/dt2]t=0 >0 ならば、点( a , b )で、関数 F( x , y ) は極小
[d2F/dt2]t=0 <0 ならば、点( a , b )で、関数 F( x , y ) は極大
であるので、
D2F >0 ならば、点( a , b )で、関数 F( x , y ) は極小
D2F <0 ならば、点( a , b )で、関数 F( x , y ) は極大
が成り立つ。 (略証終)
ところで、縁付き行列式 B と 1階偏微分作用素 D の関係から、縁付き行列式 B の公
式の証明も気になるが、慶應義塾大学経済学部の戸瀬信之先生が証明を与えていられ
るので、なぞってみたいと思う。
極値を与える候補の点( a , b )を通る曲線 C : G( x , y
)=0 は、
Gy( a , b ) ≠ 0 とすると、陰関数の定理より、点( a , b )の近くで、
C : x=t 、 y=y(t) (ただし、y(a)=b) と書ける。
G( x , y )=0 の左辺は、媒介変数 t の関数なので、両辺を t で微分すると、
Gx+Gyy’=0 すなわち、 y’=−Gx/Gy
上式を、さらに t で微分すると、 Gxx+Gxyy’+(Gxy+Gyyy’)y’+Gyy”=0
すなわち、 Gxx+2Gxyy’+Gyy(y’)2+Gyy”=0
が成り立つ。このとき、
y” = −(Gxx+2Gxyy’+Gyy(y’)2)/Gy
= −(Gxx+2Gxy(−Gx/Gy)+Gyy(−Gx/Gy)2)/Gy
= −(GxxGy2−2GxyGxGy+GyyGx2)/Gy3
同様にして、1変数 t の関数 f(t) = F( x , y ) の第二次導関数を求めれば、
f”(t) = Fxx+2Fxyy’+Fyy(y’)2+Fyy”
となる。 このとき、上記の y’、y” を代入して、
f”(t) = Fxx+2Fxy(−Gx/Gy)+Fyy(−Gx/Gy)2
+Fy(−(GxxGy2−2GxyGxGy+GyyGx2)/Gy3)
=(FxxGy2−2FxyGxGy+FyyGx2)/Gy2
+(−Fy/Gy)(GxxGy2−2GxyGxGy+GyyGx2)/Gy2
ここで、H( x , y ,λ )=F( x , y )−λG( x , y ) とすると、
点( a , b )において、Fy/Gy=λ であるので、
f”(a) =(FxxGy2−2FxyGxGy+FyyGx2)/Gy2
+(−λ)(GxxGy2−2GxyGxGy+GyyGx2)/Gy2
=((Fxx−λGxx)Gy2−2(Fxy−λGxy)GxGy+(Fyy−λGyy)Gx2))/Gy2
=(HxxGy2−2HxyGxGy+HyyGx2)/Gy2
縁付き行列式を実際に計算してみると、
B=−Gx(GxHyy−GyHxy)+Gy(GxHxy−GyHxx)
=−(HxxGy2−2HxyGxGy+HyyGx2)
なので、
f”(a)=−B/Gy2
と書ける。 従って、縁付き行列式 B について、
B<0 のとき、f”(a)>0 より、t = a すなわち、(a ,b)で、関数 F(x ,y) は極小
B>0 のとき、f”(a)<0 より、t = a すなわち、(a ,b)で、関数 F(x ,y) は極大
になることが分かる。
(コメント) 縁付き行列式 B と 1階偏微分作用素 D の間には、
B=−D2F
という関係が成り立つので、上記の証明から、次の公式が成り立つことも示される。
D2F>0 のとき、関数 F(x ,y) は、点(a ,b)で極小
D2F<0 のとき、関数 F(x ,y) は、点(a ,b)で極大
(参考文献:佐々木重夫 他著 微分積分学 (廣川書店)
外岡慶之助 他著 微分積分学 (学術図書出版社)
小松勇作 早川康弌 著 微分積分学 (朝倉書店)
福田安蔵 他著 微積分演習U (共立出版)
一松 信 著 解析学序説 上・下巻 (裳華房))