イェンゼンの不等式                        戻る

 高校で学ぶ不等式で、相加平均と相乗平均の関係は単純ながら、その応用の豊富さに
驚かされる。私の一番のお気に入りは、

     「 x>0 のとき、 x+1/x の最小値を求めよ。 」 (こちらを参照)

である。高校1年のときに初めて、この問題が相加平均と相乗平均の関係を用いて鮮やか
に解決されるのに遭遇して、そのアクロバットさゆえに数学の奥深さに感じ入ったものだ。

 相加平均と相乗平均の関係とは、

 a≧0 、b≧0 に対して、

        

というものであった。

 上記は項の数が2個の場合であるが、一般には、

  のとき、
                     
という不等式が成り立つ。

 これらの不等式の証明は、2個の場合は平易だが、一般の場合は少し複雑である。

 ものは試しに証明に挑戦してみよう! 証明は、数学的帰納法を用いる。

(証明) n=2 のとき、
                

   より、命題は成り立つ。

 n=2 (p≧1)のとき成り立つと仮定する。

 n=2p+1 のとき、隣り合う2項ずつを組み合わせて、n=2 のときの結果を用いれば、

  n=2 (p≧1)の場合に還元でき、

       

                    
より、命題は成り立つ。

 以上から、全ての自然数 p について、 n=2 のとき、命題は成り立つ。

 2以上の任意の自然数 n に対して、 2-1<n≦2 となる自然数 p が存在する。

 いま、 2−n=m とおくと、 2=m+n である。

そこで、
      
とおくと、
       

よって、    なので、 

したがって、
          

が成り立つ。  (証終)

(コメント) ...かなり技巧的な証明ですね!でも、感動しました!!


 実は、これらの不等式を統一的に証明する方法がある。それは上記の不等式の何れも
が、Jensen の不等式の特別の場合だからである。

 Jensen の不等式から、相加平均と相乗平均の関係、シュワルツの不等式やヘルダー
の不等式を導くことが出来る。その意味で、「Jensen の不等式」は、最も基本的な不等
式であると言えよう。

Jensen の不等式(1906年)

 関数 f(x) は、凸関数とする。このとき、

 λ1+λ2+・・・+λ=1 を満たすλ1≧0、λ2≧0、・・・、λ≧0 に対して 


  λ1f(x1)+λ2f(x2)+・・・+λf(x)≧f(λ11+λ22+・・・+λ

が成り立つ。


 ここで、関数 f(x) が、凸関数であるとは、

任意の a、b と 0≦ t ≦1 を満たす t に対して、

          t・f(a)+(1−t)・f(b)≧f(t・a+(1−t)・b) 

が成り立つときを言う。

 もしも、関数 f(x) が2回微分可能ならば、次の定理により、凸関数か否かが判定できる。

 関数 f(x) において、f”(x)≧0 ならば、関数 f(x) は凸関数である

 このことは、グラフ的には、次のような意味がある。

  グラフ上のどんな2点を選んでも、それらを結ぶ線分の下方に対応する部分の
 グラフがある
          
凸関数の例

(1) 区間 (−∞ ,∞) において、関数 f(x)= x2n

(2) 区間 [0 ,π] において、関数 f(x)=−sin x

(3) 区間 [−π/2 ,π/2] において、関数 f(x)=−cos x

(4) 区間 [0 ,π/2) において、関数 f(x)=tan x

(5) 区間 (0 ,∞) において、関数 f(x)=−log x

 凸関数(convex)の定義から、「−」がどうしてもついてしまう場合があるが、それを回避
するために、凹関数(concave)も同様にして定義される。

 Jensen の不等式は、凸関数を定義する不等式を一般化したものである。

実際に、t・f(a)+(1−t)・f(b)≧f(t・a+(1−t)・b)において、t=λ1、1−t=λ2 とおくと、

 λ1≧0、λ2≧0 、λ1+λ2=1 で、 λ1f(x1)+λ2f(x2)≧f(λ11+λ22

となり、これは、Jensen の不等式の n=2 の場合である。

n=3 のときは、どうだろうか?確認してみよう。

 λ1≧0、λ2≧0、λ3≧0 で、λ1+λ2+λ3=1 とする。

このとき、

λ1f(x1)+λ2f(x2)+λ3f(x3

=λ1f(x1)+(λ2+λ3)[{(λ2/(λ2+λ3)}f(x2)+{λ3/(λ2+λ3)}f(x3)]

 ここで、 λ2/(λ2+λ3)+λ3/(λ2+λ3)=1 なので、

{(λ2/(λ2+λ3)}f(x2)+{λ3/(λ2+λ3)}f(x3
                       ≧f({λ2/(λ2+λ3)}x2+{λ3/(λ2+λ3)}x3

 よって、

λ1f(x1)+λ2f(x2)+λ3f(x3

≧λ1f(x1)+(λ2+λ3)[f({λ2/(λ2+λ3)}x2+{λ3/(λ2+λ3)}x3)]

≧f(λ11+(λ2+λ3)[{λ2/(λ2+λ3)}x2+{λ3/(λ2+λ3)}x3])

=f(λ11+λ22+λ33

 よって、n=3 のときも、Jensen の不等式は成り立つ。

 同様な操作を行えば、全ての自然数 n に対して、Jensen の不等式が成り立つことが分
かる。
(詳しくは、数学的帰納法を用いて示される。)

 このJensen の不等式を用いると、相加平均と相乗平均の関係

       

は、次のように簡潔に証明される。

(証明) 区間 (0 ,∞) において、関数 f(x)=−log x は凸関数なので、

    Jensen の不等式より、

      −(1/n)log x1−(1/n)log x2−・・・−(1/n)log x

     ≧−log {(1/n)x1+(1/n)x2+・・・+(1/n)x}=−log (x1+x2+・・・+x)/n

 よって、 log (x1+x2+・・・+x)/n ≧ (1/n)log x12・・・x が成り立ち、

            

が示された。(証終)

 上記の証明は簡潔ではあるが、やはり技巧的な感じは拭えない。しばらく時間が経って、
この証明を復元するという自信が持てない。

 証明を復元するのに自信が持てない方のために、次のような直接的な証明を紹介してお
こう。(平成22年3月23日付け)

(別証) 関数 F(x)=log x について、 F’(x)=1/x 、F”(x)=−1/x2<0 より、関数

    F(x)=log x は上に凸である。

     よって、 (x1+x2+・・・+x)/n=a とおくと、x=a における接線の方程式は、

    y=1/a・(x−a)+log a なので、 1/a・(x−a)+log a ≧ log x が成り立つ。

    このとき、k=1、2、3、・・・、n に対して、

         1/a・(x1−a)+log a ≧ log x1

         1/a・(x2−a)+log a ≧ log x2

         1/a・(x3−a)+log a ≧ log x3

          ・・・・・・・・・・・・・・・・・・・・・・・・

         1/a・(x−a)+log a ≧ log x

     これらの n 個の不等式を辺々加えて、

          n・log a ≧ log x1+log x2+log x3+・・・+log x

    すなわち、   log a ≧ (log x123・・・x)/n より、

          

    が成り立つ。(別証終)


 この相加平均と相乗平均の関係について、横浜市立大学(国際総合科学部 理系)の平
成19年度入試問題は、ある意味斬新で面白いと思う。

次の問いに答えよ。

(1) すべての実数 x に対して、不等式 x ≦ ex-1 が成り立つことを示せ。

(2) 正の数 x1、x2、・・・、x が、x1+x2+・・・+x=n を満たすとき、 x12・・・x≦1

   が成り立つことを示せ。

(3) 正の数 a1、a2、・・・、a に対して、 A=(a1+a2+・・・+a)/n とするとき、

          a12・・・a≦A

   が成り立つことを示せ。

(3)は正しく、相加平均と相乗平均の関係
                           
の証明をせよという問題である。

(解)(1) F(x)=ex-1−x とおくと、 F’(x)=ex-1−1 で、 F’(x)=0 より、 x=1

         x<1 で F’(x)<0  、  x>1 で F’(x)>0

     なので、F(x)は、x=1 で極小かつ最小である。

    よって、 F(x)≧F(1)=0 より、 ex-1−x≧0 すなわち x≦ex-1 が成り立つ。

 (2) (1)より、 x12・・・x≦e1-12-1・・・e-1=e1+x2+・・・+x-n=e0=1

 (3) a1/A+a2/A+・・・+a/A=n なので、(2)より、

      (a1/A)(a2/A)・・・(a/A)≦1 すなわち、 a12・・・a≦A

   が成り立つ。

(コメント) 代数的な証明よりも、やはり解析的な証明の方が分かり易いですね!

 この不等式を用いて、次の問題が鮮やかに解かれる。

問 題  6次方程式 x6−6x5+ax4+bx3+cx2+dx+1=0 の解がすべて正であると
     き、定数 a、b、c、d の値を求めよ。

 一見すると、「途方に暮れそうな...」問題であるが、不等式が等式の問題を解決するの
に役立つことを知ると、感動的ですらある。

(解) 6次方程式の解を、 x (k=1,2,3,4,5,6) とすると、

   相加平均と相乗平均の関係から、

       

  ここで、解と係数の関係から、 左辺=x1+x2+x3+x4+x5+x6=6 で、

 x1・x2・x3・x4・x5・x6=1 より、右辺=6 で、左辺=右辺 となり、等号が成立する。

  よって、このとき、 x1=x2=x3=x4=x5=x6=1 となり、6次方程式の左辺は、

    (x−1)6=x6−6x5+15x4ー20x3+15x2−6x+1

 よって、 a=15 、b=−20 、c=15 、d=−6 である。 (終)

(コメント) 最初、本当にどうしようと思いました。こんな解法があるなんて、やはり数学は
      面白いですね!


 当HP読者のHN「red.pine.another」さんからのコメントです。(平成24年12月27日付け)

 上記の問題で、6次方程式の係数を相加相乗平均を利用して解いているのですが、友人
と検討していて疑問が浮かびました。

 6つの解を相加相乗の式に当てはめて、等号成立条件より、 (x−1)6=0 としているの
ですが、これは解が自然数という縛りがなければ答えが定まらないのではないでしょうか?
また、等号が成り立つ必要もなく、解と係数の関係を満たせば答えが導かれるのではない
でしょうか?たとえば、(x−2)2・(x−1/2)4=0 であれば、解は全て正で、解と係数の関
係も満たします。


(コメント) 6次方程式において、5次の係数が−6、定数項が1という条件が、この問題に
      おいては決定的な条件で、解が自然数という条件がなくても自然数が解となり、し
      かも他の係数も無条件に定まるというところが、この問題のユニークなところです。

   上記の解をもう少し補足したいと思います。

  相加平均と相乗平均の関係  におい
 て、x>0 (k=1〜6)なので、等号が成り立つのは、x1=x2=x3=x4=x5=x6 の場
 合に限ります。

  しかも、解と係数の関係から、 x1+x2+x3+x4+x5+x6=6
                     x1・x2・x3・x4・x5・x6=1

 なので、等号が成立しています。したがって、x1+x2+x3+x4+x5+x6=6 より、

     x1=x2=x3=x4=x5=x6=1

 とならざるを得ません。このとき、

   x6−6x5+ax4+bx3+cx2+dx+1=(x−1)6
                          =x6−6x5+15x4ー20x3+15x2−6x+1

 から、 a=15 、b=−20 、c=15 、d=−6 と定まり、これ以外はあり得ません。


※ red.pine.another さんが例示された (x−2)2・(x−1/2)4 は定数項が1となり得ず、問
 題に合致しません。


 読者のために、練習問題を残しておこう。

練習問題  3次方程式 x3−3x2+ax−1=0 の解がすべて正であるとき、定数 a の
       値を求めよ。

 答えは、もちろん、 3 である。


 当HPの読者の方からの質問です。(平成23年8月3日付け)

 相加相乗平均の関係についての質問です。相加平均と相乗平均の関係の証明は50くら
いはある、ということを聞いたことがあります。ただ、ネットや参考書などで一生懸命探して
も、なかなか見つかりませんでした。

[質問の内容]

 相加相乗平均の関係の一般の場合についての証明を考えていた時のことです。

 これまでに微分して解析的に示す方法や、2k の場合を示してさかのぼる帰納法、

「a1≦a2、b1≦b2 について、a12+a21≦a11+a22 」を帰納的に利用する方法など、

いくつかの証明を見てきました。理解は容易なものの、なんだか煙に巻かれたようなしっくり

こない心地でいました。

そこで、相加相乗平均の関係(を少しだけ書き換えたもの)

  n(b12・・・b)≦b1+b2+・・・+b

を眺めていたところ、

  n(b12・・・b)=b12・・・b+b12・・・b+・・・+b12・・・b (n 個の和)

と考えると、b1、b2、・・・、b を、n個ずつ用意して合計n2個の元を、n個ずつの組に分け、

組の中で積を作って、それらを足したものの大小の関係であることに気付きました。

 b1≦2≦・・・≦b と順序をつけてよく、このとき、左辺では組として、

    (b1,b2,・・・,b)

がn組という、大小が入り乱れた組を作っており、右辺では、

  (b1,b1,・・・,b1)、(b2,b2,・・・,b2)、・・・、(b,b,・・・,b)

という、大きいものは大きいもの同士で組を作る、という風になっています。

 これらに示したい大小関係がつくのは明らかに思えます。つまり、示したいことが、次の事
柄になったのです。

 mn個の非負の元からなる(広義)単調増加な数列 a1,a2,・・・,amn について、

この数列を任意に並び換えたものを、 b1,b2,・・・,bmn とすると、

12・・・a+an+1n+2・・・an+n+・・・+a(m-1)n+1(m-1)n+2・・・amn

   ≧ b12・・・b+bn+1n+2・・・bn+n+・・・+b(m-1)n+1(m-1)n+2・・・bmn ・・・(★)

 しかし、いざ示してみようとすると、そこまで単純なものではないのか、かなり苦戦しました。
いろいろ調べていたところ、「並べかえ不等式」と関係していそうだと思い、まずこれを一般
化することから始めました。

 なんとかその証明も自分なりに完成し、正しいかどうかはわかりませんが、そこから(★)も
解決することができました。

 そこで、質問です。: (★)という命題を容易に証明することは可能でしょうか。


 上記と同じ方からの質問です。(平成23年8月20日付け)

 前回、mn個の元からn個ずつ取り出し、積をとったものを順次足す、ということを質問しま
したが、これを直接的に証明することができました。また、並べかえ不等式についても、証
明をある程度丁寧に書いてみました。(→ pdf1 、 pdf2

 さて、この並べかえ不等式は、いわば積和の関係式ですが、それと双対(?)の関係とい
うのでしょうか、和と積の役割を完全に入れ替えた、和積の不等式も全く同様の方法が適
用されることに気がつきました。

 置換を施す前後の積和の差は、

   (A1A2+B1B2)-(A1B2+B1A2)=(A1-B1)(A2-B2)

という因数分解が成立しましたが、和積の場合は、

(A1+A2)(B1+B2)-(A1+B2)(A2+B1)=(A1B2+B1A2)-(A1A2+B1B2)=(A1-B1)(B2-A2)

という因数分解ができます。このことから、積和に関する並べ替えの不等式を和積になおす
と、(証明はひとえにこの因数分解によっているので)不等号が正反対になりました。その点
を除けば、証明はほぼ同じものでした。

 これは、和が一定の場合、いくつかの積をできる限り大きくするには、全部が等しくなるよ
うにすればよいことに関係していそうです。これはまだpdfにまとめることはできていません。

 また、その和積の場合の不等式も、相加相乗平均の関係の証明となっていました。

 {(a1+a2+・・・+an)/n} とは、a1/n、a2/n、・・・、an/n を n 個ずつ用意した場合のひとつの
和積であり、大きいものは大きいもの同士、小さいものは小さいもの同士で足して積を作っ
たほうが小さくなり、そう並べかえると、

 (a1/n+・・・+a1/n)(a2/n+・・・+a2/n)・・・(a/n+・・・+a/n)=a1a2・・・an

なので、 {(a1+a2+・・・+an)/n}≧a1a2・・・an より、n乗根をとると、

       (a1+a2+・・・+an)/n≧(a1a2・・・an1/n

となります。相加相乗平均は、和の平均と積の平均の関係なので、これは当たり前のこと
なのかもしれません。ここまでが、今確かに得ていることです。

 さらに、積和に関する並べかえの不等式から、チェビシェフの和の不等式が導かれること
は有名です。
(ウィキペディアに、その方法による証明がありました。(→ 「チェビシェフの和の不等式」)

 チェビシェフの不等式の双対(?)にあたる不等式を考えてみようと思ったのです。すると、
(もしかすると有名なことなのかもしれませんが・・・)それはコーシー・シュワルツの不等式
の一般形になっていると言えそうだと気づきました。

 チェビシェフの不等式における (a1+a2+・・・+an)/n・(b1+b2+・・・+bn)/n について、和を
積に、積を和に、1/nを1/n乗(n乗根)に変えてみると、

    (a1a2・・・an)1/n+(b12・・・bn)1/n

となります。また、同様に、 (a1b1+a2b2+・・・+anbn)/n を書き換えると、

    {(a1+b1)(a2+b2)・・・(an+bn)}1/n

となります。

 ここで、 ai、bi を ain、bin で置き換え、全体をそれぞれ n 乗することで、

  (a1a2・・・an+b12・・・bn≦(a1+b1)(a2+b2)・・・(an+bn)

が得られました。これは、2次元のn個のベクトルのコーシー・シュワルツの不等式であるは
ずです。

 チェビシェフの不等式において、数列の数を増やしていいように、これも2次元の場合が
示されれば、k次元でも帰納的に示されるので、2次元を証明することが重要だと考えまし
た。

 そこで、チェビシェフの不等式の証明を、そっくりそのまま積と和を入れ替えて適用しよう
と試みましたが、これはどうもうまくいきません・・・。チェビシェフの不等式の場合、和積を
展開し、n個の積和とみなして評価しています。しかし、コーシーシュワルツになると、最初
は積和の状態で、展開できないため、n個の何がしか、という解釈ができずに困りました。
この並べ替えの考え方を用いて、どうにかコーシー・シュワルツの不等式の拡張した場合
を示せないものでしょうか。

 相加相乗平均の関係をうまく使う方法や、相加相乗平均の逆戻りする帰納法に類似した
方法による証明は理解できたのですが、どうにか、この並べ替えの考え方で証明したいな、
と思っています。何かいい方法はないでしょうか。



  以下、工事中