Konveksni skupovi u ravnini i konveksne funkcije

 

Konveksni skupovi u ravnini

 

Za dvije različite točke \(A\) i \(B\) sadržane u \((x\)-\(y)\)-ravnini  definiramo zatvoren interval \([A,B]\) ovako:$$[A,B]=\{T:\exists t\in[0,1],\,\,\overrightarrow{OT}=(1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}\},$$ pri čemu je \(O\) ishodište koordinatnog sustava u toj ravnini.

Na primjer, za \(t=0\) je \(T\equiv A\), za \(t=1\) je \(T\equiv B\), a za \(t=1/2\) je \(T\) polovište intervala \([A,B]\).

Ako iz zatvorenog intervala \([A,B]\) u ravnini maknemo obje rubne točke \(A\) i \(B\), dobivamo otvoren interval \((A,B)\):

$$(A,B)=\{T:\exists t\in(0,1),\,\,\overrightarrow{OT}=(1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}\}.$$

Za neki neprazan podskup \(S\) sadržan u \((x\)-\(y)\)-ravnini kažemo da je konveksan, ako ima sljedeće svojstvo: za bilo koje dvije različite točke \(A, B\in S\) vrijedi da je njihova zatvorena spojnica \([A,B]\) sadržana cijela u skupu \(S\). Skup \(S\) ne mora biti omeđen.

 

U konveksnom skupu je spojnica bilo kojih dviju njegovih točaka sadržana u tom skupu (lijeva slika). U nekonveksnom skupu postoje barem dvije njegove točke tako da njihova spojnica nije sadražana u tom skupu (desna slika).

 

Vektor oblika \((1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}\), gdje je \(t\in[0,1]\), zovemo konveksnom kombinacijom vektora \(\overrightarrow{OA}\) i \(\overrightarrow{OB}\).

Primijetite da vektor \(\overrightarrow{OT}=(1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}\) možemo zapisati i ovako:$$\overrightarrow{OT}=\overrightarrow{OA}+t(\overrightarrow{OB}-\overrightarrow{OA})=\overrightarrow{OA}+t\,\overrightarrow{AB}.$$

Kao što vidimo, za \(t\in\mathbb R\) ovo predstavlja vektorsku jednadžbu pravca kroz dvije zadane točke \(A\) i \(B\). Primijetite da je \(\overrightarrow{AB}\) vektor smjera tog pravca.  Za \(t\in[0,1]\) dobivamo upravo radius-vektore svih točaka \(T\) iz zatvorenog intervala \([A,B]\) na tom pravcu, dok za \(t\in(0,1)\) dobivamo radius-vektore svih točaka otvorenog intervala \((A,B)\) u ravnini.

 

Nutrinom zadanog nepraznog podskupa \(S\) u \((x\)-\(y)\)-ravnini zovemo uniju svih otvorenih krugova sadržanih u  \(S\) (taj skup može biti i prazan).

Za točku \(A\) u ravnini kažemo da je rubna točka skupa \(S\), ako nije sadržana niti u nutrini od \(S\), niti u nutrini od komplementa od \(S\). Skup svih rubnih točaka zovemo rubom skupa \(S\). Rub skupa \(S\) označavamo s \(\partial S\).  Na primjer, rub otvorenog kruga (također i zatvorenog) jednak je rubnoj kružnici. Rub bilo kojeg pravca u ravnini jednak je samom sebi.

Ako je konveksan skup \(S\) takav da je bilo koja otvorena  spojnica \((A,B)\) dviju točaka u \(S\) sadržana u nutrini skupa \(S\), onda kažemo da je skup \(S\) strogo konveksan. Još kraće, ako za bilo koje dvije različite točke \(A\) i \(B\) na rubu skupa \(S\) vrijedi da je otvoren interval \((A,B)\) sadržan u nutrini skupa \(S\), onda kažemo da je skup \(S\) strogo konveksan.

Evo nekoliko primjera u ravnini:

  • Bilo koji krug u ravnini, uzimajući i unutarnje točke kruga, je strogo konveksan skup. Rub kruga, tj. kružnica, nije konveksan skup.
  • Svaki trokut (uključujemo ne samo rubne točke, nego i nutarnje) je konveksan skup. On nije strogo konveksan, jer na primjer spojnica rubnih točaka bilo koje stranice trokuta ostaje na rubu trokuta.
  • Rub trokuta (tj. rubni trokut) nije konveksan skup. 
  • Bilo koji pravilni \(n\)-terokut je konveksan skup (u njega uključujemo ne samo rubne točke, nego i nutarnje). Taj skup nije strogo konveksan.
  • Skup \(S=\{(x,y):y\ge kx+l\}\), tzv. nadgraf pravca \(y=kx+l\), gdje su \(k\) i \(l\) zadane realne konstante, je konveksan skup. On nije strogo konveksan. Rub tog skupa, tj. skup \(\partial S=\{(x,y):y= kx+l\}\), dakle sam pravac, je također konveksan skup (ali nije strogo konveksan).
  • Skup \(S=\{(x,y):y\ge ax^2+bx+c\}\), tzv. nadgraf parabole \(y=ax^2+bx+c\) okrenute prema gore, gdje su \(a>0\), \(b\) i \(c\) zadane realne konstante, je strogo konveksan skup. Rub tog skupa, tj. skup \(\partial S=\{(x,y):y=ax^2+bx+c\}\), dakle sama parabola, nije konveksan skup.
  • Skup \(S=\{(x,y):y\ge|x|\}\), tzv. nadgraf funkcije \(y=|x|\), je konveksan skup. On nije strogo konveksan.

 

Kao što vidimo iz navedenih primjera, skup \(S\) u ravnini je konveksan, ako je u vrlo općenitom smislu "zaobljen".

Ako je konveksan skup \(S\) takav da je u svakoj svojoj rubnoj točki "strogo zaobljen", tj. točnije, rub skupa ne sadrži niti jedan interval oblika \((A,B)\), onda kažemo da je skup strogo konveksan.

 

Konveksne i konkavne funkcije

Neka je zadana funkcija \(f:I\to\mathbb R\), gdje je \(I\) interval na \(x\)-osi, ne nužno omeđen (a može biti otvoren, zatvoren, ili poluotvoren). Nadgrafom (ili epigrafom) funkcije \(f\) zovemo skup

$$\operatorname{epi}(f):=\{(x,y):y\ge f(x)\}.$$

Podsjetimo se, grafom funkcije \(f\) zovemo skup $$\Gamma(f):=\{(x,y):y= f(x)\}.$$

Za funkciju\(f:I\to\mathbb R\) kažemo da je konveksna funkcija ako je njen nadgraf \(\operatorname{epi}(f)\) konveksan skup.

Za funkciju(f:I\to\mathbb R\) kažemo da je strogo konveksna funkcija ako za svake dvije različite točke \(A\) i \(B\) na grafu te funkcije vrijedi da je otvoren interval \((A,B)\) u nutrini epigrafa funkcije. (Jasno da je onda njen epigraf konveksna skup.)

 

Zašto nije dobro definirati strogo konvesknu funkciju kao onu čiji je nadgraf strogo konveksan? Na primjer, funkcija \(f:[-1,1]\to\mathbb R\) definirana s \(f(x)=x^2\) bi trebala biti strogo konveksna. Njezin je epigraf naravno konveksan skup. Međutim, je li u ovom slučaju epigraf strogo konveksan? Lako je vidjeti da nije. Primijetite da se rub epigrafa sastoji od grafa funkcije \(f\), te od dvije vertikalne zrake, jedne s početkom u točki \((-1,1)\), a druge s početkom u \((1,1)\). Uzmemo li dvije točke \(A\) i \(B\) na bilo kojoj od tih dviju zraka (a one jesu dio epigrafa), interval \((A,B)\) nije sadržan u nutrini epigrafa, nego ostaje na rubu epigrafa.

 

Funkcija na gornjoj slici je ne samo konveksna, nego i strogo konveksna.

 

Za funkciju(f:I\to\mathbb R\) kažemo da je konkavna funkcija ako je njen podgraf \(\{(x,y):y\le f(x)\}\) konveksan skup. To je isto što i reći da je funkcija \(-f\) konveksna.

Za funkciju \(f:I\to\mathbb R\) kažemo da je strogo konkavna funkcija ako za svake dvije različite točke \(A\) i \(B\) na grafu te funkcije vrijedi da je otvoren interval \((A,B)\) u nutrini podgrafa funkcije. (Jasno da je onda njen podgraf konveksan.) To je isto što i reći da je funkcija \(-f\) strogo konveksna. Doista, graf funkcije \(-f\) dobiva se zrcaljenjem grafa funkcije \(f\) s obzirom na \(x\)-os.

Evo nekoliko primjera:

 

  • Pravac \(y=kx+l\), gdje su \(k\) i \(l\) zadane realne konstante, je konveksna funkcija. Ona nije strogo konveksna funkcija. Ta je funkcija ujedno i konkavna funkcija.
  • Kvadratna funkcija \(y=ax^2+bx+c\), gdje su \(a\ne0\), \(b\) i \(c\) zadane realne konstante, je strogo konveksna funkcija ako je \(a>0\) (parabola okrenuta prema gore). Ako je \(a<0\), onda je kvadratna funkcija konkavna.
  • Funkcija \(y=\sqrt x\) je konkavna funkcija za \(x\ge0\).
  • Funkcija \(y=-\sqrt x\) je konveksna funkcija za \(x\ge0\).
  • Funkcija \(y=|x|\), definirana na cijelom realnom pravcu, je konveksna, ali nije strogo konveksna. Primijetite da ona u ishodištu nije diferencijabilna (točnije, ima šiljak).
  • Funkcija \(f(x)=\sin x\) nije niti konveksna niti konkavna. Mođutim, njena restrikcija na interval \([0,\pi]\) je strogo konkavna funkcija, a restrikcija na interva \([\pi,2\pi]\) je strogo konveksna. Sinusoida ima i beskonačno mnogo drugih intervala stroge konveksnosti i stroge konkavnosti.
  • Funkcija \(y=x^3\), definirana na cijelom realnom pravcu, nije niti konveksna niti konkavna. Međutim, njena restrikcija na interval \([0,+\infty)\) je konveksna, dok je restrikcija na \((-\infty,0)\) konkavna.

Za diferencijabilnu funkciju \(f:I\to\mathbb R\), definiranu na otvorenom intervalu \(I\), kažemo da u nekoj točki \(a\in I\) ima točku infleksije (ili točku prijevoja), ako je na nekom intervalu lijevo od \(a\) strogo konveksna, a na nekom intervalu desno od \(a\) konkavna, ili obratno. Kraće rečeno, točka \(a\) je točka infleksije funkcije \(f\) ako u njoj ona prelazi iz strogo konveksne u strogo konkavnu, ili obratno.

Funkcija \(y=\sin x\) ima beskončno mnogo točaka infleksije: to su sve nultočke sinusoide, tj. točke oblika \(x=k\pi\), gdje je \(k\) bilo koji cijeli broj.

Pojmovi konveksnosti i konkavnosti nemaju nikakve veze s pojmovima monotonosti. Na primjer, funkcija \(f\) može biti konveksna na nekom intervalu, a da je pritom na istom intervalu bilo rastuća, bilo padajuća, ili niti jedno niti drugo. Vidi sliku.

 

Konveksnost funkcije nema nikakve veze s njenom eventualnom monotonošću.

 

Konkavnost funkcije nema nikakve veze s njenom eventualnom monotonošću.

 

Jedna od zadaća diferencijalnog računa je za zadanu funkciju \(y=f(x)\) pronaći intervale njene stroge konveksnosti i intervale stroge konkavnosti, kao i točke infleksije.

 

Propozicija. Funkcija \(f:I\to\mathbb R\) definirana na nekom intervalu \(I\) sadržanom u \(\mathbb R\) je konveksna onda i samo onda ako za sve \(a,b\in I\) takve da je \(a\ne b\) i za sve \(t\in(0,1)\)  vrijedi$$f((1-t)a+tb)\le(1-t)f(a)+tf(b).$$

Funkcija \(f\) je strogo konveksna ako uz iste uvjete vrijedi stroga nejednakost: $$f((1-t)a+tb)<(1-t)f(a)+tf(b).$$

Slično tome, funkcija \(f:I\to\mathbb R\) je (strogo) konkavna onda i samo onda ako uz iste uvjete vrijede obratne odgovarajuće nejednakosti.

 

Dokaz. Odaberimo bilo koja dva različita broja \(a\) i \(b\) iz intervala \(I\). Točke \(A(a,f(a))\) i \(B(b,f(b))\) nalaze se na grafu funkcije \(f\); vidi sliku.

 

Konveksna funkcija

 

Pretpostavimo da je funkcija \(f\) konveksna. Onda je po definiciji konveksnosti zatvoren interval \([A,B]\) sadržan u nadgrafu \(\operatorname{epi}(f)\) funkcije \(f\). Svaka točka \(T\in[A,B]\) određena je svojim radius-vektorom

$$\begin{aligned}\overrightarrow{OT}&=(1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}=(1-t)(a\mathbf i+f(a)\mathbf j)+t(b\mathbf i+f(b)\mathbf j)\\ &=((1-t)a+tb)\mathbf i+((1-t)f(a)+tf(b))\mathbf j,\end{aligned}$$

gdje je \(t\in[0,1]\), pa su njene koordinate \(T((1-t)a+tb),(1-t)f(a)+tf(b))\). Budući da je ta točka sadržana u nadgrafu \(\operatorname{epi}(f)\), iz definicije nadgrafa slijedi da mora biti \(f((1-t)a+tb))\le(1-t)f(a)+tf(b))\). 

Obratno, ako ova nejednakost vrijedi za sve \(a\ne b\), onda se istim zaključivanjem, ali u suprotnom smjeru, dobiva da je zatvoren interval \([A,B]\) sadržan u nadgrafu \(\operatorname{epi}(f)\) za bilo koje dvije točke \(A\) i \(B\) na grafu funkcije.

Onda je jasno da i za svake dvije točke \(A_1\) i \(B_1\) odabrane u nadgrafu funkcije vrijedi da se zatvoren segment \([A_1,B_1]\) zbog pretpostavljene nejadnakosti nalazi iznad odgovarajućeg segmenta \([A,B]\) (a time i u nadgrafu), gdje su točke \(A\) i \(B\) vertikalne ortogonalne projekcije točaka \(A_1\) i \(B_1\) na graf funkcije \(f\). Time dobivamo da je nadgraf funkcije \(f\) konveksan skup, pa je funkcija \(f\) konveksna.

Stroga konveksnost funkcije \(f\) se na sličan način dobiva iz strogih nejednakosti \(f((1-t)a+tb))<(1-t)f(a)+tf(b))\). Time je tvrdnja propozicije u cjelosti dokazana. \(\blacksquare\) 

 

 

Konkavna funkcija

 

Definicija konveksnog skupa se može lako prenijeti s ravnine na slučaj podskupova \(n\)-dimenzionalnog prostora \(\mathbb R^n\), pri čemu je \(n\) bilo koji prirodan broj.

Također se i pojam konveksna funkcije može prenijeti na slučaj realnih funkcija \(n\) varijabla, oblika \(f:K\to\mathbb R\), gdje je \(K\) bilo koji konveksna podskup u prostoru \(\mathbb R^n\).

 

Za \(n=1\), tj. na realnom pravcu \(\mathbb R\), njegovi jedini konveksni podskupovi su očevidno samo intervali: otvoreni intervali, zatvoreni intervali i poluotvoreni intervali.

Općenitim konveksnim skupovima i konveksnim funkcijama, te njihovim primjenama, bavi se grana matematike koja se zova konveksna analiza (engl. convex analysis).

 

Zanimljivo je da su nazivi za konveksne i konkavne funkcije bili do 1960tih godina obratni nego danas. Takav je slučaj na primjer u antologijskom djelu Željka Markovića iz Matematičke analize:

Željko Marković: Uvod u višu analizu, Zagreb 1956. g. (postoje i kasnija izdanja)