Konveksni skupovi u ravnini
Za dvije različite točke \(A\) i \(B\) sadržane u \((x\)-\(y)\)-ravnini definiramo zatvoren interval \([A,B]\) ovako:$$[A,B]=\{T:\exists t\in[0,1],\,\,\overrightarrow{OT}=(1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}\},$$ pri čemu je \(O\) ishodište koordinatnog sustava u toj ravnini.
Na primjer, za \(t=0\) je \(T\equiv A\), za \(t=1\) je \(T\equiv B\), a za \(t=1/2\) je \(T\) polovište intervala \([A,B]\).
Ako iz zatvorenog intervala \([A,B]\) u ravnini maknemo obje rubne točke \(A\) i \(B\), dobivamo otvoren interval \((A,B)\):
$$(A,B)=\{T:\exists t\in(0,1),\,\,\overrightarrow{OT}=(1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}\}.$$
Za neki neprazan podskup \(S\) sadržan u \((x\)-\(y)\)-ravnini kažemo da je konveksan, ako ima sljedeće svojstvo: za bilo koje dvije različite točke \(A, B\in S\) vrijedi da je njihova zatvorena spojnica \([A,B]\) sadržana cijela u skupu \(S\). Skup \(S\) ne mora biti omeđen.
U konveksnom skupu je spojnica bilo kojih dviju njegovih točaka sadržana u tom skupu (lijeva slika). U nekonveksnom skupu postoje barem dvije njegove točke tako da njihova spojnica nije sadražana u tom skupu (desna slika).
Vektor oblika \((1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}\), gdje je \(t\in[0,1]\), zovemo konveksnom kombinacijom vektora \(\overrightarrow{OA}\) i \(\overrightarrow{OB}\).
Primijetite da vektor \(\overrightarrow{OT}=(1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}\) možemo zapisati i ovako:$$\overrightarrow{OT}=\overrightarrow{OA}+t(\overrightarrow{OB}-\overrightarrow{OA})=\overrightarrow{OA}+t\,\overrightarrow{AB}.$$
Kao što vidimo, za \(t\in\mathbb R\) ovo predstavlja vektorsku jednadžbu pravca kroz dvije zadane točke \(A\) i \(B\). Primijetite da je \(\overrightarrow{AB}\) vektor smjera tog pravca. Za \(t\in[0,1]\) dobivamo upravo radius-vektore svih točaka \(T\) iz zatvorenog intervala \([A,B]\) na tom pravcu, dok za \(t\in(0,1)\) dobivamo radius-vektore svih točaka otvorenog intervala \((A,B)\) u ravnini.
Nutrinom zadanog nepraznog podskupa \(S\) u \((x\)-\(y)\)-ravnini zovemo uniju svih otvorenih krugova sadržanih u \(S\) (taj skup može biti i prazan).
Za točku \(A\) u ravnini kažemo da je rubna točka skupa \(S\), ako nije sadržana niti u nutrini od \(S\), niti u nutrini od komplementa od \(S\). Skup svih rubnih točaka zovemo rubom skupa \(S\). Rub skupa \(S\) označavamo s \(\partial S\). Na primjer, rub otvorenog kruga (također i zatvorenog) jednak je rubnoj kružnici. Rub bilo kojeg pravca u ravnini jednak je samom sebi.
Ako je konveksan skup \(S\) takav da je bilo koja otvorena spojnica \((A,B)\) dviju točaka u \(S\) sadržana u nutrini skupa \(S\), onda kažemo da je skup \(S\) strogo konveksan. Još kraće, ako za bilo koje dvije različite točke \(A\) i \(B\) na rubu skupa \(S\) vrijedi da je otvoren interval \((A,B)\) sadržan u nutrini skupa \(S\), onda kažemo da je skup \(S\) strogo konveksan.
Evo nekoliko primjera u ravnini:
- Bilo koji krug u ravnini, uzimajući i unutarnje točke kruga, je strogo konveksan skup. Rub kruga, tj. kružnica, nije konveksan skup.
- Svaki trokut (uključujemo ne samo rubne točke, nego i nutarnje) je konveksan skup. On nije strogo konveksan, jer na primjer spojnica rubnih točaka bilo koje stranice trokuta ostaje na rubu trokuta.
- Rub trokuta (tj. rubni trokut) nije konveksan skup.
- Bilo koji pravilni \(n\)-terokut je konveksan skup (u njega uključujemo ne samo rubne točke, nego i nutarnje). Taj skup nije strogo konveksan.
- Skup \(S=\{(x,y):y\ge kx+l\}\), tzv. nadgraf pravca \(y=kx+l\), gdje su \(k\) i \(l\) zadane realne konstante, je konveksan skup. On nije strogo konveksan. Rub tog skupa, tj. skup \(\partial S=\{(x,y):y= kx+l\}\), dakle sam pravac, je također konveksan skup (ali nije strogo konveksan).
- Skup \(S=\{(x,y):y\ge ax^2+bx+c\}\), tzv. nadgraf parabole \(y=ax^2+bx+c\) okrenute prema gore, gdje su \(a>0\), \(b\) i \(c\) zadane realne konstante, je strogo konveksan skup. Rub tog skupa, tj. skup \(\partial S=\{(x,y):y=ax^2+bx+c\}\), dakle sama parabola, nije konveksan skup.
- Skup \(S=\{(x,y):y\ge|x|\}\), tzv. nadgraf funkcije \(y=|x|\), je konveksan skup. On nije strogo konveksan.
Kao što vidimo iz navedenih primjera, skup \(S\) u ravnini je konveksan, ako je u vrlo općenitom smislu "zaobljen".
Ako je konveksan skup \(S\) takav da je u svakoj svojoj rubnoj točki "strogo zaobljen", tj. točnije, rub skupa ne sadrži niti jedan interval oblika \((A,B)\), onda kažemo da je skup strogo konveksan.
Konveksne i konkavne funkcije
Neka je zadana funkcija \(f:I\to\mathbb R\), gdje je \(I\) interval na \(x\)-osi, ne nužno omeđen (a može biti otvoren, zatvoren, ili poluotvoren). Nadgrafom (ili epigrafom) funkcije \(f\) zovemo skup
$$\operatorname{epi}(f):=\{(x,y):y\ge f(x)\}.$$
Podsjetimo se, grafom funkcije \(f\) zovemo skup $$\Gamma(f):=\{(x,y):y= f(x)\}.$$
Za funkciju\(f:I\to\mathbb R\) kažemo da je konveksna funkcija ako je njen nadgraf \(\operatorname{epi}(f)\) konveksan skup.
Za funkciju(f:I\to\mathbb R\) kažemo da je strogo konveksna funkcija ako za svake dvije različite točke \(A\) i \(B\) na grafu te funkcije vrijedi da je otvoren interval \((A,B)\) u nutrini epigrafa funkcije. (Jasno da je onda njen epigraf konveksna skup.)
Zašto nije dobro definirati strogo konvesknu funkciju kao onu čiji je nadgraf strogo konveksan? Na primjer, funkcija \(f:[-1,1]\to\mathbb R\) definirana s \(f(x)=x^2\) bi trebala biti strogo konveksna. Njezin je epigraf naravno konveksan skup. Međutim, je li u ovom slučaju epigraf strogo konveksan? Lako je vidjeti da nije. Primijetite da se rub epigrafa sastoji od grafa funkcije \(f\), te od dvije vertikalne zrake, jedne s početkom u točki \((-1,1)\), a druge s početkom u \((1,1)\). Uzmemo li dvije točke \(A\) i \(B\) na bilo kojoj od tih dviju zraka (a one jesu dio epigrafa), interval \((A,B)\) nije sadržan u nutrini epigrafa, nego ostaje na rubu epigrafa.
Funkcija na gornjoj slici je ne samo konveksna, nego i strogo konveksna.
Za funkciju(f:I\to\mathbb R\) kažemo da je konkavna funkcija ako je njen podgraf \(\{(x,y):y\le f(x)\}\) konveksan skup. To je isto što i reći da je funkcija \(-f\) konveksna.
Za funkciju \(f:I\to\mathbb R\) kažemo da je strogo konkavna funkcija ako za svake dvije različite točke \(A\) i \(B\) na grafu te funkcije vrijedi da je otvoren interval \((A,B)\) u nutrini podgrafa funkcije. (Jasno da je onda njen podgraf konveksan.) To je isto što i reći da je funkcija \(-f\) strogo konveksna. Doista, graf funkcije \(-f\) dobiva se zrcaljenjem grafa funkcije \(f\) s obzirom na \(x\)-os.
Evo nekoliko primjera:
- Pravac \(y=kx+l\), gdje su \(k\) i \(l\) zadane realne konstante, je konveksna funkcija. Ona nije strogo konveksna funkcija. Ta je funkcija ujedno i konkavna funkcija.
- Kvadratna funkcija \(y=ax^2+bx+c\), gdje su \(a\ne0\), \(b\) i \(c\) zadane realne konstante, je strogo konveksna funkcija ako je \(a>0\) (parabola okrenuta prema gore). Ako je \(a<0\), onda je kvadratna funkcija konkavna.
- Funkcija \(y=\sqrt x\) je konkavna funkcija za \(x\ge0\).
- Funkcija \(y=-\sqrt x\) je konveksna funkcija za \(x\ge0\).
- Funkcija \(y=|x|\), definirana na cijelom realnom pravcu, je konveksna, ali nije strogo konveksna. Primijetite da ona u ishodištu nije diferencijabilna (točnije, ima šiljak).
- Funkcija \(f(x)=\sin x\) nije niti konveksna niti konkavna. Mođutim, njena restrikcija na interval \([0,\pi]\) je strogo konkavna funkcija, a restrikcija na interva \([\pi,2\pi]\) je strogo konveksna. Sinusoida ima i beskonačno mnogo drugih intervala stroge konveksnosti i stroge konkavnosti.
- Funkcija \(y=x^3\), definirana na cijelom realnom pravcu, nije niti konveksna niti konkavna. Međutim, njena restrikcija na interval \([0,+\infty)\) je konveksna, dok je restrikcija na \((-\infty,0)\) konkavna.
Za diferencijabilnu funkciju \(f:I\to\mathbb R\), definiranu na otvorenom intervalu \(I\), kažemo da u nekoj točki \(a\in I\) ima točku infleksije (ili točku prijevoja), ako je na nekom intervalu lijevo od \(a\) strogo konveksna, a na nekom intervalu desno od \(a\) konkavna, ili obratno. Kraće rečeno, točka \(a\) je točka infleksije funkcije \(f\) ako u njoj ona prelazi iz strogo konveksne u strogo konkavnu, ili obratno.
Funkcija \(y=\sin x\) ima beskončno mnogo točaka infleksije: to su sve nultočke sinusoide, tj. točke oblika \(x=k\pi\), gdje je \(k\) bilo koji cijeli broj.
Pojmovi konveksnosti i konkavnosti nemaju nikakve veze s pojmovima monotonosti. Na primjer, funkcija \(f\) može biti konveksna na nekom intervalu, a da je pritom na istom intervalu bilo rastuća, bilo padajuća, ili niti jedno niti drugo. Vidi sliku.
Konveksnost funkcije nema nikakve veze s njenom eventualnom monotonošću.
Konkavnost funkcije nema nikakve veze s njenom eventualnom monotonošću.
Jedna od zadaća diferencijalnog računa je za zadanu funkciju \(y=f(x)\) pronaći intervale njene stroge konveksnosti i intervale stroge konkavnosti, kao i točke infleksije.
Propozicija. Funkcija \(f:I\to\mathbb R\) definirana na nekom intervalu \(I\) sadržanom u \(\mathbb R\) je konveksna onda i samo onda ako za sve \(a,b\in I\) takve da je \(a\ne b\) i za sve \(t\in(0,1)\) vrijedi$$f((1-t)a+tb)\le(1-t)f(a)+tf(b).$$
Funkcija \(f\) je strogo konveksna ako uz iste uvjete vrijedi stroga nejednakost: $$f((1-t)a+tb)<(1-t)f(a)+tf(b).$$
Slično tome, funkcija \(f:I\to\mathbb R\) je (strogo) konkavna onda i samo onda ako uz iste uvjete vrijede obratne odgovarajuće nejednakosti.
Dokaz. Odaberimo bilo koja dva različita broja \(a\) i \(b\) iz intervala \(I\). Točke \(A(a,f(a))\) i \(B(b,f(b))\) nalaze se na grafu funkcije \(f\); vidi sliku.
Konveksna funkcija
Pretpostavimo da je funkcija \(f\) konveksna. Onda je po definiciji konveksnosti zatvoren interval \([A,B]\) sadržan u nadgrafu \(\operatorname{epi}(f)\) funkcije \(f\). Svaka točka \(T\in[A,B]\) određena je svojim radius-vektorom
$$\begin{aligned}\overrightarrow{OT}&=(1-t)\overrightarrow{OA}+t\,\overrightarrow{OB}=(1-t)(a\mathbf i+f(a)\mathbf j)+t(b\mathbf i+f(b)\mathbf j)\\ &=((1-t)a+tb)\mathbf i+((1-t)f(a)+tf(b))\mathbf j,\end{aligned}$$
gdje je \(t\in[0,1]\), pa su njene koordinate \(T((1-t)a+tb),(1-t)f(a)+tf(b))\). Budući da je ta točka sadržana u nadgrafu \(\operatorname{epi}(f)\), iz definicije nadgrafa slijedi da mora biti \(f((1-t)a+tb))\le(1-t)f(a)+tf(b))\).
Obratno, ako ova nejednakost vrijedi za sve \(a\ne b\), onda se istim zaključivanjem, ali u suprotnom smjeru, dobiva da je zatvoren interval \([A,B]\) sadržan u nadgrafu \(\operatorname{epi}(f)\) za bilo koje dvije točke \(A\) i \(B\) na grafu funkcije.
Onda je jasno da i za svake dvije točke \(A_1\) i \(B_1\) odabrane u nadgrafu funkcije vrijedi da se zatvoren segment \([A_1,B_1]\) zbog pretpostavljene nejadnakosti nalazi iznad odgovarajućeg segmenta \([A,B]\) (a time i u nadgrafu), gdje su točke \(A\) i \(B\) vertikalne ortogonalne projekcije točaka \(A_1\) i \(B_1\) na graf funkcije \(f\). Time dobivamo da je nadgraf funkcije \(f\) konveksan skup, pa je funkcija \(f\) konveksna.
Stroga konveksnost funkcije \(f\) se na sličan način dobiva iz strogih nejednakosti \(f((1-t)a+tb))<(1-t)f(a)+tf(b))\). Time je tvrdnja propozicije u cjelosti dokazana. \(\blacksquare\)
Konkavna funkcija
Definicija konveksnog skupa se može lako prenijeti s ravnine na slučaj podskupova \(n\)-dimenzionalnog prostora \(\mathbb R^n\), pri čemu je \(n\) bilo koji prirodan broj.
Također se i pojam konveksna funkcije može prenijeti na slučaj realnih funkcija \(n\) varijabla, oblika \(f:K\to\mathbb R\), gdje je \(K\) bilo koji konveksna podskup u prostoru \(\mathbb R^n\).
Za \(n=1\), tj. na realnom pravcu \(\mathbb R\), njegovi jedini konveksni podskupovi su očevidno samo intervali: otvoreni intervali, zatvoreni intervali i poluotvoreni intervali.
Općenitim konveksnim skupovima i konveksnim funkcijama, te njihovim primjenama, bavi se grana matematike koja se zova konveksna analiza (engl. convex analysis).
Zanimljivo je da su nazivi za konveksne i konkavne funkcije bili do 1960tih godina obratni nego danas. Takav je slučaj na primjer u antologijskom djelu Željka Markovića iz Matematičke analize:
Željko Marković: Uvod u višu analizu, Zagreb 1956. g. (postoje i kasnija izdanja)