sábado, 28 de diciembre de 2024

Teorema de Arzela Ascoli

  Sea $(X,\tau)$ un espacio topológico compacto e $(Y,d)$ un espacio métrico. Denotamos por $C(X,Y)$ al espacio de funciones continuas de $X$ en $Y$. Sobre este espacio, podemos distinguir dos topologías importantes: 

  1. La topología de la convergencia simple: Es generada por los conjuntos de la forma $$\{g\in C(X,Y) : g(x_i)\in U_i, \forall i\in I\}$$ donde $ I $ es finito, $\{x_i : i\in I\}\subset X$ y $\{U_i : i\in I\}$ son abiertos de $Y$. La convergencia en esta topología se caracteriza de la siguiente manera: Una red $(g_\alpha)$ converge a $g$ si y sólo si $g_\alpha(x)\to g(x)$ (en $Y$) para todo $x\in X$. A esta topología la denotaremos por $\tau_s$.
  2. La topología de la convergencia uniforme: Es generada por la métrica $$d_\infty(f,g) = \sup_{x\in X} d(f(x),g(x))$$ que está bien definida pues $X$ es compacto. Esta topología será denotada por $\tau_u$.

Observación 1: En general se tiene que $\tau_s\subset\tau_u$, es decir, la topología de la convergencia uniforme es más fina que la topología de la convergencia simple.

Observación 2: La topología de la convergencia simple es la traza de la topología producto en $C(X,Y)$.

Nuestro objetivo es caracterizar la compacidad en el espacio $(C(X,Y),\tau_u)$.

Definición: Un subconjunto $A\subset C(X,Y)$ se dice equicontinuo si para todo $x\in X$ y todo $\varepsilon>0$ existe $V\in\mathcal{U}_x$ tal que $d(f(y),f(x))\leq\varepsilon$ para todo $y\in V$ y $f\in A$.

Ejemplos: 

  • Si $A$ es equicontinuo entonces cualquier subconjunto de él también lo es.
  • Cualquier subconjunto finito en $C(X,Y)$ es equicontinuo.
  • Si $X=[0,1]$, $Y = \mathbb{R}$, $\alpha>0$ y $L>0$, entonces $$A := \left\{ f\in C(X,Y) : \sup_{x,y\in X, x\neq y}\frac{|f(x)-f(y)|}{|x-y|^\alpha}<L \right\}$$ es equicontinuo. 

Lema 1: Sea $A\subset C(X,Y)$ un subconjunto equicontinuo. Luego $\overline{A}^s$ también es equicontinuo.

demostración: Sea $\varepsilon>0$ y $x\in X$, entonces existe $V\in\mathcal{U}_x$ tal que $d(g(y),g(x))<\varepsilon/2$ para todo $g\in A$ y $y\in V$. Si $f\in \overline{A}^s$, existe una red $(g_\alpha)$ convergiendo a $f$ en $\tau_s$, luego tenemos convergencia puntual. Entonces, dado $y\in V$ y $\alpha$ se tiene que $d(g_\alpha(y),g_\alpha(x))\leq\varepsilon$ por ende $d(f(y),f(x))\leq \varepsilon$ se concluye que $\overline{A}^s$ es equicontinuo. $\blacksquare$

Teorema: Un conjunto de funciones $A\subset C(X,Y)$ es relativamente compacto en la topología de la convergencia uniforme si y sólo si 

  •   $A$ es equicontinuo.
  •   Para todo $x\in X$, $\{f(x):f\in A\}$ es relativamente compacto en $Y$.   

 demostración: $(\Rightarrow)$ Sea $\epsilon>0$, si $A$ no es equicontinuo, entonces existe $\varepsilon>0$ y $x\in X$ tal que para todo $V\in\mathcal{U}_x$ existe $f_V\in A$ y $x_V\in V$ tal que $d(f_V(x_V), f_V(x))\geq \varepsilon$ pero vemos que $(f_V)$. Es claro que $x_V\to x$ y por compacidad, existe una subred convergente $f_{V_\beta}\to f$ en la topología de la convergencia uniforme, luego $f_{V_{\beta}}(x_{V_{\beta}})\to f(x)$, lo que es una contradicción. Luego $A$ es equicontinuo. Por otro lado, si $x\in X$, y $(f_n)\subset A$, veamos que existe una subsecuencia de $(f_n(x))$ convergente. En efecto, como $A$ es relativamente compacto, se tiene que existe $(f_{n_k})$ convergiendo uniforme a $f\in C(X,Y)$, por ende $f_{n_k}(x)\to f(x)$, por lo tanto $\{f(x):f\in A\}$ es relativamente compacto en $Y$.


$(\Leftarrow)$ Definamos $A(x) := \{f(x):f\in A\}$, luego tenemos que $\overline{A(x)}$ es compacto en $Y$ para todo $x\in X$. Por el Teorema de Tikhonov, se tiene que $\Pi_{x\in X}{\overline{A(x)}}$ es compacto en la topología producto, por ende $A\subset Y^X$ es relativamente compacto en la topología producto.

 Veamos que si $U$ es abierto en la topología de la convergencia uniforme en $A$, entonces $U$ es abierto en la topología de la convergencia simple en $A$. Sea $f\in U$, luego existe $U'=\{ g\in C(X,Y) : d_\infty(f,g)<\varepsilon \}$ con $\varepsilon >0$ tal que $U'\cap A\subset U$, luego, para cada $x\in X$, existe $V_x^\varepsilon\in\mathcal{U}_x$ tal que $d(g(y),g(x))<\varepsilon/4$ para todo $y\in V_x^{\varepsilon}$ y $g\in A$. Tomemos $U_x := V_x^\varepsilon\cap f^{-1}(\mathbb{B}_{\varepsilon/4}(f(x)))$ para cada $x\in X$, luego como forma un recubrimiento de $X$, tomamos un subrecubrimiento finito con $x_1,...,x_n\in X$ y $X = \bigcup_{i=1}^n U_{x_i}$. Luego, definamos $$V = A\cap \{g\in Y^X :  g(x_i)\in \mathbb{B}_{\varepsilon/4}(f(x_i)), \forall i=1,...,n \}.$$ Tenemos que $V$ es abierto en la topología relativa a $A$ de la convergencia simple y además $f\in V$. Por otra parte, $V\subset U'\cap A$ pues si $g\in V$ y $x\in X$ entonces existe $i$ tal que $x\in U_{x_i}$, entonces $d(g(x_i),f(x_i))<\varepsilon/4$ además $d(f(x),f(x_i))<\varepsilon/4$ y como $x\in V_{x_i}^\varepsilon$ tenemos que $d(g(x),g(x_i))<\varepsilon/4$, se concluye que $d(g(x),f(x))<\frac{3}{4}\varepsilon$, entonces $g\in U'\cap A$.
 
 Lo anterior, nos permite probar que $\overline{A}^s = \overline{A}^u$. En efecto, si $f\in \overline{A}^s$ entonces dado $U$ vecindad de $f$ en $A$ con la topología de la convergencia uniforme, vamos a tener que $U$ es vecindad de $f$ en la topología de la convergencia simple en $A$, por lo tanto $V\cap A\neq\emptyset$, y así $f\in \overline{A}^u$. Además, ambas topologías coinciden, por ende, se concluye que $\overline{A}^u$ es compacto con la topología de la convergencia uniforme. $\blacksquare$

 

 

 

miércoles, 28 de abril de 2021

Tres jóvenes rinden unos exámenes

  Este problema es una adaptación de un problema que apareció en la Olimpiada Internacional de Matemáticas en 1974. Lo interesante es que es de esos problemas en los que se pueden chequear muchos casos particulares de manera sencilla, pero que no aseguran tener una solución concreta.

Problema

   Lautaro, Camilo y Rafael dan los mismos exámenes. Cada nota es un entero positivo. Camilo fue el primero en física. Lautaro obtuvo un puntaje total de $20$, Camilo, un total de $10$ y Rafael, un total de $9$. Entre todos los exámenes, no hubo dos puntajes que se repitieran. Determine cuántos exámenes rindieron, y quién fue el segundo en matemática.

Solución

   Algo importante al empezar es que el enunciado del problema nos pregunta por quien fue el segundo  mejor en matemáticas, cuando no sabemos cuantas pruebas se rindieron y tenemos un poco de información acerca de la prueba de física y los puntajes totales. Si hubiese más de un ramo, a parte de física, ¿podríamos distinguir cuales fueron los puntajes en matemáticas?

   Primero probaremos que sólo se rindieron dos exámenes, sea $k$ el número de exámenes rendidos, sean $\{a_1, ..., a_{3k}\}$ los puntajes obtenidos por Lautaro, Camilo y Rafael en los exámenes, sabemos que todos estos puntajes son distintas, y además podemos suponer que están ordenados, es decir, $a_{i}<a_{i+1}$ (sin perder generalidad) para todo $i\in\{1,...,3k-1\}$, luego como los $a_i$ son enteros positivos debe cumplirse que $a_i\geq i$ para todo $i\in \{1,...,3k\}$ y esto puede probarse por inducción: claramente $a_1\geq 1$ (por hipótesis), supongamos que $a_i\geq i$, luego, como $a_{i+1}>a_i$ entonces $a_{i+1}\geq a_i + 1$ (pues son números enteros), entonces $a_{i+1}\geq i+1$ y entonces concluimos que para todo $i\in\{1,..,3k\}$ tenemos que $a_i\geq i$, luego si sumamos todos estos puntajes por hipótesis tenemos que $$ 39 = 20+10+9=\sum_{i=1}^{3k}a_i\geq \sum_{i=1}^{3k}i = \frac{3k(3k+1)}{2} $$ y entonces obtenemos que $k(3k+1)\leq 26$, pero vemos que si $k\geq 3$ entonces $k(3k+1)\geq 3\cdot 10=30$ por lo tanto tenemos que $k\leq 2$, es decir se rindieron a lo más dos exámenes. 

   Si se hubiese rendido un sólo examen, sería sólo el de física, y acá tenemos una contradicción porque en tal caso Lautaro tendría puntaje $20$ en física y Camilo puntaje $10$, pero Camilo fue el mejor en física. Por lo tanto se rindieron dos exámenes, de física y matemáticas.

    Sea $N_f^c, N_f^l, N_f^r$ los puntajes en física de Camilo, Lautaro y Rafael, respectivamente. Por hipótesis se tiene que $N_f^c>N_f^l$ y $N_f^c>N_f^r$. Además tenemos que $N_m^c = 10-N_f^c$, $N_m^l = 20-N_f^l$ y  $N_m^r = 9-N_f^r$ son los puntajes de el examen de matemáticas de Camilo, Lautaro y Rafel, respectivamente.

   Como $N_f^c>N_f^r$, tenemos que $$N_f^c\geq N_f^r+1\Rightarrow 9-N_f^r\geq 10-N_f^c\Rightarrow N_m^r\geq N_m^c$$ es decir, Rafael obtuvo mejor puntaje en matemáticas que Camilo. Veamos que Lautaro obtuvo mejor nota que Rafael: Si no fuese así, entonces tenemos que $N_m^r>N_m^l$ es decir, $N_m^r\geq N_m^l + 1$, sigue que $ 10-N_f^r\geq 20-N_f^l+1 $ y por lo tanto $N_f^l\geq 11+N_f^r$, pero como Camilo fue el mejor en física, tenemos que $N_f^c\geq N_f^l$ y $N_f^r\geq 1$ por lo tanto $N_f^c\geq 12$ pero esto es una contradicción pues el puntaje total de Camilo es $10$, por tanto Lautaro obtuvo mejor puntaje en matemáticas que Rafael. De esto último se sigue que Rafael fue el segundo mejor puntaje en matemáticas.

sábado, 17 de octubre de 2020

Lema de Urysohn

     Recordemos que un espacio topológico $X$ se dice normal si para cada par de cerrados disjuntos $A,B$ existen abiertos disjuntos $U$, $V$ tales que $A\subset U$ y $B\subset V$. En estos espacios tenemos el siguiente resultado, conocido como el Lema de Urysohn

Teorema: Sea $(X,\tau)$ un espacio topológico normal. Sean $A,B$ cerrados disjuntos de $X$, entonces existe $f: X\to [0,1]$ continua tal que $f\equiv 0$ en $A$ y $f\equiv 1$ en $B$.

Demostración: Sea $\Delta = \{k2^{-n} : n\geq 1, 0<k<2^n\}$ los diádicos de $(0,1)$. Probemos que existe una familia de abiertos $\{U_r: r\in\Delta\}$ tal que $A\subset U_r\subset B^c$ para cada $r\in \Delta$ y además si $r<s$ entonces $\overline{U}_r\subset U_s$. En efecto, por la normalidad existen $V,W$ abiertos disjuntos tales que $A\subset V$ y $B\subset W$, como $V\cap W=\emptyset$ entonces $V\subset W^c$ y como $W^c$ es cerrado entonces $\overline{V}\subset W^c$, luego, $A\subset V\subset \overline{V}\subset W^c\subset B^c$, así, escogemos $U_{1/2} = V$. La construcción sigue inductivamente. Supongamos que tenemos los abiertos $\{U_r: r = k2^{-n}, 0<n<N, 0<k<2^n\}$ cumpliendo lo requerido, tomemos $j2^{-N}$ con $0<j<2^N$, si $j$ es par entonces tomamos $U_{j/2^{N}} =U_{(j/2)/2^{N-1}}$, si $j$ es impar existe $0<k<2^{N-1}$ tal que $k< j/2<k+1$, luego, $A\subset U_{k/2^{N-1}}\subset B^c$ y $\overline{U_{k/2^{N-1}}}\subset U_{(k+1)/2^{N-1}}$, entonces si tomamos $C = \overline{U_{k/2^{N-1}}}$ y $D = U_{(k+1)/2^{N-1}}^c$ que son cerrados disjuntos, con el mismo argumento del principio tenemos que existen $M, N$ abiertos disjuntos tales que $C\subset M\subset \overline{M}\subset N^c\subset D^c$, luego, tomando $U_{j2^{-N}} = M$ se tiene que $A\subset \overline{U_{k/2^{N-1}}}\subset U_{j2^{-N}}\subset\overline{U_{j2^{-N}}}\subset U_{(k+1)/2^{N-1}}\subset B^c$. De esta manera, es claro que la familia $\{U_r: r\in\Delta\}$ cumple lo que se quería. Con esta familia y haciendo $U_1 = X$, definamos $$f(x) := \inf\{r: x\in U_r\}$$ notar que $0\leq f\leq 1$, además como para todo $r\in \Delta$, $A\subset U_r\subset B^c$ entonces $f\equiv 0$ en $A$ y $f\equiv 1$ en $B$. Por otra parte, notemos que $f(x)<\alpha$ ssi existe $r<\alpha$ tal que $x\in U_r$ ssi $x\in \bigcup_{r<\alpha}U_r$ entonces $f^{-1}((-\infty,\alpha)) = \bigcup_{r<\alpha}U_r$ que es un abierto. Además, usando que $\Delta$ es denso en $[0,1]$ vemos que: $f(x)>\beta$ ssi $x\notin U_r$ para algún $r>\beta$ ssi $x\notin \overline{U_s}$ para algún $s>\beta$ (pues $\overline{U}_s\subset U_r$ si $s<r$) entonces $f^{-1}((\beta,+\infty)) = \bigcup_{s>\beta}(\overline{U}_s)^c$ que es abierto, luego $f^{-1}((\alpha,\beta))$ es un abierto para cualquier intervalo abierto, luego $f$ es continua y tenemos el resultado $\blacksquare$

martes, 29 de septiembre de 2020

Distancia más corta

Es bastante conocido e intuitivo que el camino más corto entre dos puntos en el plano es la línea recta. En este post vamos a dar una prueba formal de que efectivamente es la línea recta, para ello primero veamos la clase de caminos que tomaremos en cuenta: Es razonable pedir que sean continuos y sin auto-intersecciones, es decir, podemos pensarlos como funciones continuas que pasan por ambos puntos, además, vamos a suponer que son continuamente diferenciables ($\mathcal{C}^1$). Un resultado útil de cálculo diferencial es la fórmula del largo de una curva determinada por el grafo de una función $f\in\mathcal{C}^1$ en un intervalo $[a,b]$ que es $$ L_{a}^b(f) = \int_{a}^b\sqrt{1+f'(x)^2}dx $$ Con lo anterior, el problema queda descrito como sigue: 

Sean $(x_1,y_1),(x_2,y_2)\in\mathbb{R}^2$ con $x_1<x_2$, queremos minimizar el funcional $L_{x_1}^{x_2}(\cdot)$ sobre el conjunto $$\Lambda = \{ f\in\mathcal{C}^1([x_1,x_2]) : f(x_1) = y_1, f(x_2) = y_2 \}$$ Notar que la recta que une ambos puntos se representa por la función $\overline{f}(x) = \left(\frac{y_2-y_1}{x_2-x_1}\right)(x-x_1)+y_1$ que pertenece a $\Lambda$ y además cumple que $$L_{x_1}^{x_2}(\overline{f}) = \sqrt{(y_2-y_1)^2 + (x_2-x_1)^2}.$$ Para dar una solución de este problema, usaremos la conocida desigualdad de Cauchy-Schwarz, que en su versión en $\mathbb{R}^n$ nos dice que si $v_1,v_2\in\mathbb{R}^n$ entonces $|v_1\cdot v_2|\leq \| v_1 \|_2\|v_2\|_2$. Tomemos $f\in\Lambda$, notemos que $$\frac{d}{dx}\left(\sqrt{(f(x)-y_1)^2 + (x-x_1)^2}\right) = \frac{f'(x)(f(x)-y_1)+(x-x_1)}{\sqrt{(f(x)-y_1)^2 + (x-x_1)^2}}$$ Por Cauchy-Schwarz sigue que $$ \sqrt{f'(x)^2+1}\sqrt{(f(x)-y_1)^2 + (x-x_1)^2}\geq f'(x)(f(x)-y_1)+(x-x_1) $$ Por tanto $$ \sqrt{f'(x)^2+1}\geq \frac{d}{dx}\left(\sqrt{(f(x)-y_1)^2 + (x-x_1)^2}\right) $$ La desigualdad anterior la tenemos para todo $x\in (x_1,x_2]$, luego integrando en ese intervalo y ocupando el teorema fundamental del cálculo sigue que $$ L_{x_1}^{x_2}(f) = \int_{x_1}^{x_2}\sqrt{1+f'(x)^2}dx\geq \sqrt{(y_2-y_1)^2 + (x_2-x_1)^2} $$ De lo anterior sigue que $\displaystyle\inf_{f\in\Lambda}L_{x_1}^{x_2}(f)\geq \sqrt{(y_2-y_1)^2 + (x_2-x_1)^2}$ y el ínfimo se alcanza en $\overline{f}$. Esto muestra que el mínimo $L_f$ en $\Lambda$ es $\overline{f}$, es decir, la recta que une $(x_1,y_1)$ con $(x_2,y_2)$.

miércoles, 9 de septiembre de 2020

Subgrupos grandes

   En un grupo finito $(G,\cdot)$ es natural preguntarse cuando sus subgrupos son normales. En este post probaremos que su subgrupo de mayor orden posible (cuando sabemos que existe) es normal:

   $\textbf{Teorema}$
   Sea $(G,\cdot)$ un grupo finito y $H$ subgrupo de $G$ con índice $p$, donde $p$ es el menor primo que divide a $|G|$. Entonces $H$ es normal.

obs: Notar que $H$ es el subgrupo de mayor orden posible. 

   $\textbf{Demostración}$
   Definamos $X = G/H$, que a priori no es un grupo (con la operación usual), pero a fortiori lo será. Vemos que por hipótesis $|X| = p$. Denotemos por $S_X$ al conjunto de las permutaciones de $X$ en $X$, que es un grupo con la composición de funciones y además $|S_X| = p!$. Definamos la función $ \psi: G\to S_X $ dada por $\psi(g)(aH) = gaH$ y veamos que es un morfismo. Está bien definida pues $\psi(g)\in S_X$, $\forall g\in G$, y $$\psi(gk)(aH) = gkaH = g(kaH) = \psi(g)(kaH) = \psi(g)\circ\psi(k)(aH)$$ lo que prueba que es un morfismo. Sea $K = \text{Ker}(\psi)$, es directo que $K\subset H$, además por el teorema del isomorfismo sabemos que $\tilde{\psi}:G/K\to\text{Im}(\psi)$ es un isomorfismo, por lo que $[G:K] = |G/K| = |\text{Im}(\psi)|$ pero por el teorema de lagrange $|\text{Im}(\psi)|$ divide a $|S_X| = p!$ y por tanto $[G:K]|p!$. Notar que $[G:K]\geq [G:H] = p$. Supongamos que existe un $q$ primo dividiendo a $[G:K]$ entonces $q|p!$ luego $q\leq p$ pues en la factorización prima de $p!$ sólo aparecen primos menores o iguales que $p$, pero por el teorema de lagrange $[G:K]\cdot |K| = |G|$ lo que indica que como $q$ divide a $[G:K]$ también divide a $|G|$, luego $q=p$ pues $p$ es el menor primo que divide a $|G|$. Lo anterior muestra que el único primo que divide a $[G:K]$ es $p$ y por tanto $[G:K] = p^n$ con $n\geq 1$ luego $$p^n|p!\Rightarrow p^{n-1}|(p-1)!$$ lo que indica que $n=1$ pues en la factorización prima de $(p-1)!$ no aparece $p$. Luego $[G:K] = [G:H]=p$ por tanto $|H| = |K|$ pero vimos que $K\subset H$ por tanto $K=H$. Como $K$ es el núcleo de un morfismo, este es normal, por tanto $H$ es normal.

martes, 8 de septiembre de 2020

Topología cuociente

    La topología cuociente es una topología que nace a partir de un espacio topologico $(X,\tau)$ y una relación de equivalencia $\sim$ definida sobre $X$ en donde al espacio cuociente $X / \sim$ se le dota de la topología más fina que hace que la proyección canónica $\pi: X\to X / \sim$ ($x\mapsto [x]_\sim$) sea continua, a esta topología resultante le llamamos la topología cuociente $\tau_\sim$. De la definición, es claro que $$U\in\tau_\sim \iff \pi^{-1}(U)\in\tau$$   Al definir esta topología, algunas preguntas naturales que surgen es qué propiedades se heredan del espacio $(X,\tau)$. Veremos un ejemplo en donde el espacio $(X,\tau)$ es hausdorff pero para cierta relación $\sim$, el espacio cuociente no resulta hausdorff (recordemos que un espacio es de hausdorff si para cada par de puntos $x\neq y$ existen vecindades de aquellos puntos tales que estas no se intersectan)

   Para esto, tomemos $X = \mathbb{R}$ con la topología usual (que es un hausdorff). Tomemos la relación de equivalencia $\sim$ definida por $x\sim y\iff x-y\in\mathbb{Q}$. Sea $V$ un abierto que contiene a $[\sqrt{2}]_\sim$, luego $\pi^{-1}(V)$ es un abierto de $\mathbb{R}$, como $\mathbb{Q}$ es denso en $\mathbb{R}$ sigue que $\pi^{-1}(V)\cap\mathbb{Q}\neq \emptyset$. Sea $U$ un abierto conteniendo a $[0]_\sim$, luego $\pi^{-1}(U)$ es un abierto de $\mathbb{R}$ tal que $\mathbb{Q}\subset \pi^{-1}(U)$ pues $0\sim q, \forall q\in\mathbb{Q}$, de aquí se sigue que $\pi^{-1}(V)\cap\pi^{-1}(U)\neq \emptyset$ y por tanto $U\cap V\neq \emptyset$. Claramente tenemos que $[0]_\sim \neq [\sqrt{2}]_\sim$ y la deducción anterior nos muestra que cada vez que escojamos $U$ vecindad abierta de $[0]_\sim$ y $V$ vecindad abierta de $[\sqrt{2}]_\sim$ se tendrá que $U\cap V\neq \emptyset$, es decir, este espacio no puede ser hausdorff.

   Ahora, veamos un caso (bien particular) donde la topología cuociente resulta ser hausdorff. Supongamos que $(X,\tau)$, $(Y,\tau ')$ son dos espacios topológicos los cuales se relacionan por una función continua $f:X\to Y$, si suponemos que $(Y,\tau ')$ es un hausdorff y la relación de equivalencia $x\sim y \iff f(x) = f(y)$, entonces $(X / \sim,\tau_\sim)$ resulta hausdorff. En efecto, si $[x]_\sim\neq[y]_\sim$ entonces $f(x)\neq f(y)$, como $Y$ es hausdorff se sigue que existen $U_x$ vecindad de $f(x)$ y $U_y$, vecindad de $f(y)$ tal que $U_x\cap U_y=\emptyset$, luego, definamos $O_x = \{ [z]_\sim : f(z)\in U_x \}$ y $O_y = \{ [z]_\sim : f(z)\in U_y \}$, es claro que son disjuntos, además son abiertos pues $\pi^{-1}(O_x) = \{ z: [z]_\sim\in O_x  \} = \{ z : f(z)\in U_x \} = f^{-1}(U_x)$ que es un abierto de $X$ pues $f$ es continua, además $[x]_\sim\in O_x$, de la misma manera se prueba que $\pi^{-1}(O_y) = f^{-1}(U_y)$ y así probamos que existen vecindades disjuntas separando a puntos distintos, por tanto $(X / \sim,\tau_\sim)$ es hausdorff.

Borel-Cantelli

  En probabilidades una herramienta muy útil para probar convergencia (en algún sentido) de secuencias de variables aleatorias, es Borel-Cantelli:

$\textbf{Teorema}$ [Borel-Cantelli]

Sea $(\Omega,\mathcal{F},\mathbb{P})$ un espacio de probabilidad.

i. Sean $(A_n)_{n\in\mathbb{N}}$ una familia de eventos en $\mathcal{F}$ tales que $\sum_{n\in\mathbb{N}}\mathbb{P}(A_n)<\infty$ entonces $\mathbb{P}(\limsup{A_n}) = 0$.

ii. Si $(A_n)_{n\in\mathbb{N}}$ una familia de eventos independientes en $\mathcal{F}$ tales que $\sum_{n\in\mathbb{N}}\mathbb{P}(A_n) = \infty$ entonces $\mathbb{P}(\limsup{A_n}) = 1$.

Donde $\limsup{A_n} = \bigcap_{n\in\mathbb{N}}\bigcup_{k\geq n}A_k$ es decir un elemento está en $\limsup{A_n}$ si es que pertenece a una infinidad de $A_m$'s.

$\textbf{Demostración}$

i. Notar que $(B_n)_{n\in\mathbb{N}}$ definida por $B_n := \bigcup_{k\geq n}A_k$, es una secuencia decreciente, luego $$\lim_{n\to\infty}\mathbb{P}(B_n) = \mathbb{P}(\bigcap_{n\in\mathbb{N}}B_n)$$ pero $\limsup{A_n} = \bigcap_{n\in\mathbb{N}}B_n $, además $\mathbb{P}(B_n)\leq \sum_{k\geq n}\mathbb{P}(A_n)\to 0$ cuando $n\to\infty$ pues $\sum_{j\in\mathbb{N}}\mathbb{P}(A_j) <\infty$ de acá sigue que $\mathbb{P}(\limsup{A_n}) = 0$.

ii. Notemos que $(\limsup{A_n})^c = \bigcup_{n\in\mathbb{N}}\bigcap_{k\geq n}A_k^c$, luego, podemos definir $C_n := \bigcap_{k\geq n}A_k^c$ y notar que $(C_n)$ es una secuencia creciente, por tanto $$\lim_{n\to\infty}\mathbb{P}(C_n) = \mathbb{P}((\limsup{A_n})^c)$$ gracias a la independencia de los eventos: $$ \mathbb{P}\left(\bigcap_{k=n}^mA_k^c\right) = \prod_{k= n}^m\mathbb{P}(A_k^c) = \prod_{k= n}^m(1-\mathbb{P}(A_k))\leq \prod_{k = n}^m e^{-\mathbb{P}(A_k)} = \exp{(-\sum_{k= n}^m\mathbb{P}(A_k))}$$ donde usamos que $e^x\geq x+1,\forall x\in\mathbb{R}$, luego, tomando limite en $m$ a la desigualdad anterior, y usando que $\sum_{n\in\mathbb{N}}\mathbb{P}(A_n) = \infty$ se obtiene que $\mathbb{P}(C_n) = 0$ y de aquí se sigue que $\mathbb{P}((\limsup{A_n})^c) = 0$ y por tanto $\mathbb{P}(\limsup{A_n}) = 1$.

$\textbf{Aplicación}$

Sean $(X_n)_{n\in\mathbb{N}}$ una secuencia de v.a's i.i.d's con $X_n\sim \exp{(\lambda)}$ con $\lambda > 0$. Entonces c.s. $$\nonumber\limsup_{n\to\infty}{\frac{X_n}{\ln{n}}} = \frac{1}{\lambda}$$

Recordemos que si $X\sim\exp(\lambda)$ entonces $\mathbb{P}(X\geq x) = \exp{(-\lambda x)}$ si $x\geq 0$. Partamos viendo que $\displaystyle\mathbb{P}\left(\limsup_{n\to\infty}\left\{ \frac{X_n}{\ln{n}}\geq \frac{1}{\lambda} \right\}\right) = 1$. En efecto, notemos que $\{ \frac{X_n}{\ln{n}}\geq \frac{1}{\lambda} \}_n$ son independientes y además $$\nonumber\sum_{n}\mathbb{P}(\{ \frac{X_n}{\ln{n}}\geq \frac{1}{\lambda} \}) = \sum_{n}{\exp{(-\lambda\cdot \frac{\ln{n}}{\lambda})}} = \sum_{n}{\frac{1}{n}} = \infty$$ Sigue por borel-cantelli que $\displaystyle\mathbb{P}\left(\limsup_{n\to\infty}\left\{ \frac{X_n}{\ln{n}}\geq \frac{1}{\lambda} \right\}\right) = 1$ lo que significa que c.s. $\forall n\in\mathbb{N}, \exists k\geq n: \frac{X_k}{\ln{k}}\geq \frac{1}{\lambda}$ lo que implica que c.s. $\displaystyle\limsup_{n\to\infty}{\frac{X_n}{\ln{n}}} \geq  \frac{1}{\lambda}$.

Para probar la desigualdad faltante, sea $\epsilon >0$, veamos que $\displaystyle\mathbb{P}\left(\limsup_{n\to\infty}\left\{ \frac{X_n}{\ln{n}}\geq \frac{1}{\lambda}+\epsilon \right\}\right) = 0$, en efecto, $$\nonumber \sum_{n}{\mathbb{P}(\{ \frac{X_n}{\ln{n}}\geq \frac{1}{\lambda} + \epsilon \})} = \sum_{n}{\exp{(-\lambda\cdot\ln{n}\cdot  (\frac{1}{\lambda} + \epsilon)})} = \sum_{n}{n^{-(1+\lambda \epsilon)}}<\infty$$ luego por borel-cantelli, $\displaystyle\mathbb{P}\left(\limsup_{n\to\infty}\left\{ \frac{X_n}{\ln{n}}\geq \frac{1}{\lambda}+\epsilon \right\}\right) = 0$, sigue que c.s. $\exists N, \forall n\geq N : \frac{X_n}{\ln{n}} < \frac{1}{\lambda}+\epsilon$, luego c.s. $\displaystyle\limsup_{n\to\infty}{\frac{X_n}{\ln{n}}}<\frac{1}{\lambda}+\epsilon$, tomamos $\epsilon = \frac{1}{n}$ y tomamos $n\to\infty$, luego c.s. $\displaystyle\limsup_{n\to\infty}{\frac{X_n}{\ln{n}}}\leq\frac{1}{\lambda}$, de donde se concluye $$ \limsup_{n\to\infty}{\frac{X_n}{\ln{n}}} = \frac{1}{\lambda} $$

Teorema de Arzela Ascoli

  Sea $(X,\tau)$ un espacio topológico compacto e $(Y,d)$ un espacio métrico. Denotamos por $C(X,Y)$ al espacio de funciones continuas de...