\documentclass[a4paper]{article}
\usepackage[czech]{babel}
\usepackage[utf8]{inputenc}
\usepackage{amsmath}
\usepackage{graphicx}
\usepackage[colorinlistoftodos]{todonotes}
\usepackage{booktabs}
\usepackage{float}
\title{Přehled PST}
\author{Jaroslav Šmolík}
\date{\today}
\begin{document}
\maketitle
\begin{abstract}
Stručný přehled vzorců a vztahů z předmětu PST. Neobsahuje všechny \textit{triviální} věci (pravděpodobnost jevu) a některé \textit{komplikovanější}, které se nedají snadno stručně shrnout (CLT, Markova nerovnost etc.). Veškerou většinu ostatní potřebné výbavy na zkoušku ale ano.
\end{abstract}
\newcommand{\E}{\operatorname{E}}
\newcommand{\var}{\operatorname{var}}
\newcommand{\sd}{\operatorname{sd}}
\newcommand{\cov}{\operatorname{cov}}
\newcommand{\diff}{\mathop{}\!\mathrm{d}}
\section{Pravděpodobnost}
$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$
\section{Náhodné veličiny}
\paragraph{Střední hodnota}
$$\E X = \sum_{\forall x_i} x_i p_X(x_i)$$
$$\E X = \int_{-\infty}^{\infty} x f_X(x)$$\paragraph{Střední hodnota, rozptyl}
$$\sigma^2 = \var X = \E (X - \E X)^2 = \E X^2 - (\E X)^2$$
$$\sigma = \sd X = \sqrt{\var X}$$
\paragraph{Moment}
$$\mu_k = \E X^k$$
\paragraph{Centrální moment}
$$\sigma_k = \E (X-\E X)^k$$
\paragraph{Koeficient šimosti}
$$\gamma_1 = \frac{\sigma^3}{\sigma_3}$$
Koeficient je kladný, záporný, podle toho, kam se vrchol vychyluje. (kladný doleva, záporný doprava)
\paragraph{Koeficient špičatosti}
$$\gamma_2 = \frac{\sigma^4}{\sigma_4} - 3$$
Koeficient je kladný, záporný, podle toho, jestli je špičatější než normální rozdělení (kladný špičatější, záporný méně špičatý).
\paragraph{Kvantil}
$$x_{\alpha} = Q_X(\alpha) = \mathrm{inf}\{ x : F_X \geq \alpha \}$$
Tedy bod, který dělí veličinu tak, že před ním je $(\alpha \cdot 100) \%$ hodnot.
\paragraph{Kritická hodnota}
$$z_{\alpha} = Q_X(1-\alpha)$$
\paragraph{Moment generující funkce}
$$M_X(s) = \E (e^{sX} )$$
$k$-tý moment je pak
$$m_k = \frac{d^k}{ds^k}M_X(s)$$
\section{Náhodné vektory}
\paragraph{Marginální hustota}
$$p_X(x) = \sum_{\forall y_i} p_{X,Y}(x,y_i)$$
$$f_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x,y) \diff y$$
\paragraph{Podmíněná hustota}
$$p_{X|Y}(x|y) = \frac{p_{X,Y}(x,y)}{p_Y(y)}$$
\paragraph{Kovariance}
$$\cov_{X,Y} = \E (X-\E X)(Y-\E Y)$$
\paragraph{Korelační koeficient}
$$\rho_{X,Y} = \frac{\cov_{X,Y}}{\sqrt{\var X}\sqrt{\var Y}}$$
\section{Příklady rozdělení}
\subsection{Příklady diskrétních rozdělení}
\begin{table}[H]
\centering
\caption{Příklady diskrétních rozdělení}
\label{tb:discrete}
\resizebox{\textwidth}{!}{%
\begin{tabular}{@{}rcccc@{}}
\toprule
& Be(p) & Binom(p,n) & Geom(p) & Poisson($\lambda$) \\ \midrule \addlinespace[0.5em]
$p_X$ & $p$ & $\binom{n}{k} p^k (1-p)^{n-k}$ & $(1-p)^{k-1} p$ & $\frac{\lambda^k}{k!} e^{-\lambda}$ \\ \addlinespace[0.5em]
$\E X$ & $p$ & $n \cdot p$ & $\frac{1}{p}$ & $\lambda$ \\ \addlinespace[0.5em]
$\var X$ & $pq = p(1-p)$ & $n \cdot pq = n \cdot p(1-p)$ & $\frac{q}{p^2} = \frac{1-p}{p^2}$ & $\lambda$ \\ \addlinespace[0.5em] \bottomrule
\end{tabular}
}
\end{table}
\subsection{Příklady spojitých rozdělení}
\begin{table}[H]
\centering
\caption{Příklady spojitých rozdělení}
\label{tb:continuous }
\resizebox{\textwidth}{!}{%
\begin{tabular}{@{}rcccc@{}}
\toprule
& Unif(a,b) & Exp($\lambda$) & Norm($\mu, \sigma^2$)\\ \midrule \addlinespace[0.5em]
$p_X$ & $\begin{cases} \frac{1}{b-a},& x\in (a,b)\\ 0, & \text{else} \end{cases}$ & $\begin{cases} \lambda e^{-\lambda x},& x > 0 \\ 0, & \text{else} \end{cases}$ & $\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$ \\ \addlinespace[0.5em]
$\E X$ & $\frac{a+b}{2}$ & $\frac{1}{\lambda}$ & $\mu$ \\ \addlinespace[0.5em]
$\var X$ & $\frac{(b-a)^2}{12}$ & $\frac{1}{\lambda^2}$ & $\sigma^2$ \\ \addlinespace[0.5em] \bottomrule
\end{tabular}
}
\end{table}
\section{Bodové odhady}
\paragraph{Výběrový průměr}
$$\bar{X} = \frac{1}{n} \sum_{i=1}^{n} x_i$$
\paragraph{Výběrový rozptyl}
$$S_n^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{X})^2
= \frac{1}{n-1} \left(\sum_{i=1}^{n} x_i^2 - n \bar{X}^2\right)$$
\paragraph{Výběrová odchylka}
$$S_n = \sqrt{S_n^2}$$
\paragraph{Výběrový moment}
$$m_k = \frac{i=1}{n} \sum_{1}^{n}x_i^k$$
\paragraph{Výběrová kovarinace}
$$s_{X,Y} = \frac{1}{n-1} \sum_{i=1}^{n} (y_i - \bar{y_n})(x_i - \bar{x_n})
= \frac{1}{n-1} \left(\sum_{i=1}^{n} x_i y_i - n \bar{x_i}\bar{y_i}\right)$$
\paragraph{Výběrový korelační koeficient}
$$r = \frac{s_{X,Y}}{s_X s_Y}$$
\section{Konfidenční $(1- \alpha) 100\%$ intervaly}
\subsection{Střední hodnota}
\paragraph{Známý rozptyl}
$$\left( \bar{X_n} - z_{\frac{\alpha}{2}, n-1} \frac{\sqrt{\sigma^2}}{\sqrt{n}}, \bar{X_n} + z_{\frac{\alpha}{2}, n-1} \frac{\sqrt{\sigma^2}}{\sqrt{n}} \right)$$
$$\left( \bar{X_n} - z_{\alpha, n-1} \frac{\sqrt{\sigma^2}}{\sqrt{n}}, \infty \right) ,
\left( -\infty, \bar{X_n} + z_{\alpha, n-1} \frac{\sqrt{\sigma^2}}{\sqrt{n}} \right)$$
\paragraph{Nezmámý rozptyl}
$$\left( \bar{X_n} - t_{\frac{\alpha}{2}, n-1} \frac{\sqrt{s_n^2}}{\sqrt{n}}, \bar{X_n} + t_{\frac{\alpha}{2}, n-1} \frac{\sqrt{s_n^2}}{\sqrt{n}} \right)$$
$$\left( \bar{X_n} - t_{\alpha, n-1} \frac{\sqrt{s_n^2}}{\sqrt{n}}, \infty \right) ,
\left( -\infty, \bar{X_n} + t_{\alpha, n-1} \frac{\sqrt{s_n^2}}{\sqrt{n}} \right)$$
\subsection{Rozptyl}
Pouze normální rozdělení. Pro obecná nelze určit KI rozptylu.
$$\left( \frac{(n-1)s_n^2}{\chi^2_{\frac{\alpha}{2}, n-1}} , \frac{(n-1)s_n^2}{\chi^2_{1-\frac{\alpha}{2}, n-1}} \right)$$
$$\left( \frac{(n-1)s_n^2}{\chi^2_{\alpha, n-1}} , \infty \right) ,
\left( 0 , \frac{(n-1)s_n^2}{\chi^2_{1-\alpha, n-1}} \right)$$
\section{Lineární regrese}
\paragraph{Přímka}
$$b_0 = \bar{Y_n} - b_1 \bar{x_n}$$
$$b_1 = \frac{s_{X,Y}}{s_x^2} = r \frac{s_Y}{s_X}$$
\paragraph{RSS (residual sum of squares)}
$$S_e = \sum_{i=1}^{n} (y_i - (b_0 + b_1 x_i) )^2$$
\paragraph{Přesnost}
$$R^2 = 1 - \frac{S_e}{(n-1)s_Y^2}$$
Čím více je koeficient blíže 1, tím přesněji odpovídá model datům.
\end{document}