Section outline

    • Διάλεξη 14/2/2024: Διαδικαστικά θέματα. Εισαγωγή.
    • Διάλεξη 8/4/2024: Οnline learning, αλγόριθμος υποδιπλασιασμού, εκμάθηση διαζεύξεων, regret, no-regret αλγόριθμοι, weighted majority algorithm and randomized weighted majority algorithm, no-regret, εφαρμογές. PAC learning, no-free-lunch theorem, Empirical Risk Minimization (ERM). 

    • Διάλεξη 15/4/2024: PAC learning, Empirical Risk Minimization (ERM), VC-dimension, agnostic PAC learning (επανάληψη), learning via uniform convergence, non-uniform convergence, bias-complexity tradeoff, loss functions, ERM and convex optimization.  Οnline learning, regret, no-regret αλγόριθμοι, Follow the Leader (FTL) και Be the Leader BTL) (ορισμός και ανάλυση του regret).

    • Διάλεξη 22/4/2024: Online learning, regret, no-regret αλγόριθμοι, Follow the Leader (FTL) και Be the Leader BTL) (ορισμός και ανάλυση του regret, επανάληψη). Ο ρόλος της ισχυρής κυρτότητας στην ευστάθεια αλγορίθμων της μορφής Follow the Leader, regularization, Follow the Regularized Leader (FTRL, ορισμός, παραμετροποίηση με βάση τον regularizer, ανάλυση του regret). Οnline convex optimization, βασική ανάλυση της Gradient Descent για convex συναρτήσεις.

    • Διάλεξη 20/5/2024: Βασική ανάλυση της Gradient Descent για convex και strongly convex συναρτήσεις, Online Gradient Descent, ανάλυση για convex και strongly convex συναρτήσεις, Stochastic Gradient Descent, ανάλυση με αναγωγή στην ανάλυση της Online Gradient Descent. Εφαρμογή της SGD στην ελαχιστοποίηση log-likelihood για την εκμάθηση μέσης τιμής κανονικής κατανομής


    • Διάλεξη 27/5/2024: Επανεξέταση αλγορίθμων Gradient Descent, FTRL και Mirror Descent. Σύντομη εισαγωγή στους βασικούς αλγόριθμους για stochastic και adversarial multi-armed bandits.