# Άσκηση: Χρήση των Γκαουσιανών Μοντέλων Μείξης ως Παραγωγικών Μοντέλων (Solution)

Σε αυτή την άκηση θα χρησιμοποιήσουμε τα γκαουσιανά μοντέλα μείξης ως παραγωγικά μοντέλα, για τη δημιουργία ασπρόμαυρων φωτογραφιών ανθρώπινων προσώπων. Για το σκοπό αυτό, θα χρησιμοποιήσουμε ως δεδομένα εκπαίδευσης το σύνολο δεδομένων [Olivetti Faces](https://scikit-learn.org/0.19/datasets/olivetti_faces.html), το οποίο μπορούμε να φορτώσουμε απευθείας μέσω του scikit-learn.

Ξεκινάμε κάνοντας import τις κλάσεις και τις μεθόδους που πρόκειται να χρησιμοποιήσουμε.

In [None]:
from sklearn.datasets import fetch_olivetti_faces
from sklearn.decomposition import PCA
from sklearn.mixture import GaussianMixture

import matplotlib.pyplot as plt
import numpy as np

Στη συνέχεια ορίζουμε τη μέθοδο *print_faces()*, η οποία κατ' αντίστοιχο τρόπο με την *plot_digits()* που είδαμε στο εργαστήριο, θα εμφανίζει τις ασπρόμαυρες φωτογραφίες στη μορφή gallery.

In [None]:
def print_faces(images):
 """
 Σχεδίαση προσώπων Olivetti
 """
 fig, ax = plt.subplots(6, 6, figsize=(16,16), subplot_kw=dict(xticks=[], 
 yticks=[]))
 fig.subplots_adjust(hspace=0.05, wspace=0.05)
 for i, axi in enumerate(ax.flat):
 im = axi.imshow(images[i].reshape(64,64), cmap=plt.cm.gray) 

Κατόπιν καλούμε τη μέθοδο *fetch_olivetti_faces()* και αποθηκεύουμε στη μεταβλητή *faces* τα δεδομένα του Olivetti Faces

In [None]:
faces = fetch_olivetti_faces()

## 1. Στοιχεία της συλλογής δεδομένων

Εμφανίστε στην οθόνη τα βασικά χαρακτηριστικά της συλλογής δεδομένων (πλήθος στοιχείων επί πλήθος χαρακτηριστικών ανά στοιχείο) καθώς και ορισμένες χαρακτηριστικές εικόνες από τη συλλογή

In [None]:
print(faces.data.shape)
print_faces(faces.data)

## 2. Διαστατικότητα δεδομένων

Όπως θα είδατε παραπάνω, το πλήθος των χαρακτηριστικών του κάθε δείγματος είναι μεγάλο. Εφαρμόστε μείωση των διαστάσεων μέσω ανάλυσης κυρίων συνιστωσών (PCA) έτσι ώστε το πλήθος των χαρακτηριστικών να μειωθεί. Ορίστε το ποσοστό της διακύμανσης σε συνάρτηση και με τα επόμενα βήματα της άσκησης

In [None]:
pca = PCA(0.85, whiten=True)
data = pca.fit_transform(faces.data)
data.shape

## 3. Πλήθος γκαουσιανών

Χρησιμοποιείστε το Bayesian Information Criterion και το Aikake Information Criterion για να προσδιορίσεετε το βέλτιστο πλήθος των γκαουσιανών κατανομών που θα χρησιμοποιήσετε. Προσδιορίστε τα όρια αναζήτησης εμπειρικά και σχεδιάστε τις αντίστοιχες γραφικές παραστάσεις.

In [None]:
n_components = np.arange(10, 210, 10)
models = [GaussianMixture(n, covariance_type='full', random_state=0) 
for n in n_components]
aics = [model.fit(data).aic(data) for model in models]
bics = [model.fit(data).bic(data) for model in models]
plt.plot(n_components, aics)
plt.plot(n_components, bics)
plt.legend(loc='best')
plt.xlabel('Πλήθος στοιχείων');

In [None]:
print('Ελαχιστοποίηση AIC στα {} στοιχεία του GMM'.format(
 n_components[aics.index(min(aics))])
)
print('Ελαχιστοποίηση BIC στα {} στοιχεία του GMM'.format(
 n_components[bics.index(min(bics))])
)

## 4. Παραγωγή νέων προσώπων

Για τις βέλτιστες τιμές των κριτηρίων που βρήκατε στο προηγούμενο βήμα, κατασκευάστε τα αντίστοιχα γκαουσιανά μοντέλα μείξης και χρησιμοποιείστε τα για την παραγωγή νέων δειγμάτων. Εμφανίστε στην οθόνη τα νέα δείγματα που παράξατε.

In [None]:
gmm_aic = GaussianMixture(40, covariance_type='full', random_state=0)
gmm_aic.fit(data)
data_new = gmm_aic.sample(len(data))
t1 = data_new[0]
faces_new = pca.inverse_transform(t1)
print_faces(faces_new)

In [None]:
gmm_bic = GaussianMixture(20, covariance_type='full', random_state=0)
gmm_bic.fit(data)
data_new = gmm_bic.sample(len(data))
t1 = data_new[0]
faces_new = pca.inverse_transform(t1)
print_faces(faces_new)