Έχετε ακούσει ποτέ τη φωνή ενός ανθρώπου που δεν έχετε δει ποτέ και μετά να φανταστείτε το πρόσωπο αυτού του άγνωστού σας ανθρώπου βασισμένοι μόνο στον ήχο της φωνής του; 

Το ίδιο νοητικό άλμα κάνει και ένα πρόγραμμα τεχνητής νοημοσύνης. Παράγει την ψηφιακή εικόνα του προσώπου ενός ανθρώπου, χρησιμοποιώντας, ως βάση για την υπολογιστική διεργασία μόνο ένα σύντομο ηχητικό απόσπασμα με τη φωνή του.

Το νευρωνικό δίκτυο με την επωνυμία Speech2Face πρόκειται για έναν ηλεκτρονικό υπολογιστή που σκέφτεται με τρόπο ανάλογο του ανθρώπινου εγκεφάλου. Προγραμματίστηκε από επιστήμονες με τη βοήθεια διαδικτυακών βίντεο, στα οποία εμφανίζονται περισσότεροι από 100.000 άνθρωποι.

Το Speech2Face «έμαθε» τη σχέση μεταξύ φωνητικών ήχων και συγκεκριμένων ανθρωπολογικών χαρακτηριστικών. Στη συνέχεια, το πρόγραμμα τεχνητής νοημοσύνης παρήγαγε μια φωτορεαλιστική ψηφιακή εικόνα που ταιριάζει με το εκάστοτε ηχητικό απόσπασμα.

Ευτυχώς το πρόγραμμα, τουλάχιστον ακόμη, δεν είναι σε θέση να παράγει επακριβώς την εικόνα του προσώπου που μιλά, αλλά αναγνωρίζει συγκεκριμένα χαρακτηριστικά στη φωνή, βάσει φύλου, ηλικίας και εθνικότητας.

Ωστόσο, όπως μαρτυρούν οι φωτογραφίες, οι εικόνες που παράγονται βρίσκονται πολύ κοντά στην πραγματικότητα.

Δείτε τη συλλογή με τις φωτογραφίες: