Παρασκευή 24 Μαΐου 2024

Αυτό είναι το νέο ΑΙ εργαλείο της Google που βλέπει τα πάντα και θυμάται πού ξεχάσατε τα… πράγματά σας


Το χάσιμο των γυαλιών ή των κλειδιών του αυτοκινήτου σας μπορεί σύντομα να γίνει παρελθόν, αφού η Google αποκάλυψε ένα νέο εργαλείο AI που βλέπει και ακούει τα πάντα.

Ο τεχνολογικός γίγαντας ανακοίνωσε μια σειρά από σημαντικές αναβαθμίσεις στις προσπάθειές του για την τεχνητή νοημοσύνη, καθώς μάχεται να ανταγωνιστεί την OpenAI, τη δημιουργό του ChatGPT.

Η OpenAI έσπευσε τη Δευτέρα  – πριν από την ετήσια εκδήλωση για προγραμματιστές της Google- να ανακοινώσει τις δικές της νέες λειτουργίες, συμπεριλαμβανομένου ενός εξελιγμένου chatbot που μπορεί να βλέπει φωτογραφίες και ακόμη και να σας μιλάει σαν μια υπερ-δραστήρια Siri.

Τώρα η Google ελπίζει να κερδίσει τους χρήστες με ένα νέο concept του Project Astra που βλέπει τα πάντα γύρω σας χρησιμοποιώντας την κάμερα του smartphone σας. Επιτρέπει στους ανθρώπους να κυκλοφορούν και να ρωτούν οτιδήποτε για το περιβάλλον τους σε πραγματικό χρόνο.

Project Astra: Πώς λειτουργεί το νέο εργαλείο

Για παράδειγμα, το εργαλείο μπορεί να αναγνωρίσει το όνομα των εξαρτημάτων ενός εξοπλισμού, όπως ενός ηχείου που μπορεί να χρειαστεί να επισκευάσετε.

Ακόμα πιο εκπληκτική όμως είναι η ικανότητα του εργαλείου να θυμάται τι έχει δει καθώς περπατάτε μέσα σε ένα δωμάτιο.

Σε ένα βίντεο επίδειξης, η Google έδειξε πώς ένα άτομο ρώτησε «Πού άφησα τα γυαλιά μου;» και το εργαλείο θυμήθηκε αμέσως ότι τα είχε δει.


«Για να είναι πραγματικά χρήσιμο, ένας πράκτορας τεχνητής νοημοσύνης πρέπει να καταλαβαίνει και να ανταποκρίνεται στον σύνθετο και δυναμικό κόσμο, ακριβώς όπως οι άνθρωποι – και να λαμβάνει και να θυμάται τι βλέπει και ακούει για να κατανοήσει το περιβάλλον και να αναλάβει δράση», εξήγησε ο Demis Hassabis, επικεφαλής του τμήματος Τεχνητής Νοημοσύνης της Google, DeepMind.

«Πρέπει επίσης να είναι προληπτικό, διδακτικό και προσωπικό, ώστε οι χρήστες να μπορούν να του μιλήσουν φυσικά και χωρίς καθυστέρηση»

Ο τεχνολογικός γίγαντας αναφέρει  επίσης ότι έχει βελτιώσει τον ήχο των φωνητικών βοηθών ώστε να είναι πιο φυσικοί.

Μέρη του Project Astra θα εμφανιστούν σε προϊόντα Google όπως η εφαρμογή Gemini αργότερα φέτος. Ο Hassabis πρόσθεσε: «Αυτοί οι πράκτορες δημιουργήθηκαν με βάση το μοντέλο Gemini και άλλα μοντέλα για συγκεκριμένες εργασίες, και σχεδιάστηκαν για να επεξεργάζονται πληροφορίες πιο γρήγορα με συνεχή κωδικοποίηση καρέ βίντεο, συνδυάζοντας την εισαγωγή βίντεο και ομιλίας σε ένα χρονικό διάστημα γεγονότων και αποθηκεύοντας αυτές τις πληροφορίες για αποτελεσματική ανάκληση»

Η ανακοίνωση έρχεται μια μέρα μετά την OpenAI που εξέπληξε ξανά τον κόσμο με την νέα της τεχνολογία Chat-GPT4o που μπορεί επίσης να βλέπει πράγματα και να αντιδρά.

Οι υπεύθυνοι έδειξαν πώς θα μπορούσε να λύσει μαθηματικά προβλήματα απλά κρατώντας την κάμερα μπροστά σε ένα κομμάτι χαρτί, καθώς και να καταλάβει τη διάθεση ενός ατόμου απλά κοιτάζοντας το πρόσωπό του.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

ΤΑ ΣΧΟΛΙΑ ΑΝΑΡΤΩΝΤΑΙ ME ΜΙΚΡΗ ΚΑΘΥΣΤΕΡΗΣΗ ΚΑΙ ΚΑΤΟΠΙΝ ΕΛΕΓΧΟΥ