Η Google αποκαλύπτει το Gemini, το μεγαλύτερο γλωσσικό μοντέλο τεχνητής νοημοσύνης της μέχρι σήμερα

Φέροντας το χαρακτηρισμό ως το “μεγαλύτερο επιστημονικό και engineering έργο της Google”, το Gemini αντιπροσωπεύει ένα τεράστιο άλμα στις δυνατότητες τεχνητής νοημοσύνης χάρη στον multimodal σχεδιασμό του. Είναι το αποτέλεσμα μεγάλης κλίμακας συνεργατικών προσπαθειών από ομάδες εντός της εταιρείας, συμπεριλαμβανομένων των Google DeepMind και Google Research.

Σε αντίθεση με προηγούμενα μοντέλα AI που επικεντρώνονται στο κείμενο, το Gemini έχει προ-εκπαιδευτεί από την αρχή σε πολλαπλούς τύπους δεδομένων, συμπεριλαμβανομένων εικόνων, βίντεο, ήχου και κώδικα. Αυτός ο εγγενής χειρισμός διαφορετικών τρόπων επιτρέπει στο Gemini να συνδυάζει απρόσκοπτα αυτές τις εισόδους για βελτιωμένες ικανότητες συλλογισμού, κατανόησης και παραγωγής. Το λανσάρισμα περιλαμβάνει τρία μοντέλα Gemini διαφορετικού μεγέθους για διαφορετικά επίπεδα πολυπλοκότητας και περιπτώσεις χρήσης:

Gemini Ultra – η μεγαλύτερη παραλλαγή για σύνθετες εργασίες υψηλής ικανότητας, από την περίληψη ερευνητικών εργασιών έως τη δημιουργία νέων σχεδίων.

Gemini Pro – βελτιστοποιημένο για αποτελεσματικό scaling στις περισσότερες εργασίες με ισχυρές συνολικές επιδόσεις.

Gemini Nano – το πιο συμπαγές και αποδοτικό μοντέλο που έχει σχεδιαστεί για να εκτελείται ακόμη και σε κινητές συσκευές.

Με εκτεταμένες συγκριτικές δοκιμές σε πάνω από 30 σύνολα δοκιμών, το Gemini παρέχει κορυφαία αποτελέσματα σχεδόν παντού – από μαθηματικούς συλλογισμούς έως εργασίες φυσικής γλώσσας. Αυτό σύμφωνα με την εταιρεία αποτελεί μια τεράστια ώθηση τόσο για τις καταναλωτικές όσο και για τις επιχειρηματικές εφαρμογές της AI τεχνολογίας, με τη Google να προχωρά και σε άμεση σύγκριση με το GPT-4 της OpenA, σε μια σειρά δοκιμών (κείμενο και multimodal) που μπορείτε να δείτε στις παρακάτω εικόνες.

Για τους μέσους χρήστες, το Gemini θα επεκταθεί σταδιακά για να ενισχύσει τις υπάρχουσες υπηρεσίες της Google, όπως η Αναζήτηση, το Chrome και η διαφήμιση. Εν τω μεταξύ, η προσπάθεια του AI chatbot της εταιρείας, “Bard”, έχει αναβαθμιστεί ήδη στο Gemini, βελτιώνοντας σημαντικά τις ικανότητες κατανόησης, συλλογισμού και δημιουργίας περιεχομένου σε περισσότερες από 170 χώρες.

Οι προγραμματιστές θα έχουν επίσης πρόσβαση στα μοντέλα Gemini μέσω του Google AI Studio, της πλατφόρμας Vertex AI και της ενσωμάτωσης του Android OS από την επόμενη εβδομάδα. Αυτό επιτρέπει την ταχεία δημιουργία πρωτοτύπων εφευρετικών συστημάτων AI που αξιοποιούν τις ευέλικτες δυνατότητες του Gemini. Επιλεγμένοι προγραμματιστές θα αποκτήσουν ακόμη και πρώιμη πρόσβαση για να πειραματιστούν με το πανίσχυρο μοντέλο Gemini Ultra.

Καθώς η έρευνα της Google συνεχίζει να εξελίσσει τις δεξιότητες του Gemini, η κυκλοφορία αυτή αποτελεί μια κομβική στιγμή για την τεχνητή νοημοσύνη στον πραγματικό κόσμο. Με τον multimodal σχεδιασμό του και το τεράστιο scaling του, το Gemini μπορεί σύντομα να εκπληρώσει την υπόσχεση ότι η τεχνητή νοημοσύνη θα βελτιώσει σχεδόν κάθε πτυχή της ζωής όπως αναφέρει και ο CEO της εταιρείας, Sundar Pichai.

Διαβάστε όλο το άρθρο από την πηγή

Η Google αποκαλύπτει το Gemini, το μεγαλύτερο γλωσσικό μοντέλο τεχνητής νοημοσύνης της μέχρι σήμερα

Latest Posts

Τι αλλάζει στις προθεσμίες του φόρου εισοδήματος μετά την παράταση στις φορολογικές δηλώσεις

Εορτολόγιο 27 Ιουλίου: Ποιοι γιορτάζουν σήμερα

Οι Ολυμπιακοί Αγώνες του Παρισιού (1924)

Ο Ολυμπιακός αγοράζει τον Όρτα από την Μπράγκα

Don't Miss

Ακμή στους γλουτούς; Τα tips που θα βελτιώσουν την κατάσταση

Με 15.900 ευρώ και το κλειδί στο χέρι, το Dacia Sandero δεν έχει αντίπαλο

Ολυμπιακοί Αγώνες: Ψήφισε Γιάννη Αντετοκούνμπο για αστέρι εκτός Team USA ο Ντουράντ

Αβδάλας: Κίνητρο για την Εθνική Εφήβων το μετάλλιο των Νέων

Ο Μίμης Πλέσσας κλείνει 100 χρόνια ζωής με μία μεγάλη γιορτή στο Θέατρο Παλλάς

Η Google αποκαλύπτει το Gemini, το μεγαλύτερο γλωσσικό μοντέλο τεχνητής νοημοσύνης της μέχρι σήμερα

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Latest Posts

Stay in touch

Don't Miss