Elon Musk révèle la prochaine étape pour Grok AI

Dans la prochaine version de l’intelligence artificielle (IA) d’Elon Musk, l’accent sera davantage mis sur la reconnaissance et l’interprétation d’images réelles. La dernière version de Grok, la version 1.5, est désormais prête pour les tests bêta auprès des testeurs sélectionnés et des clients existants.

Vision Grok-1.5 par Elon Musk : focus sur la compréhension spatiale du monde réel

Le chatbot IA d’Elon Musk, Grok, s’apprête à dévoiler une nouvelle version très attendue, Grok-1.5. Cette mise à jour sera orientée vers la gestion des données visuelles, notamment des documents, des diagrammes, des graphiques, des captures d’écran et des photographies. Elon Musk lui-même a annoncé ces plans lors de l’événement « Grok-1.5 Vision Preview » sur X, tenu le 13 avril 2024.

Grok-1.5 Vision

— Elon Musk (@elonmusk) 13 avril 2024

Selon l’annonce du document, la prochaine mise à jour du chatbot comprend un outil de traitement d’image robuste nommé RealWorldQA, lui permettant de comprendre les occurrences et les situations visuelles.

Nous sommes particulièrement enthousiasmés par les capacités de Grok à comprendre notre monde physique

Précédemment rapporté par U.Today, Elon Musk a mentionné que la version mise à jour de Grok, Grok 1.5, aurait la capacité de lire et de résumer les publications X et d’aider les utilisateurs X à les créer.

La première version de RealWorldQA comprend environ 700 images, chacune accompagnée d’une question claire et d’une réponse factuelle correspondante. Cette collection est librement accessible à toute personne intéressée, sous la licence Creative Commons BY-ND 4.0.

Grok-1.5V pour surpasser GPT4 et Gemini Pro 1.5 : données

L’ensemble de données révolutionnaire est principalement composé de photos anonymisées collectées sur des voitures, ainsi que de diverses images réelles.

Dans une série d’exemples joints, Grok-1.5 transforme un schéma de blocs en code Python, produit une histoire au coucher basée sur la peinture d’un enfant, crée un ensemble de données CSV à partir d’une capture d’écran, « développe » un mème, etc.

De plus, le groupe xAI a fourni une évaluation de la façon dont Grok-1.5 se compare à ses principaux concurrents, GPT d’OpenAI, Gemini Pro 1.5 de Google et Claude 3 d’Anthropic.

Selon le rapport de xAI, Grok-1.5 excellait dans tous les problèmes mathématiques, la compréhension de textes et les analyses de situations réelles par rapport à d’autres concurrents.

2024-04-13 15:44