xAI, de Elon Musk, presenta el modelo de IA Grok 1.5 Vision en primicia, para competir con GPT-4 Vision y Gemini Pro 1.5

Create a brightly colored, 3:2 aspect ratio illustration for an article about artificial intelligence. The image should depict an abstract AI model named Grok 1.5 Vision that can process images and answer questions about them, surrounded by items representing its wide-ranging applications, such as a healthy plate of food, a medical instrument, and a self-driving car. The technology is shifting and transforming, representing the machine's learning process and its ability to outperform other models in certain tests. Display benchmark scores and details about the model subtly in the background, showcasing its competitive edge.

Elon Musk’s xAI ha presentado el modelo Grok 1.5 Vision AI, una versión mejorada del modelo Grok 1.5 con capacidades añadidas de visión por ordenador. Esto permite al modelo procesar imágenes y responder a preguntas sobre ellas. El anuncio se ha realizado a través de la cuenta oficial de xAI&#8217, en la que se han compartido las puntuaciones de los benchmarks y los detalles del nuevo modelo. El Grok 1.5 Vision se probó en varios benchmarks, superando al GPT-4 de OpenAI’s con Vision en RealWorldQA, pero con una puntuación inferior en MMMU y ChartQA. La visión por ordenador permite a los modelos de IA identificar y comprender objetos del mundo real a partir de imágenes y vídeos, de forma similar al procesamiento visual humano. Esta tecnología tiene aplicaciones muy diversas, desde el seguimiento de calorías y la información nutricional hasta su uso potencial en el diagnóstico de enfermedades y la conducción autónoma de automóviles. El auge de los modelos de IA multimodal ha llevado a varias empresas a centrarse cada vez más en modelos centrados en la visión, como Gemini 1.5 Pro de Google y GPT-4 with Vision de OpenAI.

Artículo completo

Deja una respuesta