Spoločnosť xAI Elona Muska predstavila v náhľade model umelej inteligencie Grok 1.5 Vision, ktorý bude konkurovať GPT-4 Vision a Gemini Pro 1.5

Create a brightly colored, 3:2 aspect ratio illustration for an article about artificial intelligence. The image should depict an abstract AI model named Grok 1.5 Vision that can process images and answer questions about them, surrounded by items representing its wide-ranging applications, such as a healthy plate of food, a medical instrument, and a self-driving car. The technology is shifting and transforming, representing the machine's learning process and its ability to outperform other models in certain tests. Display benchmark scores and details about the model subtly in the background, showcasing its competitive edge.

Spoločnosť xAI Elona Muska predstavila model Grok 1.5 Vision AI, vylepšenú verziu modelu Grok 1.5 s pridanými schopnosťami počítačového videnia. To modelu umožňuje spracovávať obrázky a odpovedať na otázky o nich. Oznámenie bolo zverejnené prostredníctvom oficiálneho účtu xAI’s zdieľaním výsledkov benchmarkov a podrobností o novom modeli. Model Grok 1.5 Vision bol testovaný v rôznych benchmarkoch, pričom v RealWorldQA prekonal OpenAI’GPT-4 s Vision, ale v MMMU a ChartQA dosiahol nižšie skóre. Počítačové videnie vybavuje modely umelej inteligencie na identifikáciu a pochopenie objektov v reálnom svete pomocou obrázkov a videí, podobne ako pri ľudskom vizuálnom spracovaní. Táto technológia má široké využitie, od sledovania kalórií a spätnej väzby o výžive až po potenciálne využitie pri diagnostike chorôb a samojazdiacich autách. Nárast multimodálnych modelov umelej inteligencie viedol k zvýšenému zameraniu sa rôznych firiem na modely zamerané na videnie, ako napríklad Google’s Gemini 1.5 Pro a OpenAI’s GPT-4 with Vision.

Celý článok

Leave a Reply