“Raja sudah mati”-Claude 3 melampaui GPT-4 di Chatbot Arena untuk pertama kalinya

Illustrate a sunny, optimistic 3:2 aspect ratio image inspired by cheerful and bright animation techniques. In the central part of the image, depict two speech bubbles with symbols evoking AI language models. One of the speech bubbles is slightly larger and glowing, indicating its victory in a friendly competition. In the background, show a score chart representing Chatbot Arena, with rising and falling lines, symbolizing the shifting power dynamics in the AI language model space. On the periphery, sketch abstract symbols of ChatGPT and Google's Gemini Advanced as spectators, signifying their presence in the competition.

Model bahasa besar (LLM) Claude 3 Opus milik Antropic telah melampaui GPT-4 milik OpenAI di Chatbot Arena untuk pertama kalinya, menandai momen penting dalam bidang model bahasa AI. Kemenangan Claude 3 atas GPT-4 telah menarik perhatian di media sosial, dengan pengembang perangkat lunak Nick Dobos men-tweet “RIP GPT-4.” Chatbot Arena, yang dijalankan oleh Large Model Systems Organization (LMSYS ORG), adalah sebuah platform di mana pengguna menilai output dari dua LLM yang tidak berlabel, membantu menghitung “terbaik ” model secara agregat dan mengisi papan peringkat. Hal ini sangat penting bagi para peneliti yang kesulitan mengukur performa chatbot AI karena hasil yang berbeda-beda. Munculnya Claude 3 telah menyebabkan beberapa pengguna mengganti ChatGPT dalam alur kerja harian mereka, yang berpotensi berdampak pada pangsa pasar ChatGPT. Selain itu, Gemini Advanced dari Google mendapatkan daya tarik di ruang asisten AI, sehingga menimbulkan persaingan bagi OpenAI. Meskipun demikian, OpenAI sedang bersiap untuk merilis penerus utama baru untuk GPT-4 Turbo, kemungkinan bernama GPT-4.5 atau GPT-5, yang mengindikasikan bahwa ruang model bahasa AI akan terus penuh dengan persaingan dan perombakan yang menarik di papan peringkat Chatbot Arena di masa depan.

Artikel lengkap

Tinggalkan Balasan