Apakah Anda masih lebih pintar dari AI? Ada cara untuk melacaknya

Create a 3:2 ratio illustration in a cheerful and bright format. Picture a modern, technologically advanced setting that reflects the future of artificial intelligence. Include a leaderboard showcasing various AI models, each labeled with symbols rather than names. Show researchers observing the leaderboard and evaluating the AI models. They should be depicted as a mixed group, including a Hispanic female and a Black male researcher for inclusion. In the background, subtly illustrate the development and testing of AI models, maybe through lines of code or futuristic digital displays. Imaginatively represent the cited 'Chatbot Arena', perhaps as a lively virtual arena where chatbots engage, spectators vote, and a giant scoreboard displays the results. Remember, the entire scene should not be in a specific artist's style but should be vivid, positive and light.

Pemeringkatan model AI yang dibuat oleh komunitas telah menjadi populer dalam beberapa bulan terakhir, memberikan wawasan waktu nyata ke dalam persaingan di antara perusahaan-perusahaan teknologi besar untuk mendapatkan supremasi AI. Peringkat ini melacak model AI yang paling canggih berdasarkan kemampuan mereka untuk menyelesaikan tugas-tugas tertentu. Sementara pendatang baru seperti Gemini dari Google dan Mistral-Medium dari Mistral AI telah menarik perhatian, GPT-4 dari OpenAI terus mendominasi. Peringkat tersebut didasarkan pada tes atau tolok ukur yang mengukur kinerja AI di berbagai bidang seperti pengenalan suara. Namun, tolok ukur ini tidak sempurna dan para peneliti terus berupaya memperbaikinya. Papan peringkat juga mengungkapkan jumlah model AI yang sedang dikembangkan, dengan ribuan model yang sedang dievaluasi dan diberi peringkat. Beberapa model telah melampaui kinerja manusia pada tes tertentu, yang mengindikasikan kejenuhan dan kebutuhan akan tolok ukur baru. Para peneliti sedang mengeksplorasi cara-cara kreatif untuk mengevaluasi model bahasa, termasuk masukan dari manusia dan penilaian holistik. Chatbot Arena, sebuah papan peringkat yang menggunakan evaluasi manusia, telah mendapatkan popularitas dan memungkinkan pengunjung untuk mengajukan pertanyaan dan memberikan suara pada respons chatbot terbaik. Meskipun tolok ukur memiliki keterbatasan, mereka masih mendorong inovasi di antara para pengembang AI yang berusaha untuk meningkatkan model mereka dan tetap menjadi yang terdepan di bidangnya.

Artikel lengkap

Tinggalkan Balasan