Když se před dvěma lety objevil GPT 3.5, nebylo pochyb o tom, který chatbot je nejlepší na světě. Za tu dobu se velkých jazykových modelů objevily stovky a přibyly multimodální modely.
Co se ovšem nezměnilo, jsou benchmarky, které jen málo odrážejí využití AI v reálném světě. S řešením přišla ...