Benchmarky

Hodnotenie AI modelov na slovenských jazykových úlohách

SkMTEB — Slovak Text Embedding Benchmark

Metrika: Avg Score

Slovak Massive Text Embedding Benchmark - hodnotí modely pre vektorové reprezentácie textu v slovenčine naprieč 31 datasetmi a 7 typmi úloh: vyhľadávanie, klasifikácia, zhlukovanie, preraďovanie, STS, bitext mining a klasifikácia dvojíc.

Úloha: Textové embeddingy

Aktualizované: 23. júna 2026

Slovak ASR Benchmark

Audio

Metrika: WER, CER, DSER

Tento benchmark hodnotí Speech-to-Text (STT) modely na slovenských dátach. Hlavným cieľom je posúdiť výkonnosť dostupných riešení prevodu reči na text špecificky v slovenskom jazyku. Väčšina dostupných zdrojov na túto tému (napr. Open ASR Leaderboard) sa zameriava buď na anglický jazyk, alebo na viacjazyčné datasety zoskupujúce mnoho jazykov, z ktorých väčšina je pre náš prípad použitia irelevantná. Slovenčina zvyčajne nie je zahrnutá v jazykovom mixe alebo tvorí len niekoľko percent hodnotených údajov. Preto prezentujeme robustný benchmark, ktorý sa zameriava na slovenčinu.

Úloha: Automatické rozpoznávanie reči

Aktualizované: 17. júla 2026

skLEP — Slovak Natural Language Understanding Benchmark

Text

Metrika: F1, RER

Slovak Language Evaluation Protocol - prvý komplexný benchmark špeciálne navrhnutý na hodnotenie modelov porozumenia slovenského jazyka (NLU). Zahŕňa klasifikáciu tokenov, úlohy párov viet a klasifikáciu dokumentov.

Úloha: Porozumenie prirodzeného jazyka

Aktualizované: 23. júna 2026