Test OCR

Stejný postup jako u stránky Olgy Hudečkové: tlačítko „Načíst PDF“ otevře výběr souboru a po výběru se přepis spustí sám. Tři modely pro srovnání: Gemini Flash, dražší GPT-4o a levnější GPT-4o mini. Tokeny a odhad ceny jsou součet za všechny stránky — u OpenAI vision zahrnuje prompt i image tokeny; ověřte u faktur Google AI a OpenAI.

Gemini
Google Generative Language API, model gemini-2.5-flash (stejně jako výchozí OCR v projektu).

Přepis

GPT-4o
Chat Completions, model gpt-4o — stejná cesta jako záložní OCR v projektu.

Přepis

GPT-4o mini
Levnější multimodální model OpenAI — vhodné pro srovnání kvality a ceny oproti GPT-4o.

Přepis