Titulky za pomoci AI pro zvýšení zhlédnutí vašich videí zdarma

Návod, jak vytvořit titulky pro vaše videa pomocí umělé inteligence, abyste zvýšili dosah a zpřístupnili obsah široké veřejnosti, a to bez přepisování či znalostí pravidel titulkování.

Pouhý vygenerovaný text totiž nejsou ani zdaleka titulky, i když tomu různé generátory titulky říkají. Je třeba dodržet alespoň základní věci, aby to titulky byly. Zejména délky řádků. Automaty totiž často generují řádky 45-80 znaků a pokud se titulky ručně nezalomí, v přehrávači se potom zaplní „nadoraz“ řádek 80 znaků, zalomí se text a na druhém řádku jsou 3 znaky, což se  divákům, kteří nejsou masochisté,  čte hodně špatně. Hodnoceno jako ve škole - nedostatečné.

Řádky by měly být zhruba stejně dlouhé a neměly by být delší, než 42 znaků na řádku (včetně interpunkce a mezer) a měly by být členěny po logických celcích. V televizi to je dokonce jen 35 znaků. Tento návod nemá žádné ambice vysvětlovat pravidla titulkování (i když něco tu bude). Technické a funkční parametry titulků jsou zmíněny v článku na https://medium.seznam.cz/clanek/kochlear-cz-technicke-a-funkcni-parametry-titulku-pro-osoby-se-sluchovym-postizenim-23275 Vytvořené titulky potom stačí přiložit k vašemu videu, nejlépe ve formátu SRT.

Toho, kdo běžně netitulkuje, odradí hned zkraje pracnost výroby titulků. Ale nějaké ty „základní“ (lepší, než žádné), ale i perfektní, se dají vyrobit pomocí AI. Budete potřebovat pouze Subtitle Edit (freeware) a VLC Player (freeware).

––ještě trochu osvěty––
Víc než neslyšící používají titulky diváci, kteří slyší. Slyšící diváci často používají titulky v prostředí, kde je hluk, například v letištní hale, nebo naopak v situaci, kdy musí být zachováno ticho a zvuk televizoru nebo videa je vypnutý, třeba v čekárně u lékaře, ale i v malém bytě, pokud nemají být další osoby zvukem z televizoru nebo videa rušeny. Někdo používá titulky při sledování videa během jízdy hromadnou dopravou. Titulky jsou však užitečné i pro ty, kteří nejsou zdatní v daném jazyce a porovnávají jeho mluvenou a psanou formu. Článek BBC z roku 2006 http://news.bbc.co.uk/2/hi/uk_news/magazine/4862652.stm.
––/konec osvěty––

Obrázky v tomto návodu se zobrazí v původní velikosti kliknutím na ně.

1) A jdeme na to. Spusťte Subtitle Edit.

rozhraní Subtitle Edit

2) V roletce „video“ otevřete soubor s videem (v nastavení SE musí být nastavena cesta k VLC Playeru).

rozhraní Subtitle Edit

3) Nastavte si Subtitle Edit (hlavně těch 42 znaků na řádek a rychlost čtení).
nastavení Subtitle Edit

4) Opět roletka „video“ a položka „audio to text (Whisper)".
generování titulků pomocí Whisper

5) Nastavte si Engine CPP, jazyk čeština a model large. S modelem large to sice mnohem déle trvá, zato však přepisuje hodně přesně, a to většinou i nespisovná a neznámá slova. U všech tří položek si chce poprvé Subtitle Edit něco stáhnout.
nastavení Whisper generování

6) Já mám 15 let starou kraxnu (a to ještě obyčejný kancelářský stroj). Jdu si udělat kafe, odhad je 65 minut (video má 17 minut). U dvouminutového videa to bylo asi 6 minut.
odhad doby generování titulků

Snad ho nezavařím.
snad ten počítač nezavařím

7) A máme vygenerováno.
A máme vygenerováno

 

Úskalí pravopisu

Nikdo samozřejmě nechce dávat na web titulky s chybami a překlepy. Můžete použít zabudovanou kontrolu pravopisu v Subtitle Edit. Je to však úplně obyčejná „kontrola překlepů“, takže to bude považovat např.: „Udělejte se kontrolu pravopisu“ za dobře. Po takovéto kontrole budete sice mít titulky bez překlepů, ale někdy s nesmysly.
Hodnoceno jako ve škole - dobré.

Mnohem lepší však je použít nějaký nástroj, kde se zkontroluje zároveň i gramatika. Takové titulky už budou školní známkou chvalitebné. Krásně se to dělá třeba ve Wordu (pokud máte k dispozici), nebo v Libre Office (kancelářský balík zdarma). Použít jde také třeba Opravidlo (https://opravidlo.cz/), ale v něm už to není tolik pohodlné.

Aby byly titulky na výbornou

Pokud se nespokojíte se známkou „chvalitebné“, investujte ještě trochu času a práce. Otevřete si soubor s titulky v nějakém editoru, kde jde nastavit počet znaků na řádku (já to neumím nastavit ve Wordu a používám PSPad), kde si nastavte „42“ a upravte zalomení řádků tak, aby měly tzv. „štábní kulturu“.

Neměňte v Subtitle Edit vygenerované časy, tím by se to celé rozhodilo. Pouze osamocená písmena na koncích řádků, zalomení po čárce, seskupení do jednoho řádku krátkých titulků, atd. Přičemž je lepší, když je delší spodní řádek, ale to často nevychází.
kontrola a uprava v PSPadu

 

Titulky na jedničku s hvězdičkou

To jsou takové titulky, které zároveň splňují i „Technické a funkční parametry“ titulků pro osoby s postižením sluchu. Ony už to často jsou ty „z PSPadu“, jelikož když když mluví na videu jeden mluvčí, není třeba dělat uvozovací pomlčky, případně psát zvuky atd.
 

Ladislav Kratochvíl

Klíčová slova: