Důmyslný deepfake telefonát manželů Zelenských

illustration
Na facebooku koluje nahrávka údajného telefonátu mezi Volodymyrem Zelenským a jeho manželkou Olenou. Zelenskyj v nahrávce nadává na západní politiky, kteří mu údajně vyhrožují, že ho nahradí, pokud neporazí korupci na Ukrajině. „Čistý nesmysl,“ říká podle českých titulků Zelenskyj, „bez korupce by se celá administrativa zhroutila.“ Nahrávka je podle všeho ale podvrhem, který rozšířily proruské kanály.

Meta fact-check 16. prosince 2023

Na sociálních sítích se šíří nahrávka, která údajně zachycuje telefonát mezi Volodymyrem Zelenským a jeho manželkou Olenou. Ti na audiozáznamu mluví o nátlaku ze strany západních politiků, především amerického prezidenta Joea Bidena, kteří poskytování vojenské pomoci Ukrajině podmiňují vymýcením místní korupce. 

Zelenskyj do telefonu například říká, že je Biden připravený jej nahradit někým jiným, pokud nedostane situaci s korupcí pod kontrolu (video, 0:20). V dalších větách si pak stěžuje, že to není možné provést, protože „bez korupce by se celá administrativa zhroutila.“ Součástí korupčního systému jsou totiž podle něj na Ukrajině úplně všichni a nikdo ve válce nechce bojovat zadarmo.

Zelenskyj také na nahrávce před svou manželkou nazývá Antonyho Blinkena, amerického ministra zahraničních věcí, klaunem. Nelichotivými tituly následně Zelenskyj označuje i Joea Bidena, německého kancléře Olafa Scholze a čelní představitele Polska – prezidenta Andrzeje Dudu a nyní již expremiéra Mateusze Morawieckého. „Do p***le s takovými spojenci,“ říká hlas Zelenského na audiozáznamu (video, 1:38). 

Nahrávka a způsob, kterým se na internetu začala šířit, však působí podezřele. Ačkoliv se hlasy ukrajinského prezidenta a první dámy na první poslech zdají být pravé, při podrobné analýze jejich řeči a obsahu jejich konverzace celá nahrávka působí nepřesvědčivě.

Zdařile napodobené hlasy prezidentského páru 

Intonace obou osob v nahrávce napovídá, že se jedná o audiozáznam vytvořený umělou inteligencí. Ačkoliv současná technologie dokáže často zdařile napodobit hlasy reálných osob, zbavení se strojové výslovnosti a dokonalé napodobení emocí je stále pro umělou inteligenci náročné.

Způsob, kterým manželé mluví (video, 0:03–0:13), se liší od jejich skutečné melodie řeči (video). Oba mluví pomaleji a nepřirozeně. Především nadávky, kterými Zelenskyj adresuje západní politiky, jsou vyslovené bez emocionálního zabarvení. Toho si lze všimnout například v momentě, kdy nevybíravými výrazy častuje Olafa Scholze (video, 1:39–1:41) a později Andrzeje Dudu s Mateuszem Morawieckým (1:53–1:56). Zelenského věty taky působí, jako by četl předem připravený text (video, 1:28–1:30). 

Doplňme, že podobně jako u deepfake videí, která obsahují i přímo obraz, není v současnosti příliš složité podobný podvrh audiozáznamu vytvořit. Do nástrojů využívajících umělou inteligenci v podstatě stačí jen nahrát existující záznam hlasu daného člověka a poté zadat příslušný text, který umělá inteligence tímto hlasem přečte.

Nahrávku jsme zároveň podrobili kontrole pomocí nástrojů k rozpoznání uměle vygenerovaných nahrávek DeepFake Detector, ElevenLabsAI or Not, ovšem bez jednoznačného výsledku. 

Chybí původ nahrávky

S přibývající technickou dokonalostí deepfake nahrávek a videí je obtížné hodnotit pravost nahrávky čistě na základě její analýzy samotné. Věnovali jsme se tedy i tomu, zda účty, které nahrávku sdílely, uvedly nějaký zdroj, od kterého mohla realisticky pocházet.

Podle webu Myth Detector, který se stejně jako Demagog.cz zabývá fact-checkingem, se záznam na internetu poprvé objevil 6. prosince 2023 na stránce The Intel Drop. Ta video s nahrávkou publikovala i na svém YouTube kanálu, z platformy bylo ale odstraněno kvůli porušení pravidel. 

The Intel Drop na konci svého článku uvádí, že „není jasné, odkud nahrávka pochází“. Anonymní autoři v textu usuzují, že „kvůli klesající popularitě“ Zelenského mohla uniknout z iniciativy jak ukrajinských, tak západních zpravodajských služeb. Možnost, že by se mohlo jednat o podvrh, článek naopak vůbec nezmiňuje.

Pro úplnost je vhodné dodat, že The Intel Drop šířil nepravdivé informace už v minulosti. V březnu 2023 například zveřejnil falešnou zprávu, že ruská armáda na Ukrajině údajně zničila tajný bunkr Severoatlantické aliance, ve kterém byly stovky důstojníků ze zemí NATO.

V českém prostředí se nahrávka poprvé objevila na platformě Telegram. 7. prosince ji sdílel například telegramový kanál s názvem MG – zprávy 24/7 bez cenzury!, tehdy ještě ve verzi s anglickými titulky, která se původně objevila na webu The Intel Drop. Poté se video na telegramu šířilo na dalších českých i slovenských účtech.

Větší úspěch na českých sociálních sítích ale nahrávka zaznamenala až s českým překladem titulků. Podle textu na konci videa (video, 1:56-1:59) jej vytvořil portál AENews, který tuto verzi zveřejnil ve svém článku 8. prosince 2023.

Zmíněný server, jinak také známý jako Aeronet, je dlouhodobě řazen mezi české dezinformační weby. Správce českých domén CZ.NIC ho v únoru 2022 zařadil i na seznam „webů šířících dezinformace“, které „ohrožují naši národní bezpečnost“ v souvislosti s vypuknutím rusko-ukrajinského konfliktu. Ačkoliv CZ.NIC později blokaci ukončil, portál je za dezinformační web označován i doposud. 

Aeronet sice v titulku uvádí, že autenticita nahrávky „nebyla potvrzena a může jít o podvrh“, i přesto se ale video odtud dále rozšířilo na sociální sítě a jiné dezinformační portály.

Žádné z médií a účtů, které nahrávku šířily, tedy neuvádí zdroj, ze kterého by realisticky mohla pocházet. Nahrávka se navíc zřejmě poprvé objevila na webu média, které opakovaně sdílelo pro-ruské smyšlené zprávy. I z toho můžeme dovozovat, že jde o nápodobu hlasů a nikoli o skutečný záznam rozhovoru manželů Zelenských.

Závěr

Záznam zachycující údajný telefonát, ve kterém Volodymyr Zelenskyj mj. nadává západním politikům, na první poslech může působit důvěryhodně. Podle podrobnějšího rozboru je ale pravděpodobné, že se jedná o důmyslný podvrh vytvořený umělou inteligencí. Způsob, kterým na nahrávce Zelenskyj a jeho manželka Olena mluví, se liší od jejich skutečné melodie řeči. Oba hovoří pomaleji, nepřirozeně a bez emocionálního zabarvení řeči. Navíc není dohledatelná jakákoli informace o původu nahrávky. V rámci naší spolupráce se sociální sítí Facebook jsme tedy toto video označili jako pozměněné.