Semalt: Jak funguje Wiki v různých jazycích?

Oliver King, Semalt Customer Success Manager, říká, že Wikipedia má rozsáhlou škálu dat, článků a obsahu v různých jazycích, a editoři jsou povzbuzováni k vytváření chybějících článků v této obrovské encyklopedii. Lze s jistotou říci, že Wikipedia existuje ve více než třech stech jazycích, ale většina z nich je neúplná a relativně malá. Lidé ze všech částí světa denně navštěvují Wikipedii a čtou si více než 300 jazykových vydání. Někteří z nich hledají konkrétní články a obsah napsaný stovkami až tisíci dobrovolných spisovatelů, kteří jsou zodpovědní za budování a udržování této slavné a bezplatné encyklopedie. Návštěvníci Wikipedie většinou prohledávají články v anglickém jazyce a ostatní jazyky představují 30 milionů záznamů Wiki.

Demokratizujte přístup ke znalostem

Aby pomohli spisovatelům a redaktorům různých jazykových komunit zhodnotit chybějící články, počítačoví experti z nadace Wikimedia Foundation a Stanford úspěšně vytvořili některé nástroje. Jeden z nich pomáhá identifikovat důležité články, které ještě nejsou k dispozici v konkrétním jazyce. Redaktoři poté použijí tato doporučení k vytvoření nových článků. Pokud jsou editoři a spisovatelé vícejazyční, je velmi snadné najít články ve druhém jazyce a překládat je do místního jazyka pro čtenáře Wikipedie.

Tento systém tedy nejprve identifikuje editora Madagaskaru, který chce psát ve francouzském jazyce, a požádá jej, aby vyplnil chybějící části článku a nechal jej zveřejnit na malajské Wikipedii. Tímto způsobem mohou editoři vytvářet články pro různé lidi na světě, což zase může ovlivnit celkový dojem uživatele.

Výzkumníci nadace Wikimedia Foundation Leila Zia a Ellery Wulczyn spolupracovali se studentem Stanfordské univerzity Robertem Westem, aby představili zprávu na mezinárodní světové webové konferenci v Montrealu. Podle nich má Wikipedia velké množství dat a mezi jejími články existuje silný vztah.

Vědci začali vytvářet seznamy článků v různých jazycích a křížové odkazy na seznamy, aby zjistili, které články v jakých jazycích chybí. Poté odhadli význam všech chybějících článků na základě geografického a kulturního významu. Jejich cílem je co nejdříve zveřejnit chybějící články a získat je v lepším pořadí.

Zapojení mezer

Vědci testovali předpoklad s řadou experimentů. Zahájili projekt více než 4 miliony článků, které byly napsány v anglickém jazyce, a zjistily, že ve francouzské části Wikipedie chybí více než 1,5 milionu článků. Odborníci poté vybrali 300 000 důležitých článků v anglickém jazyce a přeložili je do francouzského jazyka. Články byly rozděleny do tří hlavních skupin po více než 100 000 článcích a byly předány nejlepším a nejzkušenějším editorům. Do experimentu byly zapojeny dvě hlavní skupiny šesti tisíc editorů a spisovatelů, kteří provedli několik úprav ve francouzském a anglickém jazyce do dvanácti měsíců před ukončením experimentu. V červnu 2015 dostali všichni editoři e-mail s upozorněním na jedinečné chybějící články a byli požádáni o překlad celého seznamu článků z angličtiny do francouzštiny. O měsíc později odborníci přistoupili k tvorbě chybějících článků a zjistili, že by mohli zvýšit míru tvorby organických článků. Na základě všech těchto výsledků nadace Wikipedia Foundation vyvinula několik experimentálních nástrojů, ve kterých mohou editoři a spisovatelé najít mezery ve svých místních jazycích a poukázat na konkrétní položky.