Для генерації субтитрів YouTube використовує технологію машинного навчання

351

Від автора: YouTube удосконалив систему автоматичної генерації субтитрів. Тепер вона вміє розпізнавати не тільки людську мову, але і навколишні звуки. Розширення можливостей функціоналу орієнтоване, насамперед, на користувачів з порушенням слуху.

Поки система автоматичної генерації субтитрів «навчилася» розпізнавати всього кілька «зовнішніх» звуків: грає музику, сміх і оплески. Для аналізу аудіодоріжки використовуються алгоритми, створені на основі технології машинного навчання.

Відзначається, що з часом масштаби розпізнаваних звуків будуть розширюватися. В найближчому майбутньому система зможе виділяти із загального аудіопотоку дзвін, стукіт і гавкіт собак. Але для цього буде потрібно якийсь час, поки алгоритми системи самостійно не навчитися їх розуміти.

Функціонал для створення субтитрів до публікованим роликам з’явився у YouTube в 2006 р. Через три рік була запущена система автоматичної генерації субтитрів. В 2012 вона стала доступна і для російськомовних видавців контенту.