Megogo будет искать мат в фильмах с помощью нейросети
Видеосервис в течение месяца запустит программу-робота, в основе которой лежит многозадачная нейронная сеть. Она сможет распознавать четыре группы нецензурных слов из списка Роскомнадзора и производные от них, а также сцены курения, употребления алкоголя, а в перспективе – сцены насилия.
Программа должна будет проанализировать библиотеку Megogo и выявить контент с матом и указанными сценами, чтобы перекрыть ее звуковым сигналом или проставить маркировку «18+», сообщили «Ведомости».
Многозадачная нейронная сеть базируется на двух существующих решениях. Первое – автономный инструмент для распознавания речи с открытым исходным кодом Vosk.
С применением принципов машинного обучения этот инструмент дорабатывается, уже и сейчас распознает нецензурную брань, но иногда идентифицирует как мат и части слов, говорит гендиректор Megogo Виктор Чеканов. К примеру, к таковым, по его словам, робот пока может отнести словосочетание «не психуй».
Второе решение – система визуального распознавания на основе нейросети. Здесь одна из самых сложных задач, как отмечает гендиректор Megogo, обучить робота распознавать сцены насилия, так как даже человек не всегда способен определить степень допустимой на экране жестокости.
Программа через год сможет самостоятельно идентифицировать запрещенный к распространению контент, но пока участие человека в процессе необходимо, подчеркнули в компании.
Изображение: Pixabay.com