Мембрана от информационного цунами
Анатолий Гуляев (ВМК МГУ имени М.В.Ломоносова): «Спасти пользователей от избыточной информации может только искусственный интеллект»
Пока умные системы не упорядочили большие данные в Сети, эту роль в числе прочих выполняет Википедия, считает заместитель декана ВМК МГУ имени М.В.Ломоносова по информационным технологиям Анатолий Гуляев. По словам собеседника RSpectr, универсальная интернет-энциклопедия является идеальной моделью и прототипом искусственного интеллекта (ИИ), созданного людьми вручную в ожидании соответствующих технических средств. По мнению эксперта, поисковые системы лишь на заре их появления казались инструментами организации информации, а сегодня стали источниками огромных массивов данных, сильно засоренных рекламой, в том числе контекстной. Также он рассказал и о 20-летии Википедии, которое интернет-общественность отмечает 15 января 2021 года.
RSpectr: Какова роль Википедии в современном мире и как МГУ празднует ее день рождения?
Анатолий Гуляев (А.Г.): Википедию сегодня можно приравнять к самым могущественным СМИ в мире, и это объективная реальность, подтверждаемая статистикой посещения портала читателями.
20 лет Википедии – знаковая дата. МГУ имени М.В.Ломоносова встречает этот юбилей достойно. К нему приурочено начало межфакультетских курсов на факультете ВМК «Введение в Википедию». Программа изучения интернет-энциклопедии в таком объеме впервые реализована в России.
В прошлом году нами был создан прототип Вики-системы МГУ, который в форматах Википедии готов принять весь огромный объем данных, которыми владеет и генерирует сообщество Московского университета. Надеемся, что этот шаг поможет их сохранить и приумножить, а также даст автономную площадку для экспериментов в области использования вики-систем.
__________
СПРАВКА
Анатолий Викторович Гуляев
заместитель декана ВМК МГУ имени М.В.Ломоносова по информационным технологиям
- Доцент кафедры суперкомпьютеров и квантовой информатики (СКИ).
- Кандидат физико-математических наук.
- Заведующий лабораторией программного обеспечения вычислительного практикума.
- Работает в МГУ с 1977 года. Область научных интересов: системное программирование, защита данных, неоднородные сетевые операционные системы. Автор более 15 научных работ.
- Заслуженный преподаватель Московского университета (2007 год).
- Награжден медалью «В память 850-летия Москвы» (1997).
RSpectr: Расскажите о развитии самой большой сетевой энциклопедии.
А.Г.: Становление происходило стремительно и динамично. Секрет в том, что создателям удалось соединить в проекте несколько составляющих (цифровая основа хранения данных, система wiki, система гипертекста), симбиоз которых дал невиданный результат, обеспечивший непрерывный рост площадки, которая с определенного момента уже не зависела от отцов-основателей.
Вдохновитель Википедии предприниматель Джимми Уэйлс, помимо финансирования, сделал два невероятных поступка в отношении проекта.
Первый – полный отказ от размещения рекламы в пространстве Википедии. Этот шаг заставил многих сподвижников уйти в другие подобные вики-проекты. Кстати, следует отметить, что ни один из этих проектов не выжил.
Второй – это отказ Уэйлса от всех прав на Википедию (уже в момент ее расцвета) и передача их сообществу википедистов через некоммерческий фонд Викимедиа.
RSpectr: Смерть интернет-энциклопедии предрекают ежегодно, каково ваше мнение на этот счет?
А.Г.: Человечество любит предсказывать гибель разным явлениям, имеющим глобальный характер: Европе, США, Википедии.
В эпоху накатывающего на нас информационного цунами больших данных мы вырабатываем защитную реакцию по упрощению представлений о явлениях и предметах окружающего мира. Например, постулируя, что Википедия – просто сетевая энциклопедия, и основное, что нам достаточно про нее знать, – это то, что править ее статьи может каждый. С такими представлениями прогноз, как правило, оказывается неточным.
Если основываться на этих двух постулатах, то, вероятно, можно было бы ожидать конца развития ресурса очень скоро. К счастью, все не совсем так, что дает основания надеяться на долгое и устойчивое существование Википедии.
Ее устойчивость в том, что это не совсем и не только энциклопедия.
Правильнее говорить о проекте Викимедиа, в котором Википедия является одним из элементов, хотя и значимым
Это глобальный проект, включающий в себя множество направлений.
Мало кто знает, например, что в составе Википедии существует система обучения новых участников умению работы в пространстве ресурса, языку вики-разметки и правилам взаимодействия с сообществом. К каждому вновь зарегистрированному пользователю присоединяют опытного куратора, готового ответить на его вопросы и помочь в случае возникновения трудностей. Существует система инкубатора, где можно писать статьи, привлекая к помощи опытных экспертов.
Продвижение на новый уровень иерархической системы Википедии – это не просто назначение, а сдача экзамена перед другими членами сообщества на умение работы с информацией, владение инструментами Викимедиа, умение излагать мысли и доказательство уравновешенности характера при взаимодействии с коллегами.
Все это происходит одновременно на пространствах более 300 языковых Википедий.
Чистая правда то, что правку может внести каждый человек, но есть также дополнительная истина, что подтвердить эту корректуру имеет право только опытный участник, прошедший достаточно строгий отбор членов сообщества. Чем достигается требуемая достоверность информации.
Интернет-энциклопедия живет и развивается, опираясь на пять столпов, которые описываются в большом количестве правил, регулирующих деятельность участников, но самым удивительным является последний принцип – «В Википедии нет строгих правил». Он говорит о том, что все правила ресурса вторичны по отношению к его целям. Поэтому, если какое-либо правило мешает вам улучшать Википедию или поддерживать ее функционирование, игнорируйте его. И если сообщество упирается в тупик, то способно изменить правила для его преодоления.
RSpectr: «Яндекс.Дзен» в настоящее время набирает все большую популярность и лояльность аудитории. Возможно ли предположить, что данный сервис рано или поздно составит прямую конкуренцию Википедии?
А.Г.: Этот вопрос напоминает волнующее многих сомнение из детства: «Кто сильнее кит или слон?» Они совершенно разные и существуют в разных средах.
В современном мире, захлестываемом цифровой информацией, есть два типа систем:
– генерирующие потоки слабосвязанных данных;
– обеспечивающие интеллектуальную обработку и фильтрацию данных, поступающих к обществу.
Если поисковые системы, социальные сети и упомянутый вами «Яндекс.Дзен» относятся к первому виду систем, то Википедия – к редчайшему второму типу.
В целом можно сказать, что Википедия является идеальной моделью и прототипом ИИ, созданного людьми в ожидании соответствующих технических средств, которые, как уже было в предыдущей истории человечества, всегда отстают от мощи человеческой мысли. Приходится решать задачи вручную.
Самую большую воронку по краже человеческого времени жизни создал сам человек в ходе процесса автоматизации. Она называется Big Data
Рост объема информации в мире, при переходе от аналогового вида ее распространения и хранения к цифровому, имеет гиперболический характер.
В век больших данных википедисты выступают хранителями времени для общества. А сама Википедия – мембраной, защищающей общество от огромного информационного потока, обрушивающегося на каждого из нас по бесчисленным каналам связи.
В сети Интернет основными источниками больших данных, сильно замусоренных прямой, а в последнее время – и контекстной рекламой, являются поисковые системы, которые на заре их существования казались инструментами упорядочивания информации.
Примером избыточности является классический тест: на запрос «что такое Бразилия» любая поисковая система предложит вам не менее 50 млн ответов. При обращении с таким вопросом к ИИ должен был бы последовать один лаконичный ответ: «Бразилия – это государство в Южной Америке с одноименной столицей». Пока ИИ на подходе, на первую линию защиты общества от мусорного потока больших данных заступила Википедия, выбирающая из него наиболее важную информацию и формируя на ее основе оптимальные выдержки, максимально соответствующие запросам.
Сообществу википедистов приходится следить за отсутствием даже ростков некорректных данных, проникающих в основное пространство Википедии. Самым очевидным излишком является реклама. Ее сила многократно возрастает из-за того, что присутствие любой информации в Википедии считается значимым просто вследствие ее основных правил. Раз сведения попали в Википедию и не удалены, значит, априори значимы и достоверны, пока не будет доказано обратное.
Википедистов можно назвать рыцарями ордена хранителей времени, которым приходится вручную поддерживать систему отбора и формирования оптимальной информации, разрабатывать и испытывать алгоритмы и правила такой работы.
RSpectr: Можно ли доверять Википедии?
А.Г.: Да. Безусловно. И это подтверждается объективно растущим числом ее читателей изо дня в день, как и числом упоминаний Википедии в СМИ. Люди своим посещением голосуют за признание достоверности. На плохое не ходят. Значит, эффект от посещения положительный.
RSpectr: Как Вы считаете, возможно ли полностью перевести все накопленные обществом знания в электронный формат?
А.Г.: Человечество в настоящее время как раз занято тем, что оцифровывает остатки аналоговой информации, и процесс развивается по гиперболе. Это происходит не без издержек, поскольку вместе с необходимыми данными норовит вписаться паразитная лишняя информация. Человек создал монстра Франкенштейна – Большие цифровые данные, которые уже растут сами по себе при помощи ботов и без участия человека.
Теперь нужно срочно выстраивать защиту, и времени на это остается немного.
Спасти нас может только реальное создание системы ИИ, главной функцией которого является защита человека от избыточной информации. Вероятно, такая формулировка главной задачи ИИ окажется неожиданной для читателей, но это чистая правда. В ином случае нас затопит информационный поток.
Дело с большими данными зашло так далеко и развивается столь быстро, что, похоже, поможет нам только чудо, то есть – квантовый компьютер, создание которого уже не за горами.
От лишней информации мы защитимся, но одновременно появятся новые проблемы. Не буду распространяться на эту тему, а только намекну, вспоминая слова одного уважаемого мной разработчика из IBM: «Быстродействие квантового компьютера столь высоко, что вам не нужно давать ему задачу расшифровать восьмеричный код, считайте, что он его уже знает». А дальше можно размышлять об изменениях, которые это вызовет в мире.
RSpectr: Как Википедия борется с фейками? Если писать на платформе, по сути, может любой желающий, значит, нужно перепроверять данные, которые они оставляют?
А.Г.: Борьбой с ложной информацией занимаются опытные редакторы, носящие название «патрулирующие», которые имеют право утверждать окончательный текст статьи. Они проводят проверку текстов статей Википедии, руководствуясь двумя первыми столпами ресурса:
– должны храниться только проверенные данные, опирающиеся на авторитетные источники;
– о нейтральной точке зрения при изложении материалов, что означает, что при наличии различных мнений в статьях Википедии не должно отдаваться предпочтение какому-либо одному из них, а нужно представить оба.
До проверки патрулирующими в верхней строчке статьи присутствует надпись: «Текущая версия страницы пока не проверялась опытными экспертами…» Можно проверить в этом случае смущающую вас информацию, но в подавляющем числе случаев она окажется достоверной.
Добросовестность авторов обеспечивается вики-системой, фиксирующей все действия участников, которые, как правило, очень дорожат своей репутацией.
RSpectr: В свое время Instagram получил второе дыхание, создав формат stories. Какие, на Ваш взгляд, новые инструменты может предложить пользователям Википедия?
А.Г.: Instagram относится к первому типу систем цифровой эпохи, генерирующих малосвязанные цифровые данные.
Википедия, в принципе, уже все основные форматы и инструменты предъявила обществу. На их базе можно создавать и развивать новые чудесные проекты. Часть таких проектов уже ведет фонд Викимедиа.
Как мы говорили, мало кто знает, что Википедия – один из нескольких проектов фонда Викимедиа. Перечислим хотя бы часть этих проектов:
– Викитека – проект, имеющий целью создание постоянно пополняемой библиотеки свободно распространяемых текстов на всех возможных языках.
– Викисловарь – свободно пополняемый многофункциональный многоязычный словарь.
– Викиучебник – веб-сайт для коллективного написания учебной литературы.
– Викиверситет – проект по реализации новых форм интерактивного образования.
– Викиновости – международное информационное агентство и открытое новостное интернет-издание, ведущееся группой добровольцев.
– Викитревел и Викигид – проекты, связанные со сферой туризма, включая создание путеводителей различных типов.
Не все перечисленные проекты равноценны, но некоторые из них обязательно прорастут.
Фото: предоставлено А.В.Гуляевым