По горячим следам: данные «Юрайта» — вузам и колледжам. Интервью с Иваном Чернышевым
Блоги06.11.2020

По горячим следам: данные «Юрайта» — вузам и колледжам. Интервью с Иваном Чернышевым

Образовательная платформа «Юрайт» кропотливо собирает информацию обо всех активностях своих пользователей. За годы работы у нас накопился колоссальный массив данных, который может служить интереснейшим материалом для образовательной аналитики. Поэтому мы запускаем программу исследований, открытую для каждого российского вуза и колледжа, и приглашаем присоединиться всех, кто хочет работать с Big Data и повышать уровень своего учебного заведения, наблюдая за цифровыми процессами и анализируя их. Мы поговорили о новой программе с IT-директором Образовательной платформы «Юрайт» Иваном Чернышевым и выяснили, что планируется исследовать, какие преимущества дает программа всем участникам учебного процесса, как присоединиться к ней и даже узнали пару лайфхаков по защите личных данных в наш цифровой век.

ОСНОВНАЯ ИДЕЯ?

Основная идея программы исследований — поднять российское образование на новый уровень с применением различных методик доказательной педагогики, используя учебную аналитику. Привлечь к этому исследовательские команды, которых достаточно много, привлечь студентов, аспирантов и всех заинтересованных участников.

В ЧЕМ НЕОБХОДИМОСТЬ ИССЛЕДОВАНИЙ?

Мы много изучаем российский и зарубежный опыт, посещаем конференции — много где проводятся различные исследования, анализ цифровых следов студентов и преподавателей, в том числе по университетам. Также посещали конференции, которые проводят различные поставщики контента, и увидели проблему фальсификации данных и статистик. Плюс у исследовательских команд нет возможности получить все эти данные для полноценного исследования. У университета много поставщиков данных — различных платформ, внутренних и внешних. И в реальности, чтобы понять ситуацию, как учатся их студенты, и построить хорошую аналитику, нужны данные со всех. Мы захотели решить эту проблему, и первым шагом было открытие раздела «Юрайт.Статистика», где есть открытая информация по всем учебным заведениям.

КАКИЕ ЕСТЬ НАПРАВЛЕНИЯ РАБОТЫ И КАКИЕ ВУЗЫ УЖЕ СТАЛИ ПАРТНЕРАМИ «ЮРАЙТА»?

Мы находимся на начальном этапе, только-только начинаем сотрудничать с вузами и другими исследовательскими командами. Сейчас уже запущена проектная работа со студентами.

Первое — мы готовим проекты, связанные с анализом данных для студентов технических специальностей, сопряженных с информатикой, — предоставляем им доступ ко всем обезличенным данным нашей платформы, чтобы они могли проводить свои исследования.

Второе — в планах привлекать не только студентов в рамках учебной проектной работы, но и брать к себе на стажировку аспирантов, которые также получат доступ к нашим данным.

И третье направление — это открытый сервер статистики, куда мы планируем выгрузить все свои данные и дать доступ к этому серверу всем исследователям. То есть любой ученый из любого университета сможет получить доступ к нему и использовать информацию в рамках своих исследований. В будущем планируем подключать к этому серверу и других поставщиков контента.

Сейчас по проектной работе мы сотрудничаем с УрФУ и ВШЭ — это два запущенных проекта. В УрФУ уже состоялись первые встречи со студенческими исследовательскими командами — поставлено на поток. В ВШЭ прошли организационные встречи, в ближайшее время студенты ознакомятся с предложенными проектами на основе наших данных.

КАК ПРИСОЕДИНИТЬСЯ К ПРОГРАММЕ?

Все просто: необходимо обратиться к нам с желанием проектной работы либо проведения практик аспирантов, если им нужен доступ к данным для проведения исследований в области учебной аналитики. Мы оперативно обсудим все организационные вопросы и предоставим доступ и возможность использовать наши данные. Пишите на почту менеджеру проекта Снежане: s.chernakova@urait.ru

ЕСТЬ ЛИ КОММЕРЧЕСКИЙ ИНТЕРЕС ДЛЯ УЧЕБНЫХ ЗАВЕДЕНИЙ?

Сама работа на экономию средств не влияет. Но вполне вероятно, что результаты исследований приведут к экономии средств. Работа с аспирантами подразумевает применение результатов исследований на практике — интеграция построенных моделей, выводов на Образовательную платформу «Юрайт», что должно сказаться на качестве образования. В том числе есть исследования, которые помогут сократить затраты заведений на учебный процесс.

КАКОВЫ ПРЕИМУЩЕСТВА ДЛЯ РУКОВОДИТЕЛЕЙ ВУЗОВ И КОЛЛЕДЖЕЙ?

Со стороны исследователей и конкуренции на рынке исследований — если будут проведены исследования на одних и тех же наборах данных, то 

разные команды смогут проверить результат. Мне кажется, релевантность, корректность результатов и возможность их проверки очень важны в современном научном сообществе. Какую еще выгоду это дает учебным заведениям? Это, скажем так, прикладная работа студента. Работая с нами, они понимают, зачем они это делают, и у них есть реальный шанс создать что-то классное и интересное, что в дальнейшем будут использовать многие университеты в своем учебном процессе. То есть они приложат руку к достаточно серьезной с социальной точки зрения теме образования в России.

ЧТО «ЮРАЙТ» БЕРЕТ НА СЕБЯ?

Сопровождение данного проекта, разъяснение требований студентам, что мы хотим получить и в каком виде, консультирование студентов по структуре баз данных, спецификации, погружение студентов в предметную область — для многих студентов, которые только начинают работать с данными, важно вникнуть в специфику учебного процесса, ведь, будучи учащимися, мы навряд ли мы задумывались, как работают преподаватели, какие у них цели, как они взаимодействуют со студентами, по каким причинам они это делают, как работа отличников с учебными материалами отличается от работы средних студентов и по каким данным это можно отследить.

Возможно, некоторых данных на нашей платформе будет не хватать для определенных целей, хотя ею пользуются достаточно большое количество как преподавателей (порядка 300 тысяч), так и студентов (более 1 млн). Поэтому, если там каких-то данных не хватает, мы можем попросить наших пользователей оставлять в специальных формах обратной связи дополнительную информацию в исследовательских целях — при необходимости мы готовы даже на модификацию платформы, чтобы собирать необходимые данные в нужном формате.

ЧТО ИССЛЕДОВАТЬ?

Успеваемость, анализ траекторий студентов, построение различных эффективных моделей по обучению студентов. Но стоит не забывать, что участниками учебных процессов являются не только студенты, но и сами преподаватели, поэтому мы планируем также исследовать траектории преподавателей. Как они взаимодействуют со своими студентами, какие материалы они используют, анализировать их публикационную активность, анализировать их активность по созданию различных учебных материалов, онлайн-курсов. Это позволит взглянуть на учебный процесс с другой точки зрения и также в дальнейшем, зная, как учатся студенты в каком-то университете в каком-то регионе (можно выбрать разные сегменты), как в этих же университетах, регионах работают преподаватели, насколько они хороши, можно будет опять же анализировать в целом уровень образования в том или ином университете. Это позволит будущим абитуриентам осознанно выбирать место учебы — у них тоже есть определенный интерес к результатам.

С помощью активности преподавателей мы планируем развивать сетевое взаимодействие — это сейчас тоже очень важно. В российском образовании идет много разговоров о сетевом взаимодействии, и не помешает в совместной работе предоставлять друг другу различные материалы. Этот обмен информацией можно развить — например, для студентов, готовящих выпускную квалификационную работу, появится возможность найти себе научных руководителей, экспертов, которые помогут не только в рамках своего университета либо в рамках очень узких договоренностей нескольких университетов, но и в целом по стране, и связаться с ними! У студента будет шанс найти специалиста по своему направлению, который активно работает в онлайне и поможет с темой либо проконсультирует или отрецензирует. Мне кажется, это повысит качество квалификационных работ — рецензирование и проверка работ будут идти несколько более независимо и одновременно с тем широко.

Готовы ли университеты выставлять на всеобщее обозрение свои результаты?

Сразу скажу, что данные обезличены — нет имен, паспортных данных, дат рождения. Определить, что это за человек, по косвенным данным практически нереально. Однако в целом информация об университете или колледже сохраняется. В целом университеты заинтересованы в подобного рода исследованиях — большие университеты внутри себя такие исследования проводят сами, но опять же, как говорил, собрать нужные объемы данных — это тоже одна из непростых задач. Что касается открытия подобных данных на всю страну, открытого доступа — по сути это уже произошло. Мы уже опубликовали по всем учебным заведениям такую сложную статистику использования платформы, статистику повышения квалификации преподавателей.

Возмущения по поводу публикации этих данных не было. Наоборот, вузы и колледжи, которые увидели себя в первых строчках, безумно обрадовались. Они писали об этом, давали интервью в региональных СМИ — для них это хороший инфоповод и способ привлечь абитуриентов. Некоторые университеты, увидев свои колоссальные показатели, осознали, что они — эталон работы в цифровой среде со студентами и преподавателями для всех остальных, а это очень приятно. Мы также приглашаем их представителей на свои мероприятия и конференции — по-моему, для них это еще один способ рассказать о себе. Пиар для учебного заведения — очень важный аспект, и такие открытые данные помогают это делать. Те, у кого данные были не столь хороши, не возмущались — они скорее с нами связывались и выясняли причину произошедшего, которая зачастую просто в низкой активности и вовлеченности.

Соревновательный элемент никогда не исчезал — учебные заведения всегда борются за абитуриентов, за результаты и статус, а еще за внимание студентов, причем не только между собой, но и с другими площадками. Сейчас много онлайн-курсов — Нетология, GeekBrains и многие другие, которые отвлекают студентов от университета, переманивают, и подобные рейтинги, где ВУЗы видят себя по цифровой активности и вовлеченности студентов в учебный процесс в том числе с помощью цифровых технологий, ставят их наравне с такими изначально цифровыми учебными заведениями.

Какие преимущества для студентов разных уровней?

У нас есть обезличенные данные, которые мы собираем по нашей платформе и которые планируем принимать от различных поставщиков контента и других платформ. Также мы двигаемся в сторону уже личных данных — естественно, по согласию студентов и преподавателей о том, чтобы их траектории, цифровые показатели активности были опубликованы на сайте и с ними могли ознакомиться в том числе другие преподаватели и университеты, а также работодатели — это тоже очень важно.

Если пройти по жизненному пути студента — как данные и их анализ могут помочь на каждом этапе?

Абитуриент сможет выбрать себе учебное заведение в соответствии с обобщенной статистикой.

После поступления в университет, благодаря опять же анализу данных, преподаватель сможет несколько персонализировать обучение студентов, чтобы повысить его качество. Обучаясь в институте, студент дает разрешение на публикацию своей цифровой активности на сайте, таким образом открывая свое резюме и портфолио будущим работодателям. Мы считаем, что студентов можно уже на достаточно ранних этапах включать в стажировки, практики. Работодатели с помощью этих открытых портфолио тоже смогут выбирать наиболее квалифицированных и подходящих студентов — по следам они смогут увидеть, что это за студент, готов ли он учиться, насколько быстро он воспринимает информацию, как он социализируется — насколько активно общается с другими одногруппниками и с преподавателями. Так можно составить представление о личных качествах будущего сотрудника и уже в зависимости от этого решить, брать ли его на работу.

На этапе написания ВКР — помощь в поиске специалиста в нужной области.

Идем далее: помимо работы на предприятиях, это исследовательские проекты, интересные для тех студентов, которые планируют быть ближе к науке. Они смогут применить свои знания на реальных проектах по анализу данных.

Аспиранты: учебная аналитика, психометрика, и для этого опять же нужна открытость данных. Исследователям она помогает иметь тот ресурс, на основе которого они смогут проводить свои исследования.

Выпускники: на протяжении всего срока обучения хочется помочь с поиском работодателя и пониманием, чего вообще хочется в жизни. Тут поможет электронное портфолио и новый способ связи с работодателями.

Мы прожили жизнь студента — мне кажется, она становится лучше.

Относится ли все это к студентам колледжей?

Конечно это все относится к среднему профессиональному образованию — это общая история. Причем работа с работодателями, мне кажется, в колледжах даже несколько более актуальна и насущна, потому что колледжи практикоориентированы.

Масштабирование проекта

Мы готовим специальный сервер с обезличенной статистикой по преподавателям и студентам и интеграционную шину, по которой любые поставщики контента смогут также загружать туда свои данные — для исследователей будут доступны колоссальные объемы информации. Для поставщиков контента это возможность сравнивать свои результаты с результатами других платформ и взаимодействовать между собой — не столько соревноваться, сколько кооперироваться и предоставлять аналитику, статистику учебным заведениям в едином формате. Это конкурентная борьба, таким образом каждый видит, на каком месте он находится по цифровой активности, куда ему стоит двигаться, как развиваться в этом плане. В целом мы открыты для сотрудничества с поставщиками контента, коллегами.

Какие риски и сложности были при запуске?

Если говорить о работе со студентами, на это требуется выделять ресурсы — для их консультирования. Сейчас только начало, мы еще увидим ту производительность и тот объем команд, с которыми мы можем работать в университетах, либо будем расширять свой штат специалистов, которые работают с данными и будут работать со студентами. В чем еще сложность по созданию единого сервера статистики и работе со статистикой в целом — спецификация. У каждой платформы все хранится в своем виде: у кого-то только видео, у кого-то и видео, и текст, у кого-то задания, у кого-то они в разных вариантах, у кого-то текстовые страницы HTML. То есть надо искать спецификацию, единый формат данных, с которым мы будем все вместе работать.

Все надо как-то привести к единому формату — это большая работа. Скорее всего она будет осуществляться операционно по мере подключения новых поставщиков данных — расширяться, унифицироваться и масштабироваться.

Можно ли вообще доверять данным и строить на них доказательное образование?

Нерешенный вопрос, кто будет проверять, кто будет сертифицировать данные — это, получается, должны быть какие-то незаинтересованные лица. Конечно, в этом есть проблема. Суть в том, что сертификация аккаунта независимая, проводится зарубежными компаниями, и все должно полностью соответствовать тем стандартам, которые там прописали — получается какой-то замкнутый круг. Вроде один и тот же формат, но сертификацию не проходит. Это вопрос, который пока остается открытым.

Возможно, его можно решить путем анализа обобщенных данных, то есть практически всегда можно посмотреть распределение до тех или иных показателей дисперсии и найти какие-то выбросы и фальсификации. Есть электоральная статистика, где на основе количества проголосовавших в каждом отделении человек строятся различные модели и таким образом находятся фальсификации. То же самое, я думаю, возможно и в нашем случае. Сфальсифицировать данные так, чтобы этого не заметили, — трудоемкая задача. Ходят слухи о том, что некоторые поставщики фальсифицировали, но они просто умножали на определенный коэффициент и это просто было хорошо видно — идет умножение. Если проанализировать данные, можно найти подобные манипуляции.

Как защитить данные?

Во-первых, передавать свои данные только проверенным организациям, которые достаточно долго на рынке, иначе можно столкнуться с продажей баз данных каким-то внешним клиентам — сейчас много где можно в интернете порыться и купить за определенное количество денег список email или телефонов — так они и попадают злоумышленникам. Тут вопрос цифровой этики — кому передавать личные данные. Нужно проверить, как давно зарегистрирована та или иная фирма, посмотреть, с кем они сотрудничают — если с известными корпорациями или государственными учреждениями, то скорее всего платформа с данными обращается аккуратно. Могу подсказать также лайфхак для обладателей почты Gmail. Вы можете при регистрации на сайте после имени своей почты ввести «+» и какие-то свои слова, например, названия сайтов, на которых вы регистрируетесь, — тогда все письма будут приходить на ваш основной ящик с пометкой, откуда они. И если увидите спам, то по адресу после плюса сможете понять, кто сдал ваши данные — это знак к тому, чтобы удалить аккаунт и больше не регистрироваться там.

Есть вопрос, конечно, и именно защищенности данных, которые хранятся на серверах. Сайты должны использовать шифрование, то есть сертификаты и протоколы шифрования — это можно проверить. В строке сайта адрес должен начинаться с https — это значит, что на сайте ведется шифрование, а если буковки s нет, значит протокол отсутствует, и трафик можно перехватить. Например, где-нибудь оставите личные данные, и злоумышленнику не понадобится их даже расшифровывать, он легко их прочитает и использует в своих целях.

На самом деле о безопасности данных можно очень много говорить, но скажу так — быть инкогнито в интернете практически невозможно, потому что все используют социальные сети. Уже поздно, надо было думать об этом раньше.

От Ивана

Я бы не боялся публикации данных и вообще следов, потому что это позволит преподавателям университетов работать с вами в несколько более персонализированном формате. Если бы у меня все время был выбор, давать данные или нет, я бы точно разрешил. Преподаватели не заинтересованы в том, чтобы вам сделать что-то плохое, они заинтересованы в том, чтобы повышать эффективность своей работы и вашу успеваемость. Это качество вашего образования и статус вашего учебного заведения. Доказательная педагогика и анализ данных позволят избавиться от засевшей в головах мысли, что диплом нужен только для галочки — хочется, чтобы диплом действительно отражал уровень знаний.

Читайте также
Комментариев пока нет
Больше статей