В ногу со временем: как в Твери обучают алгоритмам искусственного интеллекта
Tverigrad.ru побеседовал с заведующим кафедрой программного обеспечения ТвГТУ Александром Калабиным и узнал, какими будут новый профиль обучения «Разработка систем искусственного интеллекта» и Лаборатория по исследованию и разработке систем искусственного интеллекта в Тверском политехе. Выяснилось, что в вузе уже не первый год идёт разработка проектов в сфере ИИ.
В 2023 году термин AI (artificial intelligence) – искусственный интеллект (ИИ) был признан словом года по версии британского словаря Collins. И удивляться здесь нечему – способный ответить практически на любой вопрос ChatGPT, рисующая лучше многих Midjourney, болтливые Siri от Apple и Алиса от нашего Яндекса уже перестали быть чем-то сверхъестественным, хотя вышли на рынок совсем недавно. Но, может, над разработкой искусственного интеллекта человечество трудится гораздо дольше, чем нам кажется? Tverigrad.ru побеседовал с заведующим кафедрой программного обеспечения ТвГТУ Александром Калабиным и узнал, что же такое загадочный ИИ и как в этом направлении работает ведущий технический университет Твери.
Неважно, учились ли вы в вузе по Болонской системе или оканчивали специалитет, каждый студент знает, что перед тем, как приступить к практике, необходимо надкусить гранит науки и попробовать на вкус теорию. Поэтому прежде, чем рассказать о разработках тверских студентов и преподавателей и движении ТвГТУ в сторону ИИ, найдём ответ на вопрос: Что же такое искусственный интеллект?
Artificial intelligence
Сегодня мы наблюдаем третий приход искусственного интеллекта в IT, предыдущие два были ещё во второй половине XX века. Но, если копнуть глубже в историю, можно отметить, что первая идея о возможности создания искусственного интеллекта появилась примерно 200 лет назад, и связана она с именем английского математика Ады Лавлейс. Считается, что именно эта женщина стала первой программисткой, при этом не написав ни одной программы. Ада Лавлейс сотрудничала с другим английским математиком Чарльзом Бэббиджем – изобретателем механического аппарата, в котором содержались все элементы современных машин. Однажды Ада Лавлейс высказала идею создания алгоритма вычисления чисел и поставила перед обществом вопрос о том, может ли машина думать.
– Более-менее серьёзно термин «искусственный интеллект» появился в 1950-х годах, – рассказывает завкафедрой ТвГТУ Александр Калабин. – Алан Тьюринг считается главным теоретиком вычислительных процессов, он придумал вычислительную машину Тьюринга, которая является машинно-умозрительной, скажем, виртуальной. Она считается самым мощным вычислительным устройством, которое придумали люди. Все остальные машины пытаются имитировать её работу. Он задался этим вопросом в начале 1950-х годов и сформулировал такой критерий, что машина обладает интеллектом в том случае, когда вы ведёте беседу, не видя собеседника, и не можете определить – человек это или машина.
В наши дни понятие искусственного интеллекта трансформировалось, считает наш собеседник, включив в себя две основные вещи – нейросети и Data Mining (извлечение знаний алгоритмами без участия человека). Самый простой пример Data Mining – задача классификации, которая строится на теории вероятностей. Сегодня задача квалификации активно решается банками, используя настроенные алгоритмы финансовые организации, они могут выносить решения относительно одобрения займов. Алгоритм обеспечивают большим объёмом информации о заёмщиках – добросовестных и нет, после чего он может оценивать потенциальных кредиторов и рассчитывать, с какой долей вероятности они вернут долг. Окончательное решение в таких задачах принимает человек. Кроме классификации, Data Mining направлен на решение задач по кластеризации (объединению объектов с одинаковыми свойствами), а также по поиску сортировочных правил или, если говорить проще, составлению торговой корзины. Так, с помощью Data Mining мерчендайзеры в магазинах могут более грамотно распределять продукцию, ставя рядом товары из одной корзины.
Несмотря на то, что уже не первый раз в своей истории человечество сталкивается с искусственным интеллектом, настоящую популярность ИИ приобрёл именно в XXI веке. Так почему же AI стало словом года лишь в 2023 году, а не 50 или 60 лет назад?
– Есть несколько причин роста популярности ИИ, это развитие аппаратных средств и эволюция центральных процессов, а также произошедшая цифровизация и рост цифровых данных. Почему цифровых? Потому что компьютеры хорошо их обрабатывают, в основном они все работают с числами, – отвечает на вопрос Александр Калабин. – Приведу пример, на Формуле-1 за одну секунду движения машины записывается несколько гигабайт. Возникает вопрос – что делать с таким большим количеством данных? Тогда человек предлагает не писать программы, а использовать алгоритмы Data Mining, отдать данные нейронной сети, которая научиться их обрабатывать и будет делать это без участия человека.
С ростом числа цифровых данных появилась необходимость в использовании искусственного интеллекта, но возможность развития ИИ стала реальной вместе с эволюцией вычислительной техники. Закон Мура (эмпирическое наблюдение, сделанное Гордоном Муром) предполагает, что каждые 18 месяцев количество транзистор-центральных процессоров удваивается, соответственно, очень быстро растёт производительность. Так, если на обычном компьютере обучить нейросеть решать простую задачу по распознаванию картинок уйдёт примерно 10-12 часов, то на видео-картах, которые используют для крипто, это занимает час.
– Построить нейронную сеть можно было бы и раньше, но на её обучение потребовались бы годы, что было бессмысленно. Теперь же появилась техника, позволяющая это делать, – объясняет завкафедрой. – На данный момент на основе нейросетей решены, на мой взгляд, три задачи: распознавание картинок, речи и перевод, который за последние 10-15 лет резко изменился, когда для перевода стали использовать нейросети. Почему это возможно? Потому что хорошие данные для обучения, ведь нейронные сети решают задачи, когда они хорошо обучены. Почему перевод? Оказывается, благодаря ООН и ЮНЕСКО, есть основные документы, которые правильно написаны на пяти языках, на них проходит обучение нейросети, поэтому перевод на них очень хороший.
Говорить о пользе ИИ для мира и целесообразности его активной разработки – ещё рано, считает наш собеседник. По словам Александра Калабина, существуют мнения, что это «дутый пузырь», а оценки западных и американских экспертов свидетельствуют о том, что дальнейшее продвижение в этой сфере экономически неоправданно – финансовые вложения не соответствуют результату. Однако судить, действительно, рано. Ведь сейчас мы можем заметить, что некоторые алгоритмы активно входят или уже вошли в нашу жизнь. Корпорации Microsoft и Oracle получают значимую часть прибыли на основе программного обеспечения, которое относится к ИИ. В большинстве организаций искусственный интеллект пытаются внедрить в работу предприятий, в некоторых случаях благодаря этому решается ряд задач, что увеличивает производительность труда, производство становится дешевле и быстрее.
Популярность ИИ лишь растёт, как и уровень зарплат среди программистов, работающих с нейросетями и большими данными. Финансовое благополучие – одна из причин, почему молодёжь всё активнее выбирает для себя работу в сфере ИТ, поступает на цифровые факультеты. Удаётся ли удержаться в IT у тех, кто пришёл туда, не питая сильной любви к технологиям, мы узнали у заведующего кафедрой программного обеспечения ТвГТУ Александра Калабина.
ИИ в Твери
Кафедра программного обеспечения, как признаётся наш собеседник, уже не первый год является одним из лидером по популярности среди абитуриентов Тверского политеха. В 2024/2025 учебном году для айтишников даже добавили бюджетные места. Так, на кафедре появился новый профиль обучения «Разработка систем искусственного интеллекта» для бакалавров, первые студенты которого придут на пары уже в понедельник. Запуск направления для магистров возможен в следующем году. Кроме того, при поддержке со стороны компаний AXENIX и ДКС на базе кафедры будет открыта Лаборатория по исследованию и разработке систем искусственного интеллекта. Кажется, что с появлением лаборатории и нового направления обучение в ТвГТУ только начнётся эра искусственного интеллекта. Но это лишь на первый взгляд.
– На кафедре есть магистратура, где фактически уже 15 лет мы учим студентов Data Mining и нейросетям. У нас уже есть наработки, поэтому мы решили и бакалавров этому учить, – рассказывает Александр Калабин. – Мы столкнулись с ситуацией, что никто толком не можем сказать, чему нужно учить на направлениях, связанных с ИИ. И решить этот вопрос нам было даже интересно.
В итоге преподавательским составом кафедры был создан учебный план нового профиля обучения «Разработка систем искусственного интеллекта». Основу программы составит сильный курс математики с уклоном на теорию вероятностей, далее идёт программирование и алгоритмы – Data Mining и нейросети. По мнению преподавателей ТвГТУ, данный набор дисциплин соответствует основным знаниям и навыкам, необходимым для разработчиков в сфере ИИ.
Безусловно, в основе высшего образования лежит теория, но преподаватели ТвГТУ не принижают значимость практики. Поэтому на последних курсах ожидается уклон в практическую часть – решение реальных задач.
– Искусственный интеллект плохо решает задачи без человека, но с участием человека очень хорошо. Искусственный интеллект – это инструмент. Это могучие средство, вопрос в том, что его нужно грамотно использовать и получать реальные результаты, применять там, где это нужно, – отмечает Александр Калабин. – Наша главная задача – не испортить студентов, не мешать им, они же учатся сами. Чем можем, помогаем.
Лаборатория по исследованию и разработке систем искусственного интеллекта, открытие которой ожидается это осенью, будет использоваться для проведения исследований по таким направлениям, как анализ больших данных, машинное обучение и генеративный ИИ. При этом, как рассказал Tverigrad.ru Александр Калабин, некоторые разработки уже ведутся в университете, в будущем вуз ставит перед собой цель научить студентов старших курсов решать задачи, связанные с реальным производством.
Одно из приложений, разработанных студентами и преподавателями политеха, занимается анализом данных. Особенностью проекта является то, что данные могут поступать туда в любом формате, как информация с сайта, так и Excel-файл. При этом, выход данных тоже происходит в любом формате.
– Студенты берут учебные данные, пропускают и изучают работу алгоритмов. Приложение используют для работы с data set (наборами данных, – прим. ред.) и получают некоторый опыт. Учебные данные – понятны, а когда встречаются реальные данные, трудно даже сформулировать задачу анализа, – подчёркивает наш собеседник.
Вторым крупным проектом, разработанным в стенах политеха и связанным с ИИ, является текстовый поэтапный анализатор. Входящие в него алгоритмы позволяет анализировать тексты, разбивать на кластеры, классифицировать и сравнивать их. Кроме того, на основе текстового анализатора студентами ТвГТУ было разработано приложение для поисковика, позволяющее сделать поиск статей в сети более выборочным, после обучения по определенной тематики.
– Вы ищете какую-то статью, используете ключевые слова, как правило, вам выдаётся половина того, что не нужно. Но если вы уже наработали что-то, обучили нейросеть по этой теме – адреса, которые выдал поисковик, вы вводите в нашу программу, после чего с определенной вероятностью выдается, что эти ссылки имеют к этому отношению, а остальные нет, – объясняет Александр Калабин. – Текстовый анализатор разбивает тексты на кластеры по тематике. Подобные вещи есть в интернете, но в ходе обучения студентов мы сделали их так, как нам нужно, и всё это точно работает. Главное для обучения – это наличие вывода результатов на каждом этапе работы алгоритма, и теперь студенты пытаются понять, как это происходит, а не просто вход и выход, как пользователи. Особенность искусственного интеллекта в наше время заключается в том, что он хорошо решает ряд определенных задач, для которых он достаточно обучен, но без интеллекта и квалификации человека не может самостоятельно перейти к качественному решению другой проблемы.
Обучение студентов на кафедре программного обеспечения ТвГТУ нельзя назвать лёгким. Несмотря на то, что у абитуриентов данного направления достаточно высоких проходной балл в университете, через 2-3 месяца некоторые из них начинают с трудом учиться.
– Они сталкивают с реальностью, и между их представлениями о программировании и реальным процессом возникают некоторые противоречия. Основная проблема – они психологически не готовы к решению многоуровневых задач. Чтобы хорошо заниматься программированием, надо любить или иметь силу воли. Если студенты будут хорошо программировать, у них будет значительно больше шансов разобраться во всем этом, – считает завкафедрой.
Для того, чтобы обучение в вузе проходило легче и продуктивнее, Александр Калабин советует ещё в школе начинать заниматься программированием и математикой, развивающими алгоритмическое мышление. А вот разбор теории в сфере искусственного интеллекта без знаний высшей математики, теории вероятностей наш собеседник считает бессмысленным. Эти знания, в свою очередь, приобретаются уже в высшей школе. Осмысленный подход к учёбе в вузе не только позволит сдавать сессию на отлично, но и в будущем сыграет положительную роль в жизни студента.
– Кафедра программного обеспечения существует с 2008 года, большинство сотрудников работают в индустрии. Мы держим определенный уровень, выставляем высокие требования к дипломному проекту, – отмечает заведующий кафедрой. – 100% выпускников трудоустраиваются на места, связанные с компьютерами. Разработкой программного обеспечения занимаются чуть больше половины, не все способны это делать качественно. Обычно после выпуска все устраиваются в Твери, 1-2 года работают, потом уезжают в Москву и быстро растут, примерно через 5 лет хорошие студенты становятся руководителями проектов.
Тверские университеты совместно с другими российскими вузами решают задачу оснащения ИТ-индустрии в стране квалифицированными кадрами. Год назад, в августе 2023-го, министр цифрового развития Максут Шадаев заявлял, что дефицит программистов в России составляет примерно 500-700 тысяч человек. В июне текущего года на ПМЭФ-2023 министр сообщил, что дефицит специалистов в областях искусственного интеллекта, машинного обучения, робототехники и автоматизации процессов наблюдается по-прежнему. Напомним, в мае в Твери состоялась конференция «Преподавание информационных технологий в России», участниками которой стали представители ведущих вузов и ИТ-компаний страны, обсуждавшие, как привлечь большее число разработчиков в индустрию.
Сложившийся дефицит кадров, конечно, не может не оказывать влияние на рост зарплат айтишников. По данным Института статистических исследований и экономики знаний НИУ ВШЭ, средняя заработная плата в IT-отрасли составляет 155,9 тысячи рублей, при чём при аналитике учитывались не только данные по ИТ-специалистам, но и по другим сотрудникам. Также для разработчиков была продлена программа льготной ипотеки. Поэтому, возможно, здравой мыслью для сегодняшних школьников будет использовать компьютер не только для игр, но и для того, чтобы написать пару строчек кода.
Несмотря на нехватку разработчиков, сфера ИТ в России продолжает развиваться, в частности рост заметен и в Тверской области. Губернатор Игорь Руденя считает ИТ-сферу одной из перспективных для экономики региона. В Верхневолжье сосредоточены авторитетные научно-исследовательские институты и производственные объединения, ИТ-компании, способные предложить практически весь спектр продуктов и услуг. В частности, производство высокотехнологичных устройств присутствует, например, у компании «Аквариус», новый завод которой расположен под Тверью.
КОММЕНТАРИИ 0 Войти