• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Нейросети могут давать настолько же точные оценки, как и человек»

«Нейросети могут давать настолько же точные оценки, как и человек»

© Высшая школа экономики

Голосовые помощники стали частью обычной жизни. Они могут строить маршрут, включать музыку и фильмы, отвечать на вопросы. Качество речи голосовых ассистентов требует оценки. Для решения этой задачи студенты мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK разработали нейросети, способные оценивать синтез речи.

Никита Шевцов

«Технологии Text-to-Speech превращают текст в речь. Это те самые голоса, которые мы слышим в навигаторах или аудиокнигах. Чтобы понять, насколько хорошо работает синтез, раньше требовалась ручная проверка: люди слушали записи и выставляли оценки. Мы решили автоматизировать этот процесс. Студентам мастерской предстояло создать систему, которая заменит субъективную оценку на нейросетевую модель. Ручная разметка не только дорогая и долгая, но и требует участия множества специалистов», — говорит Никита Шевцов, руководитель проекта мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK.

Студенты мастерской ИМШ и VK использовали открытые англоязычные датасеты SOMOS, содержащие 20 100 аудиофрагментов, 200 TTS-систем, 987 асессоров и более 350 000 оценок.

На их основе были подготовлены и внедрены две метрики: MOS (Mean Opinion Score) — оценка одного аудиофайла от 1 до 5; SBS (Side-by-Side) — сравнение двух аудиофрагментов с выбором лучшего. Также были разработаны пять моделей: для MOS — MOSNet, MOSNetBert, WhisperBert; для SBS — NeuralSBS, NeuralSBSBert. Модели работают как в аудиоформате, так и в мультимодальном формате.

«Мы увидели, что нейросети могут давать настолько же точные оценки, как и человек. MOS-модели показали RMSE ≈ 0,4, что близко к человеческой погрешности 0,62. Модель NeuralSBS определяет лучшее аудио в 73% случаев — на уровне среднего субъективного слушателя. Это открывает путь к ускорению и удешевлению оценки качества TTS», — отметил Никита Шевцов.

Следующий этап — переобучение моделей на русском языке. Команда также рассматривает возможность интеграции оценочных моделей в пайплайны CI/CD, чтобы внедрить автоматическую проверку качества в производственные процессы генерации речи.

«Автоматическая оценка синтеза речи — это шаг к более надежным и масштабируемым TTS-системам. Мы собираемся сделать ее доступной для широкой разработки», — добавил Никита Шевцов.

Вам также может быть интересно:

Высшая школа экономики и «Ростелеком» поддержат ИИ-стартапы для госсектора

НИУ ВШЭ и «Ростелеком» подписали на ПМЭФ-2026 соглашение о сотрудничестве в рамках реализации акселератора ИИ-решений для государственного сектора. Совместная работа позволит объединить технологическую экспертизу крупнейшего цифрового партнера государства и академический потенциал ведущего исследовательского университета страны.

НИУ ВШЭ второй год подряд на первом месте рейтинга вузов Альянса в сфере ИИ

Альянс в сфере искусственного интеллекта опубликовал рейтинг российских высших учебных заведений по качеству подготовки кадров для работы с ИИ. Высшая школа экономики второй год занимает первую строчку рейтинга, оставаясь единственным университетом в категории A++.

Институт искусственного интеллекта и цифровых наук ВШЭ представил платформу предиктивной аналитики для бизнеса

Институт искусственного интеллекта и цифровых наук ФКН ВШЭ разработал Predict Core — унифицированное алгоритмическое ядро предиктивной аналитики. Платформа переводит работу с данными из режима отчетности постфактум в управленческую привычку с прогнозами, интерпретацией и понятным следом, показывающим, как была получена эта цифра.

НИУ ВШЭ и МТС договорились об обмене ИИ-компетенциями при подготовке инженерных кадров для телекома

НИУ ВШЭ и ПАО «МТС» заключили соглашение о стратегическом партнерстве, которое предполагает подготовку кадров с ИИ-компетенциями для телекоммуникационной отрасли по программам высшего и дополнительного профессионального образования. Соглашение направлено на повышение качества образования, обмен экспертизой и компетенциями при подготовке инженеров, владеющих технологиями ИИ и машинного обучения.

Студенты ФКН НИУ ВШЭ разработали ИИ-решения для прогнозирования и маркетинга

24 мая в Вышке состоялись защиты и церемония награждения хакатона по машинному обучению для ретейла, организованного MAGNIT TECH и факультетом компьютерных наук НИУ ВШЭ. В течение четырех дней команды работали над индустриальными кейсами технологичного драйвера крупнейшего ретейлера страны — компании «Магнит». Участники анализировали данные, обучали модели, проверяли гипотезы и защищали свои решения перед экспертами компании, чтобы в итоге не только добиться высокого качества моделей, но и предложить подходы для использования в реальном бизнесе.

Образовательный марафон для учителей: как ФКН ВШЭ выстраивает диалог с педагогами

В рамках фестиваля «Дни компьютерных наук» ФКН НИУ ВШЭ на базе учебного центра «Вороново» прошел первый Образовательный марафон для учителей информатики и математики. Всего в мероприятии приняли участие 76 педагогов, представлявших разные регионы России, а также участники из Витебска (Беларусь) и Вьентьяна (Лаос).

Точка входа в ИИ: на ЦИПР обсудили влияние технологий на будущее

Участники ЦИПР-2026 обсудили, как офисные приложения могут стать точкой массового доступа к ИИ и снизить барьеры использования. Эксперты сошлись во мнении, что будущее — за адаптивными моделями и экосистемным подходом к корпоративным данным. В экспертных дискуссиях приняли участие представители НИУ ВШЭ.

«Входить в сферу робототехники сейчас — значит расти вместе с направлением»

Беспилотный транспорт, роботы-курьеры и умные колонки стремительно становятся частью нашей жизни. В 2026 году факультет компьютерных наук НИУ ВШЭ открывает новый бакалавриат«Проектирование интеллектуальных робототехнических систем» (ПИРС). Здесь будут готовить специалистов на стыке ИТ, искусственного интеллекта и робототехники. О том, как устроена учеба и почему выпускников программы «точно возьмут в будущее», рассказывает академический руководитель ПИРС Вадим Моргачёв. 

Технодень МИЭМ на Покровке: совместно исследуем инженерный код Вышки

26 мая в центральном атриуме корпуса на Покровском бульваре, 11, пройдет традиционный масштабный фестиваль инженерных разработок проектных команд Московского института электроники и математики (МИЭМ) ВШЭ. В программе — презентации лучших студенческих технологических проектов, стенды дружественных компаний и совместных мастерских, лекторий с участием практикующих инженеров, круглый стол о развитии инженерного образования и представление магистерских программ МИЭМ.

НИУ ВШЭ представит цифровые проекты на ЦИПР-2026

В Нижнем Новгороде стартовала крупнейшая конференция по цифровой трансформации базовых секторов промышленности ЦИПР-2026. В ее работе участвуют премьер-министр Михаил Мишустин, члены правительства, губернаторы, главы компаний, ученые. НИУ ВШЭ в этом году стал официальным партнером конференции. Проректор Елена Одоевская и другие представители университета примут участие в экспертных сессиях, подпишут ряд соглашений, а на стенде ВШЭ будут презентованы цифровые разработки.