Нейросеть смоделировала интервью с Уинстоном Черчиллем

Дата:

Заложенная в его основе технология — следующий этап развития поисковых систем.

«МегаФон» не первый год использует работающих на основе нейронных сетей ботов в решениях для бизнеса. Они помогают оптимизировать внутренние процессы и освобождают сотрудников от рутинной работы. Первое такое решение «МегаФон» разработал в партнерстве с компанией Nlogic. Пилотную версию бота-юриста LegalApe компании публично продемонстрировали на Петербургском международном юридическом форуме в 2018 году. Проектная команда тренировала его несколько месяцев: обучала на информации из книг, судебных разбирательств и в ходе практических тренировок. На форуме LegalApe состязался в мастерстве с реальным юристом Романом Бевзенко. Машина проиграла человеку со счетом 178 против 243 очков, но все же ей удалось эффектно выступить и зарекомендовать себя.

В 2020 году «МегаФон» выпустил сервис «Цифровой юрист» с набором решений для автоматизации рутинной работы. В его основе — уже натренированная нейросеть вместе с технологией оптического распознавания символов. Работает все ровно так же, как и любой чат-бот. Человек пишет: «Хочу договор на поставку диванов от компании Икс к 31 декабря 2021 года в количестве 20 штук с бюджетом 100 000 рублей и предоплатой 20%». Бот берет информацию из запроса, дополняет данными из корпоративной базы поставщиков и в ответ присылает готовый черновик договора, который иногда даже не нужно корректировать. В результате на ранее занимавшую, как минимум, полчаса операцию уходят не более 2-5 минут.

— Когда мы услышали про идею об интервью с Уинстоном Черчиллем, мы поняли, что можем ее реализовать, опираясь на наш опыт работы с нейронными сетями, — говорит директор по правовым вопросам «МегаФона» Сергей Переверзев. — И «юридический баттл», и бот для составления договоров, и интервью с исторической личностью в своей основе, несмотря на разные задачи, похожи. Все три проекта опираются на семантический поисковик, настроенный на работу в определенной тематике. Бот-юрист обучен на юридической литературе, бот для составления договоров — на корпоративных документах и базах, а бота Черчилля обучали на многочисленных трудах самого британского политика.

Технический директор проекта Андрей Богомолов вспоминает, что разработка началась в августе 2021 года. Специалисты «МегаФона» и Nlogic сразу сфокусировались на самых новых технологиях. В дело пошла генеративная модель GPT-3 от компании OpenAI, которую дообучили на нескольких десятках книг Черчилля. Сначала казалось, что это успех — действительно чувствовалась стилистика автора, но проявился целый ряд проблем.

— В основу нового подхода положили фактчек — проверку фактов. Упор сделали на то, чтобы бот всегда мог подтвердить свои высказывания отсылкой к источнику  — конкретной книге или выступлению Черчилля. В результате получился неплохой поисковик по трудам Черчилля, но для проведения интервью этого было пока недостаточно, — рассказывает Богомолов. —  На следующем этапе улучшения бота разработчики составили датасет из нескольких тысяч вопросов на самую разную тематику. К разработке на несколько месяцев подключились команды разметчиков. В автоматическом режиме бот генерировал ответы на вопросы, а живым людям предстояло их обработать: указать, где нейросеть справилась хорошо, а где — не очень. И это сильно помогло.

После этого, по его словам, важно было сделать ответы бота похожими на речь живого человека. Изучение множества интервью с разными политиками помогло выявить общие моменты. Два из них стали основными целями для имитации виртуальным Черчиллем:

— в ответе на вопрос человек чаще всего выражает несколько идей,

— никто не перечисляет эти идеи пунктами, а связывает вместе в непрерывную речь.

Чтобы решить задачу, разработчики собрали несколько типов вводных конструкций для разных повествований. Например, вторая фраза может быть следствием первой, но может и отрицать ее, а также дополнять. На собранных примерах дата-саентисты обучили еще одну нейросеть, определяющую конкретный тип связи между двумя предложениями. Это помогло сделать речь виртуального сэра Уинстона структурированной и «человечной».

Есть ли у бота и, главное, стоящей за ним технологии будущее?

Несмотря на то, что для разработчиков это был, скорее, игровой формат, они приводят несколько потенциальных вариантов применения технологии. Наиболее очевидный лежит в гуманитарной плоскости — уже сейчас этот бот может сэкономить время на поиск цитат сэра Уинстона. Кроме того, технология позволяет создать уже на готовой основе бота, обученного на текстах любой исторической личности — от Платона до Маркса.

Но в глобальном смысле Nlogic и «МегаФон» видят во всем этом следующий этап развития поисковых систем. Когда-то поисковая строка для ввода запроса и появляющийся после этого список релевантных ссылок стали революцией. Но специалисты компаний отмечают, что модель устарела. На смену ей придут боты, которые смогут обрабатывать запрос, самостоятельно отбирать нужные результаты сразу из нескольких источников, а затем компилировать их в единый связный текст так, как это бы сделал настоящий живой ассистент.

Интервью с виртуальным Черчиллем опубликовано на сайте РБК.

Материал и фото для публикации предоставлены пресс-службой компании «МегаФон».

0
0

В Тогучинском районе установили новые телекоммуникационные объекты

Цифровая экосистема МТС провела модернизацию инфраструктуры мобильной связи в Новосибирской области. В ряде поселений Тогучинского района, в том числе в селе Буготак, которое граничит с федеральным природным памятником Буготакские сопки, были установлены новые телекоммуникационные объекты и обновлено уже имеющееся оборудование, сообщили в пресс-службе компании.

Несмотря на небольшое население села Буготак (менее тысячи человек), оно пользуется популярностью у любителей внутреннего туризма. Окрестности села изобилуют живописными природными объектами, такими как Карпысакский пруд с водопадом и упомянутые Буготакские сопки, имеющие статус особо охраняемой природной территории федерального значения, что делает их привлекательными для летнего отдыха.

Читать полностью

Логистический хаб Антарктиды получил мобильный интернет

Цифровая экосистема МТС расширила возможности своей телекоммуникационной сети, охватив ею полярную станцию «Прогресс». Местные жители и работники получили доступ к мобильной связи в районе бухты Тала, которая служит ключевым логистическим центром для Российской антарктической экспедиции (РАЭ). Реализация данного проекта стала возможной благодаря сотрудничеству с Арктическим и антарктическим научно-исследовательским институтом (ААНИИ).

Для обеспечения связи в Прогрессе была построена новая базовая станция, а также проложена радиорелейная линия длиной 13 километров до места стоянки судов в бухте. Такое решение позволяет передавать сигнал на значительные расстояния, преодолевая трудности, связанные с прокладкой оптоволокна в условиях антарктического ландшафта, который характеризуется наличием ледников и сложного рельефа. В результате суда, доставляющие грузы и исследователей, теперь имеют устойчивое соединение для голосовой связи стандарта GSM и мобильного интернета.

Читать полностью

Ещё 10 тысяч жителей Кировского района получили улучшенный интернет

Цифровая экосистема МТС развивает сеть быстрого домашнего интернета в Новосибирске. Благодаря обновлению техники и возведению современной инфраструктуры увеличена территория охвата. Теперь к интернету в домашних условиях могут подключиться дополнительные 4 тысячи семей в Кировском районе.

Специалисты выполнили модернизацию в нескольких домах Южно-Чемского микрорайона, жилом комплексе «Акация на Ватутина» и на Северо-Чемском.

Читать полностью

На заводе «Балтика-Новосибирск» повысили уровень безопасности работников

Цифровая экосистема МТС внедрила на предприятии «Балтика-Новосибирск» передовую платформу, направленную на повышение уровня безопасности работников.

Рабочие производственной лаборатории, ответственные за контроль качества входящего сырья, материалов и итоговой продукции, на определенных этапах своей деятельности сталкиваются с необходимостью использования химических реагентов. Лабораторные помещения оборудованы системой специализированного доступа, и персонал, находящийся там, теперь оснащен персональными идентификаторами с функцией позиционирования.

Читать полностью

Волейбольные болельщики в «Локомотив-Арене» получили улучшенный интернет

В «Локомотив-Арене» была значительно улучшена мобильная связь благодаря усилиям цифровой экосистемы МТС. Проведенное обновление технического оснащения привело к увеличению скорости обмена данными по всей территории спортивного комплекса, охватывая трибуны, зоны для зрителей и комнаты отдыха спортсменов.

Специалисты осуществили модернизацию телекоммуникационного оборудования внутри здания, что обеспечивает приоритетный доступ к ресурсам сети для всех пользователей, находящихся на арене.

Читать полностью

Мобильная связь в Инюшенском бору стала лучше

Цифровая экосистема МТС модернизировала свою сеть в Инюшенском бору, что положительно сказалось на качестве мобильной связи. В результате апгрейда оборудования, пиковая скорость передачи данных в этой рекреационной зоне возросла на 20%.

Инюшенский бор – уникальный, старейший лес Новосибирска, представляющий собой реликтовый массив, сохранивший почти нетронутый вид. Посетители бора могут ощутить себя в настоящем лесу, несмотря на его расположение в городской черте. Здесь можно активно проводить время: зимой, катаясь на лыжах и санках, летом, организуя пикники.

Читать полностью
Прямым текстом

Подпишитесь на новости
Подпишитесь на рассылку самых актуальных новостей.


Выражаю согласие на обработку персональных данных, указанных при заполнении формы подписки на рассылку новостей в соответствии с Политикой конфиденциальности

Я согласен (согласна)

 
×
Поиск по автору:
×
Март 2026
Пн Вт Ср Чт Пт Сб Вс
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
×





    Выражаю согласие на обработку персональных данных, указанных при заполнении формы «Предложить новость» в соответствии с Политикой конфиденциальности
    Я согласен (согласна)


    ×

    Эксклюзивный материал

    Материалы, отмеченные значком , являются эксклюзивными, то есть подготовлены на основе информации, полученной редакцией infopro54.ru. При цитировании, перепечатке ссылка на источник обязательна

    ×

      Участие в конференции бесплатно






      Формат участия:


      Отправляя сообщение, я принимаю условия соглашения об использовании персональных данных и соглашаюсь с Правилами сайта

      ×

        Участие в конференции бесплатно







        [recaptcha size:compact]
        Отправляя сообщение, я принимаю условия соглашения об использовании персональных данных и соглашаюсь с Правилами сайта

        ×
        На нашем сайте используются файлы cookie. Продолжая пользоваться сайтом, Вы подтверждаете свое согласие на использование файлов cookie в соответствии с условиями их использования
        Понятно
        Политика конфиденциальности