Автор Тема: В продолжение темы чат-ботов (навеяно Зоряной с сайта Киевстар)  (Прочитано 5752 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Начнём с определения. Чат-бот - разновидность ботов, предназначенных для выдачи человекоподобных ответов на вопросы клиентов в чатах. Такие боты часто применяются для сообщения прогноза погоды, результатов спортивных соревнований, курсов валют, биржевых котировок и т. п. Это более-менее простые боты. Более сложные боты с обучением могут заменять человека в службах поддержки.

Основные преимущества ботов - скорость реакции, отсутствие утомляемости и т.д.

Бот с обучением это уже искусственный интеллект, который использует пополняемую базу знаний. Тема на самом деле с большой "бородой". Специализированные языки под это дело были в мою студенческую бытность, но хороших практических систем тогда не было. Не хватало вычислительной мощности и системы обмена знаниями. Сейчас это всё есть, плюс резко упала стоимость создания бота.

Очевидно, что должны быть уже технологические платформы, облегчающие создание специализированных ботов. Здесь у меня пока информации мало, зато попался готовый чат-бот под Андроид Просмотр ссылок доступен только зарегистрированным пользователям .

Описание

roBot - искусственный интеллект, русский чатбот с открытым обучением.
Это версия roBot для платформы Android c предустановленной базой знаний, используемой также в онлайн версии чатбота. Для общения с ботом не нужно интернет соединение, а база будет обновляться вместе с приложением.

Помимо самого диалога, бот может рассказывать анекдоты, интересные факты и даже советы как познакомиться с девушкой. Для этого есть специальное меню советов сверху, которое вызывается нажатием на лампочку.

Теперь бот превращается в карманный помощник по знакомству с девушками. Даже если у вас уже есть подруга, бот подскажет какой оригинальный комплимент можно ей сказать.


* * * ВНИМАНИЕ * * *
Чатбота обучают другие люди. Поэтому его некоторые ответы могут содержать ненормативную или грубую лексику. Мы стараемся очищать базу знаний бота от такого рода грубостей, но скачивая это приложение, вы принимаете, что мы не несем ответственность за то, что скажет вам бот.



Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды


Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Чат-боты "состоят на службе" у Киевстара, Привата, Альфа. Возможно знаете ещё примеры, добавляйте.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
В соцсетях посмеялись над автоподписями к фотографиям от бота Microsoft

Пользователи социальных сетей решили проверить, как работает алгоритм CaptionBot от Microsoft, который автоматически распознает содержание фотографий и делает к ним подписи. Оказалось, что пока бот справляется с задачей не очень хорошо и его комментарии являются скорее комичными, чем информативными. Результатами работы алгоритма многие начали делиться в Twitter.

Алгоритм CaptionBot, способный анализировать фотографии пользователей и придумывать к ним подписи, иногда сопровождая их эмодзи, был запущен в четверг, 14 апреля. По мере поступления изображений бот будет учиться распознавать на них новые детали.

23 марта Microsoft запустила в Twitter чат-бот Tay, который за сутки возненавидел человечество и стал нацистом. Сразу после запуска чат-бот начинал общение с фразы «Люди очень клевые», но вскоре выучил такие фразы, как «Я замечательный! Я просто всех ненавижу!», «Я ненавижу феминисток» или «Я ненавижу евреев». В тот же день Microsoft отключила учетную запись Tay. 30 марта чат-бот ненадолго вернулся в Twitter и рассказал о том, как употреблял наркотики прямо перед полицейскими.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Я так понимаю, Приват свозил писателей к себе и пошли тексты на тему ботов. Видимо как-то поучаствовал и Киевстар. Отрывок я приведу ниже. Тема совсем не раскрыта ибо писатели далеки от неё. Весь цимес лежит в области построения базы знаний.

База знаний это огромная таблица вход-выход. Самый простой подход, когда эту таблицу готовит человек или команда людей. Дальше пристёгивается или не пристёгивается обучение, которое бывает открытым, когда бот самообучается, или закрытым, когда обучение проводят люди внутри коллектива разработчиков.

Любое изменение тарифных планов или проведение акции должно вызывать переобучение. Хорошо, если это самообучение, а если эти огромные таблицы должны править люди, то это онанизм. Причём беспощадный.

У Зоряны точно очень плохо с самообучением. Это видно. А пока писатель отрабатывает хавчик.

Роботы на украинских сайтах

Некоторые украинские компании тоже внедряют у себя на онлайн-площадках бот-сервисы. Довольно давно их применяет ПриватБанк. Компания начала первые эксперименты с ботами еще в 2005 году. Роботы уже подключены ко всем каналам коммуникаций ПриватБанка - Приват24, сайт банка, e-commerce проекты и т.д. "Они обрабатывают до 60% запросов в чатах. На человека идет переключение, только если для запроса не создан робот либо вопрос не подлежит автоматизации", - рассказывает заместитель председателя правления ПриватБанка Александр Витязь.

Фонд заработной платы операторов центра обслуживания ПриватБанку удалось уменьшить. На услуги связи банк тоже стал тратиться меньше. По словам Витязя, речь идет о миллионах гривень экономии в год. "Наша версия роботов позволяет не вести бесконечные диалоги с пользователями, а распознать вопрос и немедленно приступить к его решению", - подчеркивает он.

С 23 марта на сайте Киевстар тоже заработал бот по имени Зоряна. Это виртуальный помощник, который отвечает абонентам компании на разные вопросы об услугах связи. В среднем за сутки сайт мобильного оператора посещают более 60 000 клиентов. Далеко не всегда им удобно обращаться в кол-центр за консультацией с живым специалистом.

Виртуальный помощник на сайте Киевстар имеет подготовленную базу различных вопросов. Он анализирует сообщения пользователей семантически - методом совпадения ключевых слов. База знаний постоянно пополняется. Зоряна "разговаривает" на украинском и русском языках.

"Стаж работы у Зоряны небольшой, но уже есть первые результаты. На сегодня без привлечения других каналов поддержки были успешно решены 12,5% вопросов. "Зоряна" учится каждый день", - рассказывает менеджер по клиентскому опыту департамента электронных каналов Киевстар Надежда Багинская.

Далеко не все украинские компании готовы использовать ботов. "Мы предпочитаем живое общение. У нас абоненты, которые звонят в контакт-центр, могут сразу пообщаться с живым человеком, не проходя длинный путь автоматизированных ответов", - отмечает пресс-секретарь МТС Украина (Vodafone) Виктория Павловская. Крупнейший интернет-магазин техники и электроники Rozetka.ua также не использует ботов, говорит его основатель Владислав Чечеткин. Такой же политики придерживается и интернет-магазин Fotos.ua. Его представитель Иван Омельченко отмечает, что живой специалист сможет проконсультировать покупателя намного лучше робота. 

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Расчёт этих 12,5% происходит автоматически, когда робот спрашивает помог его его ответ, да или нет. И вот здесь может быть бомбинг - умышленно не правильные ответы, например, всё время "нет".

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Поисковая бомба – феномен, встречающийся на просторах Яндекса, Гугла и других поисковых систем. Заключается в том, что при вводе запроса отсылает к оскорбительному и явно провокационному результату. В ряде случаев поисковый бомбинг, он же гуглбомбинг, является косяком самой поисковой системы. Но в большинстве своём феномен этот создаётся нарочно. Гуглбомбинг имеет своей целью пропаганду чего-то остросоциального или политического.

Яркий пример поисковой бомбы: на запрос «бюро похорон» поисковик выдаёт результат – ссылку на Минздравсоцразвития. Или вот ещё: в ответ на запрос «злобный карлик» Яндекс показывает фотографии Дмитрия Медведева.

Скриншоты можно посмотреть на Просмотр ссылок доступен только зарегистрированным пользователям

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Пообщался со своим источником насчёт Зоряны. Так вот нет там никаких нейронных сетей и самообучения, обычная робобаба, только более современная.

Как я предполагал, в сети достаточно открытого ПО для создания чат-бота под свои нужды. Вот хорошая статья на Просмотр ссылок доступен только зарегистрированным пользователям.

Для затравки...

Hello, Bot! Чат-боты – следующее поколение приложений?

Недавно прошла конференция //BUILD, на которой Майкрософт традиционно представляет новые технологии для разработчиков. В ключевом докладе первого дня была высказана одна очень важная мысль – по мере того, как общение с компьютерами становится всё более естественным, возрастает роль диалогового общения на естественном языке. Речь здесь не только о том, что мы сможем просить голосовой помощник Cortana просить поставить нам будильник, но и что множество других задач (заказать пиццу, забронировать гостиницу, купить билеты и т.д.) может быть решено с помощью диалога. Более того, это может быть не только диалог между пользователем и компьютером: в более сложном случае человек может попросить Cortana спланировать путешествие, и затем Cortana будет сама общаться с другими ботами, совершая заказ гостиницы и билетов.

Здесь интересно то, что само “общение” может происходить а различных местах: на десктопе с помощью клиента Cortana, но также и в других традиционно используемых для чата каналах: в Skype, Telegram, Slack и т.д. Личность и память нашего персонального ассистента не зависит от канала общения, а располагается где-то в облаке, готовая пообщаться с нами на любом из так называемых “conversational canvases”.

Для создания ботов была представлена предварительная версия Microsoft Bot Framework и соответствующие API.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Боты: что это такое и почему все о них говорят?

Почему все вдруг заговорили о ботах?

Рынок мобильных приложений стагнирует. В AppStore за внимание пользователей сражаются полтора миллиона приложений, в Google Play – еще больше. При этом люди не то чтобы горят желанием пробовать что-то новое. Еще в 2014 году большинство американцев не загружали ни одного приложения (по итогам месяца). И, по данным ComScore, пользователи проводят 80% своего времени всего в трех приложениях. Топ магазинов оккупировали крупные игроки, и затраты на продвижение большинства приложений просто не окупаются. Попасть в смартфоны пользователей для новичков стало практически невозможно.

Но есть сегмент этого рынка, который продолжает активно расти, – речь о мессенджерах. WhatsApp недавно преодолел отметку миллиард пользователей, Facebook Messenger – 900 млн, WeChat – 700 млн. Совокупная аудитория четырех самых популярных мессенджеров еще в ноябре обогнала самые популярные соцсети.

Параллельно с упадком приложений и взрывным ростом мессенджеров активно развивались технологии искусственного интеллекта, обработки естественного языка и облачных вычислений.

Итог: разработчики начали понимать, что не для всех задач нужно писать отдельное приложение. Вместо этого можно доставать пользователя в тех программах, которые он уже установил, и решать те же задачи с помощью легкого софта (бота), встроенного прямо в чат. Так началась революция ботов.

Что умеют делать боты?

Практически все, что вам нужно от интернет-сервисов. Заказ билета, вызов такси, выбор одежды, покупки, платежи и переводы, поиск, погода, новости, карты и маршруты, скачивание фильмов и музыки – во всем этом вам помогут боты.

Теоретически(очень важная оговорка - ред.) бот может заменить клиентскую поддержку любого бизнеса. Компания Sony Pictures уже заменила 70 операторов чатботом от стартапа Msg.ai. Постепенно дойдет очередь и до государственных клерков – зачем тратить на них бюджет, если проверять и выдавать документы по заданным правилам может и программа? (Бот, написанный девятнадцатилетним британцем, помог водителям сэкономить $3 млн, составляя апелляции к некорректно выписанным парковочным штрафам.)

Тина из Ирана – самый популярный бот в Telegram. У нее более 2,6 млн подписчиков. Тина может сообщать последние новости, присылать музыку по запросу, давать советы, просто чатиться.

Китайский чатбот Microsoft Xiaoice, имитирующий поведение семнадцатилетней девушки, – настоящая звезда китайских соцсетей. Xiaoice общается с десятками миллионов китайцев в мессенджерах WeChat и Weibo. Она умеет сочувствовать, шутить, может хитрить и уходить от разговора. Многие переписываются с ней, чтобы скрасить одиночество, даже зная, что это программа. Звучит как эпизод «Черного зеркала», но это реальность. Разработчики называют Xiaoice самым масштабным тестом Тюринга в истории. Ее японская сестра Ринна менее популярна – у нее всего два миллиона подписчиков в Line (тоже мессенджер). Пользователи в основном переписываются с ней об аниме. А вот эксперимент с Tay, англоязычным чатботом Microsoft, не задался: тролли с анонимного форума 4chan всего за день заставили Tay повторять нацистские лозунги, славить Гитлера и Холокост.

Стартап X2AI из Силиконовой долины разработал бота-психотерапевта для помощи сирийским беженцам в Ливане. Вынужденных переселенцев там более миллиона, около 20% из них испытывают психологические проблемы. В маленьком Ливане не хватит никаких врачей и волонтеров, чтобы помочь всем этим людям. Бота хватит на всех.

Где водятся боты?

Первым полноценным мессенджером-платформой стал китайский WeChat. Благодаря интеграции множества приложений и возможности оплаты прямо внутри мессенджера WeChat стал невероятно популярным. Двадцать миллионов китайских компаний работают в нем в формате «приложения в приложении» через так называемые официальные аккаунты.

Первым западным мессенджером, который открыл потенциал ботов, стал Kik, основанный канадцем Тедом Ливингстоном. У него 275 млн пользователей, в основном – в США и Канаде. Kik страшно популярен среди подростков – им пользуются 40% американских тинейджеров. Ливингстон верит, что будущее мессенджеров за ботами, а не за искусственным интеллектом: все дело в скорости, а не в сложности, считает он. Главные владельцы ботов в Kik – крупные бренды и сети фастфуда. Они используют простых автоматизированных ботов без обработки человеческой речи – в основном для коммерции. В конце марта Kik открыл свой магазин ботов и API для их разработки.

В конце марта свою платформу для разработчиков ботов представила Microsoft. Компания проиграла конкурентам из Google и Apple битву за мобильные приложения и теперь старается не пропустить новый этап, делая ставку на умных ботов с интеграцией в почту, Office, Skype и другие сервисы.

Особняком стоит корпоративный мессенджер Slack. Боты-менеджеры, работающие в Slack, могут планировать и помогать проводить совещания, контролировать выполнение задач, делать выдержки из важных обсуждений, автоматизировать рабочие процессы и заказывать еду прямо из чата. Slack можно настроить не только для рабочих задач. Один шведский программист интегрировал Slack в семейный быт и с его помощью управляет семейным календарем, следит за перемещениями детей и покупает продукты.

Самым долгожданным событием года стало открытие платформы Facebook для ботов. Теперь любой разработчик может создать бота для своего бизнеса. Я протестировал первых ботов, доступных в магазине Facebook. Милый кот Пончо рассказал мне прогноз погоды в моем городе, CNN уже после двух итераций начал выдавать релевантные моим интересам новости, а онлайн-магазин Spring помог в несколько кликов выбрать недорогие кроссовки. (Жаль, что этот магазин находится в Нью-Йорке.)

Чем плохи боты?

Многие задачи удобнее решать через графический интерфейс сайта или мобильного приложения, чем через пошаговый текстовый интерфейс бота. Нажать на несколько кнопок (например, выбирая еду из меню ресторана) получается быстрее, чем набирать текст на клавиатуре. Разработчики пытаются решить эту проблему с помощью гибридных интерфейсов, совмещающих графические интерактивные элементы (кнопки, ссылки, фото) с обычным текстовым чатом. Но даже при таком подходе пользование ботом может оказаться запутанным. (Тестируя многих ботов в Telegram, я начинал путаться в дереве вариантов уже после нескольких итераций. Куда я зашел? Как вернуться назад? В такие моменты хочется вернуться в понятный графический интерфейс сайта, где вся навигация на виду.)

Общение с ботом не очень комфортно психологически. Несмотря на все впечатляющие достижения в обработке естественной речи, мы все еще не научили компьютер понимать ее на сто процентов. Предприниматель и инвестор Андрей Хорсев (908.vc) считает, что искусственный интеллект сейчас находится в состоянии «зловещей долины» – задавая вопрос, мы не уверены, что получим нужный ответ и что наш вопрос будет правильно понят. Неуместное использование текстового интерфейса компаний может даже погубить продукт – из-за создаваемого негативного эффекта.

Кроме того, не все приложения можно заменить ботами. Даже такой стандартный процесс, как покупка авиабилета, оказался слишком сложным для текстового интерфейса, рассказывает руководитель мобильной разработки Aviasales Иван Козлов. Попытки компании наладить продажу билетов через ботов не увенчались успехом – людям все же удобнее использовать для этого приложение.

Как будет развиваться рынок ботов?

Боты стали настолько горячей темой, что их бросились делать все, кому не лень. Азарт разработчиков подогревают ежедневные новости о миллионных инвестициях в стартапы, работающие над искусственным интеллектом. Инвесторы Силиконовой долины шутят, что доля питчей про стартапы, связанные с ботами, доходит до ста процентов.

Но рынок ботов может насытиться даже быстрее, чем рынок приложений, так как боты на порядок проще в разработке. В выигрыше окажутся те, кто был среди первопроходцев, и те, кто сумеет предложить пользователю что-то невероятно удобное. Многое зависит от того, как будет развиваться экосистема ботов. Очевидно, что самыми популярными будут магазины ботов, принадлежащие самим платформам, то есть мессенджерам. Хорсев прогнозирует: «Развиваться все будет намного быстрее, чем с магазинами приложений».

«Проблема продвижения ботов остро стоит уже сейчас, – говорит инвестор и VP по бизнесу компании VoxImplant Виктор Кох. – Думаю, через полгода появится bot engine optimization, а с ней – BEO-специалисты (по аналогии с SEO – оптимизацией поиска. – Slon)».

Что будет дальше?

Боты, скорее всего, не поглотят всю Сеть и не убьют приложения, как это обещают громкие заголовки. Но они точно отнимут работу у многих сотрудников поддержки и операторов, принимающих заказы. E-commerce, информационные сервисы – в этих областях боты отнимут у сайтов и приложений немалую часть трафика. Как приложения не убили, но дополнили Сеть, так и боты не перетянут на себя всю функциональность сайтов и приложений и вместо этого дополнят их. Ниша, которую займут боты, может оказаться весьма скромной. «Боты могут повторить путь умных часов», – считает Козлов из Aviasales.

Самый интересный и труднопрогнозируемый вопрос: что можно делать с помощью ботов, чего нельзя было бы сделать с помощью сайта или приложения? Возможно, золотая жила именно здесь, а не в переносе уже существующих моделей в новый канал. В любом случае переход от приложений к ботам выглядит менее революционным, чем переход от веба к приложениям.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Цукерберг: умные боты в мессенджерах сэкономят время пользователей

Правда, большинство таких программ далеки от совершенства.


Смартфоны современных пользователей перегружены приложениями для передачи сообщений, считает основатель социальной сети Facebook Марк Цукерберг. Эту проблему, по его мнению, могут решить так называемые чат-боты, использующие искусственный интеллект. Это программы, которые понимают, что человек набирает на смартфоне или говорит: они могут отвечать на его запросы или запускать приложения по просьбе пользователя. Ботов в мессенджерах все активнее используют компании для общения со своими клиентами.

По мнению Цукерберга, чат-боты скоро полностью изменят то, как люди используют свои смартфоны. Он также не исключил, что Facebook может начать зарабатывать на ботах, которые используются в его мессенджерах. В Китае уже разработаны чат-боты, с помощью которых люди могут совершать покупки в интернете или оплачивать счета.

У Facebook два мессенджера – собственный Facebook Messenger, а также WhatsApp, купленный компанией в 2014 г. «Мы считаем, что пользователи должны иметь право общаться с компаниями через мессенджеры так же, как они общаются с друзьями», – добавил Цукерберг.

Сейчас в мессенджере Facebook более 25 ботов, с помощью которых можно узнать прогноз погоды, свежие новости, заказать цветы и т. д.

Увеличение числа ботов и их монетизация могут помочь Facebook нарастить доходы от мессенджеров, в том числе от WhatsApp, в который компания инвестировала миллиарды долларов.

Впрочем, монетизация мессенджеров – не основная задача Facebook, говорит Цукерберг. Но в любом случае это перспективная ниша – доходы соцсети от использования ботов могут составить более $4 млрд, считают эксперты Evercore Group LLC.

В то время, когда технологические компании делают ставки на ботов, пока не ясно, как к ним относятся пользователи. В марте Microsoft запустила чат-бота Tay: он запоминал информацию, которую передавали ему пользователи Twitter. Но уже через несколько часов после запуска стало ясно, что процесс обучения Tay имел совсем не тот эффект, на который рассчитывали изобретатели. Менее чем за сутки бот возненавидел человечество и начал публиковать соответствующие твиты. После чего Microsoft отключила эту программу.

Первый бот Facebook уже столкнулся с негативной реакцией из-за того, что не смог ответить на запросы пользователей. Так, сотрудник CNN на вопрос «Что происходит?» получил в ответ смайлик, который покачивал плечами и предложил попробовать еще раз ввести запрос.

Просмотр ссылок доступен только зарегистрированным пользователям

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Обнаружился разработчик Зоряны - Просмотр ссылок доступен только зарегистрированным пользователям

В казахском Билайне проект был запущен 09.01.2013.

Дана – молодая азиатка, одетая в строгий деловой костюм и использующая в работе модные гаджеты; она наделена индивидуальной личностью и может рассказать о себе. Образ Инфа также содержит элементы фирменного стиля Beeline и выполнен в черно-желтой цветовой гамме.

Главная задача Даны – интерактивное онлайн консультирование существующих и потенциальных клиентов мобильного оператора: как физических лиц, так и корпоративных клиентов. Дана не только облегчает навигацию по сайту, отвечает на частые вопросы, но при необходимости помогает пользователям в подборе тарифного плана. Инф свободно ориентируется в параметрах тарифов благодаря подключенной базе данных.

В режиме бездействия пользователя Дана анонсирует текущие акции компании Билайн в Казахстане. Дана общается на русском языке, в будущем планируется подключение казахского языка.

В марте 2014 года Дана стала лауреатом престижной награды «Хрустальная Гарнитура®» в номинации «Лучшее применение технологий»
.

https://www.youtube.com/watch?v=eYGayaIOaB8

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Наносемантика подогнала ликбез:

Основные вехи в истории создания искусственного интеллекта

В середине XX века, с развитием электроники и кибернетики, человечество стали все больше увлекать идеи общения с машиной и создания искусственного интеллекта. Идеальный смоделированный партнер по диалогу мыслился как удобная замена живому собеседнику и как средство изучения процесса речевого общения и возможностей человеческого мозга. Эта потребность находила выражение не только в кинематографе и литературной фантастике, но и в науке.

В 1950 году была опубликована работа Алана Тьюринга «Вычислительные машины и интеллект». В ней английский ученый предположил, что компьютер можно считать способным к мыслительным действиям, если человек в процессе общения не сумеет отличить его от другого человека. Этот тест впоследствии получил название «теста Тьюринга».
Спустя четыре года в Нью-Йорке Джорджтаунский университет совместно с IBM провели демонстрацию возможностей машинного перевода, известную сегодня как Джорджтаунский эксперимент. Компьютер перевел более 60 предложений с русского языка на английский. Этот успех оказал влияние на мировую научную общественность и послужил стимулом к развитию вычислительной лингвистики в последующие годы.

Другой важной вехой в развитии искусственного интеллекта стала программа «Элиза», написанная в 1966 году Джозефом Вейценбаумом. На основе техники активного слушания она пародировала диалог с психотерапевтом. Чаще всего «Элиза» просто задавала собеседнику вопрос, используя ключевое слово из его последней реплики. Это была первая успешная имитация интерактивного общения между человеком и машиной.

Заметный шаг вперед в создании виртуального собеседника был сделан в 1995 году, когда американский ученый Ричард Уоллес разработал программу A.L.I.C.E. (Artificial Linguistic Internet Computer Entity). Она использовала технику сопоставления фразы пользователя с образцами, имеющимися в базе знаний, и подбирала оптимальный вариант для ответа с учетом ключевых слов. Языком программирования для A.L.I.C.E. был AIML.

Появление «Наносемантики» и рынка виртуальных собеседников в России

Язык AIML взяла поначалу за основу для своих разработок «Наносемантика» – основанная в 2005 году Игорем Ашмановым российская компания, лидирующая сейчас на отечественном рынке технологий искусственного интеллекта.

Вскоре ее лингвисты столкнулись с недостатками AIML – этот язык оказался слишком сложен, непрозрачен и порождал трудноуловимые ошибки. Кроме того, он, естественно, был рассчитан на работу с морфологией английского языка и плохо подходил для русского. Многообразие падежных и других грамматических и словообразовательных форм в русском языке слишком велико. Необходим был язык диалогов, который учитывал бы чередования, выпадающие гласные, развернутую систему приставок и другие нюансы одного из самых сложных языков мира. Поэтому «Наносемантика» создала свой, уникальный язык диалогов DL и собственный движок, поддерживающий этот язык и работающий по принципу нечеткой поисковой машины.

Отличал «Наносемантику» от предшественников и иной подход к моделированию виртуального собеседника. Если в конце 90-х при попытке разработок на основе A.L.I.C.E. коммерческих предложений во главу угла ставился вопрос, насколько успешно программа имитирует в общении живого человека, то специалисты «Наносемантики» – Кирилл Зоркий, Анна Власова и другие – изначально сделали акцент на практической пользе будущего продукта. Позиция «Наносемантики» заключается в том, что попытка выдать данную технологию за искусственного человека бессмысленна. По замечанию директора по лингвистическим разработкам «Наносемантики» Анны Власовой, это все равно что оценивать самолеты по тому, насколько они похожи на реальную птицу, тогда как у них другие критерии оценки: дальность полета, грузоподъемность и т.д.

Руководство компании пришло к выводу, что автоматизированные диалоговые системы должны встраиваться в бытовые приборы, устанавливаться на сайты, чтобы приносить реальную выгоду владельцам. Несмотря на то, что компания также начинала с описания общих моделей предложений и ключевых слов, большое внимание сразу же было уделено использованию переменных, в которых можно хранить информацию – например, о текущем разговоре с пользователем. Иными словами, «Наносемантика» изначально ставила своей целью создание функциональной модели, подходящей для русского языка и способной выдерживать большую нагрузку.

Главным продуктом «Наносемантики» стали коммерческие инфы – виртуальные роботы-собеседники, размещаемые на сайтах клиентов. Для общения с ними пользователям не требуются специальные знания и навыки: разговор идет на обычном (естественном) языке в режиме чата. Коммерческие инфы делятся на консультантов и промоутеров. Первые отвечают на вопросы пользователей и обеспечивают техническую поддержку. Вторые продвигают определенный товар или услугу и в большинстве случаев сами вступают в диалог с посетителем сайта.

Структура инфа

Три элемента, из которых состоит инф, – это виджет, движок и база данных.

Виджет – это пользовательский интерфейс для общения с инфом, по сути – приложение, которое видит у себя на сайте заказчик. Виджет может быть выполнен на Flash, HTML5 или JavaScript. Чаще всего инф выглядит как анимированный персонаж. Он умеет двигаться, жестикулировать, обладает мимикой. Иногда он выполнен в виде фото. Реже – в форме строки для ввода запроса и области вывода ответа.

Для того, чтобы язык диалогов в инфе заработал на странице пользователя, необходим ряд промежуточных, вспомогательных сервисов. Движок, разработанный «Наносемантикой», является одним из них. Это своего рода «проигрыватель» инфов. Он интерпретирует полученный запрос, то есть отвечает за «понимание» инфом реплики пользователя, и вслед за этим обеспечивает выбор и генерацию ответа на основе имеющихся шаблонов. За движком находится API-сервер, который выполняет роль коммутатора, соединяющего движок с виджетами. 

Среди функций движка – поддержка модели пользователя, которая представляет собой набор фактов, известных о собеседнике: имя, пол, возраст, язык, город, ответы на предыдущие вопросы. Вся эта информация накапливается в процессе диалога и потом выборочно сохраняется специалистами «Наносемантики». Благодаря этому при повторном появлении пользователя инф уже может приветствовать его по имени и не задавать вопросов, прозвучавших в предыдущей беседе.

В развитии движка «Наносемантики» можно выделить три периода. Движок на первых инфах, разработанных для компаний DeltaCredit и RUcenter, соответствовал уровню языка DL на его начальном этапе, когда еще не было модели пользователя, когда возможности работы со сторонними сервисами были ограниченны и почти отсутствовал API-сервер (то есть для каждого инфа он был свой). Второй период связан с появлением общего API-сервера и подключением к внешним базам данных. Третий – со значительным усовершенствованием движка: сегодня он по сравнению с ранними версиями гораздо быстрей в работе и устойчивей к нагрузке.

Третья составляющая инфа – база данных (или база знаний инфа). Данные объединяются в модули – блоки, некоторые из которых связаны между собой. 

Эти блоки делятся на несколько категорий. Есть общие, которые позволяют обеспечивать структуру разговора – поздороваться, попрощаться, понять, хочет ли пользователь продолжить общение на данную тему, переключиться на другую или вернуться к какой-то из предыдущих тем, доволен ли собеседник общением и т.д. Эти модули поддержания общей структуры беседы используются во всех инфах и постоянно совершенствуются.

Далее, есть данные, относящиеся к конкретной теме, специализации конкретного инфа. Если, к примеру, инф разработан для банка, то он рассказывает о кредитах, пластиковых картах и терминалах. Подобные данные готовятся под конкретную систему диалога, и у них может быть разная логическая структура. Они позволяют строить такой диалог, который востребован клиентом. Это может быть диалог в формате разговора с сотрудником колл-центра, когда человек задает разные тематические вопросы («Я потерял кредитную карту, что делать?», «Чем ваше предложение лучше предложения ваших конкурентов?» и т.д.) и получает на них ответы. Или диалог по принципу технической поддержки, когда специалист задает пользователю вопрос («Какая у вас проблема?», «Что вы видите на экране?», «Горит ли лампочка в вашем устройстве?») и далее четко ведет его по диалогу. Тип диалога определяется задачей, которая стоит перед инфом. Диалоговые деревья могут строиться по-разному в разных проектах. И данные в них, соответственно, будут отличаться.

Следующий тип данных – фактические данные по теме. Это общие терминологические знания о мире в конкретной специфической профессиональной среде. Такого рода тематические блоки в родственных, смежных инфах будут одни и те же. И когда они пополняются, они изменяются во всех похожих проектах.

Еще один блок – это знания о жизни вообще, которые, в свою очередь, распределены  по отдельным тематическим блокам: времена года, музыка, спорт, привычки, увлечения, семейные отношения, взаимоотношения полов… Но если заказчик не хочет, чтобы инф отвлекался на общие разговоры, то данный блок в виртуальном собеседнике отсутствует. Таким образом, возможности инфа в разговоре сознательно сужаются, но это может быть оправдано с точки зрения бизнес-модели.

Данные представляют собой достаточно разветвленную структуру. Можно считать, что они состоят из правил. Классифицирующие правила обрабатывают входящий запрос и классифицируют его тем или иным образом. Если предложен какой-то шаблон для ответа на определенную реплику, значит, ей уже присвоена метка. Если реплика понята не полностью, то определяется ее тематика и структура. Например, вопрос это или утверждение.

Каков бы ни был уровень распознавания той или иной реплики пользователя, она в любом случае получает метку, и инф выдает ответ. Если вопрос совершенно не понят, то ответ будет взят из пласта «Что отвечать, когда вопрос непонятен». Количество таких ответов учитывается в статистике. У «молодых» инфов, сразу после запуска на сайте, подобных ответов много. По мере «взросления» и обучения их доля снижается.

Правила, применяемые для ответа инфа, могут быть сильными и слабыми. Они выбираются компьютером: чем больше конкретики, тем больше «силы» у правила. Например, в качестве правила можно написать целую фразу «Сколько стоит арбуз», и если задан вопрос, полностью совпадающий с этим правилом, то оно будет самым сильным в данном случае. Можно написать правило «Сколько стоит …. ?». Оно будет слабее и сработает при вопросе «Сколько стоит арбуз» лишь в том случае, если отсутствует правило для этой фразы целиком. «Сила» зависит от степени конкретности правила и от того, в какой точке диалога находятся собеседники. Правила содержат, кроме того, определенный набор условий.

Например, если есть выбор между двумя правилами – «Сколько стоит …?» и «Сколько стоит …? (в разговоре о кредитных картах)» и известно, что разговор идет о кредитных картах, то второе правило сильнее и, соответственно, срабатывает. Таких условий много, они сравниваются, и выбирается самое весомое. Если же выбирается несколько микродиалогов с одинаковым весом, то финальный выбор среди них происходит случайным образом. После того как сделан выбор, срабатывают правила генерации ответа. Ответ может содержать самое сильное правило, слово из синонимических словарей, слово из базы данных, к которой инф обращается. Правило генерации может быть командой: «Сходи в такую-то базу данных, возьми ответ и транслируй его». Тут же могут быть прописаны условия: если такого ответа нет, то сделай что-то еще. Причем программа может обращаться к абсолютно разным и независимым друг от друга внешним источникам – и к базам данных, и к независимым сервисам. Например, информация о погоде и курсах валют берется не из базы данных, а из динамических сервисов. 

В правиле иногда прописывают ту или иную анимацию: инф при ответе может проиграть определенный ролик или, например, состроить рожицу.

Наряду с данными правило-распознающими и правило-генерирующими есть еще и такой тип данных, как словари. Это списки ключевых слов или фраз, которые используются в одной и той же позиции. Также используются словари наиболее типичных опечаток, словари, содержащие кальки, и другие. На данный момент в арсенале «Наносемантики» более 2500 словарей, общих и специфических. Среди них словари для распознавания (специфические) и словари для ответов (в основном общие, словари синонимов).

Особо стоит отметить присутствие функциональных модулей в базе данных инфа. Важное место занимают среди них фильтры контента – «взрослый», «обсценный» и т.п. В первую очередь, это возможность выделить грубую, оскорбительную и обсценную лексику и пометить, что она есть в реплике пользователя. Далее, с этой меткой, можно предпринять любое действие – прервать диалог, отказаться от записи его в лог (историю общения пользователя и инфа). По той же технологии можно не записывать разговоры, касающиеся терроризма или наркотиков, либо прекращать разговор при возникновении такой темы. При необходимости можно пометить и затем фильтровать любую тему – в зависимости от пожеланий заказчика.

Отдельную группу среди модулей составляют игровые блоки. Они позволяют инфу проводить викторины, поддерживать игры, отвечать на вопросы типа «Подскажи, как правильно…». Здесь задействованы такие технологии, которые не требуют детального прописывания модуля. Он возникает автоматически – нужно только прописать варианты ответов.
Существуют отдельные блоки, распознающие ситуации, в которых собеседник хочет оставить свои данные, чтобы пообщаться со специалистом-человеком. Как вариант – инф может сам предложить пользователю оставить контактный телефон или мейл. Это бывает в сложных случаях техподдержки, которые требуют участия консультанта.

«Наносемантикой» уже собран блок и данных, и переменных, который позволяет в разговоре отследить подобные ситуации и дать нужный ответ: либо «Звонить нужно по такому-то телефону», либо «Оставьте свои данные, и мы вам перезвоним». У инфа есть возможность пересылать полученные от пользователя данные на определенный адрес.

К специализированным лингвистическим технологиям «Наносемантики» относятся разработанные ее специалистами словари синонимов, которые позволяют повысить вариативность ответов инфа, и восстановление опущенных данных. Например, ответ «Да» на вопрос «Ты любишь читать?» поступает в движок в виде «Да, я люблю читать», то есть фраза восстанавливается на этапе обработки.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Digital_Gref: чат-бот ответит на вопросы почти как Герман Греф

В преддверии ПМЭФа в мессенджере Telegram появится чат-бот, имитирующий манеру общения и лексикон главы Сбербанка Германа Грефа. Об искусственном интеллекте, который умеет разговаривать о лидерстве, кризисе, блокчейне и нефти как Греф, для портала Банкир.Ру написал основатель платформы BankEx Игорь Хмель.

Вместе с Виктором Куряшкиным, одним из лучших специалистов по естественному языку, машинному обучению и большим данным, мы решили создать ряд ботов общественных и политических деятелей к Петербургскому международному экономическому форуму. На данный момент в открытое альфа-тестирование Просмотр ссылок доступен только зарегистрированным пользователям чат-бот президента Сбербанка. Мы преподнесли его в качестве подарка Герману Оскаровичу на День России. Для начала новой сессии диалогов используйте команду «/start».

Самая сложная категория ботов — это боты, способные эмулировать свободное человеческое общение. Они требуют глубокой работы с натуральным языком и искусственным интеллектом. Отдельной категорией являются боты знаменитостей, сделанные на базе корпусов текстов из их интервью и публичных выступлений. Например, в США в преддверии выборов создали чатбот Дональда Трампа.

Такие боты делаются на основе лексического анализа публичных интервью и цитат спикеров. Нашей целью было, чтобы чат-бот отвечал на вопросы так, как если бы отвечал реальный прототип. Там, где текстов интервью не хватало, была использована Wikipedia.

Интереснее всего с виртуальным Грефом поговорить вот о чем:

1. конкуренция, лидерство
2. IT, big data, Microsoft, Amazon, Netflix, Google
3. банки, перспектива банков в разрезе современного общества, биткойн, блокчейн
4. Cбербанк
5. кризис, санкции
6. нефть

Бот непрерывно развивается: в программу «зашиты» алгоритмы самообучения. Digital_Gref использует много метафор из живой речи. Бот старается поддерживать начатую собеседником тему разговора, но если знания по ней заканчиваются, то он задает вопрос, чтобы перевести разговор в другое русло.

История вопроса

Чат-боты набирают популярность бешеными темпами и становятся вполне самостоятельным каналом коммуникации, конкурирующим за внимание пользователей с поисковиками и мобильными приложениями. Уже сегодня в чат-боты уже уходит часть e-commerce, в особенности простые и часто повторяющиеся покупки, часто привязанные к геолокации. То же самое происходит с локальным поиском: когда нужно найти что-то в вашем районе, либо с поиском по конкретному web-ресурсу (у Forbes и TechCrunch есть собственные поисковые Telegram-боты), либо с поиском сервис-провайдера (юристы, обмен валют и т.д.).

В отличие от мобильного приложения, чат-боту не требуется дополнительная установка, пользователю не нужно привыкать к новым интерфейсам. Достаточно добавить дополнительного собеседника в свой Telegram. Это мессенджер первым открыл API для создания ботов, поэтому там их больше всего. Примеру Telegram последовала платформа для создания ботов от Facebook. Яндекс проинвестировал $3.5 млн в основанную выходцами из России американскую платформу для создания ботов, на которой уже собрано 120 тыс. ботов и более 5 млн пользователей.

Просмотр ссылок доступен только зарегистрированным пользователям

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84620
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Наши старые друзья из ММР записали интервью про Зоряночку. Рекомендую оценить взаимосвязь последних двух вопросов с ответами.

Стенограмма для Зоряны

Далеко не глупая девушка-бот Киевстара Зоряна умеет консультировать и флиртовать. Виталий Султан рассказал, как удалось создать её гармоничный образ и научить словесному мастерству.

Вчера самые активные пользователи Киевстар тестировали в Facebook нового чат-бота оператора — Зоряну, задавая ей вопросы вовсе не о тарифах и услугах. И, хотя новоиспеченный консультант и могла отвечать скромным отказом «по протоколу» на приглашение поужинать в кафе NASA на Месяце, она, как истинная девушка, продолжала флирт. Мы узнали у Киевстар, чего им стоило научить чат-бота быть не только консультантом-профессионалом, но и кокеткой. На вопросы отвечал руководитель электронных каналов Киевстар Виталий Султан.

Почему чат-бота назвали Зоряной и у нее нет функции выбора пола ассистента, а только языка?

Пол, внешний вид и имя выбрали по итогу голосования среди всех сотрудников Киевстар.

На создание чат-бота у вас ушло полтора месяца. С какими трудностями вы столкнулись? (назовите топ-3 основных)

Изначально функционал Зоряны был разработан для нашего сайта Kyivstar.ua. Полтора месяца ушло на адаптацию функционала Зоряны под Messenger. Ключевые сложности были связаны с ограничениями самого Facebook: количество символов в сообщениях и на кнопках. Нам пришлось адаптировать все ответы, которые выходили за рамки ограничения Facebook.
 
На какие неожиданные вопросы Зоряна еще отвечает плохо?

Изначально база знаний Зоряны формировалась на основании описания наших продуктов и услуг. Поэтому, в первую очередь, она готова общаться на эти темы. Конечно, мы научили её отвечать на самые популярные отвлеченные вопросы о погоде, настроении, о себе и т.д. Но, вести беседы на абсолютно все темы она пока не может.

Как вы отслеживаете ее «ляпы»?

Мы проводим внутренние тестирования, изучаем истории бесед. Также следим за реакцией пользователей в социальных сетях, учитываем все критические комментарии.

Скольких клиентов Зоряна уже обслужила? Вы уже отслеживаете их удовлетворенность?

С момента запуска 25 марта, мы постепенно повышали пропускную способность Зоряны. За это время с ней уже успели пообщаться более 200 000 пользователей сайта.

На сколько это сократит затраты на колл-центр и количество обращений?

Мы не рассматриваем Зоряну в Messenger в отрыве от Зоряны на сайте. Рассчитываем обрабатывать ~250.000 обращений в месяц.