Демонстрация и применение искусственного интеллекта — КиберПедия 

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Демонстрация и применение искусственного интеллекта

2021-01-31 83
Демонстрация и применение искусственного интеллекта 0.00 из 5.00 0 оценок
Заказать работу

 

Если не считать весьма небольшого числа более ранних случаев (вроде системы Лекуна для распознавания рукописных номеров на чеках), можно сказать, что коммерческому применению глубокого обучения всего несколько лет. Однако такие технологии распространяются с удивительной скоростью. Разработчик программного обеспечения Джефф Дин[199], который возглавлял программы Google по использованию глубокого обучения, отмечает, что еще в 2012 году компания не применяла эту технологию для улучшения таких продуктов, как поиск Google, Gmail, YouTube или Google Maps[200]. Однако к третьему кварталу 2015 года глубокое обучение стало использоваться примерно в 1200 проектах компании и показало б о льшую производительность по сравнению с другими методами.

Компания DeepMind особенно продвинулась в сочетании глубокого обучения с другой технологией, известной как обучение с подкреплением[201], сосредоточив внимание не только на информационных продуктах, предоставляемых клиентам, но и на важных процессах реального мира. Google ввела в строй несколько крупнейших в мире дата-центров, которые потребляют очень много энергии. В этих зданиях расположены 100 тысяч серверов, которые должны не только получать питание, но и охлаждаться. Проблема с охлаждением усугубляется тем фактом, что общая вычислительная нагрузка для центра, или общее количество запрашиваемых серверов, непредсказуемо изменяется во времени. Кроме того, на необходимость охлаждения влияет погода.

Как правило, всеми насосами, вентиляторами, охладительными башнями и прочим оборудованием, которое поддерживает нужную температуру в дата-центрах, управляют люди. Они следят за термометрами, датчиками давления и прочими сенсорами и принимают решения, как лучше охлаждать здание. Компания DeepMind захотела узнать, можно ли вместо этого использовать машинное обучение. Специалисты использовали данные прошлых лет о вычислительной нагрузке, показаниях датчиков, факторах окружающей среды (температуре и влажности), чтобы обучить систему нейронных сетей управлять всем имеющимся оборудованием для охлаждения. В каком-то смысле разработчики подошли к дата-центру как к гигантской видеоигре и дали указания своим алгоритмам постараться набрать максимальное количество очков; в рассматриваемом случае очки начислялись за оптимальную эффективность энергопотребления.

Когда реальный дата-центр перешел под управление этой системы, результаты появились немедленно и поражали воображение[202]. Общее количество энергии, используемой для охлаждения, снизилось на целых 40 процентов, а ситуация с непроизводительными потерями — энергией, которая не использовалась непосредственно для IT-оборудования и включала дополнительные нагрузки и потери, — улучшилась примерно на 15 процентов. Один из основателей DeepMind Мустафа Сулейман сказал нам, что это одно из самых крупных улучшений, которые когда-либо видела команда дата-центров Google. Сулейман также подчеркнул, что подход DeepMind очень хорошо поддается обобщению. Нейронные сети необязательно полностью перестраивать для каждого нового дата-центра. Их просто нужно обучить с использованием максимально подробных данных за несколько лет. Такое обучение — тонкая и сложная работа[203], но она определенно окупается.

Наиболее эффективные системы машинного обучения, используемые сегодня для самых разных приложений — от управления энергией в дата-центрах до распознавания речи, классификации образов и автоматического перевода — удивительно похожи. Это просто варианты глубокого обучения, а сама сфера применения существенно не изменяет технологию. Это означает, что такой подход к искусственному интеллекту способен с большой скоростью проникать в различные области промышленности и экономики. Новые нейронные сети можно почти мгновенно дублировать и масштабировать, обучать с помощью данных, а потом применять в деле.

Технологические гиганты, включая Microsoft, Amazon, Google и IBM, разработали собственные технологии машинного обучения и сделали их доступными для других компаний[204] посредством сочетания облака и программных интерфейсов приложений (API), которые, по сути, являются ясными, согласованными и открытыми правилами, определяющими то, как части программного обеспечения взаимодействуют друг с другом. API значительно облегчают комбинирование кода из различных источников в единое приложение, а облако обеспечивает его доступность по запросу в любой точке мира.

С такой инфраструктурой появляется возможность быстрого распространения машинного обучения по всему миру. Однако по причинам, описанным в главе 1, мы предполагаем, что это будет происходить неравномерно, поскольку в ведущих компаниях перестраиваются процессы и возникают новые модели ведения бизнеса. Это уже произошло кое-где, в том числе в некоторых неожиданных местах.

Когда японец Макото Коикэ в 2015 году приехал к родителям на огуречную ферму, он увидел возможность применить машинное обучение. Ранее он работал инженером по аппаратному и программному обеспечению в автомобильной промышленности, поэтому был сведущ в создании оборудования, сочетающего коды и механизмы. Он нашел приложение своим талантам, взявшись за сортировку огурцов, которой ранее занималась его мать. Используя свой многолетний опыт, она вручную сортировала всю продукцию фермы на девять категорий[205]. Работа не казалась сложной, поскольку ферма была небольшая (средний размер японской фермы, за исключением тех, где выращивают рис, составляет всего 1,5 гектара[206], то есть примерно полтора бейсбольных или два футбольных поля[207]), но мать сильно уставала. Во время пика созревания она работала до восьми часов в день.

Макото Коикэ был впечатлен[208] способностями AlphaGo к сравнению изображений и заинтересовался технологией машинного обучения TensorFlow, которую Google открыла для широкой общественности в ноябре 2016 года. Инженер решил использовать TensorFlow, чтобы узнать, можно ли автоматизировать работу по сортировке огурцов на семейной ферме. Хотя у него не было опыта в области машинного обучения, он освоил TensorFlow, а затем обучил систему, взяв 7 тысяч изображений огурцов различных категорий. Используя недорогие камеры, компьютеры и контроллеры, Макото построил полностью автоматический сортировщик, который в первый год работы добился 70-процентной точности. Улучшить результат почти наверняка можно будет с помощью изображений более высокого разрешения и нового поколения программного обеспечения для машинного обучения, использующего облако. Макото говорит об этих технологиях так: «Мне не терпится их опробовать»[209]. Работы, подобные описанной, заставляют нас согласиться с мнением Каза Сато из Google, заметившего: «Я не преувеличу, если скажу, что варианты применения машинного обучения и глубокого обучения ограничены только нашим воображением»[210].

Когда мы писали книгу, почти все коммерчески успешные системы в этой сфере использовали методы контролируемого обучения и лишь немногие применяли неконтролируемое обучение (как в случае с оптимизацией дата-центра компанией DataMind). Однако люди в основном учатся с помощью неконтролируемого обучения. Ребенок каждый день изучает физику, играя с кубиками, выливая воду из стакана, бросая мячик и опрокидывая стулья, а не изучая законы Ньютона и не запоминая уравнения типа F = ma. Ян Лекун метко обрисовал широту и почти полную невостребованность неконтролируемого обучения с помощью такой метафоры: «Если сравнивать машинное обучение с кексом, то неконтролируемое обучение будет собственно кексом, контролируемое — сахарной глазурью, а обучение с подкреплением — вишенкой наверху. Мы знаем, как делать сахарную глазурь и где взять вишенку, но мы пока не в силах испечь кекс»[211]. Он считает, что разработка улучшенных алгоритмов неконтролируемого обучения станет важна, если мы когда-нибудь создадим общий искусственный интеллект.

 

РАЗУМ И МАШИННОЕ ОБУЧЕНИЕ

 

Мы не раз слышали, как создатели нынешнего поколения нейронных сетей пренебрежительно именуют предыдущий, основанный на правилах подход «конструированием признаков». Сейчас многие специалисты считают неверным подход, при котором сначала все соответствующие ситуации правила собираются, а затем вводятся в компьютер. Они полагают, что гораздо продуктивнее создавать системы, способные изучать правила самостоятельно. Статистический лагерь исследователей искусственного интеллекта сейчас занимает лидирующие позиции и уже выполнил по меньшей мере некоторые обещания из тех, что были даны более полувека назад.

И как же в таких условиях свести вместе разум и машину? Есть несколько разных способов. Один был описан в предыдущей главе; его сторонники, Пол Мил и Том Дэвенпорт, полагают, что люди, наделенные здравым смыслом, будут наблюдать за решениями и действиями искусственного интеллекта и вмешиваться, если заметят что-то неладное. Именно это делала компания DeepMind, когда оптимизировала обслуживание дата-центра с помощью нейронных сетей. Люди-контролеры никуда не делись, в любой момент они могли перехватить контроль у компьютера.

Автопроизводители, которые встраивают в машины технологии автоматического управления, пользуются таким же методом. Они подчеркивают, что человек и в буквальном, и в переносном смысле находится на месте водителя и отвечает за безопасное функционирование автомобиля даже в то время, когда тот едет сам. Многим участие человека в схеме управления кажется благоразумным, поскольку невнимательность может быть фатальной. Летом 2016 года машина марки Tesla Джошуа Брауна врезалась в борт грузового прицепа, водитель погиб[212]. Фура белого цвета совершала левый поворот с автострады на боковую дорогу. Браун ехал по противоположной стороне шоссе. Поскольку машина Tesla не затормозила перед катастрофой, похоже, ни Браун, ни видеокамера автомобиля не заметили белый прицеп на фоне яркого неба Флориды[213]. Возможно, Браун слишком полагался на систему автоматического вождения, так как видел ее эффективность во многих предыдущих случаях и привык не обращать особого внимания на дорогу.

Google считает, что, поскольку человеческая невнимательность — это вечная проблема, нужно полностью исключить людей из управления транспортным средством. Крис Урмсон, бывший руководитель проекта компании по машинам с автоматическим управлением, говорит: «Общепринятая точка зрения такова, что нам нужно взять существующие системы помощи водителю и каким-то образом постоянно улучшать их, тогда у нас со временем появятся самоуправляемые автомобили. Что ж, я отвечу так: это равнозначно утверждению, что если я буду усердно учиться прыгать, то когда-нибудь научусь летать. На самом деле действовать нужно несколько иначе»[214]. Вот почему компания работает над созданием на сто процентов автономных машин, которые не требуют участия человека, — это называется автономностью пятого уровня[215].

Их возможности впечатляют. На конференции TED[216] 2015 года Урмсон сообщил: «Наши автомобили проезжали через Маунтин-Вью, и вот с чем мы столкнулись. Одна женщина на электрическом кресле-коляске гонялась кругами за уткой. В правилах дорожного движения ничего не написано о том, что нужно делать в таком случае, однако наши машины смогли обнаружить препятствие, снизить скорость и проехать дальше»[217]. Автономных машин, способных безопасно ездить в любых условиях и ситуациях, пока еще нет. Тем не менее, по нашему мнению, они скоро появятся.

Способность машин преодолевать парадокс Полани начинает применяться в работе бэк-офисных подразделений «белых воротничков», которая в данный момент удивительно плохо поддается полной автоматизации. «Бэк-офис» — обобщающий термин для умственной работы, происходящей вне поля зрения клиента и включающей закупки, бухгалтерию и IT. Как мы говорили ранее, наиболее масштабные и распространенные операции бэк-офиса давно автоматизированы корпоративными системами, тем не менее в большинстве компаний все равно остается масса ручной работы. Один из способов автоматизировать хотя бы часть такой работы — спросить выполняющих ее людей, какими правилами они руководствуются, каковы исключения из них, когда нужно использовать другой набор правил или директив и прочее. Однако на сбор такой информации с помощью опросов ушло бы много времени, и это отвлекло бы сотрудников от работы и, вероятно, не оправдало бы себя. Лица, выполняющие менее рутинную работу, по всей вероятности, не способны точно и исчерпывающе изложить кому бы то ни было, как они действуют.

Японская страховая компания Fukoku Mutual Life использует другой подход[218]. В декабре 2016 года она объявила о попытке использовать созданную IBM технологию искусственного интеллекта Watson, чтобы хоть частично автоматизировать работу людей, имеющих дело с заявлениями о наступлении медицинского страхового случая. Система будет извлекать соответствующую информацию из документов, предоставленных больницами и другими медицинскими учреждениями, и использовать ее для заполнения надлежащих кодов для страховых выплат, а затем выдаст эту информацию людям. В перспективе же система будет «изучать историю оценивания прошлых выплат, чтобы перенять опыт и квалификацию оценщиков»[219]. Другими словами, технологии предстоит обучаться по ходу дела, и со временем она сможет освободить людей от большого объема работы.

Мы ожидаем, что в ближайшее время появится немало таких проектов, и прогнозируем быстрое распространение глубокого и других видов машинного обучения. Например, значительная часть работы с клиентами заключается в том, что сотрудник выслушивает заказчика, чтобы понять, чего тот желает, а затем предоставляет ему ответ или услугу. Современные технологии смогут взять на себя вторую часть описанной процедуры, как только овладеют правилами взаимодействия. Гораздо труднее будет автоматизировать не нахождение ответа, а первый этап — выслушать и понять. Распознавание речи и другие аспекты обработки естественного языка крайне сложны для искусственного интеллекта с самого его зарождения по причинам, описанным в этой главе. Доминировавший ранее символический подход с такими задачами не позволял справиться вовсе, однако ему на смену пришли новые подходы, основанные на глубоком обучении, которые развиваются очень быстро даже на удивление экспертов.

В октябре 2016 года группа из Microsoft Research объявила, что сконструированная ею нейронная сеть достигла «уровня распознавания разговорной речи, сравнимого с человеческим»[220]. Такая фраза была в названии их статьи. Их система работала точнее, чем профессиональные люди-транскрибаторы[221], причем справлялась как с аудиозаписями по установленным темам, так и с обычными разговорами между друзьями и членами семьи. Комментируя этот результат, профессор Джеффри Паллум написал: «Должен признаться, я никогда не думал, что доживу до такого дня. В 1980-х я считал, что полностью автоматическое распознавание связной речи (слушание и точная запись сказанного) слишком трудно для машин… Специалисты достигли этого, не опираясь на какой-либо синтаксический анализ[222]: они проделали чисто техническую работу с помощью статистического моделирования, основанного на гигантском объеме исходных данных… Я не только не думал, что когда-либо это увижу, — я уверенно поставил бы на обратное»[223].

Легендарный ученый Фредерик Йелинек, работавший в области информатики, точно подметил причину масштабного сдвига внутри сообщества разработчиков искусственного интеллекта от подхода, основанного на правилах, к статистическому подходу. В середине 1980-х он сказал: «Каждый раз, когда я увольняю лингвиста, качество распознавания речи улучшается»[224]. К середине 2010-х в самых успешных группах, работавших над задачами преобразования речи в текст, лингвистов не было, и результаты удивили мир. Мы уверены, что нас еще ждут новые сюрпризы.

Мы согласны с CEO[225] компании Salesforce и пионером индустрии высоких технологий Марком Бениоффом в том, что мы двигаемся к «миру с лидерством искусственного интеллекта»[226]. Как и мы, он видит бесчисленные возможности в перспективе заменить людей, принимающих решения, чем-то намного более эффективным. Марк Бениофф пишет: «Многие бизнесы по-прежнему принимают важные решения, опираясь на интуицию, а не на информацию… В ближайшие несколько лет это изменится, так как искусственный интеллект становится все более распространенным и потенциально делает каждую компанию и каждого работника умнее, быстрее и производительнее»[227]. Несколько лет назад такой прогноз показался бы ужасным преувеличением, сегодня же он выглядит беспроигрышной ставкой.

 

Резюме

 

• Основанный на правилах, или символический, подход к искусственному интеллекту сейчас пребывает в спячке. Кажется очень маловероятным, что он выживет за пределами узких областей, а возможно, и совсем исчезнет.

• Машинное обучение — искусство и наука создания программных систем, которые могут обнаруживать закономерности и формулировать выигрышные стратегии после просмотра множества примеров, — в итоге выполняет свои давние обещания и уже приносит определенную пользу.

• Системы машинного обучения действуют лучше, когда становятся больше, работают на более быстром и специализированном аппаратном обеспечении, получают доступ к большему количеству данных и содержат улучшенные алгоритмы. Поскольку все эти вещи сейчас активно совершенствуются, то и машинное обучение быстро прогрессирует.

• Нейронные сети достигают наилучших результатов при контролируемом обучении, когда есть размеченные примеры. Однако в неконтролируемом обучении — основном способе, которым люди познают мир, — прогресс нейронных сетей невелик.

• Контролируемое обучение идеально подходит для автоматизации многих задач, которые сейчас выполняют люди, особенно в сферах сопоставления образов, диагностики, классификации, прогнозирования и рекомендаций. Машинное зрение, распознавание речи и другие вещи, которые некогда считались невозможными, сейчас во многих областях осуществляются на уровне, сравнимом с человеческим.

• Пока мы находимся на ранних стадиях распространения машинного обучения. Оно будет проникать в экономику и общество, особенно после того, как стало доступно любому желающему в облаке.

• Системам машинного обучения (и всем прочим формам искусственного интеллекта) по-прежнему не хватает здравого смысла.

 

Вопросы

 

1. Выполняете ли вы какую-нибудь важную работу по сопоставлению образов, диагностике, классификации, прогнозированию и рекомендациям? Рассматриваете ли вы применение машинного обучения для каких-либо из перечисленных областей?

2. Принятие каких решений и выполнение каких операций (если таковые есть) вы могли бы доверить системам искусственного интеллекта? Какие из этих решений и задач в случае автоматизации потребуют присмотра человека?

3. Вы согласились бы завтра утром поехать на работу на машине с автоматической системой вождения? Как вы думаете, будет ли вам комфортно делать это через пять лет? Почему?

4. Заполните пропуск в предложении: «Если конкуренты реализуют успешную систему машинного обучения для __________, у нас будут серьезные проблемы».

5. Какой стратегией машинного обучения вы пользуетесь? Насколько далеки вы от внедрения машинного обучения в своей организации?

 

 

Глава 4. Привет, робот!

 

 

Тою порою Фетида достигла Гефестова дома…

Бога, покрытого потом, находит в трудах, пред мехами

Быстро вращавшегось: двадцать треножников вдруг он работал,

В утварь поставить к стене своего благолепного дома.

Он под подножием их золотые колеса устроил,

Сами б собою они приближалися к сонму бессмертных,

Сами б собою и в дом возвращалися, взорам на диво[228].

 

Гомер, «Илиада», VIII в. до н. э.

 

* * *

 

Еда редко бывает одновременно питательной, вкусной и доступной по цене. Еще более необычно, если при всех этих достоинствах она также дает общее представление о перспективах автоматизации.

Первый ресторан Eatsa открылся в районе Саут-оф-Маркет в Сан-Франциско в 2015 году. Он предлагал различные вегетарианские блюда из киноа — южноамериканской зерновой культуры, отличающейся превосходными питательными свойствами[229]. В сети Eatsa вместе с киноа использовали кукурузу, бобы, баклажаны и соус гуакамоле; блюда имели такие названия, как «Юго-западный скрэмбл» и «Не беспокойся, карри».

 

Рабочие процессы без людей

 

До того как попробуют пищу, посетители Eatsa сталкиваются с кое-чем необычным: они заказывают, оплачивают и получают ее, не встречаясь ни с кем из работников. При входе в ресторан клиенты видят ряд планшетных компьютеров. С любого из них можно сделать заказ и оплатить его картой (в ресторанах Eatsa не принимаются наличные). Пока еда готовится, большой экран показывает имена клиентов, полученные с пластиковых карт. Когда имя приближается к верхней части списка, рядом с ним появляется число, соответствующее одной из примерно двадцати ячеек — небольших отверстий в стене, закрытых панелями. Эти панели — прозрачные жидкокристаллические дисплеи, на каждом из них отображается имя клиента посередине и маленький кружок в правом верхнем углу. Нужно два раза прикоснуться к кружку, чтобы панель открылась и можно было забрать еду, упакованную навынос (в ресторане мало мест для сидения).

В заведениях Eatsa есть небольшой штат администраторов, которые показывают новичкам, как обрабатывать заказы, и отвечают на вопросы, но большинству посетителей не приходится иметь с ними дело. Первые отзывы об Eatsa были превосходными. Один восторженный клиент сказал: «В этом ресторане вам не нужно взаимодействовать ни с одним человеком. Воспользуйтесь экраном, и через несколько минут вы получите вкусную питательную еду по умеренной цене. Присоединяйтесь»[230].

Популярность Eatsa иллюстрирует важный феномен второй эры машин: многие виды взаимодействия, которые ранее происходили между людьми в физическом мире, сейчас производятся через цифровые интерфейсы. Оказалось, что для множества бизнес-процессов вовсе не требуется, чтобы какое-то количество реальных атомов перемещалось с места на место, — достаточно двигать и трансформировать биты, фрагменты информации. Заказать еду в сети Eatsa, оплатить и узнать, где ее можно забрать, — примеры таких процессов. Не вполне правильно говорить, что они полностью автоматизированы, поскольку в них по-прежнему участвует человек — сам клиент. Точнее будет понятие «виртуализированные процессы».

 


Поделиться с друзьями:

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.058 с.