10 августа 2021 ・ Управление инновациями
Статья, опубликованная в журнале «Гарвард Бизнес Ревью Россия»

Почему ИИ для вашего бизнеса не должен быть слишком сложным
и дорогим

Как создавать ИИ-системы без больших данных в нетехнологичных отраслях

Автор: Эндрю Ын

Почему ИИ для вашего бизнеса не должен быть слишком сложным и дорогим

Иллюстрация: Skizzomat

читайте также

Искусственный интеллект открывает огромные возможности, но в большинстве отраслей он пока не используется. Конечно, ИИ изменил крупные потребительские интернет-компании вроде Google, Baidu и Amazon с миллионами пользователей и огромными объемами данных. Но прогнозы о том, что ИИ будет приносить дополнительные $13 трлн в год, оправдаются, когда предприятия промышленности, сельского хозяйства и здравоохранения научатся использовать эти технологии. И вот в чем проблема: сценарий, используемый интернет-компаниями для создания своих ИИ-решений, где одна универсальная система может обслуживать множество пользователей, не подходит для других секторов.

Более традиционным отраслям понадобится множество индивидуализированных решений, адаптированных к разнообразным вариантам использования. Однако это не означает, что ИИ не подходит для этих сфер. Это означает лишь то, что им необходим другой подход.

Чтобы заполнить пробел и в полном объеме реализовать возможности ИИ, руководители всех отраслей должны внедрять новый подход к построению ИИ на основе данных. Если говорить более конкретно, при создании таких систем важно, чтобы данные ясно отражали то, чему необходимо научить ИИ. Для этого они должны охватывать все важные случаи и должны быть последовательно размечены. Иначе говоря, для создания полезных систем ИИ нам нужны команды, способные программировать с помощью данных, а не кода.

Почему сложно внедрять ИИ в нетехнологичных отраслях

Почему ИИ не получил широкого распространения за пределами интернет-компаний? Вот некоторые главные проблемы, связанные с внедрением ИИ в других отраслях:

Маленькие объемы данных. В потребительской интернет-компании с огромным числом пользователей инженеры располагают миллионами элементов данных, на которых может учиться ИИ. Но в других отраслях объемы данных гораздо меньше. Например, можно ли построить систему ИИ, которая научилась бы распознавать бракованный автомобильный компонент, увидев всего 50 примеров? Или выявлять редкое заболевание, изучив всего 100 диагнозов? Методы, предназначенные для работы с 50 млн элементов данных, не будут работать всего с 50.
Стоимость кастомизации. В потребительских интернет-компаниях работают десятки или сотни квалифицированных инженеров, разрабатывающих и поддерживающих единые системы ИИ, приносящие огромную пользу (скажем, систему онлайн-рекламы, приносящую выручку более $1 млрд в год). Но в других отраслях существуют многочисленные проекты стоимостью $1—5 млн, каждый из которых нуждается в индивидуальной системе ИИ. Например, каждому предприятию, производящему разные типы продуктов, может понадобиться индивидуальная система технического контроля, а каждой больнице, имеющей собственный способ кодирования медицинских записей, — собственный ИИ для обработки данных пациентов. Совокупная ценность сотен тысяч этих проектов огромна, но экономика индивидуального проекта может не предполагать найма специальной большой команды для создания и поддержания системы ИИ. Проблема усугубляется постоянной нехваткой специалистов в области ИИ, что еще больше повышает издержки.
Период между подтверждением концепции и вводом в эксплуатацию. Даже когда система ИИ работает в лаборатории, для ее практического внедрения требуются долгие часы работы инженеров. Нередко команды празднуют успешное подтверждение концепции и затем обнаруживают, что им предстоит еще один или два года работы, прежде чем систему можно будет ввести в эксплуатацию и поддерживать ее работу.

Чтобы в полной мере реализовать потенциал ИИ, необходим систематический подход к решению этих проблем во всех отраслях. И здесь новые возможности открывают методы работы с ИИ на основе данных, поддерживаемые инструментами, предназначенными для создания, запуска и эксплуатации ИИ-систем, то есть платформами машинного обучения (MLOps). Компании, которые внедрят этот подход быстрее, на шаг опередят конкурентов.

Разработка ИИ на основе данных

Системы ИИ состоят из программного обеспечения (компьютерной программы, включающей модель ИИ) и данных (информации, используемой для обучения модели). Например, чтобы создать системы ИИ для автоматического приемочного контроля на производстве, инженер может разработать ПО, применяющее алгоритм глубокого обучения, которому затем демонстрируется набор данных с хорошими и бракованными запчастями, чтобы он мог научиться различать их.

За последнее десятилетие множество исследований в области ИИ было обусловлено разработкой на основе программного обеспечения (также называемой разработкой на основе моделей), при которой используются одни и те же фиксированные данные и команды пытаются оптимизировать или изобрести новые программы, чтобы они хорошо учились на имеющихся данных. Многие технологические компании располагали большими объемами данных от миллионов пользователей и использовали их для внедрения инноваций в ИИ.

Но на текущем уровне развития ИИ во многих областях применения сложность заключается в получении подходящих данных для программного обеспечения. Мы слышали о преимуществах больших данных, но теперь знаем, что во многих областях полезнее будет сосредоточиться на получении качественных данных, ясно иллюстрирующих концепции, которым нужно обучить ИИ. Это означает, например, что данные должны всесторонне описывать важные случаи и должны быть последовательно размечены. Данные являются пищей ИИ, и для современных систем ИИ важны не только калории, но и качество питания.

Сместив фокус с ПО на данные, вы получите важное преимущество: вы сможете рассчитывать на людей, уже работающих у вас. Хороших специалистов в области ИИ не хватает, и в таких условиях подход, основанный на данных, позволяет привлекать к разработке ИИ-систем отраслевых специалистов с хорошим опытом в своей сфере.

Например, на большинстве заводов есть работники, которые умеют прекрасно определять и находить брак (царапина 0,2 мм считается браком? Или она слишком мала и не имеет значения?). Если представить, что каждое производство попросит своих работников разработать новое программное обеспечение для ИИ, чтобы получить необходимое индивидуальное решение, прогресс будет медленным. А если вместо этого создать и предложить этим профильным специалистам инструменты, которые позволят подготовить данные и применить свои знания о производстве для обучения ИИ, их шансы на успех будут гораздо выше.

Создание и использование ИИ должно представлять систематический и воспроизводимый процесс

Переход к разработке ИИ на основе данных стал возможен благодаря возникновению MLOps, которые обеспечивают инструменты, как никогда облегчающие создание, внедрение и поддержание систем ИИ. Инструменты, позволяющие упростить подготовку качественных массивов данных, дают нам ключ к решению описанных выше проблем недостаточного объема данных, высокой стоимости кастомизации и длинного пути ввода проекта по использованию ИИ в эксплуатацию.

Как именно? Во-первых, наличие высококачественных данных означает, что системы ИИ смогут учиться на меньших выборках, имеющихся в большинстве отраслей. Во-вторых, дав возможность готовить данные узким специалистам компании, а не экспертам в области ИИ, вы повышаете доступность использования ИИ всеми отраслями. И, в-третьих, платформы MLOps обеспечивают поддерживающее ПО, необходимое для ввода систем ИИ в эксплуатацию, и командам больше не нужно заниматься его разработкой. Это позволяет командам внедрить системы ИИ и сократить период между подтверждением концепции и ее вводом в эксплуатацию с нескольких лет до нескольких месяцев или недель.

Мы пока даже не можем себе представить огромное множество важнейших проектов в области ИИ. И даже для проектов, над которыми команды уже работают, период, ведущий к вводу в эксплуатацию, еще предстоит сократить — по оценкам компании Accenture, 80—85% проектов в области ИИ находятся на этапе подтверждения концепции.

Вот что компании могут сделать прямо сейчас:

Не уделяйте все внимание количеству собираемых данных, также учитывайте их качество, следите, чтобы они ясно иллюстрировали концепции, необходимые для обучения ИИ.
Пусть ваша команда использует подход на основе данных, а не программного обеспечения. Многих разработчиков ИИ, в том числе имеющих богатый научный или исследовательский опыт, учили опираться на ПО, призывайте их также внедрять методы, ориентированные на данные.
Для любого намеченного проекта с использованием ИИ планируйте его ввод в эксплуатацию и используйте инструменты MLOps. Например, даже работая над подтверждением концепции, призывайте команды сразу разрабатывать более долгосрочный план по управлению данными, внедрению, мониторингу и поддержке системы ИИ.

Возможно, ИИ станет выгодным активом не только для потребительских интернет-компаний, располагающих огромными запасами данных, но в других отраслях над этим еще придется работать. Но именно поэтому самые большие неизученные возможности ИИ могут находиться в этих других отраслях. Когда-то электричество изменило все сферы, теперь это может сделать искусственный интеллект. Но следующие несколько шагов на этом пути потребуют изменений сценария создания и внедрения систем ИИ. В частности, новый подход на основе данных в сочетании с инструментами MLOps, которые позволяют отраслевым специалистам участвовать в создании, внедрении и поддержке систем ИИ, поможет все отраслям воспользоваться преимуществами, предлагаемыми ИИ.

Об авторе

Эндрю Ын (Andrew Ng) — основатель и CEO компании Landing AI, бывший вице-президент и руководитель направления разработки в Baidu, соруководитель и сооснователь Coursera, бывший основатель и руководитель Google Brain и доцент Стэнфордского университета.

Почему ИИ для вашего бизнеса не должен быть слишком сложным
и дорогим

Как создавать ИИ-системы без больших данных в нетехнологичных отраслях

Автор: Эндрю Ын

От отца к сыну

История о богатыре

Что делать, если ваша команда вас подводит

Как измерить настроение

Четырехдневная рабочая неделя: за и против

Всё сложно: что делать, если начальник живет в своей реальности

Как заработать миллиард на идеях сотрудников

Миф о синергии сделок M&A

Почему ИИ для вашего бизнеса не должен быть слишком сложным и дорогим

Как создавать ИИ-системы без больших данных в нетехнологичных отраслях

Автор: Эндрю Ын

От отца к сыну

История о богатыре

Что делать, если ваша команда вас подводит

Как измерить настроение

Четырехдневная рабочая неделя: за и против

Всё сложно: что делать, если начальник живет в своей реальности

Как заработать миллиард на идеях сотрудников

Миф о синергии сделок M&A

Почему ИИ для вашего бизнеса не должен быть слишком сложным
и дорогим