(Окончание, предыдущую часть см. http://rusrim.blogspot.com/2022/03/2.html )
А как насчет использования синтетических данных, часто ли они являются хорошим решением?
Эндрю Нг: Я считаю, что синтетические данные - важный инструмент в инструментальном наборе ориентированного на данные искусственного интеллекта. На семинаре NeurIPS Анима Анандкумар (Anima Anandkumar, http://tensorlab.cms.caltech.edu/users/anima/ ) выступила с отличным докладом, где была затронута тема синтетических данных. Думаю, что существуют важные сценарии применения синтетических данных, выходящие за рамки простого шага предварительной обработки с целью увеличения набора данных для алгоритма обучения. Я хотел бы видеть больше инструментов, позволяющих разработчикам использовать генерацию синтетических данных в качестве части замкнутого цикла итеративной разработки систем машинного обучения.
Считаете ли Вы, что синтетические данные позволят Вам опробовать модель на большем количестве наборов данных?
Эндрю Нг: Не совсем, и вот пример. Допустим, вы пытаетесь обнаружить дефекты в корпусе смартфона. Имеется множество различных типов дефектов для смартфонов - это могут быть царапины, выбоины. вмятины, обесцвечивание материала и другие виды пятен. Если Вы обучите модель, а затем в ходе анализа ошибок обнаружите, что в целом она работает хорошо, но плохо работает на вмятинах, то генерация синтетических данных позволит Вам решить проблему более целенаправленно. Вы можете сгенерировать больше данных именно для категории вмятин.
«В Интернет-среде потребительского программного обеспечения мы могли бы обучить небольшое число моделей машинного обучения для обслуживания миллиарда пользователей. На производстве у Вас может быть 10 тысяч производителей, создающих 10 тысяч настроенных для себя моделей ИИ» - Эндрю Нг
Генерация синтетических данных - очень мощный инструмент, однако имеется множество более простых инструментов, которые я часто пробую в первую очередь. Это, например, увеличение объёма данных (data augmentation), улучшение согласованности маркировки или просто просьба к заводу собрать больше данных.
Чтобы показать эти вопросы более конкретно, не могли бы Вы привести пример? Когда компания обращается к компании Landing AI и говорит, что у неё есть проблемы с визуальным контролем, как Вы принимаете их заказ и движетесь в сторону развертывания решения?
Эндрю Нг: Когда к нам обращается клиент, мы обычно обсуждаем его проблему с проведением контроля и просматриваем ряд изображений, чтобы убедиться, что проблема решаема с помощью компьютерного зрения. Если это так, то мы просим их загрузить их данные на платформу LandingLens ( https://landing.ai/platform/ ). Мы часто консультируем их по методологии ориентированного на данные ИИ, и помогаем им маркировать данные.
Одним из главных направлений деятельности компании Landing AI является предоставление компаниям-производителям возможности самостоятельно осуществлять машинное обучение. Значительная часть нашей работы заключается в обеспечении того, чтобы программное обеспечение было быстрым и простым в использовании. В ходе итеративного процесса разработки систем машинного обучения мы консультируем клиентов по таким вопросам, как обучать модели на платформе, когда и как улучшить маркировку данных для того, чтобы повысить производительность модели. Проводимое нами обучение и наше программное обеспечение поддерживают их на всех этапах, вплоть до развёртывания обученной модели на оконечном устройстве на заводе.
Как Вы реагируете на меняющиеся потребности? Если на заводе меняются продукты или условия освещения, может ли модель подстроиться под эти изменения?
Эндрю Нг: Это зависит от производителя. Существует дрейф данных во многих контекстах. Однако есть отдельные производители, которые используют одну и ту же производственную линию с небольшими изменениями уже 20 лет, поэтому они не ожидают изменений в ближайшие пять лет. Такие стабильные условия облегчают жизнь. Другим производителям мы предоставляем инструменты, позволяющие сообщать о наличии серьезных проблем с дрейфом данных. Я считаю очень важным дать возможность клиентам-производителям самим корректировать данные, переобучать и обновлять модель - потому что, если вдруг что-то изменится, а в США будет 3 часа ночи, я хочу, чтобы они могли сразу же адаптировать свой алгоритм обучения, чтобы обеспечить непрерывность работы.
В Интернет-среде потребительского программного обеспечения мы могли бы обучить небольшое число моделей машинного обучения для обслуживания миллиарда пользователей. На производстве у Вас может быть 10 тысяч производителей, создающих 10 тысяч настроенных для себя моделей ИИ. Проблема заключается в том, как это сделать, не нанимая в компанию Landing AI 10 тысяч специалистов по машинному обучению?
Итак, Вы говорите, что для масштабирования Вам нужно дать клиентам возможность самим выполнять значительную часть обучения и другой работы?
Эндрю Нг: Да, именно так! Это общеотраслевая проблема ИИ, а не только проблема производства. Посмотрите на здравоохранение - каждая больница имеет свой немного отличающийся формат электронных медицинских документов. Каким образом каждая из больниц может обучить свою собственную модель искусственного интеллекта? Нереалистично ожидать, что ИТ-персонал каждой больницы изобретет новые архитектуры нейронной сети. Единственный выход из этой дилеммы - создать инструменты, которые позволят клиентам создавать свои собственные модели, предоставляя им средства для «конструирования» данных и выражения своих знаний в предметной области. Это то, что Landing AI делает в сфере компьютерного зрения, и сфере искусственного интеллекта требуются другие команды, чтобы делать то же в других областях.
Есть ли что-то ещё, что, по Вашему мнению, является важным для того, чтобы люди понимали, какую работу Вы делаете и что собой представляет движение за ориентированный на данные ИИ?
Эндрю Нг: За последнее десятилетие самым большим сдвигом в области искусственного интеллекта стал переход к глубокому обучению. Полагаю, что вполне возможно, что в этом десятилетии наибольший сдвиг произойдёт в сторону ориентированного на данные ИИ. Учитывая зрелость сегодняшних архитектур нейронных сетей, думаю, для многих практических приложений узким местом будет способность эффективно получать данные, необходимые для разработки хорошо работающих систем. Движение за ориентированный на данные ИИ обладает огромной энергией и импульсом в масштабах всего сообщества. Я надеюсь, что всё больше исследователей и разработчиков присоединятся к нему и будут работать в этом направлении.
Интервью брала Элиза Стрикленд (Eliza Strickland)
Источник: сайт IEEE Spectrum Международной ассоциации специалистов по электротехнике и радиоэлектронике IEEE
https://spectrum.ieee.org/andrew-ng-data-centric-ai#toggle-gdpr
Комментариев нет:
Отправить комментарий