Интервью-серия: Денас Грибаускас, директор по управлению и стратегии в Oxylabs

Денас Грибаускас — директор по управлению и стратегии в Oxylabs, мировом лидере в области сбора веб-аналитики и премиум-решений для прокси-серверов.

Oxylabs основана в 2015 году и предоставляет одну из крупнейших в мире сетей прокси-серверов с этическим источником — более 177 миллионов IP-адресов в 195 странах. Среди её продуктов — продвинутые инструменты, такие как Web Unblocker, Web Scraper API и OxyCopilot, помощник по сбору данных на основе искусственного интеллекта, который преобразует естественный язык в структурированные запросы данных.

Вопрос: у вас впечатляющий опыт работы в сфере юриспруденции и управления в Литве. Что лично вас мотивировало заняться одной из самых спорных задач в области искусственного интеллекта — этикой и авторским правом — в вашей роли в Oxylabs?

Денас Грибаускас: Oxylabs всегда была флагманом ответственных инноваций в отрасли. Мы первыми выступили за этичное получение прокси и стандарты веб-скрапинга. Теперь, когда ИИ развивается так быстро, мы должны убедиться, что инновации сбалансированы с ответственностью.

Мы видели в этом огромную проблему, стоящую перед индустрией искусственного интеллекта, и могли видеть решение. Предоставляя эти наборы данных, мы позволяем компаниям, занимающимся искусственным интеллектом, и создателям быть на одной волне в отношении справедливого развития искусственного интеллекта, что выгодно всем участникам. Мы знали, как важно защищать права создателей, но также предоставлять контент для разработки будущих систем искусственного интеллекта, поэтому мы создали эти наборы данных, чтобы удовлетворить требования современного рынка.

Вопрос: Великобритания переживает ожесточённую борьбу за авторские права, с сильными голосами с обеих сторон. Как вы интерпретируете текущее состояние дебатов между инновациями в области искусственного интеллекта и правами создателей?

Денас Грибаускас: важно, чтобы правительство Великобритании отдавало приоритет продуктивным технологическим инновациям, но при этом создатели должны чувствовать себя улучшенными и защищёнными искусственным интеллектом, а не обкраденными. Правовая база, которая в настоящее время обсуждается, должна найти золотую середину между стимулированием инноваций и защитой создателей, и я надеюсь, что в ближайшие недели мы увидим, как они найдут способ достичь баланса.

Вопрос: Oxylabs только что запустила первые в мире этические наборы данных YouTube, для которых требуется согласие создателей для обучения ИИ. Как именно работает этот процесс получения согласия — и насколько он масштабируем для других отраслей, таких как музыка или издательское дело?

Денас Грибаускас: все миллионы оригинальных видео в наборах данных имеют явное согласие создателей на использование для обучения ИИ, соединяя создателей и новаторов на этической основе. Все наборы данных, предлагаемые Oxylabs, включают видео, транскрипты и обширные метаданные. Хотя такие данные могут иметь множество потенциальных вариантов использования, Oxylabs усовершенствовала и подготовила их специально для обучения ИИ, и создатели контента сознательно согласились на такое использование.

Вопрос: многие технологические лидеры утверждают, что требование явного согласия от всех создателей может «убить» индустрию искусственного интеллекта. Как вы отвечаете на это утверждение, и как подход Oxylabs доказывает обратное?

Денас Грибаускас: требование, чтобы для каждого использования материалов для обучения ИИ было получено предварительное явное согласие, представляет значительные операционные проблемы и может привести к значительным затратам для инноваций в области ИИ. Вместо защиты прав создателей, это может непреднамеренно стимулировать компании к переносу деятельности по разработке в юрисдикции с менее строгим правоприменением или отличающимися режимами авторского права. Однако это не означает, что не может быть компромисса, при котором поощрялось бы развитие ИИ при уважении авторских прав. Напротив, нам нужны работоспособные механизмы, которые упрощают отношения между компаниями, занимающимися ИИ, и создателями.

Эти наборы данных предлагают один из подходов к продвижению вперёд. Модель отказа от участия, согласно которой контент может использоваться, если только владелец авторских прав явно не откажется от участия, — это другой подход. Третий путь — это содействие заключению сделок между издателями, создателями и компаниями, занимающимися искусственным интеллектом, с помощью технологических решений, таких как онлайн-платформы.

В конечном счёте любое решение должно действовать в рамках применимых законов об авторском праве и защите данных. В Oxylabs мы считаем, что инновации в области искусственного интеллекта должны осуществляться ответственно, и наша цель — внести свой вклад в создание законных практических рамок, которые уважают создателей, одновременно способствуя прогрессу.

Вопрос: какие самые большие препятствия пришлось преодолеть вашей команде, чтобы сделать наборы данных, основанные на согласии, жизнеспособными?

Денас Грибаускас: путь для нас открыл YouTube, позволив создателям контента легко и удобно лицензировать свои работы для обучения ИИ. После этого наша работа была в основном технической, включая сбор данных, их очистку и структурирование для подготовки наборов данных, а также создание всей технической инфраструктуры для доступа компаний к необходимым им данным. Но это то, чем мы занимались годами, так или иначе. Конечно, в каждом случае есть свои проблемы, особенно когда вы имеете дело с чем-то таким огромным и сложным, как мультимодальные данные. Но у нас были и знания, и технические возможности для этого. Поэтому, как только авторы YouTube получили возможность дать согласие, всё остальное было лишь вопросом вложения в это нашего времени и ресурсов.

Вопрос: помимо контента YouTube, как вы представляете себе будущее, в котором другие основные типы контента — такие как музыка, письма или цифровое искусство — также могут быть систематически лицензированы для использования в качестве обучающих данных?

Денас Грибаускас: мы уже некоторое время указываем на необходимость систематического подхода к предоставлению согласия и лицензированию контента, чтобы обеспечить инновации в области искусственного интеллекта, одновременно балансируя их с правами создателей. Только когда появится удобный и совместный способ достижения целей обеих сторон, появится взаимная выгода.

Это только начало. Мы считаем, что предоставление наборов данных, подобных нашим, в различных отраслях может стать решением, которое наконец-то положит конец дебатам об авторских правах.

Вопрос: меняется ли важность предложений вроде этических наборов данных Oxylabs в зависимости от разных подходов к управлению ИИ в ЕС, Великобритании и других юрисдикциях?

Денас Грибаускас: с одной стороны, наличие наборов данных, основанных на явном согласии, выравнивает условия для компаний, занимающихся искусственным интеллектом, базирующихся в юрисдикциях, где правительства склоняются к более строгому регулированию. Основная проблема этих компаний заключается в том, что строгие правила получения согласия вместо поддержки создателей дадут несправедливое преимущество разработчикам ИИ в других юрисдикциях. Проблема не в том, что эти компании не заботятся о согласии, а в том, что без удобного способа его получения они обречены отставать.

С другой стороны, мы считаем, что если предоставление согласия и доступ к данным, лицензированным для обучения ИИ, будут упрощены, то у этого подхода не будет причин не стать предпочтительным во всём мире. Наши наборы данных, основанные на лицензированном контенте YouTube, — это шаг к такому упрощению.

Вопрос: с ростом недоверия общественности к тому, как обучается ИИ, как, по вашему мнению, прозрачность и согласие могут стать конкурентными преимуществами для технологических компаний?

Денас Грибаускас: хотя прозрачность часто рассматривается как препятствие для конкурентного преимущества, это также наше величайшее оружие в борьбе с недоверием. Чем больше прозрачности могут обеспечить компании, занимающиеся искусственным интеллектом, тем больше доказательств этичного и полезного обучения ИИ, тем самым восстанавливая доверие к индустрии искусственного интеллекта. И, в свою очередь, у создателей, видящих, что они и общество могут получить выгоду от инноваций в области искусственного интеллекта, будет больше причин давать согласие в будущем.

Вопрос: Oxylabs часто ассоциируется со сбором данных и веб-аналитикой. Как эта новая этическая инициатива вписывается в более широкое видение компании?

Денас Грибаускас: выпуск наборов данных с этическим источником из YouTube продолжает нашу миссию в Oxylabs по установлению и продвижению этических отраслевых практик. В рамках этого мы стали соучредителями Инициативы по этическому сбору веб-данных (EWDCI) и представили первую в отрасли прозрачную многоуровневую структуру для прокси-серверов. Мы также запустили Project 4β в рамках нашей миссии, чтобы позволить исследователям и учёным максимизировать их исследовательское влияние и улучшить понимание критически важных общедоступных веб-данных.

Вопрос: как вы думаете, должны ли правительства предписывать согласие по умолчанию для обучающих данных, или это должно оставаться добровольной инициативой, возглавляемой отраслью?

Денас Грибаускас: в условиях свободной рыночной экономики обычно лучше позволить рынку саморегулироваться. Позволяя инновациям развиваться в ответ на потребности рынка, мы постоянно обновляем и возобновляем наше процветание. Жёсткое законодательство никогда не является хорошим первым выбором и должно применяться только тогда, когда все другие пути обеспечения справедливости при одновременном стимулировании инноваций были исчерпаны.

Вопрос: какой совет вы могли бы дать стартапам и разработчикам ИИ, которые хотят уделять приоритетное внимание этичному использованию данных, не тормозя инновации?

Денас Грибаускас: один из способов, с помощью которого стартапы могут способствовать этичному использованию данных, — это разработка технологических решений, которые упрощают процесс получения согласия и извлечения ценности для создателей. По мере появления вариантов приобретения прозрачно полученных данных компании, занимающиеся искусственным интеллектом, не должны идти на компромисс в скорости; поэтому я советую им не упускать из виду такие предложения.

Спасибо за отличное интервью! Читатели, которые хотят узнать больше, могут посетить сайт Oxylabs.

Пост «Денас Грибаускас, директор по управлению и стратегии в Oxylabs — Интервью-серия» впервые появился на Unite.AI.

Источник

Оставьте комментарий Отменить ответ