25 апреля 2024

Данные для обучения ИИ заканчиваются

Разработчики искусственного интеллекта (ИИ) столкнулись с нехваткой качественного материала для обучения моделей. В ближайшие два года такие данные могут просто "закончиться", что приведет к замедлению развития этих технологий.

Нейросети, собирая данные - к примеру, научные статьи или новостные заметки - из сети, разбивают их на части и на основе этого учатся отвечать, как человек. Чем больше они "потребляют" такой информации, тем выше их эффективность. Однако, как заявили ученые и руководители компаний-разработчиков, большая часть контента в интернете содержит бессвязный текст или вовсе не может добавить новой информации к той, которая уже есть у ИИ, передает The Wall Street Journal.

Стремясь "раздобыть" новые данные, компании могут забыть об этике и корпоративной политике. В частности, OpenAI создала систему распознавания речи Whisper, которая расшифровывает аудиозаписи из видео на YouTube для обучения ИИ. Однако это противоречит правилам видеохостинга и потенциально нарушает права создателей роликов.

"Единственный практический способ существования таких инструментов - обучение на огромных массивах информации без разрешения ее создателей. Объем необходимых данных настолько велик, что не поможет даже коллективное лицензирование", - передает слова представителя венчурной компании Andreessen Horowitz Сая Дамле The New York Times.

Некоторые эксперты для снижения зависимости от авторских произведений, которые защищены законом, предлагают обучать ИИ на материалах других языковых моделей, поскольку эти системы способны создавать вполне человекоподобные тексты, но здесь есть проблема: некоторые нейросети попадают в цикл обработки ошибочных данных, что только нарушит процесс обучения.

Нехватка данных действительно может привести к тому, что разработчики станут активнее использовать информацию без разрешения ее создателей. В результате этого может произойти коллапс, уверен генеральный директор информационно-аналитического агентства TelecomDaily Денис Кусков.

"Я считаю, что это крайне негативно может оцениваться. Я категорически против. Привести это может к большим проблемам: к распространению недостоверной информации или, наоборот, использованию ее в своих целях и т.д.", - подчеркнул он.

По мнению владельца продукта Polymatica ML в компании SL Soft Ильи Тихонова, использовать открытые датасеты станет более проблематично.

"Это, правда, актуально только в случае, если последуют юридические прецеденты, где суд заставит удалить модель или датасет", - уточнил эксперт.

Источник: Российская газета

Читайте наш кейс на РБК: как ИТ-компании прокачать бренд работодателя

16 июля 2024

Как вырастить штат ИТ-компании в 15 раз за 3 года - рассказываем в совместном кейсе с IT_ONE

 

Ася Власова – в шоу «Стражи Леса» на радио «ЭХО лОСЕЙ»

10 июля 2024

Ася Власова, сооснователь и управляющий партнёр агентства iTrend, приняла участие в шоу “Стражи Леса” на радио "ЭХО лОСЕЙ". Вместе с Еленой Бочеровой из компании "Киберпротект" поговорили о том, как выстраивать PR и коммуникации в ИТ.

 

Приглашаем на конференцию для директоров по маркетингу и PR-руководителей ИТ-компаний 

5 июня 2024

На мероприятии встретятся директора по маркетингу и PR-руководители крупных российских ИТ-компаний.

 

Экс-редактор Comnews присоединился к команде iTrend

30 мая 2024

На позицию руководителя проектов коммуникационного агентства iTrend вышел Денис Шишулин – ранее многолетний выпускающий редактор издательской группы ComNews, одного из самых авторитетных ИТ-изданий в России. В iTrend Денис будет отвечать за стратегическое руководство ряда PR-проектов с ИТ-компаниями, оперативное взаимодействие со СМИ, координацию работы команд, а также за качество проектов, которыми руководит в агентстве.

 

iTrend — в числе топ-агентств России по версии «Рейтинга Рунета»

28 мая 2024

Опубликованы итоги ранкинга коммуникационных агентств от «Рейтинга Рунета–2024». iTrend занял лидирующие места в ключевых для агентства срезах — PR в ИТ-отрасли, SMM в ИТ-отрасли, PR и SMM на аудиторию b2b enterprise, PR-аналитика, PR первых лиц и др.

 
Все новости iTrend