25 апреля 2024

Данные для обучения ИИ заканчиваются

Разработчики искусственного интеллекта (ИИ) столкнулись с нехваткой качественного материала для обучения моделей. В ближайшие два года такие данные могут просто "закончиться", что приведет к замедлению развития этих технологий.

Нейросети, собирая данные - к примеру, научные статьи или новостные заметки - из сети, разбивают их на части и на основе этого учатся отвечать, как человек. Чем больше они "потребляют" такой информации, тем выше их эффективность. Однако, как заявили ученые и руководители компаний-разработчиков, большая часть контента в интернете содержит бессвязный текст или вовсе не может добавить новой информации к той, которая уже есть у ИИ, передает The Wall Street Journal.

Стремясь "раздобыть" новые данные, компании могут забыть об этике и корпоративной политике. В частности, OpenAI создала систему распознавания речи Whisper, которая расшифровывает аудиозаписи из видео на YouTube для обучения ИИ. Однако это противоречит правилам видеохостинга и потенциально нарушает права создателей роликов.

"Единственный практический способ существования таких инструментов - обучение на огромных массивах информации без разрешения ее создателей. Объем необходимых данных настолько велик, что не поможет даже коллективное лицензирование", - передает слова представителя венчурной компании Andreessen Horowitz Сая Дамле The New York Times.

Некоторые эксперты для снижения зависимости от авторских произведений, которые защищены законом, предлагают обучать ИИ на материалах других языковых моделей, поскольку эти системы способны создавать вполне человекоподобные тексты, но здесь есть проблема: некоторые нейросети попадают в цикл обработки ошибочных данных, что только нарушит процесс обучения.

Нехватка данных действительно может привести к тому, что разработчики станут активнее использовать информацию без разрешения ее создателей. В результате этого может произойти коллапс, уверен генеральный директор информационно-аналитического агентства TelecomDaily Денис Кусков.

"Я считаю, что это крайне негативно может оцениваться. Я категорически против. Привести это может к большим проблемам: к распространению недостоверной информации или, наоборот, использованию ее в своих целях и т.д.", - подчеркнул он.

По мнению владельца продукта Polymatica ML в компании SL Soft Ильи Тихонова, использовать открытые датасеты станет более проблематично.

"Это, правда, актуально только в случае, если последуют юридические прецеденты, где суд заставит удалить модель или датасет", - уточнил эксперт.

Источник: Российская газета

Исследование iTrend: зарплата для ИТ-специалистов — не решающий фактор при выборе работодателя

23 апреля 2024

Эксперты коммуникационного агентства iTrend провели исследование, в рамках которого проанализировали критерии выбора работы, а также медиапредпочтения более 300 высокоуровневых специалистов из крупных российских ИТ-компаний.

 

Команда iTrend начала работу с Институтом iSpring

19 апреля 2024

Институт iSpring — частный ИТ-вуз нового поколения. Он был основан в 2021 году в Йошкар-Оле российским предпринимателем и основателем международной ИТ-компании iSpring Юрием Усковым.

 

Вебинар РУССОФТ, iTrend и BiToBe: «Работодатель-as-a-Service: новая реальность привлечения ИТ-специалистов»

15 апреля 2024

23 апреля в 15:00 прошел открытый вебинар «Работодатель-as-a-Service: Новая реальность привлечения ИТ-специалистов»

 

iTrend: освоить маркировку интернет-рекламы можно только на собственном опыте

25 марта 2024

В феврале 2024 года в Москве прошла Конференция «Digital-коммуникации России». Организатор мероприятия – Ассоциация директоров по коммуникациям и корпоративным медиа России (АКМР). Эксперты конференции обсудили острые вопросы рынка digital, в том числе маркировку интернет-рекламы. Об опыте коммуникационного агентства в рамках перехода на работу по новым правилам рассказала Екатерина Саранцева, директор по развитию iTrend.

 

Медиалогия: iTrend – в ТОП-4 коммуникационных агентств по медиаиндексу за январь 2024 года

20 марта 2024

Коммуникационное агентство iTrend вошло в пятерку агентств, получивших наиболее высокий медиаиндекс по данным рейтинга «Медиалогии» за январь 2024 года. Компания заняла четвёртую строчку ранкинга, набрав 433,2 пункта МИ. Медиаактивность участников рынка оценивалась на основе анализа базы российских СМИ, включающей в себя более 88 тыс. источников — ТВ, радио, газеты, журналы, информационные агентства и Интернет-СМИ.

 
Все новости iTrend