25 апреля 2024

Данные для обучения ИИ заканчиваются

Разработчики искусственного интеллекта (ИИ) столкнулись с нехваткой качественного материала для обучения моделей. В ближайшие два года такие данные могут просто "закончиться", что приведет к замедлению развития этих технологий.

Нейросети, собирая данные - к примеру, научные статьи или новостные заметки - из сети, разбивают их на части и на основе этого учатся отвечать, как человек. Чем больше они "потребляют" такой информации, тем выше их эффективность. Однако, как заявили ученые и руководители компаний-разработчиков, большая часть контента в интернете содержит бессвязный текст или вовсе не может добавить новой информации к той, которая уже есть у ИИ, передает The Wall Street Journal.

Стремясь "раздобыть" новые данные, компании могут забыть об этике и корпоративной политике. В частности, OpenAI создала систему распознавания речи Whisper, которая расшифровывает аудиозаписи из видео на YouTube для обучения ИИ. Однако это противоречит правилам видеохостинга и потенциально нарушает права создателей роликов.

"Единственный практический способ существования таких инструментов - обучение на огромных массивах информации без разрешения ее создателей. Объем необходимых данных настолько велик, что не поможет даже коллективное лицензирование", - передает слова представителя венчурной компании Andreessen Horowitz Сая Дамле The New York Times.

Некоторые эксперты для снижения зависимости от авторских произведений, которые защищены законом, предлагают обучать ИИ на материалах других языковых моделей, поскольку эти системы способны создавать вполне человекоподобные тексты, но здесь есть проблема: некоторые нейросети попадают в цикл обработки ошибочных данных, что только нарушит процесс обучения.

Нехватка данных действительно может привести к тому, что разработчики станут активнее использовать информацию без разрешения ее создателей. В результате этого может произойти коллапс, уверен генеральный директор информационно-аналитического агентства TelecomDaily Денис Кусков.

"Я считаю, что это крайне негативно может оцениваться. Я категорически против. Привести это может к большим проблемам: к распространению недостоверной информации или, наоборот, использованию ее в своих целях и т.д.", - подчеркнул он.

По мнению владельца продукта Polymatica ML в компании SL Soft Ильи Тихонова, использовать открытые датасеты станет более проблематично.

"Это, правда, актуально только в случае, если последуют юридические прецеденты, где суд заставит удалить модель или датасет", - уточнил эксперт.

Источник: Российская газета

Студенты СПбГАСУ будут учиться моделированию на цифровой платформе RITM³ компании SIMETRA

3 мая 2024

В рамках соглашения SIMETRA поставила вузу академические лицензии на использование в образовательном процессе цифровой платформы RITM³. Это собственная инновационная ИТ-разработка компании, которую студенты смогут применять для выполнения практических заданий по моделированию транспортных потоков.

 

HRlink повысил надежность работы сервиса кадрового ЭДО

3 мая 2024

Архитектуру платформы кадрового электронного документооборота (ЭДО) HRlink адаптировали к существенному росту количества пользователей. Кроме того, в 2024 году HRlink первой на рынке решений для безбумажного КДП занялась подключением второго удостоверяющего центра для электронных подписей.

 

В Санкт-Петербурге программные роботы оптимизировали работу Комитета по тарифам

2 мая 2024

Комитет по тарифам Санкт-Петербурга оптимизировал ряд своих рабочих процессов за счёт внедрения трех программных роботов. Проект реализовали специалисты Санкт‑Петербургского информационно-аналитического центра.

 

MONT предложит партнерам решение «Лаборатории Касперского» для обнаружения дронов

27 апреля 2024

В продуктовом портфеле ГК MONT появилось решение для обнаружения дронов – Kaspersky Antidrone от «Лаборатории Касперского». Программно-аппаратный комплекс подходит для любого типа объектов и направлен на обнаружение, классификацию и нейтрализацию беспилотников.

 

Облачное направление Linx растет быстрее рынка

26 апреля 2024

ровайдер облачных решений и услуг ЦОД Linx увеличил в 2023 году выручку на 20% до 1,6 млрд рублей. Наиболее существенный рост компания показала по направлению IaaS – выручка Linx Cloud выросла на 51%.