Американский миллиардер Илон Маск и бывший главный научный сотрудник OpenAI Илья Суцкевер заявили, что у компаний, занимающихся искусственным интеллектом, закончились данные для обучения генеративных моделей
«Мы уже практически исчерпали совокупный объем человеческих знаний <…> в области обучения ИИ. И это произошло в прошлом году», — заявил Маск в разговоре с председателем компании Stagwell Марком Пенном в соцсети X.
Эти слова прозвучали всего через несколько дней после того, как Суцкевер, который помогал создавать ChatGPT, рассказал на ежегодном мероприятии Neurips, что компании достигли пика данных — и больше их не будет.
Если это правда, значит, восполнить дефицит можно с помощью синтетических данных, то есть контента, который производят сами генеративные модели ИИ. Однако этот способ далек от идеала.
Исследователи из Стэнфордского университета и Университета Райса ранее обнаружили, что модели, обучаемые на данных, сгенерированных ИИ, будь то тексты или изображения, имеют тенденцию «сходить с ума» после пяти циклов обучения.
Оценили 4 человека
12 кармы