Компания Reddit собирается изменить свою политику доступа к своему API, введя плату за использование. Как сообщает The New York Times, плата будет взиматься с компаний, которые используют API для обучения нейросетей на разговорах в соцсети.
В то же время, бесплатный доступ останется доступным для тех, кто создает приложения на основе API, которые могут быть полезны для социальной сети. Новый тарифный план должен быть объявлен в ближайшие недели, и Reddit уточняет детали платного доступа.
Разработчикам, которые используют API для создания приложений, которые помогают людям использовать Reddit, такие как боты, которые отслеживают, соответствуют ли комментарии правилам сабреддита, будет доступен бесплатный доступ к API. Также исследователям, которым нужны данные для некоммерческих целей, будет предоставлен бесплатный доступ. Однако разработчикам искусственного интеллекта, которые используют данные для обучения своих моделей, придется платить за доступ к API.
Несколько крупных компаний, таких как Google, OpenAI и Microsoft, используют разговоры пользователей в Reddit для обучения своих нейросетей. Reddit считает свои данные «особенно ценными», потому что они постоянно обновляются, и это именно то, что нужно нейросетям. Однако сооснователь социальной сети Стив Хаффман заявляет, что Reddit является «местом общения», где пользователи часто делятся своими личными историями. Поэтому он считает «справедливым», если компании будут платить за доступ к данным Reddit.
Новость о планах Twitter отключить бесплатный доступ к своему API в феврале 2023 года подтверждает, что проблема доступа к данным социальных сетей для обучения нейросетей становится все более актуальной. Владелец Twitter Илон Маск также заявил о работе над альтернативой чат-бота ChatGPT под названием TruthGPT, который будет тренироваться на контенте из Twitter. Ранее, в 2021 году, Shutterstock и OpenAI начали сотрудничать, продавая изображения и метаданные для обучения нейросети DALL-E.