


Какую информацию не стоит грузить в нейросети
Все, что попадает в публичные нейросети вроде ChatGPT или Gemini потенциально может стать частью их жизненного опыта и использоваться для дальнейшего обучения. Так сказано в политике сервисов, которую все конечно же читают при регистрации.
Если вы работаете с корпоративными данными, конфиденциальной информацией или просто не хотите, чтобы что-то утекло в сеть — не показывайте их нейросетям. Даже если в политике конфиденциальности указано, что данные не используются для обучения, лучше перестраховаться.
Вот правила, которых следует придерживаться:
Когда нужно работать с персональными данными — включаем режим анонимности. К этой категории относится любая информация, по которой можно идентифицировать конкретного человека:
- Документы: сканы или фотографии паспорта, водительских прав, СНИЛС, ИНН.
- Контакты: полные адреса, номера телефонов, личные email.
- Финансовая информация: номера банковских карт, выписки со счетов, пароли от онлайн-банка.
- Данные для входа: любые логины, пароли и API-ключи.
Если с такими данными работать все-таки нужно, замените всю конкретику на вымышленные примеры. Нейросети важна структура данных, а не их содержание.
Когда речь идет о рабочих данных — обезличивайте информацию. Принцип работы здесь тот же — убрать всю конкретику, которая может идентифицировать вашу компанию, клиентов или проекты, но сохранить логику и структуру задачи.
Когда нужна полная конфиденциальность — используйте закрытые решения. Иногда обезличить данные нельзя, а иногда нужно работать конкретно с этой конфиденциальной информацией. В таких случаях вместо работы через обычные нейросети лучше использовать:
- Корпоративные версии ИИ. Многие разработчики предлагают платные тарифы для бизнеса (например, ChatGPT Team/Enterprise). В них, как правило, прописаны гарантии, что ваши данные не будут использоваться для обучения моделей и полностью изолированы. (но все могут врать, помните это)
- Локальные нейросети. Это языковые модели с открытым исходным кодом (например, Llama, Mistral), которые можно скачать и запустить прямо компьютере или на своем сервере. В этом случае вся обработка информации происходит внутри вашего устройства и данные гарантированно никуда не передаются.
Плюсов у таких нейронок несколько:
Максимальная конфиденциальность. Вся информация, которую вы загружаете, остается на вашем компьютере.
Работа без интернета. После установки модель работает полностью автономно.
Отсутствие цензуры и ограничений. Вы можете использовать модель для любых задач без ограничений со стороны разработчика.
Но есть и минусы: такие нейронки обычно сильно глупее обычных сервисов, потому что их база меньше. Запустить такие нейросети можно только на достаточно мощных компьютерах с большим объемом видеопамяти (от 8-12 ГБ VRAM) и большой объем оперативной памяти (минимум 16 ГБ, а лучше — 32 ГБ и больше).
Ура! Мы разобрались с принципами общения с LLM и теперь можем правильно формулировать промпты и использовать возможности нейронок на максимум. В следующих мини-курсах разберемся, как генерировать тексты, картинки и видео.