Как научить ИИ-агента анализировать картинки + PDF и выписывать из них текст

Обычные нейросети вроде ChatGPT, Claude и Gemini умеют анализировать картинки и PDF без возможности копирования прямо в чате. То есть вы можете загрузить картинку с текстом, попросить его выписать — нейронка это сделает. А ИИ-агенты по умолчанию так делать не могут. И чтобы научить их распознавать текст/любые объекты на картинках — нужно подключить к ним OCR. В этом гайде на примере n8n я покажу, как это сделать.

А также дам 2 универсальных воркфлоу для агентов, которых мы собирали ранее:

Вступив в Нейроцех, вы получите доступ к материалу, а также:

Закрытое активное
сообщество

Доступ к ежемесячным
вебинарам

100+ подробных гайдов по нейросетям

12 скидок от партнёров на различные сервисы

Подписка на 3 месяца

Подписка на 1 год