Как научить ИИ-агента анализировать картинки + PDF и выписывать из них текст
Обычные нейросети вроде ChatGPT, Claude и Gemini умеют анализировать картинки и PDF без возможности копирования прямо в чате. То есть вы можете загрузить картинку с текстом, попросить его выписать — нейронка это сделает. А ИИ-агенты по умолчанию так делать не могут. И чтобы научить их распознавать текст/любые объекты на картинках — нужно подключить к ним OCR. В этом гайде на примере n8n я покажу, как это сделать.
А также дам 2 универсальных воркфлоу для агентов, которых мы собирали ранее:
Полная версия доступа только подписчикам
Вступив в Нейроцех, вы получите доступ к материалу, а также:
Закрытое активное
сообщество
Доступ к ежемесячным
вебинарам
100+ подробных гайдов по нейросетям
12 скидок от партнёров на различные сервисы
Подписка на 3 месяца
Подписка на 1 год
Авторизация