
📄 Firecrawl выкатили Fire-PDF — парсер, который конвертирует PDF в markdown.
Каждая страница за 400 мс. Финансовый отчёт на 216 страниц — 83 секунды.
Таблицы остаются таблицами, формулы — в LaTeX. Поддерживает PDF, DOCX, XLSX и другие форматы.
Два режима: fast (только текст) и auto (текст + OCR при необходимости).
Такое себе, берём 👍
MUSIN PRO
#firecrawl #PDF #парсинг #инструменты #разработка
