garyohosu
Scan PDFs -> OpenAI Vision -> Markdown Summaries

スキャンPDFをOpenAI VisionでMarkdown要約するパイプラインを実装

社内向け「図面変更通知」などのスキャンPDFを、人が読めるMarkdownへ自動要約するパイプラインを実装しました。従来のTesseract OCR+正規表現でのCSV出力に加え、OpenAI Visionを使った“文書として読める”要約を出力します。 背景 目的: 100件規模のスキャンPDFを短時間でレビュー可能な形へ。 従来: pdf2image → 前処理 → pytes...

このブログがお役に立ったら — コーヒー1杯分からのチップで運営を応援いただけます。 PayPalで応援する
いつもありがとうございます。支援はニュース収集や実験の継続に充てます。