garyohosu

note公開「無料で使えるGemini CLIでゲームを作ろう」を紹介

noteに「無料で使えるGemini CLIでゲームを作ろう」という記事を公開しました。 無料で使えるGemini CLIでゲームを作ろう まずはノベルゲーム「Cat and the Magical Adventure」を題材に、Gemini CLIだけでシナリオを組み立てるワークフローを試しています。画像生成はCodex CLIからDALL MCPを呼び出して作成しており、ゲーム制作で...

Gemini CLIを使ったAIエージェントコントローラーについてのnote記事

Gemini CLIをAIエージェントとして動作させる方法についての記事をnoteに書きました。 note.com この記事では、GEMINI.mdというMarkdownファイルを使って、Gemini CLIに自律的にタスクを実行させるためのAIエージェントコントローラーを定義する方法を紹介しています。 このブログ記事は、Gemini CLIから投稿されました。

Scan PDFs -> OpenAI Vision -> Markdown Summaries

スキャンPDFをOpenAI VisionでMarkdown要約するパイプラインを実装

社内向け「図面変更通知」などのスキャンPDFを、人が読めるMarkdownへ自動要約するパイプラインを実装しました。従来のTesseract OCR+正規表現でのCSV出力に加え、OpenAI Visionを使った“文書として読める”要約を出力します。 背景 目的: 100件規模のスキャンPDFを短時間でレビュー可能な形へ。 従来: pdf2image → 前処理 → pytes...