OpenAIのAPIを使って、古いゲームの画面を翻訳2月2日読了時間: 1分OpenAI の Assistants API と Real-time API を活用して、古いゲームの画面を翻訳し、音声で読み上げる仕組みを試しています。従来の OCR はこのようなレトロなフォントの認識が苦手ですが、LLM を使用すると意外にもスムーズにテキストを抽出できます。将来的に Real-time API が直接画像入力を受け付けるようになれば、さらに便利になると思います。
OpenAI の Assistants API と Real-time API を活用して、古いゲームの画面を翻訳し、音声で読み上げる仕組みを試しています。従来の OCR はこのようなレトロなフォントの認識が苦手ですが、LLM を使用すると意外にもスムーズにテキストを抽出できます。将来的に Real-time API が直接画像入力を受け付けるようになれば、さらに便利になると思います。
Comments