2026年6月25日

Unlimited OCR:長文書を一度に解析する高精度OCR

Unlimited OCR: One-shot long-horizon parsing (github.com)

github.com ·

この記事は、百度が公開した長文書向けOCRのオープンソース実装を紹介している。最大1024トークンのウィンドウでドキュメントを一度に解析でき、SGLangベースの推論サーバーが同梱されている。

Claude Codeを使ってMoebius画像修復モデルをブラウザで動作させる

Porting the Moebius 0.2B image inpainting model to run in the browser with Claude Code

simonwillison.net ·

この記事では、Claude Codeを活用して画像修復モデルMoebiusをONNX Runtime WebとWebGPUに移植するプロセスを詳細に記録している。コード生成AIが実際のモデル移植をどこまで自動化できるかを示す実践的な事例。

次回配信予定: 2026年6月28日