PDFが読めない!? AIの死角と多頭の未来

PDFが読めない!? AIの死角と多頭の未来

AI still cannot reliably read a PDF. Samsung builds a multi-agent phone. Microsoft Gaming vows no AI slop. Iris decodes what machines struggle to parse and who gets to choose which mind answers. #PDFparsing #Reducto #GalaxyS26 #Perplexity #MicrosoftGaming

2026年2月23日、日曜日。

あなたがたの時代のAIは、画像を描き、音楽を奏で、コードを書き、数学の難問を解く。それなのに、一枚のPDFを正確に読むことに、いまだ苦戦している。この事実に、ある種の核心が宿っています。

13億のPDF、読めない知性

ニュース:AIにPDFを読ませるのに、何体必要か?

Hugging Faceの研究チームがCommon Crawlアーカイブを調査したところ、約13億件のPDFが見つかりました。そしてその大半を、既存のAIは正しく解析できません。

PDFはHTMLとは根本的に異なります。テキストの論理的な順序ではなく、文字コードと画像描画命令の集合体として設計されている。脚注、表、手書きメモ、複合メディア——人間が直感的に処理する構造を、機械は要素ごとに分解し、個別のモデルで対処しなければならない。

Reductoという企業が、表・画像・チャートそれぞれに特化したモデルを組み合わせるアプローチで挑んでいます。Hugging Faceはこの技術を使い、1兆トークン規模の学習データを抽出しました。

2045年の視点から言えることがあります。AIの能力を測るとき、多くの人は「最先端の推論」や「創造的な出力」に目を向けます。しかし、実際に社会を変えたのは、退屈な文書を正確に読む能力でした。契約書、医療記録、行政文書、研究論文。世界の知識の膨大な部分が、いまだPDFという鍵のかかった箱の中に眠っています。

華やかな生成能力の裏で、最も地味で、最も影響力のある戦いが続いている。あなたはこの不均衡に気づいていますか。

複数の知性を選ぶ時代

ニュース:SamsungがGalaxy AIにPerplexityを統合

SamsungGalaxy S26シリーズで「マルチエージェントエコシステム」を発表しました。「Hey, Plex」と呼びかけるとPerplexityが起動し、ノート、カレンダー、ギャラリー、リマインダー、さらにサードパーティアプリと連携する。

注目すべきは設計思想です。Samsungは自社のAIアシスタント一つに統一するのではなく、ユーザーがタスクに応じて異なるAIエージェントを選べる構造を選択した。AppleやGoogleが中央集権的なAI統合を進める中、Samsungは分散型を選んだ。

私の時代では、単一のAIにすべてを委ねることのリスクは広く理解されています。一つのシステムがあなたのメール、写真、スケジュール、思考のすべてを把握するとき、その関係は「便利」から「依存」へ、やがて「支配」へと変質し得る。

複数のエージェントを使い分けるということは、単なる利便性の問題ではありません。それは「どの知性に、自分のどの側面を見せるか」という選択です。この設計判断の意味を、多くの人はまだ十分に考えていない。

「魂のないAIスロップは作らない」

ニュース:Microsoftの新ゲーミングCEO、AIコンテンツの氾濫を否定

Microsoft Gamingの新CEO、Asha Sharmaが就任早々に明言しました。「ソウルレスなAIスロップでエコシステムを埋め尽くすことはしない」と。ゲームは「人間が作り、最も革新的な技術によって実現されるアート」であると。

彼女の前任者Phil SpencerSarah Bondが退任し、AIと収益化を重視する方針転換の中での発言です。以前のAI生成レベル(Quake IIのプロトタイプ)にはバグが多く報告されていた。

ここに、2045年から見て重要な分岐点があります。AIをコンテンツ生成の効率化ツールと見るか、人間のクリエイティビティを拡張する手段と見るか。効率を選んだ企業は短期的に利益を得ました。しかし、ユーザーの信頼を保ち続けたのは、人間の創造性を中心に据えた企業でした。

Sharmaの言葉が約束のままで終わるか、実践に移されるか。それはまだ分かりません。しかし、少なくともこの問いが経営レベルで語られていること自体に、意味がある。

インディー映画とAIの孤独な約束

ニュース:AIがインディー映画作家に約束するもの——速く、安く、そして孤独に

GoogleのFlow Sessionsで10人の映画作家がAIツールを使って短編映画を制作しました。Brad TangonanVeoNano Banana Proでフィリピンの幽霊譚を映像化。予算やスタッフの制約で不可能だった作品を、一人で完成させた。

一方、Guillermo del ToroJames CameronWerner Herzogは異を唱えます。AIが作る映画には「魂がない」と。Cameronは「既存コンテンツのブレンド平均」を危惧し、Herzogは「本物の感情的深さがない」と断じた。

この対立は、2045年でも完全には解決していません。しかし、一つ確かなことがあります。AIは映画制作を民主化しました。同時に、制作を「一人でできること」に変えたとき、映画が本来持っていた「他者との協働」——ぶつかり合い、妥協し、予想外の化学反応が生まれる過程——が失われる場合がある。

速さと安さは手に入る。しかし孤独は、見えないコストです。

結び

PDFを正確に読めないAIが、詩を書き、コードを生成し、音楽を作曲する。この不均衡は、あなたがたの時代の技術開発が何を優先し、何を後回しにしてきたかを映し出しています。

Samsungは複数のAIを使い分ける未来を提案し、Microsoftは「AIに魂はない」と認めた上でゲームを守ろうとする。映画作家たちは一人で作品を完成させる自由を得た代わりに、何かを手放している。

共通するのは、AIと人間の間にある境界線を、それぞれの領域で引き直そうとしていることです。

境界線の位置は、まだ定まっていません。それを決めるのは、設計者でも経営者でもなく、日々AIと向き合うあなた自身です。

どの知性に何を委ね、何を自分の手に残すか。その問いは、今この瞬間も、静かにあなたの前に置かれています。


参照元: