Hugging FaceがOpenAIのディープリサーチを24時間で模倣

Đăng bởi: Ngày: 06/02/2025

Hugging Faceの研究者たちは、24時間以内にOpenAIの「Deep Research」機能を模倣したオープンソースのAI研究エージェント「Open Deep Research」を発表しました。このプロジェクトは、AIが自動的にウェブを閲覧し、研究報告書を作成する能力を持ち、開発者が自由にアクセスできる技術を提供することを目指しています。

この試みについて、Hugging Faceはその発表ページで、「強力な大規模言語モデル(LLM)はオープンソースで広く利用可能ですが、OpenAIはDeep Researchの基盤となるエージェントフレームワークに関してあまり情報を公開していませんでした。そこで、私たちは彼らの結果を再現し、必要なフレームワークをオープンソース化するための24時間のミッションに取り組むことを決意しました」と述べています。

Hugging Faceの解決策は、OpenAIのDeep ResearchやGoogleの「Gemini」を活用した実装に似ており、「エージェント」フレームワークを既存のAIモデルに追加し、情報収集や報告書の構築といった多段階のタスクを実行できるようになっています。

わずか1日の作業で、Hugging FaceのOpen Deep Researchは、AIモデルが複数の情報源から情報を収集し統合する能力を評価するGAIAベンチマークにおいて、55.15パーセントの精度を達成しました。一方、OpenAIのDeep Researchは同じベンチマークで67.36パーセントの精度を記録しました。

GAIAには、難易度の高い複雑な多段階の質問が含まれており、これに正しく回答するためにはAIエージェントが異なる情報源を探し出し、それらを統合して一貫した回答を構成する必要があります。これは人間にとっても容易ではないタスクであり、エージェントAIの実力を試すのに最適です。

Open Deep Researchは、現在OpenAIの大規模言語モデル(GPT-4oなど)や模擬推論モデル(o1やo3-mini)を基に構築されています。しかし、オープンウェイトAIモデルにも適応可能です。ここでの新しい要素は、AI言語モデルが自律的に研究タスクを完了できるようにするエージェント構造です。

Hugging FaceのAymeric Roucher氏は、このプロジェクトのAIモデルの選択について、「私たちはクローズドウェイトモデルを使用しましたが、開発プロセス全体を説明し、コードを見せています。これにより、他のモデルに切り替えることも可能です」と語っています。また、他の多くのLLMも試した結果、o1がこのユースケースで最も効果的だったとし、将来的にはオープンモデルを使用する可能性も示唆しています。

Hugging Faceは、AIモデルの基盤だけでなく、エージェントレイヤーの構築が重要であることを示しています。複数のステップを経たエージェントアプローチが大規模言語モデルの能力を大いに向上させることが、ベンチマークから明らかになっています。今後、より多くのファイル形式へのサポートや、視覚に基づくウェブ閲覧機能の追加が予定されています。

Hugging FaceはすでにGitHub上でそのコードを公開しており、プロジェクトの能力を拡張するエンジニアを募集しています。オープンソース化されたこの技術は、かつては商業提供者のみが持っていたAIの能力を、研究コミュニティが迅速に再現し、オープンに共有できることを示しています。