Core Concepts
大規模言語モデルを活用し、HTMLの階層構造を段階的に理解することで、ウェブクローラーを効率的に生成する。
Abstract
本論文は、ウェブクローラー生成タスクを提案し、大規模言語モデル(LLM)とクローラーを組み合わせる新しいパラダイムを紹介している。提案手法のAUTOCRAWLERは、HTMLの階層構造を段階的に理解するための2段階のフレームワークを採用している。
第1段階では、トップダウンとステップバックの操作を組み合わせ、LLMを活用して段階的にHTML要素を絞り込み、実行可能なアクションシーケンスを生成する。第2段階では、複数のウェブページから得られたアクションシーケンスを統合し、より汎用性の高いクローラーを生成する。
実験結果は、提案手法がベースラインと比べて優れた性能を示すことを明らかにしている。特に、大規模LLMを活用することで、HTMLの階層構造を効果的に理解し、高精度なクローラーを生成できることが確認された。一方で、LLMの能力に依存するため、LLMの性能向上が重要な課題であることも示唆された。
Stats
平均得点(PPG)は24.8
リバウンド(RPG)は7.3
アシスト(APG)は7.8
Quotes
"ウェブオートメーションは、一般的なウェブアクションを自動化することで、複雑なウェブタスクを実行する重要な技術である。"
"従来のラッパー方式は、新しいウェブサイトに直面した際の適応性と拡張性に限界がある。"
"一方、大規模言語モデル(LLM)を活用したジェネレーティブエージェントは、オープンワールドシナリオでパフォーマンスと再利用性が低い。"