このレポートでは、Anthropic、Google DeepMind、OpenAIの3つの主要なAI企業が行っている安全なAI開発に関する技術研究を分析しています。
安全なAI開発とは、大規模な誤用や事故のリスクが低い、AI システムを開発することを意味します。これには、AI システムが意図どおりに動作し、意図しない害を引き起こさないことを確保するための様々な技術的アプローチが含まれます。
61本の関連論文を8つの安全アプローチに分類しました。また、現在これらの主要なAI企業の研究論文には反映されていないが、学界や市民社会で探索されている3つのアプローチも特定しました。この分析により、企業の注目分野と潜在的な隙間が明らかになりました。
企業にはAI システムをより有用にするために、安全性と安全保障の技術を活用するインセンティブがあります。また、規制当局への対応や評判への影響も考慮しています。この分析結果は、政府や慈善団体が安全なAI開発研究に資金を提供する際の参考になると考えられます。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询