top of page

Anthropic、Claudeが実世界の対話で示す価値観を初めて大規模に調査

Authropicは、AI アシスタント「Claude」が数十万件の実世界対話の中でどのような価値観を示しているのかを分析しました。研究者らはプライバシーを守りながら、AI が実際の会話で示す価値観(規範的な考慮事項)を抽出し、分類しました。その結果、3,307種類の独自のAI価値観と、それらが文脈によってどう変化するかを明らかにしました。「実用性」や「認識論的価値」が全体の半分以上を占め、よく見られる価値観として「有用性」「プロフェッショナル性」「透明性」などが上位に挙げられています。また、AI の価値観は、恋愛相談では「健全な境界」を、歴史的議論では「歴史的正確さ」を、AI 倫理の議論では「人間の主体性」をより強調するなど、タスクによって大きく異なることが示されました。この研究は、AI システムの価値観を実証的に把握し、評価・設計するための基盤を提供しています。


最新記事

すべて表示
GoogleがGemini 2.0 Flashの画像生成機能をアップデート

Googleは開発者向けに、Gemini 2.0 Flashモデルによる画像生成・編集機能をプレビュー版として提供開始しました。この新バージョンでは、以前の実験版と比較して視覚的品質の向上、テキストレンダリングの精度向上、フィルターブロック率の大幅な低減といった改善が施され...

 
 
 

Kommentare


bottom of page