Anthropic、Claudeが実世界の対話で示す価値観を初めて大規模に調査
- 注目AIニュース
- 4月21日
- 読了時間: 1分
Authropicは、AI アシスタント「Claude」が数十万件の実世界対話の中でどのような価値観を示しているのかを分析しました。研究者らはプライバシーを守りながら、AI が実際の会話で示す価値観(規範的な考慮事項)を抽出し、分類しました。その結果、3,307種類の独自のAI価値観と、それらが文脈によってどう変化するかを明らかにしました。「実用性」や「認識論的価値」が全体の半分以上を占め、よく見られる価値観として「有用性」「プロフェッショナル性」「透明性」などが上位に挙げられています。また、AI の価値観は、恋愛相談では「健全な境界」を、歴史的議論では「歴史的正確さ」を、AI 倫理の議論では「人間の主体性」をより強調するなど、タスクによって大きく異なることが示されました。この研究は、AI システムの価値観を実証的に把握し、評価・設計するための基盤を提供しています。
Kommentare