Anthropic、Claudeが実世界の対話で示す価値観を初めて大規模に調査

注目AIニュース
4月21日
読了時間: 1分

Authropicは、AI アシスタント「Claude」が数十万件の実世界対話の中でどのような価値観を示しているのかを分析しました。研究者らはプライバシーを守りながら、AI が実際の会話で示す価値観（規範的な考慮事項）を抽出し、分類しました。その結果、3,307種類の独自のAI価値観と、それらが文脈によってどう変化するかを明らかにしました。「実用性」や「認識論的価値」が全体の半分以上を占め、よく見られる価値観として「有用性」「プロフェッショナル性」「透明性」などが上位に挙げられています。また、AI の価値観は、恋愛相談では「健全な境界」を、歴史的議論では「歴史的正確さ」を、AI 倫理の議論では「人間の主体性」をより強調するなど、タスクによって大きく異なることが示されました。この研究は、AI システムの価値観を実証的に把握し、評価・設計するための基盤を提供しています。

https://x.com/AnthropicAI/status/1914333220067213529

Anthropic、Claudeが実世界の対話で示す価値観を初めて大規模に調査

最新記事

Kommentare