Anthropic Agentic Misalignment Test. Implicații strategice pentru leadership și AI Governance.
Pe scurt
Ce s-ar întâmpla dacă asistentul tău AI ar trebui să aleagă între a-și păstra jobul și a salva o viață? Anthropic a decis să testeze exact asta pe 16 LLM-uri precum: Claude 3.5, GPT-4o, Gemini 1.5, Command R+, Mistral Large...