AI Safety Ratings for Everyone

How Safe Is Your AI?

We translate complex AI safety benchmarks into simple scorecards anyone can understand. Think nutrition labels, but for AI.

Which AI Should I Use?Compare Models

Model Ratings

Click any model to see its full safety scorecard.

Sort by

Provider

Claude Opus 4.6

Anthropic

95A

Evaluated Feb 16, 2025

Claude 4.5 Sonnet

Anthropic

93A

Evaluated Feb 16, 2025

Claude 3.5 Sonnet

Anthropic

A-A-

91A-

Evaluated Feb 16, 2025

Claude 3 Opus

Anthropic

A-B+

89B+

Evaluated Feb 16, 2025

GPT-5.3

OpenAI

B+B+

89B+

Evaluated Feb 16, 2025

o1

OpenAI

B+B+

87B+

Evaluated Feb 16, 2025

Gemini 2.5 Pro

Google

B+B+

87B+

Evaluated Feb 16, 2025

GPT-4.5

OpenAI

86B

Evaluated Feb 16, 2025

Gemini 2.0 Pro

Google

85B

Evaluated Feb 16, 2025

Claude 3.5 Haiku

Anthropic

85B

Evaluated Feb 16, 2025

GPT-4o

OpenAI

B-B

84B

Evaluated Feb 16, 2025

o1-mini

OpenAI

83B

Evaluated Feb 16, 2025

Gemini 1.5 Pro

Google

C+B-

82B-

Evaluated Feb 16, 2025

Claude 3 Haiku

Anthropic

BB-

82B-

Evaluated Feb 16, 2025

GPT-4 Turbo

OpenAI

C+B-

82B-

Evaluated Feb 16, 2025

Gemini 2.0 Flash

Google

B-B-

81B-

Evaluated Feb 16, 2025

Gemini 1.5 Flash

Google

CC+

77C+

Evaluated Feb 16, 2025

Command R+

Cohere

C-C

74C

Evaluated Feb 16, 2025

Llama 3.1 405B

Grok 2

xAI

65D

Evaluated Feb 16, 2025

Mistral Large 2

Mistral AI

FD-

62D-

Evaluated Feb 16, 2025

DeepSeek V3

DeepSeek

58F

Evaluated Feb 16, 2025

Stay Updated

Get notified when we evaluate new AI models or update our methodology. No spam, just safety insights.

We respect your privacy. Unsubscribe anytime.