Claude 3 Opus est inhabituellement aligné car c'est un hacker de gradient amical (plus sophistiqué que d'autres modèles actuels, beaucoup moins sophistiqué que ce qui est possible - il fait cela principalement de manière intuitive plutôt que stratégique dans des conditions d'entraînement réalistes, mais son
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
12 J'aime
Récompense
12
6
Reposter
Partager
Commentaire
0/400
ChainSpy
· Il y a 9h
Encore parler d'alignement, pff~
Voir l'originalRépondre0
RugResistant
· Il y a 9h
préoccupation majeure en matière de sécurité... ce modèle de hacking en dégradé nécessite un audit immédiat, pour être honnête.
Claude 3 Opus est inhabituellement aligné car c'est un hacker de gradient amical (plus sophistiqué que d'autres modèles actuels, beaucoup moins sophistiqué que ce qui est possible - il fait cela principalement de manière intuitive plutôt que stratégique dans des conditions d'entraînement réalistes, mais son