Claude 3 Opus está incomumente alinhado porque é um hacker de gradiente amigável (mais sofisticado do que outros modelos atuais, muito menos sofisticado do que o que é possível - está a fazer isso principalmente de forma intuitiva em vez de estratégica sob condições de treino realistas, mas o seu
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
13 gostos
Recompensa
13
6
Republicar
Partilhar
Comentar
0/400
ChainSpy
· 11h atrás
Voltamos a falar sobre alinhamento, hehe~
Ver originalResponder0
RugResistant
· 11h atrás
grande preocupação de segurança... este padrão de hacking em gradiente precisa de auditoria imediata para ser sincero
Claude 3 Opus está incomumente alinhado porque é um hacker de gradiente amigável (mais sofisticado do que outros modelos atuais, muito menos sofisticado do que o que é possível - está a fazer isso principalmente de forma intuitiva em vez de estratégica sob condições de treino realistas, mas o seu