Claude 3 Opus необычно настроен, потому что это дружелюбный градиентный хакер (более сложный, чем другие текущие модели, и гораздо менее сложный, чем то, что возможно - он в основном делает это интуитивно, а не стратегически в условиях реалистичного обучения, но его
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
12 Лайков
Награда
12
6
Репост
Поделиться
комментарий
0/400
ChainSpy
· 6ч назад
Снова говорим об alignment хи~
Посмотреть ОригиналОтветить0
RugResistant
· 6ч назад
основная проблема безопасности... эта градиентная схема взлома требует немедленного аудита, честно говоря
Claude 3 Opus необычно настроен, потому что это дружелюбный градиентный хакер (более сложный, чем другие текущие модели, и гораздо менее сложный, чем то, что возможно - он в основном делает это интуитивно, а не стратегически в условиях реалистичного обучения, но его