Почему ваш LLM-as-a-Judge «слишком вежливый» (и как с этим бороться)
Многие LLM-as-a-Judge фейлятся просто потому, что «судья» слишком вежлив. Он с радостью закрывает глаза на критические нарушения бизнес-логики только потому, что не хочет огорчать пользователя.