#OpenAI: Evaluation best practices