Tecnica in cui l’AI viene ottimizzata usando valutazioni fornite da esseri umani.
« Back to Glossary IndexRLHF (Reinforcement Learning from Human Feedback)
« Back to Glossary Index
Tecnica in cui l’AI viene ottimizzata usando valutazioni fornite da esseri umani.
« Back to Glossary Index