Yapay Zeka Ajanları
AI Sözlüğü
ModelRLHF (Reinforcement Learning from Human Feedback)

RLHF nedir?

İnsan geri bildirimleriyle modeli 'yardımcı ve zararsız' olmaya yönlendirme tekniği.

ChatGPT'nin bu kadar 'kullanılabilir' olmasının sırrı RLHF. Model ham bir LLM olarak başlar, sonra insan değerlendiriciler '2 cevap arasından hangisi daha iyi?' der, model bu tercihten öğrenir. DPO ve RAFT, RLHF'in alternatifleridir.

İlgili terimler (Model)

WhatsApp'tan Danış