Reinforcement Learning
Erklärung
Ein maschinelles Lernverfahren, bei dem Algorithmen durch Feedback und Belohnungen lernen, Entscheidungen zu treffen.
Beispiel
DeepSeek nutzt Reinforcement Learning, um die Leistung des Modells durch kontinuierliches Feedback zu verbessern.