Reinforcement Learning for Programming Feedback: Aligning Small Language Models Without Human Preferences

Published in 9th Educational Data Mining in Computer Science Education (CSEDM) Workshop, 2025