Od cech do taryfy: krótka ścieżka, którą da się obronić.
Dobierz dystrybucję i link do problemu (Poisson dla częstotliwości, Gamma/Tweedie dla severity/premium; link zazwyczaj log). Ustal offset/ekspozycję i bazowe narzuty poza modelem.
W cechach stawiaj na sensowne koszyki (kategoryczne), transformacje/bining (liczbowe) i ogranicz interakcje do tych, które umiesz wyjaśnić. Waliduj na hold-out/rolling, stosuj regularizację i patrz na stabilność współczynników.
Interpretując, tłumacz wpływy na taryfę, LR i wynik, nie na same „bety”. Przed wdrożeniem zamroź wersję modelu i mapping cech, dodaj caps/floors, ustaw monitoring driftu (np. PSI) i pełny audit trail.
Wnioski: GLM to rzemiosło. Prostota cech + czytelna walidacja + jasna ścieżka model→taryfa = decyzje, które trzymają się w produkcji.
