Dlaczego warto z nami tworzyć modele scoringowe?
Kluczem do zrobienia dobrego modelu jest kwestia zrozumienia danych oraz konkretnego biznesu. Oczywiście nie obejdzie się bez dobrych danych oraz wiedzy z zakresu statystyki i przetwarzania danych, te czynniki jednak są na tyle oczywiste, że opowiemy pokrótce o dwóch pierwszych aspektach.
Dobry model statystyczny musi przybliżać rzeczywistość. Jeśli tworzymy model dla jakieś gałęzi biznesu, to nie da się stworzyć dobrego odwzorowania rzeczywistości bez szczegółowego zrozumienia konkretnego biznesu i procesów w nim zachodzących. Dla przykładu podczas tworzenia modli dla oceny ryzyka kredytowe klienta ubiegającego się o pożyczkę, konieczne jest dokładne zapoznanie się między innymi z kanałami pozyskania klienta, sposobem potwierdzania tożsamości, sposobami wprowadzania danych przez klienta oraz ich przechowywania, czy motywacjami do wzięcia pożyczki. Nie sposób pominąć też etap ustalenia miejsc, w których klient może wprowadzać nas w błąd (świadomie czy nie). Rozumienie biznesu pozwala określić jakie dane warto wybrać do sprawdzenia podczas samego procesu modelowania.
Zrozumienie danych jest niezbędne aby nie stworzyć modelu zbyt dopasowanego do danych. Tylko dobrze rozumiejąc co oznaczają poszczególne wartości w każdej bazie danych możemy uniknąć błędów wynikających na przykład z błędnego grupowania.
Ponadto dobry model scoringowy musi być zaimplementowany w odpowiednim miejscu w procesie decyzyjnym, a w procesie tworzenia należy wziąć pod uwagę wszystkie wcześniejsze etapy procesu decyzyjnego, jeśli takie występują.
Jak wygląda proces tworzenia modelu scoringowego we współpracy z 4business.expert?
- Analiza ilościowa danych
Pozwala odpowiedzieć na pytanie, czy zakres zebranych danych jest wystarczający do rozpoczęcia prac nad budową modelu
- Analiza procesu decyzyjnego oraz pobierania danych
Celem tego etapu jest pełne zrozumienie procesu, który będzie modelowany w danym projekcie oraz kryteriów które mogą być stosowane na innych etapach procesu. Na tym etapie często pojawiają się nasze sugestie dotyczące możliwego wprowadzenie usprawnień w danych etapach
- Objaśnienie danych
W tym etapie dopytujemy o konkretne znaczenie i pochodzenie wszystkich zebranych w bazie danych
- Modelowania
4.1 Wybór próby i zdefiniowanie zmiennej objaśnianej
4.2 Podział zbioru na próbkę modelową i walidacyjną
4.3 Grupowanie zmiennych
4.4 Dobór zmiennych
4.5 Walidacji stworzonych modeli oraz wybór modelu do wdrożenia
4.6 Skalowanie modelu
4.7 Wybór punktu odcięcia (cut-off)
- Wdrożenie modelu
Wdrożenie modelu powinno nastąpić we wcześniej ustalonym miejscu procesu. Po wdrożeniu modelu powinny zostać zaimplementowane rozwiązania do obserowania stabilności modelu i populacji, aby właściwie określić moment konieczności wprowadzenia zmian w modelu.