Veľmi sa mi páčil článok, ako filtrovať pôžičky na Bondore a zvýšiť si tak, aspoň štatisticky svoje príjmy potencionálnym znížením default rate. Tento semester som mal na výške predmet o štatistike a myslel som si, že to aplikujem na data set z isePankur, lenže nejako som tu štatistiku odflákol a pre jednoduché filtrovanie a získavanie percentuálnych údajov stačí excel.
Stiahol som si teda ten najnovší dataset, no na moje prekvapenie obsahoval len 7636 záznamov. Myslel som, že toho bude oveľa viac, no celkový počet vydaných úverov na bondore je len 8359 (žeby tých 723 úverov prebehlo za posledný mesiac, keď ešte nebol aktualizovaný dataset? ). Ak chcete filtrovať dáta rovnako ako ja, prečítajte si prvý odkaz v článku alebo Pivot table. Je to otázkou pár minút.
Čo dataset obsahuje?
Základné delenie budem robiť podľa krajín, pretože podľa mňa kultúra a zákony v danej krajine budú podobné pre všetkých žiadateľov danej krajiny. Ja momentálne investujem len do EE (Estónsko). Z prvého pohľadu na tabuľku by som sa mal tešiť, že až 85,4 % záznamov je z estónskych úverov. Na druhej strane sa bondora v posledných mesiacoch rapídne mení a to čo platilo predtým, už neplatí. Nie je už tak veľa žiadostí a vyberá sa horšie, dostupné sú už často len pôžičky overené telefónom či inými dokumentami.
Count of loan\_id | ||
Country | Total % | Total |
EE | 85,40% | 6521 |
ES | 7,18% | 548 |
FI | 6,74% | 515 |
SK | 0,68% | 52 |
Grand Total | 100,00% | 7636 |
Rozloženie pôžičiek podľa veku.
18-20 | 21-30 | 31-40 | 41-50 | 51-60 | 61-70 | 71-77 | Grand Total | |
Country | ||||||||
EE | 87 | 2606 | 1939 | 1174 | 550 | 153 | 12 | 6521 |
ES | 123 | 194 | 126 | 69 | 35 | 1 | 548 | |
FI | 147 | 120 | 137 | 88 | 23 | 515 | ||
SK | 16 | 16 | 12 | 7 | 1 | 52 | ||
Grand Total | 87 | 2892 | 2269 | 1449 | 714 | 212 | 13 | 7636 |
Keď aplikujem filter:60D FromFirstPayment: 1 a Country: Estónsko:
60D FromFirstPayment | 1 | |||||||
Country | EE | |||||||
Count of loan\_id | Age2 | Age | ||||||
18-20 | 21-30 | 31-40 | 41-50 | 51-60 | 61-70 | 71-77 | Grand Total | |
PD | ||||||||
0 | 41 | 1670 | 1393 | 822 | 367 | 121 | 10 | 4424 |
1 | 46 | 525 | 271 | 149 | 71 | 6 | 2 | 1070 |
Grand Total | 87 | 2195 | 1664 | 971 | 438 | 127 | 12 | 5494 |
Čo v percentách znamená:
Count of loan\_id | Age2 | Age | ||||||
18-20 | 21-30 | 31-40 | 41-50 | 51-60 | 61-70 | 71-77 | Grand Total | |
PD | ||||||||
0 | 47,13% | 76,08% | 83,71% | 84,65% | 83,79% | 95,28% | 83,33% | 80,52% |
1 | 52,87% | 23,92% | 16,29% | 15,35% | 16,21% | 4,72% | 16,67% | 19,48% |
Grand Total | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% |
Z tabuľky vyplýva, že čím je človek starší, tým má menšiu default rate. (PD v tabuľke znamená actual default, neviem prečo mi to premenovalo z AD na PD) Ten 50% default u 18-20 neúnosný a 23,92% tiež nie je ideál. Takže investovať ideálne do veku 30+. To sa dalo predpokladať, ale moc som vek nebral doteraz do úvahy.
Typ overenia žiadosti
Sú 3 možnosti, pričom číslo 2 a 3 sa začali používať len nedávno.
- 2 Verified by Phone
- 3 Verified by Other Documents
- 4 Verified by Bank Statement
Žiadosti overené cez bank statement sa dali zadať do automatického investičného plánu, do týchto investícií nebolo možné manuálne investovať. Investícia ale obsahuje veľké riziko, keď viete o danej investícií len to, že spĺňa základné kritéria, ktoré ste zadali do automatického investovania. Ja som rád investoval manuálne a preto v poslednej dobe len do typu overenia číslo 2 a 3. No a ako to vyzerá v číslach?
Použité filtre:
60D FromFirstPayment | 1 |
Country | EE |
VerificationType | 2 |
credit\_score | 1000 |
Výsledok:
Count of loan\_id | Age2 | Age | ||||||
18-20 | 21-30 | 31-40 | 41-50 | 51-60 | 61-70 | 71-77 | Grand Total | |
PD | ||||||||
0 | 62,86% | 70,75% | 77,14% | 68,47% | 70,49% | 100,00% | 60,00% | 72,28% |
1 | 37,14% | 29,25% | 22,86% | 31,53% | 29,51% | 0,00% | 40,00% | 27,72% |
Grand Total | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% |
V priemere z úverov overených telefónom 27,72 % žiadateľov prestane splácať svoj úver (vzorka 826 úverov).
VerificationType = 3
Count of loan\_id | Age2 | Age | |||
21-30 | 31-40 | 41-50 | 51-60 | Grand Total | |
PD | |||||
0 | 63,24% | 61,11% | 64,71% | 75,00% | 63,58% |
1 | 36,76% | 38,89% | 35,29% | 25,00% | 36,42% |
Grand Total | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% |
V priemere z úverov overených pomocou iných dokumentov 36,42 % žiadateľov prestane splácať svoj úver (vzorka 151 úverov).
VerificationType = 4
Count of loan\_id | Age2 | Age | ||||||
18-20 | 21-30 | 31-40 | 41-50 | 51-60 | 61-70 | 71-77 | Grand Total | |
PD | ||||||||
0 | 77,78% | 89,96% | 93,28% | 93,78% | 95,30% | 95,60% | 100,00% | 92,43% |
1 | 22,22% | 10,04% | 6,72% | 6,22% | 4,70% | 4,40% | 0,00% | 7,57% |
Grand Total | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% |
V priemere z úverov overených pomocou bankových výpisov 7,57 % žiadateľov prestane splácať svoj úver (vzorka 2392 úverov).
Ako je na týchto tabuľkách vidno, asi by som mal prestať investovať do úverov s verifikáciou číslo 2 a 3. Následne som si však pripravil tabuľku s rozdelením podľa percent a s kredit score 1000:
Verification type | 2 | 3 | 4 |
Actual default | 27,72% | 36,42% | 7,57% |
No problem | 72,28% | 63,58% | 92,43% |
Interest rate | 34% | 31% | 14% |
Investment | 1000 eur | 1000 eur | 1000 eur |
istý zisk | 1000×1,34×0,72=968,55 eur | 1000×1,31×0.6358=832,89 eur | 1000×1,14×0,9243=1052,70 eur |
istý zisk v percentách | -3,15% | -16,71% | 5,27% |
default v eurách | 371,45 eur | 477,11 eur | 88 eur |
keby bondora vymôže všetko | 1340 | 1310 eur | 1140 eur |
keby vymôže 80 % | 1265,7 | 1214 | 1122 |
keby vymôže 60 % | 1191,4 | 1119 | 1105 |
keby vymôže 40 % | 1117,1 | 1023 | 1088 |
keby vymôže 20 % | 1042,8 | 928 | 1071 |
keby vymôže 0 % | 968,55 eur | 832,89 eur | 1052,7 eur |
Len v skratke popíšem tabuľku. V stĺpcoch sú dáta rozdelené podľa typu verifikácie a pod tým percentá z data setu. Piaty riadok predpokladá s investíciou 1000 eur v daných verifikačných typoch. Riadok s názvom “istý zisk” je štatisticky hodnota úverov, ktoré splácajú bez problémov. Pri verifikačnej metóde 4 to je istý zisk 5,27 %, a teda keby investujete 1000 eur len do Estónskych A1000 úverov, máte 5,27 % zisk a zvyšných 8,73 % sa pripočíta, ak bondora všetky default pôžičky bude schopná vymôcť. U verifikačnej metódy 3 máte zo vzorne splatených úverov stratu 16,71%, takže potrebujete ešte aby bondora vymohla 35% úverov, nech nie ste stratový.
Teda stratový aj tak budete, ak zarátame infláciu a prípadný úrok v banke cca 4 %. Niekde som čítal, že bondora vymôže zhruba 80 percent default úverov, čo sa mi zdá veľa. Asi to bolo rátané len v Estónsku. Ale keby to aj bola pravda, prečo to nezverejniť? Aj tak, aby ste boli v pluse, nestačí to len vymôcť, ale treba to vymôcť aj dostatočne rýchlo. Ak To bondora vymôže za 3 roky, tak zisk musíte rozdeliť medzi tie tri roky. Často sa asi stáva, že bondora vymôže len určitú časť, z ktorej najprv zaplatí svoje poplatky za odoslanie listov, … a až potom vašu investíciu.
No tak teoreticky ak bondora je schopná vymôcť 80% úverov v plnej výške investície do roka, úvery overené telefónom vám ročne pridajú 26%, inými dokladmi 21% a bankovými výpismi 12%. (vzorka s inými dokladmi obsahuje ale iba 157 záznamov!)
Rozdelenie podľa creditScore a creditGroup
Použité filtre: 60D FromFirstPayment=1, Country=EE
Count of loan\_id | CreditGroup | ||||
PD | A | B | C | (blank) | Grand Total |
0 | 79,71% | 88,37% | 88,00% | 80,00% | 80,52% |
1 | 20,29% | 11,63% | 12,00% | 20,00% | 19,48% |
Grand Total | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% |
Typ A, B alebo C teda príliš nevplýva na schopnosť splácať úver. Aj keď skupiny B a C nie sú až také početné:
PD | A | B | C | (blank) | Grand Total |
0 | 3955 | 395 | 66 | 8 | 4424 |
1 | 1007 | 52 | 9 | 2 | 1070 |
Grand Total | 4962 | 447 | 75 | 10 | 5494 |
Credit score s rovnakými filtrami:
Count of loan\_id | credit\_score | |||||||
PD | 500 | 600 | 700 | 800 | 900 | 1000 | (blank) | Grand Total |
0 | 43,05% | 75,11% | 74,25% | 83,68% | 82,93% | 86,20% | 70,00% | 80,52% |
1 | 56,95% | 24,89% | 25,75% | 16,32% | 17,07% | 13,80% | 30,00% | 19,48% |
Grand Total | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% |
Vplyv pohlavia
Aj keď v hore spomínanom anglickom blogu vyšlo, že ženy majú nižšiu o 3 percenta, v aktuálnom data sete pohlavie nemá vplyv splatnosti úverov (0,2 % rozdiel od priemeru).
Count of loan\_id | Gender | ||
PD | muž | žena | Grand Total |
0 | 80,72% | 80,31% | 80,52% |
1 | 19,28% | 19,69% | 19,48% |
Grand Total | 100,00% | 100,00% | 100,00% |
Vplyv vzdelania
Count of loan\_id | education\_id | |||||
PD | Primary education | Basic education | Vocational education | Secondary education | Higher education | Grand Total |
0 | 60,00% | 76,74% | 67,01% | 82,53% | 84,05% | 80,52% |
1 | 40,00% | 23,26% | 32,99% | 17,47% | 15,95% | 19,48% |
Grand Total | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% | 100,00% |
Logicky čím vyššie, tým lepšie.
Typ bývania
Všetky terajšie investície mám buď do Vlastníka (Owner) alebo Hypotéky (Mortgage). Aspoň to ako pozerám je správne. Celkom ma prekvapuje Homeless, kde všetky úvery boli splatené. Jedná sa ale len o 7 úverov.
Count of loan\_id | PD | |
home\_ownership\_type\_id | 0 | 1 |
Homeless | 100,00% | 0,00% |
Owner | 88,17% | 11,83% |
Living with parents | 83,64% | 16,36% |
Tenant, pre-furnished property | 88,95% | 11,05% |
Tenant, unfurnished property | 86,11% | 13,89% |
Council house | 63,33% | 36,67% |
Joint tenant | 84,82% | 15,18% |
Joint ownership | 90,52% | 9,48% |
Mortgage | 94,48% | 5,52% |
Owner with encumbrance | 88,89% | 11,11% |
(blank) | 62,13% | 37,87% |
Typ povolania
Count of loan\_id | PD | |
occupation\_area | 0 | 1 |
Other | 78,09% | 21,91% |
Mining | 50,00% | 50,00% |
Processing | 84,66% | 15,34% |
Energy | 73,61% | 26,39% |
Utilities | 82,76% | 17,24% |
Construction | 82,78% | 17,22% |
Retail and wholesale | 83,10% | 16,90% |
Transport and warehousing | 78,68% | 21,32% |
Hospitality and catering | 70,83% | 29,17% |
Info and telecom | 84,33% | 15,67% |
Finance and insurance | 79,67% | 20,33% |
Real-estate | 75,00% | 25,00% |
Research | 88,68% | 11,32% |
Administrative | 84,62% | 15,38% |
Civil service & military | 80,40% | 19,60% |
Education | 82,34% | 17,66% |
Healthcare and social help | 80,25% | 19,75% |
Art and entertainment | 73,63% | 26,37% |
Agriculture, forestry and fishing | 75,25% | 24,75% |
(blank) | 77,27% | 22,73% |
Grand Total | 80,52% | 19,48% |
RECOVERY
Je tam toho strašne veľa, takže ďalej už v jednotlivých tabuľkách pokračovať nejdem. Na konci zoznamu sa nachádza položka recovery, čo je hodnota, ktorú bondora vymohla od jednotlivých zdefaultovaných úverov. Túto hodnotu nám treba, aby sme vedeli vypočítať, ako sa nám ktoré investície oplatia. Teda koľko je bondora schopná vymôcť. Bohužiaľ neobsahuje žiadny údaj, koľko času to trvalo, ale aspoň zistíme sumu.
Komplet Dataset:
Počet žiadosti o úver: 8359
Počet default úverov: 1118 (13%)
Úverov, z ktorých Bondora nevymohla ani cent je 280 v hodnote 694202,74 eur.
Hodnota default úverov: 1247150,23 eur
Hodnota úverov, bondora získala späť: 264837,93 eur (21,12%)
Filter pre Estónsko:
Počet default úverov: 1070
Ich hodnota: 994775,23 eur
Hodnota úverov, bondora získala späť: 264251,00 eur (26%)
Filter pre Estónsko a owner/mortgage:
Bondora vymohla len 22 % sumy úverov, ktoré neboli splatené. Pre rank 1000 je to 25,5 % z defaultovej sumy. Neviem prečo vychádza suma vymoženej hodnoty okolo 20 percent. Je možné, že tých spoínaných 80 percent je len blud, alebo tam rátajú aj úvery, kde vymôžu len nepatrnú časť z celkovej sumy.
//na diskusnom fóre som našiel topic o default and recovery rate.
Záver:
Neviem prečo mi čísla nesedia s bondorou, ktorá uvádza v máji default rate 4,8% a júny 5,37%. Podľa datasetu je default rate 23,35% pre všetky krajiny a 24,18% pre Estónsko. Som zvedavý, ako sa to zmení pri najnovších úveroch z bondora+, keď väčšinou je tam Španielsko a u nich mám ja aktuálnu overdue rate 27%. Pri použití Estónska, vyššie spomínaných typov bývania, povolania, vzdelania, veku s credit score 1000 je default rate 5,17%. To je 4 krát menší default rate. Už len keby sa dalo do pôžičiek s takými parametrami investovať. 🙂
UPDATE: Odpoveď na tú vysokú recovery rate:
When looking at recovery, it usually makes sense to only look at loans that defaulted at least a certain time ago (e.g. loans that defaulted at least 24 months ago). This can give you an estimate on how well a loan recovers within a 24-month period.
If you include all defaulted loans in your calculations, then this doesn’t give you very much significant info as there isn’t and can’t be any recovery for loans that just defaulted.
Refer to the default curves graphs shared above to see when the majority of recovery actually takes place to see what period it makes sense to look at.
Takže podľa toho príspevku predpokladám, že majú 89% recovery rate po 2 rokoch. Ešte sa možno pozrem na ten dataset podľa dátumov. Bohužiaľ recovery rate na Slovensku teda zistíme až po 2 rokoch, aspoň pre prvé pôžičky.