Spora część polskiej Sieci wie, że zamówiłem trochę książek w Amazon. Przyszły dwa tygodnie przed terminem. Dwie z nich już przeczytałem. Jedną z nich jest Super Crunchers Ian Ayresa (to z podtytułu tej książki zapożyczyłem tytuł tego tekstu).
By zrozumieć o czym opowiada Ayres wystarczy przypomnieć sobie co stało się z młodszymi specjalistami kredytowymi w bankach. Wychowani w PRL czytelnicy bloga zapewne w ogóle nie mają takich wspomnień, ale jeszcze 30 lat temu, na przykład w USA, o udzieleniu kredytu decydował pracownik lokalnego oddziału banku, bardzo szanowany członek społeczności, który na podstawie własnej oceny popartej finansową analizą możliwości kredytowych klienta, przyznawał kredyt lub odmawiał jego udzielenia.
Tak było zanim stworzono punktową metodę przyznawania kredytów (w oparciu o credit score). Obecnie, specjalista do spraw kredytów tym różni się od osoby wprowadzającej dane do systemu, że ma ‘ładny’ tytuł stanowiska. Dane wprowadzone przez pracownika banku przetwarzane są przez centralny system instytucji i to stworzone przez innych pracowników banku algorytmy decydują o przejęciu lub odrzuceniu podania o kredyt.
Ayres w gruncie rzeczy pyta: kto następny? W jakich kolejnych dziedzinach analiza statystyczna okaże się lepsza, wydajniejsza od pracy ekspertów? Jednym z najbardziej opornych dziedzin jest medycyna. Trudno się temu dziwić – to w końcu medycy przez długie lata ignorowali statystyczne dowody na efektywność ‘wariackiego’ konceptu Ingaza Semmelweisa, że mycie rąk przez lekarzy drastycznie obniża śmiertelność matek na izbach porodowych. Dziś, trudno uwierzyć, że terabajty danych, które miliony pacjentów w państwach rozwiniętych ‘produkuje’ każdego roku swoimi dolegliwościami jest praktycznie niewykorzystane. Istnieją już jednak programy komputerowe, które z listy 30 000 potencjalnych chorób wskazują, na podstawie wprowadzonych do systemu symptomów, kilka najbardziej prawdopodobnych schorzeń. Tymczasem, po zdigitalizowaniu kart pacjenta i zmuszeniu lekarzy pierwszego kontaktu do dokładnego wpisywania danych, cała służba zdrowia mogłaby się przekształcić w jedno gigantyczne badanie kliniczne. Ten system istnieje już w onkologii (gdzie lekarze mogą na przykład skorzystać ze statystyk o tym czy przy III stadium raka mózgu skuteczniejsza jest radioterapia czy chemioterapia) i nie ma technicznych przeciwwskazań przed rozszerzeniem do na inne dziedziny.
Wykładniczy wzrost mocy obliczeniowych i dostępnej pojemności pamięci umożliwił gromadzenie, przetwarzanie i analizowanie danych na skalę nie znaną jeszcze 30 lat temu. Biblioteka Kongresu liczy około 20 terabajtów informacji. W 2007 roku Yahoo każdego dnia gromadziło 12 terabajtów danych!
Przy tak dużej dostępności danych i tak niewielkim koszcie ich analizowania – dokonywanie skomplikowanych analiz statystycznych staje się podstawą działań operacyjnych i marketingowych wielu korporacji. Visa, na podstawie analizy wydatków z karty kredytowej, jest w stanie skutecznie prognozować prawdopodobieństwo rozwodu w następnych 5 latach. Firmy wypożyczające samochody wykorzystują credit score klientów do oceny prawdopodobieństwa, że spowodują oni wypadek. Linie lotnicze na bieżąco ustalają ceny biletów lotniczych w celu optymalizowania (czytaj: maksymalizowania) przychodów. W odpowiedzi, powstają serwisy, które za pomocą algorytmów prognozują czy cena danego biletu wzrośnie czy spadnie w okresie kilku najbliższych dni. Wyścig trwa.
Analiza statystyczna otworzyła, a raczej wyrwała z zawiasami, drzwi nowych możliwości w badaniach naukowych, także w ekonomii, oraz umożliwiła naukową ocenę wielu przedsięwzięć społecznych i gospodarczych. Gigantyczny program oceny skuteczności meksykańskiego programu Progresa udowodnił, że Warunkowe Transfery Pieniężne (Conditional Cash Transfer) są jedną z najlepszych metod udzielania pomocy społecznej i podnoszenia poziomu życia biednych społeczności. Wydaje się, że wieść o skuteczności tego programu dotarła nad Wisłę skoro nawet polscy legislatorzy zdecydowali się powiązać ‘becikowe’ z regularnymi wizytami u ginekologa w trakcie ciąży.
Łatwość stosowania analizy statystycznej w badaniach ekonomicznych zrewolucjonizowała także tę dziedzinę nauki. Obecnie, już nie trzeba dedukować o motywach kierującymi ludźmi gdy decydują o wzięciu kredytu. Można wysłać 10 różnych wzorów listów reklamowych do 500 000 ludzi. Sprawdzić skuteczność każdego z tych wzorów i empirycznie przekonać się co jest istotne dla ludzi decydujących się na kredyt. Dzięki temu, można się na przykład dowiedzieć, że umieszczenie w prawym górnym rogu oferty kredytowej zdjęcia atrakcyjnej młodej kobiety jest dla mężczyzn równie zachęcające co zaproponowanie im oprocentowania niższego o 450 punktów bazowych! Żegnaj bajeczko o racjonalnych homo oeconomicus.
Naturalnie, rozwój analizy statystycznej ma drugie oblicze. Chyba najlepiej pokazały je wybory prezydenckie w 2000 roku na Florydzie. Algorytm, łączący dane z rejestrów wyborczych na Florydzie z danymi o skazanych w całych USA błędnie wykluczył z udziału w wyborach około 50 000 Afroamerykanów. Okazało się, że program bardzo luźno dopasowywał dane z dwóch baz – na przykład ignorował ‘różne’ drugie imiona, zamianę imienia i nazwiska (Washington Bruce i Bruce Washington był jedną osobą dla programu) a nawet kilkudniowe różnice w dacie urodzenia. O potencjalnych konsekwencjach tego błędu najlepiej przekonać się sprawdzając jak kształtowały się preferencje wyborcze Afroamerykanów w ostatnich kilku dekadach i ile wynosił margines zwycięstwa Busha na Florydzie.
Książka Ayresa jest fascynująca. Napisana w amerykańskim stylu, czyli w taki sposób by czytać mogli ją eksperci i ignoranci. Myślę, że statystycznie uzdolnione, kreatywne osoby znajdą w niej z tuzin pomysłów na biznes. Ayres nie napisał tego wprost ale myślę, że z książki można wyciągnąć wiosek, że w XXI wieku analfabetyzm statystyczny będzie tym samym czym tradycyjny analfabetyzm był 150-200 lat temu. Bez umiejętności ‘myślenia liczbami’ będzie można osiągnąć sukces życiowy ale będzie to trudne.


“Tak było zanim stworzono punktową metodę przyznawania kredytów (w oparciu o credit score) (…) Ayres w gruncie rzeczy pyta: kto następny? W jakich kolejnych dziedzinach analiza statystyczna okaże się lepsza, wydajniejsza od pracy ekspertów?”
Kliknąłem na link o książce, zeby się upewnić, kiedy wydana została, ale już to zdanie mnie nie myliło: przed Ogólnoświatowym Kryzysem.
Trystero, rozumiem, ze w książce można było coś takiego napisać, ale Ty? Metoda oparta o credit score jest (podobnie jak całe multum różnych dziwnych modeli, których działanie oparte zostało na pesudostatystyce bez zrozumienia, jak działaja te korelacje) może jest tańsza od “szanowanego członka społeczności” w ocenie kredytowej, ale na pewno nie lepsza. Garbage in, garbage out.
Zanim zaczniesz polemizować, odpowiem, że credit score jest bardzo pożytecznym narzędziem i do celu, do którego został wymyślony (drobne pożyczki konsumenckie czy karty kredytowe) sprawdza się pewnie wciąż nieźle. Ale kiedy jakiś pseudomądrala postanowił tego użyć do wszystkiego, to mamy problem. W starych dobrych czasach, kiedy na kredytach znali sie ludzie, a nie “komputery”, ci sami wiedzieli, że wiarygodność kredytów hipotecznych przede wszystkim (a poważnych kredytów w ogólności), opiera się na 3 filarach: creditworthiness, capacity i collateral. Pierwsza z nich, to właśnie ta wiarygodność kredytowa (niektórzy to “C” czytali jako “character”, czyli siła charakteru), historia tego, jak dana osoba “dotrzymuje słowa”. Drugie “C”, capacity, to zdolność udźwignięcia obciążenia (czyli m.in stosunek rat do zarobków) i wreszcie “collateral” to zabezpieczenie kredytowe. I nie znające się na niczym pseudomądrale zaczęły używac tylko pierwszego “C”, w postaci automatyczbnego “credit score”, ignorując dwa następne (stąd zatrzęsienie kredytów na 100% wartości, bez weryfikacji zarobków). Skutek odczuwamy do dziś i będziemy jeszcze długo.
Nie wiem, co będzie istotne w XXI wieku, ale podejrzewam, że myślenie “bezprzymiotnikowe” (a nie “liczbami”), będzie ciągle w cenie
Pamiętacie pierwszą część “Dekalogu” Kieślowskiego? Takie miałam skojarzenie czytając wpis Trystero.
@ poszi
Mysle, ze to co napisalem da sie obronic. Nie przedstawiam tutaj analizy statystycznej jako remedium na wszystko bolaczki swiata. Twierdze raczej, za Ayresem, ze w tych samych okolicznosciach analiza statystyczna jest lepsza niz intuicja ekspertow.
Jasne, bardzo latwo jest krytykowac modele statystyczne, te ‘kretynskie’ korelacje pomiedzy defaultami, ktore zostaly zniszczone w czasie kryzysu, a ktore przewrocily caly rynek CDO. Tylko, ze banka kredytow brokerskich pod koniec lat 20′ powstala bez modeli matematycznych, tak jak wiele innych tragicznych dyslokacji kapitalu przed stworzeniem algorytmow.
Powinnismy zapytac, co by zrobili tradycyjni analitycy kredytowi w latach 2002-2005? Intuicyjnie dostrzegliby banke spekulacyjna? Nie sadze. Mysle, ze udzielali by kredytow wszystkim ‘bo ceny nieruchomosci zawsze ida w gore’.
Rzeczywiscie moglem te recenzje napisac inaczej, ale chcialem napisac w pozytywnym tonie o analizie statystycznej poniewaz uwazam, ze dala ona gospodarce duzo wiecej korzysci niz strat. Tym bardziej, ze analiza statystyczna nie podejmuje decyzji. Ona pozwala podejmowac je w oparciu o lepsze podstawy niz intuicja ekspertow. Nie gwarantuje jednak poprawnosci decyzji.
@poszi:Nie wiem, co będzie istotne w XXI wieku, ale podejrzewam, że myślenie “bezprzymiotnikowe” (a nie “liczbami”), będzie ciągle w cenie
Oczywiście, tylko jaki procent populacji jest kreatywny? Pewnie poniżej 1%. Metody statystyczne pozwalają “zagospodarować” mniej kreatywną część populacji. To jest właśnie siła statystyki (rzetelnie aplikowanej do rzetelnych danych), że nie musimy rozgryzać przez 10 lat jak coś działa. Możemy próbować stosować jakąś metodę działania bez rozumienia jej istoty. Jak ktoś opierając się na tych samych danych stworzy teorię, która obejdzie się bez statystyki, to chwała mu za to. Metody statystyczne są tańsze i szybsze w zastosowaniach, a wyjaśnianie zasad, które rządzą zaobserwowanymi korelacjami to już domena “czystej nauki”. Zreszta w takich dziedzinach jak ekonomia, nauki społeczne, … nie mamy innych narzędzi. Chcę jeszcze przypomnieć, że zaawansowane metody statystyczne (analiza czynnikowa, gron, wariancji) są dokładnie rozpracowane i ich stosowanie nie musi polegać na manipulacjach przy pomocy których można osiągnąć jaki się chce wynik (trzy rodzaje kłamstw: zwykłe, cholerne i statystyka:)
Aby nastąpiło to o czym piszesz, społeczeństwo musi przestać być organizmem a stać się mechanizmem. Prawdą jest, że zmierzamy w tym kierunku (i to nie przypadkiem moim zdaniem), ale mnie, w odróżnieniu od Ciebie, wcale to nie raduje.
@ poszi
Mozesz jakos zdefiniowac myslenie bezprzymiotnikowe?
@ karakuli
Coz, to ludzie tworza skomplikowane regresje i buduja algorytmy. Analiza statystyczna jest tylko narzedziem. Ja teraz bardzo to splyce: ale spojrz na Freakonomics. Ta ksiazka nie istnialaby bez intuicji Levitta. Ale intuicja Levitta nie dalaby takich rezultatow gdyby nie latwosc gromadzenia i przetwarzania danych.
@trystero,
Jak to sprowadzamy do “analizy danych stystycznych”, to zaczynamy schodzić do pokładów oczywistej oczywistości. Cała dzialalność poznawcza polega na analizie danych i obserwacjach. Nic nowego pod słońcem. Od starożytnej astronomii po zderzacz hadronów w CERN. Problemem jest to, jak zaczynamy uprawiać lenistwo intelektualne. Zawsze, kiedy sie posługujemy statystyką, należy rozumieć, co pod tymi liczbami sie kryje. Zawsze pytać, dlaczego. Czy są inne zmienne, w których to korelacja jest ukryta. Istnieje niesamowita korelacja między poziomem rozwoju gospodarczego, a ilościa produkowanych śmieci komunalnych. Zapewne jakiś niezbyt bystry “analityk statystyczny” wyciagnąłby wniosek, że nalezy zatem produkować więcej śmieci, co podniesie poziom rozwoju gospodarczego.
Tak twierdzę, że tradycyjna ocena wiarygodności kredytowej jest lepsza. Nie chcę się bawić w co by było, gdyby (zresztą i tak wszystkiemu winien jest Greenspan/Bernanke :) ), bo nigdy sie nie dowiemy, ale poleganie na bezmózgowej ocenie wiarygodności było jednym z powodów, dlaczego udzielono aż tylu złych kredytów.
@Trystero:
Zgadzam się z ostatnim zdaniem posta. Podejrzewam jednak, że statystka “ze zrozumieniem” jeszcze długo pozostanie dziedziną elitarną. Nie dość, że przekracza możliwości intelektualne sporej części populacji, to jeszcze stanowi zbyt silne narzędzie pojmowania Świata, żeby ktokolwiek chciał jej skutecznie uczyć za darmo/małe pieniądze (skutecznie, czyli tak, aby uczniowie byli w stanie zastosować ją w życiu, a nie tylko recytowali wzorki i regułki, jak to ma miejsce w naszych państwowych szkołach).
@poszi:
Kredyty “na 100% wartości, bez weryfikacji zarobków” to wynik igrzysk nieodpowiedzialności i zamierzonego rozdawnictwa kredytowego w imię krótkoterminowych korzyści i bonusów dla zarządu.
Statystyka to tylko narzędzie. Równie dobrze mógłby zostać skonstruowany model, w którym uwzględnia się wszystkie 3 C i oblicza score na tej podstawie, realizując sensowne kryteria. To, że uwzględniono tylko jeden czynnik nie oznacza, że metody statystyczne są fuj, tylko, że konstruujący model ludzie mieli na celu rozdawnictwo kredytowe (choć naturalnie tłumaczą się niekompetencją, plausible deniability FTW!).
@trystero,
Myślenie bezprzymiotnikowe to po prostu myślenie.
Jesteś już postPRLowskim rocznikiem (sądząc po Twoim profilu), więc pewnie nie pamiętasz z własnej skóry, że socjalistyczna nowomowa uwielbiała dodawać przymiotniki do pojęć, przez co stawały sie ich farsą. Dlatego była “demokracja ludowa” (już nie demokracja) czy “sprawiedliwość społeczna” (polegająca na ograbieniu posiadaczy). Dlatego “myślenie liczbowe” jest taką samą farsą “myślenia” polegającym na bezkrytycznym oddaniu się maszynie.
“Myślenie liczbowe” to w moim przekonaniu ujmowanie myśli w związki przyczynowo-skutkowe wyrażone ilościowo. Nie ma nic wspólnego z bezkrytycznym oddawaniem się komu- czy też czemukolwiek. Narzędzie, nie ideologia.
@ Trystero artykuł ciekawy zwraca uwagę na potrzeby w edukacji (w Polsce znajomość matematyki po szkołach to dno a statystyki nie ma wcale).
Ze swojej strony uważam że statystyczne metody za przydatne. Należy jednak pamiętać że mają one swoje ograniczenia. Są tylko pewnymi uproszczeniami i nie zawsze oddają dobrze relacje. Sam współczynnik korelacji ma duuuużo wad.
Stanowią szansę ale i pewne zagrożenie. Wyniki jakie dają metody statystyczne w mojej ocenie powinny być weryfikowane. Tym bardziej że uważam je za niebezpieczne dlatego że dają poczucie pewności posiadanych danych.
Dokladnie, to tylko narzedzia, ale dzieki taniej mocy obliczeniowej staly sie lepsze bo szybsze i tansze niz kiedykolwiek. Same w sobie czesto sa prymitywne (np.srednia), inne tylko troche trudniejsze (np.metoda Monte Carlo) jednak uzyteczne. Powinny pomagac ludziom (i wierze, ze to robia) ale ich nie zastapia.
“Biblioteka Kongresu liczy około 20 terabajtów informacji. W 2007 roku Yahoo każdego dnia gromadziło 12 terabajtów danych!”
Czy to informacja przedstawiona w ksiazce przez przywolywanego Ayres’a? Bo zastanawiam sie, jakiegoz to rodzaju wartosciowe dane zbiera Yahoo w tak imponujacej ilosci, ze Ayres (jezeli to On) zestawia je ze… zbiorami Biblioteki Kongresu? ;)
Przyjemnego wieczoru:)
Na marginesie wykorzystania statystyki w medycynie, pokazał się dziś fascynujący materiał na TEDzie na ten temat. Nie trzeba zmuszać lekarzy do wprowadzania danych, wystarczą pacjenci. Lekarzy natomiast przypuszczalnie trzeba będzie zmusić do wykorzystania tych informacji, w miejsce zamiast odsyłania z kwitkiem na Ibuprom ludzi, którzy przychodzą z “jakimiś tam świstkami z internetu”.
http://www.ted.com/talks/jamie_heywood_the_big_idea_my_brother_inspired.html
Przyznawanie kredytow na podstawie wyniku programu komputerowego jest metoda moze i wygodna, ale zawodna jak diabli.
Od 11 lat moja praca polega na sprawdzaniu jakosci takiego oprogramowania (i innego) i to co widze powoduje, ze skora marszczy mi sie na tylku.
Z reguly oprogramowanie bankow jest proprietary i zanim da sie zaimplementowac znaczace zmiany a potem je przetestowac uplywa cala masa czasu.
Powiedzmy, ze przez rok bank odrzuca kredyty ludzi, ktorzy powinni je dostac (albo na odwrot). Zmienil sie rynek, zmienilo sie zapotrzebowanie i sytuacja… a program sam sie odpowiednio nie dostosuje, niestety.
Albo jeszcze lepsze rozwiazanie: poniewaz potrzeba wprowadzic zmiane SZYBKO a nie ma czasu na przetestowanie calego systemu, to sie POMIJA jeden z istotnych czynnikow, ot taka weryfikacje zarobkow…
Na sma mysl, ze wiekszosc dziedzin naszego zycia bedzie kontrolowana przez takie oprogramowanie robi mi sie straszno.
@ olaf
Hm, ja spodziewam sie, ze sa to odwiedzone strony, wyszukiwania i ‘takie tam’ rzeczy. Ale bajt to bajt. Niewazne czy jest to fragment Illiady czy rachunek ze sklepu :)
@ poszi
Twoj przyklad ze smieciami i rozwojem gospodarczym jest przykladem na intuicyjne myslenie eksperckie a nie na analize statystyczna. Statystyk zbuduje regresje i pokaze, ze wzrost gospodarczy nie jest wynikiem zwiekszonej produkcji smieci.
@trystero,
A powiedz mi, jak statystyk zbuduje regresję, która pokaże, że to nie śmieci generują wzrost? Zrobimy ładny wykres “10-letni przyrost PKB vs 10-letni przyrost śmieci dla różnych krajów” i wyjdzie śliczna korelacja. Korelacja to korelacja. To nasza znajomość niestatystyczna świata, nasze rozumienie, jak działa pozwala nam na wyciągniecie odpowiedniego wniosku, a nie regresja.
To, co nie podoba mi sie we wpisie, to jakieś szukanie “nowej ery”. Już nie potrzeba specjalisty kredytowego, za niego pomyślą statystycy, którzy robili program. I podajesz przykład credit score, na oparciu którego wyłożył sie rynek kredytów hipotecznych w USA. Potrzeba lepszego dowodu na miałkość tej tezy?
Analiza statystyczny czy w ogóle “data mining” to świetne narzędzia. Sam credit score jest przydatny o czym pisałem. Ale tylko tyle. Ani to nowa era, ani to nie jest “oddajmy się wszechmocy narzędzi statystycznych”.
@ poszi
Rynek kredytow hipotecznych nie wylozyl przez credit score. Credit score ocenia zdolnosc kredytowa. Problemem nie bylo to, ze credit score podawal wysoka zdolnosc kredytowa ludzi, ktorzy mieli niska zdolnosc kredytowa. Problemem bylo to, ze dawano kredyty ludziom o niskiej zdolnosci kredytowej.
Jesli chcesz mi pokazac, ze credit score jest winny to musisz pokazac wykres, na ktorym podano odsetek kredytow w ‘defaulcie’ dla poszczegolnych przedzialow credit score. Jesli sie okaze, ze nie ma korelacji pomiedzy wysokim credit score a niskim odsetkiem defaultow to przyznam Ci racje. Tymczasem, daje sobie uciac reke do nadgarstka, ze korelacja jest i to bardzo silna.
Co do przykladu ze smieciami: toz to jest czysty populizm, w stylu rozwoj piractwa morskiego moze zmniejszyc liczbe tropikalnych cyklonow. Jesli tak maja wygladac ‘anty-statystyczne’ argumenty to statystycy nie maja sie czego obawiac. Dlaczego?
Bo liczba blednych wnioskow wyciaganych z anegdotycznych sytuacji jest wielokrotnie wieksza niz liczba blednych wnioskow wyciaganych z analizy statystycznej. Przechodzilem przez ulice i w radiu grali Poker Face i wtedy potracil mnie samochod. Nigdy juz nie bede sluchal Poker Face przy przechodzeniu przez ulice.
Wejdz na pierwsze lepsze forum internetowe i zobacz ile przykladow takiego myslenia mozesz znalezc.
Żona udzielała kredytów konsumenckich kilka lat temu. „Na oko” nie wysyłała nawet wniosków części klientów a znaczki za 5 zł defraudowała :)
Współczynnik spłacalności miała o rząd wielkości lepszy ! Jeden bank rozwiązał umowę z całą „siecią” w której pracowała z wyłączeniem jej oddziału !
Jak klienci połapią się jak działa system punktowy – to to jest jego koniec, zaczną się pod niego „ustawiać”.
@trystero,
W żadnym miejscu nie powiedziałem, że nie ma korelacji między credit score a ryzykiem. Napisałem, że credit score mierzy to jedno z “C”. Jeśli wszystkie inne rzeczy są jednakowe, to osoby o lepszym credit score będa miały większą spłacalność. Problem jest taki, że osobom o wyższym score wciskano takie kredyty, których nie byli w stanie spłacić, bo credit score to takie super cudo, co pozwala zapomnieć po pozostałych “C”. I rynek Alt-A, gdzie kredyty udzielano osobom o wyższym score niż subprime rozpadł się w równie spektakularny sposób, co subprime, a biorąc pod uwagę, ze wyższy credit score miał być lekarstwem na wszystko, rezerwy przeznaczone na problemy z kredytami Alt-A były dużo mniejsze niż dla subprime które zawsze było ryzykowne.
Porównaj subprime i Alt-A
http://www.clayton.com/RMBS InFront Reports/January 2010.pdf
Alt-A maja wyższy score od subprime (703, a nie 631, co jest ogromną różnicą i w przypadku kredytów konsumenckich oznacza kilkukrotnie mniejsze ryzyko), inne charakterystyki są podobne (kredyty są młodsze, co oznacza, że będzie jeszcze gorzej), niższe oprocentowanie (więc były uznawane za mniej ryzykowne) i co oznacza, że powinno łatwiej je sie spłacać oraz prawie 2 razy średnio wieksza kwotę. To jest własnie to, o czym mówię. FICO (credit score) stało sie magicznym wyliczaczem zdolnosci kredytowej, którym nigdy nie było i nie powinno być.
I mamy niecałe 50% zaległości w subprime i ponad 40% w Alt-A, a jak kurz opadnie to te 2 grupy kredytów będą prawdopodobnie równie podłe.
@Trystero
Popełniasz jeden dość poważny błąd, który popełniają wszyscy statystycy. Zakładają oni a-priori, że istnieje związek przyczynowo-skutkowy;-) David Hume w swojej pracy >Badania dotyczące rozumu ludzkiego< zakwestionował istnienie takich związków, a badania cząstek elementarnych w części potwierdzają jego tezy. Weźmy choćby elektron i pozyton. Pozyton to nowa cząsteczka, czy też elektron cofający się w czasie?-) Przyjęło się uważać, że to nowa cząsteczka, ale dowodów, że to prawda nadal nie ma;-) Proszę zerknąć na http://efizyka.win.pl/przygoda/frameless/eedd.html i zamienić strzałki procesu. Przyczyna stała się skutkiem, a skutek przyczyną;-)
A swoją drogą, czy ktoś wie, co tak naprawdę mierzy credit score?-)))
@Hans:
“Zakładają oni a-priori, że istnieje związek przyczynowo-skutkowy”
No przecież ludzie działają :)
“Pozyton to nowa cząsteczka, czy też elektron cofający się w czasie?”
Chyba pozytron – antycząstka elektronu.
“Przyjęło się uważać, że to nowa cząsteczka, ale dowodów, że to prawda nadal nie ma;”
Coś ci się pomieszało.
“Przyczyna stała się skutkiem, a skutek przyczyną;-)”
Tylko w świecie mikroskopowym.
@Liberto
Pozyton, pozytron, antyelektron to nazwa tego samego;-)
“Tylko w świecie mikroskopowym.”
Składamy się z mikroświatów;-)
” I nie znające się na niczym pseudomądrale zaczęły używac tylko pierwszego “C”, w postaci automatyczbnego “credit score”, ignorując dwa następne (stąd zatrzęsienie kredytów na 100% wartości, bez weryfikacji zarobków).”
Pytanie 1 : który bank w Polsce udzielał kredytów na 100% wartości nieruchomości bez weryfikacji zarobków ?
Pytanie 2 : Do czego jest potrzebny analityk kredytowy gdy jako warunki brzegowe wprowadzimy zarobki minimalne (1 pensja + dodatkowe dziecko w przypadku małżeństw) oraz wartość zabezpieczenia w scenariuszu zlicytowania nieruchomości ?
Pytanie 3: Czy w USA nie stosowano przy ocenie kredytów symulowanej wartości nieruchomości w przyszłości ?
Pytanie 4: Jak to się stało że tak wiele bezczelnych przekrętów zrobiono w Polsce w latach 90-tych w starych dobrych czasach ?
@poszi, Trystero, niktwazny
dla mnie z typowym scoringiem problem jest taki, że niezależnie czy ktoś (osoba prywatna, firma) ubiega się o 1 tys. zł czy o 100 mln zł to zgodnie z tymi metodami otrzyma się taki sam wynik – podmiot jest wiarygodny lub niewiarygodny. Więc, zgadzam się z tym co napisał poszi, że do całości potrzebna jest jeszcze ocena zabezpieczenia i dochodów w stosunku do wielkości rat. Przy suprime przyjęto, że wartość zabezpieczeń będzie tylko wzrastała tak więc nie ma potrzeby oceniać niepotrzebnie relacji dochodów do rat:)
No ale to nie oznacza, że wprowadzenie scoringu było błędem. Generalnie, prawidłowo wykorzystywany (a więc jako jeden z elementów) jest jak najbardziej przydatny – tańszy i bardziej obiektywny.
Problem jest dla mnie taki, iż część uczestników rynku (w tym banki, audytorzy, regulatorzy) zaczęli uważać, że wszystko może zapisać w postaci algorytmu, ewentualnie nieco bardziej skomplikowanego. Tym samym przyjęto, że w gospodarce występuje tylko ryzyko, a nie występuje już niepweność.
Ponadto problem ze statystyką jest taki, że wymaga ona odpowiednio wielkiego zasobu danych. No a przecież, jeżeli banki dopiero wpadły na świetny pomysł udzielania kredytu bez badania poziomu dochodów to takimi danymi dysponować nie mogły. W dodatku tutaj kluczowe byłyby dane historyczne z okresu dekoniunktury. Z drugiej strony jest też pozytyw – takimi danymi już będziemy dysponować dzięki bankom z USA:) A więc statystycy moga pracować nad nowymi, bardziej skutecznymi metodami:)
@Hans:
“Pozyton, pozytron, antyelektron to nazwa tego samego”
Faktycznie co do nazwy to można stosować zamiennie.
“Składamy się z mikroświatów;-)”
Ale wraz ze wzrostem skali zjawiska kwantowe zanikają.
http://fotonowy.pl/index.php?main_page=page&id=12
@trystero
co do zagadki 1 – statystyke dawno mialem, ale nie brakuje informacji o jakim rozkladzie mowimy?
@Jacek:
Masz na myśli tę zagadkę dotyczącą wzrostu z następnego wpisu? Możemy śmiało założyć, że to jest krzywa Gaussa. Stoi za tym central limit theorem, który mówi, że rozkład zmiennej losowej, która jest złożeniem wielu innych zmiennych losowych zawsze dąży do rozkładu Gaussa, pomimo, że każda ze zmiennych losowych może mieć zupełnie inny typ rozkładu. W przypadku wzrostu można śmiało tak założyć, bo jest mnóstwo czynników losowych determinujących wzrost LOSOWO wybranego osobnika.