Intuice expertů prohrává s algoritmy

Existuje spor o to, zda je v předpovědích v nejistém prostředí (v prostředí s nízkou validitou predikcí) lepší intuice expertů, anebo podle nějakých předem daných pravidel vytvořené matematické relativně jednoduché vzorce. Mechanický postup rozdělení problému do jasných kategorií, kvantifikace a postup podle jasných pravidel odpovídá analytickému duchu racionality. Tento spor je tedy do značné míry přeložitelný jako spor vrcholné intuice (protože jde o intuici těch, kteří se daným problémem zabývali) a stroze racionálnímu strojovému analytickému přístupu.

Popsaný spor je přitom na základě vědeckých dat zdá se prakticky rozřešen v neprospěch intuice expertů a ve prospěch relativně jednoduché matematiky, jak dokládá Kahneman.

Příkladem experimentů, o kterých budeme mluvit, je tento pokus: úkolem je predikovat prospěch studenta na vysoké škole. Profesionální pedagogičtí poradci k tomu mají k dispozici známky ze SŠ, výsledky testů, dlouhý pohovor a studentovo čtyřstránkové prohlášení k přijímacímu řízení. Proti nim stojí relativně jednoduchý vzorec složený ze známek na SŠ a výsledku jednoho testu. Výsledek: vzorec je v predikci lepší než 11 ze 14 pedagogických pracovníků, což lze jednoznačně hodnotit jako prohru intuice.

Podobné výsledky byly zaznamenány i v dalších 200 experimentech, které byly k tomuto problému provedeny: 60 % z nich skončilo ve prospěch vzorců, u zbytku nebyla signifikantně lepší ani jedna strana (což je ovšem z praktického hlediska vítězství pro vzorce, jelikož ty jsou vždy levnější). Pro expertní intuici nehovořil žádný z 200 pokusů, které byly prováděny v celé řadě oblastí expertní činnosti: lékářské prognózy, předpovědi recidivy pachatelů trestných činů, vyhodnocení vhodnosti párů pro pěstounství, ohodnocení úvěrových rizik, předpovídání výsledků fotbalu, predikce úspěchu podniků i budoucí kvalita vína. (Poslední zmíněná položka je zvlášť pikantní. Reakce vinařů se podle Kahnemana pohybovala někde mezi divokou kritikou a hysterií.)

Paul Meehl, jeden z psychologů, kteří řešení tohoto sporu podnítili, prohlásil: "Ve společenských vědách neexistuje kontroverzní hypotéza, která by vyprovokovala tak různorodý soubor kvalitativně různorodých studií, jako je tato." (s. 239)

Proč jsou experti horší než "bezduchá" matematika? Bylo zjištěno, že lidé mají odpor k použití vzorců, i když jsou k dispozici; myslí si, že jsou chytřejší, že ví více. Ve skutečnosti však mají spíše tendenci úsudek překombinovat. Dále, jak bylo ukázáno už v sekci o chybách intuice na příkladu soudců a lékařů, experti chybují i v úsudcích o přítomnosti, natož pak o budoucnosti. Jejich úsudek je nespolehlivý, kontextově závislý na Systému 1, na aktuálních irelevantních okolnostech, náladě apod. - to se vzorci nikdy stát nemůže. Kahneman tedy podle vzoru Meehla doporučuje: "Chcete-li maximalizovat přesnost předpovědí, finální rozhodnutí by mělo být ponecháno na vzorcích". (s. 242) Většinou k tomu však lidé nepřistupují - například u pohovorů v personalistice panuje nadměrná důvěra v intuici.

Navíc vzorce mohou být jen velmi jednoduché, aby fungovaly. Například bylo zjištěno, že pro predikci doby trvání vztahu je relativně velmi dobrý tento vzoreček: četnost milování mínus četnost hádek. Kahneman k tomu říká, že "algoritmus, který si sepíšete na kus papíru, je často stejně dobrý jako statistický vzorec s vícenásobnou regresí, a určitě dost dobrý na to, aby překonal expertní úsudek". (s. 243) Toto pravidlo by mělo platit velmi obecně, od výběru akcií po výběr léčebné metody. Příkladem dobrého postupu v duchu tohoto doporučení je Apgar test zachraňující životy v porodnictví - určení diagnózy je dáno jasným a jednoduchým pravidlem bodujícím zaznamenané symptomy.

Problémem však je již zmíněná averze vůči algoritmům. Kahneman sesbíral pejorativní označení, která byla v diskusi o daném problému matematizující metodě přiřknuta: mechanická, roztříštěná, příliš zjednodušující, umělá, nereálná, nahodilá, nekompletní, tupá, pedantická, rozštěpená, triviální, násilná, statická, povrchní, rigidní, sterilní, akademická, pseudovědecká, slepá. Oproti tomu metoda, která staví na intuitivním úsudku expertů, bývá označována těmito přívlastky: dynamická, globální, smysluplná, holistická, subtilní, delikátní, sympatická, konfigurální, vzorová, organizovaná, bohatá, hluboká, ryzí, senzitivní, sofistikovaná, reálná, živoucí, konkrétní, přirozená, realistická, chápající. Jako lidé máme k naší vlastní škodě tendenci sympatizovat s přirozeným proti umělému, s lidským proti strojovému. (Tato preference odpovídá i popularitě bioproduktů ve srovnání s továrními výrobky.) Kahneman nicméně věří, že postupně si budeme zvykat.

Po vzoru Meehlovy práce upravil Kahneman systém pro pohovory v armádě. Stanovil vlastnosti, které mají být u adeptů preferovány. Instruoval personální pracovníky, aby nejprve nezávisle sesbírali data o těchto kritériích, každé kritérium objektivizovali a obodovali. Teprve pak mělo být podle vzorce zachycujícího důležitost kritérií provedeno celkové zhodnocení a následný výběr měl být taktéž proveden podle výsledku vzorce. Tím mělo být zajištěno, aby hodnocení více odolávala kognitivním biasům, zejména haló efektu. Při aplikaci nového systému však hrozila vzpoura psychologů, kteří pohovory prováděli - protestovali, že se z nich dělají roboti, chtěli hodnotit sami. Tak Kahneman přistoupil na to, že vedle "strojového" hodnocení pak ještě každý ohodnotí uchazeče podle vlastní intuice.

Nový postup přinesl zlepšení - výsledky byly ve větším souladu s budoucími výkony vojáků. Celý postup však vylepšil i samotné intuitivní odhady psychologů. Uvedený postup objektivizování a zhodnocení dílčích kritérií a jejich matematizované syntézy lze přitom transformovat i na jiné problémy, v podstatě na jakýkoliv pečlivější proces výběru jednání.