Minimalistyczna ilustracja mózgu podzielonego na część organiczną i sztuczną sieć, symbolizująca wpływ AI na myślenie krytyczne

Paradoks AI: im więcej narzędzi, tym mniej myślenia krytycznego

Wpływ AI na myślenie krytyczne jest mierzalny i udokumentowany. Korzystanie z dużych modeli językowych obniża aktywność poznawczą u osób, które ich używają, a efekt utrzymuje się nawet po odstawieniu narzędzia. Wykazało to badanie z MIT Media Lab (Kosmyna i in., czerwiec 2025) z użyciem EEG: osoby piszące eseje z pomocą ChatGPT wykazywały najsłabszą aktywność mózgu w paśmie alfa, a po przejściu w tryb bez narzędzia nadal nie odzyskiwały poziomu charakterystycznego dla osób, które nigdy z LLM nie korzystały. Niezależne badanie Microsoft Research i Carnegie Mellon University (Lee i in., konferencja CHI 2025) wśród 319 specjalistów pokazuje mechanizm: im wyższe zaufanie użytkownika do AI, tym mniej krytycznego myślenia w zadaniu. Obserwacja zbiega się z raportem McKinsey Health Institute ze stycznia 2026 roku, który stawia „kapitał mózgowy” w centrum nowej narracji ekonomicznej o pracy z AI.

Kluczowe wnioski

  • Badanie EEG z MIT Media Lab (n=54, czerwiec 2025) wykazało spadek aktywności mózgu u osób piszących z LLM, utrzymujący się po odstawieniu narzędzia.
  • Recenzowane badanie Microsoft Research i Carnegie Mellon University na 319 pracownikach wiedzy (CHI 2025) potwierdza: wysokie zaufanie do AI koreluje z niższym zaangażowaniem krytycznym.
  • Mechanizm to „ironia automatyzacji” (Bainbridge, 1983): mechanizując rutynę, system odbiera użytkownikowi okazje do ćwiczenia osądu w tej rutynie.
  • Kontrdowód: w niektórych kontekstach edukacyjnych odciążanie poznawcze poprawia wyniki uczenia się (Iqbal i in., Scientific Reports, maj 2025).
  • McKinsey i Światowe Forum Ekonomiczne (styczeń 2026): umiejętności poznawcze stają się klasą aktywów ekonomicznych, którą codzienne korzystanie z AI może osłabiać.

Czym jest poznawcze odciążanie i jak wpływa AI na myślenie krytyczne

Poznawcze odciążanie (cognitive offloading) to delegowanie procesów myślowych, czyli zapamiętywania, analizy, oceny, do zewnętrznego nośnika, zamiast wykonywania ich w głowie. Termin został systematycznie zdefiniowany w przeglądzie Risko i Gilbert (Trends in Cognitive Sciences, 2016), choć samo zjawisko obserwowano w psychologii poznawczej już wcześniej.

Wcześniej takim nośnikiem była kartka, kalkulator, książka adresowa, GPS. Z tych przykładów wynikał klasyczny wniosek: odciążanie zwalnia zasoby umysłowe na zadania trudniejsze. Z dużymi modelami językowymi schemat się zmienia. LLM nie odciąża tylko zapamiętywania ani liczenia; przejmuje fragmenty rozumowania, oceny i syntezy, czyli funkcji wyższego rzędu, które tradycyjnie odróżniały eksperta od początkującego.

Różnica jest istotna. Kalkulator wykonuje operację, której wynik użytkownik weryfikuje. Model językowy generuje tekst, w którym proces myślowy i wynik są spleceni, a użytkownik nie ma intuicyjnego sposobu, by odróżnić jedno od drugiego.

Co wykazało badanie MIT z czerwca 2025

W badaniu zespołu Nataliyi Kosmyny z MIT Media Lab, opublikowanym jako preprint na arXiv w czerwcu 2025 roku, 54 osoby w wieku od 18 do 39 lat pisały krótkie eseje w stylu testu SAT, podzielone na trzy grupy: korzystającą z ChatGPT, korzystającą z wyszukiwarki Google oraz piszącą bez żadnych narzędzi. Aktywność mózgu mierzono za pomocą EEG.

Grupa korzystająca z LLM wykazywała najsłabszą aktywność mózgu w paśmie alfa, mierzoną specjalistyczną metodą EEG. Eseje pisane z pomocą ChatGPT zostały ocenione przez nauczycieli języka angielskiego jako „wyzbyte z indywidualnego głosu” i powtarzające te same wyrażenia oraz schematy myślowe. Po trzech sesjach uczestnicy z tej grupy często ograniczali się do skopiowania polecenia z arkusza i przyjęcia odpowiedzi modelu z minimalną redakcją.

Najbardziej istotny był efekt z czwartej sesji. Uczestników, którzy wcześniej pracowali z LLM, poproszono o pisanie bez narzędzia (grupa „LLM-to-Brain”). Ich aktywność mózgu pozostała niższa niż u osób, które od początku pisały bez wsparcia. Autorzy nazwali ten efekt „długiem poznawczym” (cognitive debt).

Trzy ograniczenia wymagają wyraźnego zaznaczenia: badanie jest preprintem (nie przeszło recenzji), próba liczy 54 osoby, a kontekst (esej szkolny) nie generalizuje się na inne formy pracy umysłowej. Sama autorka prosi w komunikacji medialnej, by nie używać sformułowań typu „uszkodzenie mózgu” ani „zgłupienie”.

Co dodaje badanie Microsoft Research i Carnegie Mellon

Hao-Ping Lee, Advait Sarkar, Lev Tankelevitch i współpracownicy z Microsoft Research oraz Carnegie Mellon University opublikowali na konferencji CHI 2025 (kwiecień 2025) wyniki ankiety wśród 319 specjalistów używających generatywnej AI co najmniej raz w tygodniu. Zebrano 936 konkretnych przypadków użycia AI w zadaniach zawodowych.

Główny wynik ilościowy: poziom zaufania użytkownika do AI ujemnie koreluje z zaangażowaniem w myślenie krytyczne, a poziom pewności siebie użytkownika dodatnio. W praktyce ten, kto ufa narzędziu, weryfikuje mniej; ten, kto ufa sobie, weryfikuje więcej, niezależnie od jakości narzędzia.

Wynik jakościowy jest równie ważny. Generatywna AI nie eliminuje myślenia krytycznego; przesuwa je na inne zadania. Pracownicy mniej generują, a więcej oceniają, integrują i nadzorują (autorzy nazywają to „nstrzeżeniem zadania” – świadomym nadzorem nad pracą AI). Krytyczne myślenie nie znika, lecz zmienia funkcję.

Autorzy cytują koncepcję „ironii automatyzacji” sformułowaną oryginalnie przez Lisanne Bainbridge w 1983 roku: mechanizując rutynę, system odbiera użytkownikowi okazje do ćwiczenia osądu w tej rutynie. Gdy pojawia się sytuacja wyjątkowa, w której narzędzie zawodzi, użytkownik nie ma wytrenowanej kompetencji, by ją obsłużyć.

To kluczowa rama interpretacyjna. Ryzyko nie polega na tym, że AI generuje gorszą pracę, lecz na tym, że pracownik traci zdolność do oceny, czy jest gorsza.

Dwa najsilniejsze badania z 2025 roku: porównanie

WymiarMIT Media LabMicrosoft / Carnegie Mellon
AutorzyKosmyna i in.Lee, Sarkar, Tankelevitch i in.
Data publikacjiCzerwiec 2025Kwiecień 2025 (CHI 2025)
StatusPreprint arXiv (bez recenzji)Recenzowany (CHI 2025, ACM)
Próba54 osoby (18 ukończyło 4. sesję)319 specjalistów
MetodaEEG plus ocena ekspercka esejówAnkieta plus analiza 936 przypadków
KontekstEsej szkolny w stylu SATRealne zadania zawodowe
Główny wynikSpadek aktywności mózgu w grupie LLM, utrzymujący się po odstawieniu narzędziaWyższe zaufanie do AI koreluje z niższym poziomem myślenia krytycznego
Główne ograniczenieMała próba, wąski kontekst, status preprintuDane deklaratywne, brak pomiaru behawioralnego

Zbieżność dwóch metod, zupełnie różnych populacji i niezależnych zespołów wskazuje, że obserwowany efekt nie jest artefaktem jednego projektu. Brakuje natomiast danych podłużnych: nie wiemy, jak długo utrzymuje się „dług poznawczy” ani czy podlega odwróceniu po dłuższej przerwie od narzędzia.

Mechanizm: dlaczego brak ćwiczenia osłabia umiejętność

Dlaczego umiejętność, której się nie ćwiczy, słabnie? Odpowiedzi szuka się w neurobiologii uczenia się i w teorii ekspertyzy.

Z perspektywy neurobiologicznej, umiejętności wyższego rzędu (analiza, ocena, synteza) opierają się na obszarach mózgu, których siła zależy od częstotliwości użycia. Mechanizm opisuje neuroplastyczność mózgu (przegląd: Gazerani, Brain Research, lipiec 2025). Jeśli rutynowe zadania, na których osadzona jest praktyka osądu, są przejmowane przez narzędzie, te same sieci są aktywowane rzadziej. Po pewnym czasie wzorce aktywacji zmieniają się trwale, co jest spójne z obserwacjami EEG z MIT.

Z perspektywy teorii ekspertyzy (Anders Ericsson, „Peak”, 2016) umiejętność ekspercka powstaje przez „celowe ćwiczenie” (deliberate practice): wielokrotne wykonywanie zadań na granicy własnych możliwości, z informacją zwrotną. Jeśli LLM wykonuje zadanie zamiast użytkownika, użytkownik nie ćwiczy. Co więcej, nie ma okazji do popełnienia błędu, który byłby okazją do nauki.

Sygnałem, że kompetencja słabnie, nie jest spadek wyników w rutynie (gdzie AI maskuje deficyt), lecz nieumiejętność reakcji w sytuacji nietypowej. Tu zamyka się pętla z badaniem Microsoft: pracownik z wysokim zaufaniem do narzędzia weryfikuje mniej, co prowadzi do braku praktyki osądu, co z kolei prowadzi do dalszego wzrostu zaufania, ponieważ użytkownik nie potrafi już dostrzec, kiedy narzędzie się myli.

Paradoks ekonomiczny: AI wymaga tego, co odbiera

Raport McKinsey Health Institute z 15 stycznia 2026 roku, opracowany we współpracy ze Światowym Forum Ekonomicznym, wprowadza pojęcie „kapitału mózgowego” (brain capital): połączenia zdrowia mózgu i umiejętności poznawczych jako klasy aktywów ekonomicznych.

Kontekst makro jest jednoznaczny. Według raportu Future of Jobs Światowego Forum Ekonomicznego (styczeń 2025), cytowanego przez McKinsey, 59 procent światowej siły roboczej będzie wymagało dodatkowego szkolenia do 2030 roku, by sprostać zmianom technologicznym. Umiejętności poznawcze wyższego rzędu (krytyczne myślenie, twórczość, elastyczność, samoregulacja) są nadreprezentowane wśród kompetencji najsilniej pożądanych przez pracodawców.

Tu pojawia się paradoks. AI zmienia rynek pracy w taki sposób, że pracownik jest oceniany bardziej za zdolności, których maszyna nie ma: twórczość, osąd, integrację. Jednocześnie codzienne korzystanie z AI może obniżać aktywność poznawczą w tych samych obszarach, jak sugerują badania Lee i in. oraz Kosmyna i in.

Mechanizm jest cyrkularny. Pracodawca wymaga kompetencji X. Pracownik korzysta z AI, by sprostać tempu pracy. Korzystanie z AI obniża X. Pracownik staje się mniej konkurencyjny w obszarze X. W odpowiedzi szuka jeszcze szerszego wsparcia AI. McKinsey opisuje to jako wymaganie „skill partnership” między człowiekiem a maszyną; bez celowej interwencji edukacyjnej partnerstwo zamienia się w zależność.

Dla polskiego rynku pracy implikacje są specyficzne. Branże regulowane (bankowość, ubezpieczenia, doradztwo prawne), w których nadzór człowieka nad maszyną jest wymogiem prawnym, są szczególnie wystawione na ryzyko. Pracownik, który formalnie „weryfikuje” odpowiedź AI, ale stracił praktykę głębokiej weryfikacji, generuje ryzyko zarówno dla klienta, jak i dla instytucji. To nie jest wyłącznie kwestia kompetencji, lecz architektury procesu i odpowiedzialności.

Kontrargumenty: kiedy odciążanie poznawcze pomaga

Teza o „atrofii poznawczej” ma trzy istotne ograniczenia, których nie można pominąć.

Po pierwsze, dowody przeciwne. W badaniu Iqbala i in. (Scientific Reports, maj 2025) na próbie 465 studentów-przyszłych nauczycieli z pięciu uczelni w Wuhan stwierdzono, że korzystanie z generatywnej AI poprawia osiągnięcia w nauce; rolę mediatora pełnią zarówno świadome myślenie o własnym procesie uczenia się, jak i poznawcze odciążanie. W pewnych kontekstach edukacyjnych odciążanie nie obniża, lecz podnosi efektywność uczenia się.

Po drugie, jakość danych. Badanie MIT Media Lab to preprint na próbie 54 osób w wąskim kontekście esejowym. Badanie Microsoft i Carnegie Mellon oparte jest na danych deklaratywnych (self-reported), które mogą być obciążone efektami ekspozycji medialnej. Żadne z tych badań nie pozwala wnioskować o efekcie populacyjnym ani długoterminowym.

Po trzecie, kontekst historyczny. Każda technologia poznawcza, od pisma (Platon w „Fajdrosie” obawiał się o pamięć), przez kalkulator, GPS, po wyszukiwarkę, wywoływała podobne lęki. Część z nich okazała się trafna w sensie wąskim: badania pokazują, że nawyk korzystania z GPS rzeczywiście zmniejsza zdolności orientacji przestrzennej (Hejtmánek i in., Scientific Reports, 2018). Społeczeństwa adaptowały się jednak przez nowe formy edukacji, narzędzia metapoznawcze i zmiany w organizacji pracy.

Ważna jest jednak różnica skali. Wcześniejsze technologie odciążały konkretne, wąskie funkcje. LLM odciąża rozumowanie ogólne. Nie znamy precedensu i nie mamy danych podłużnych. Każdy kategoryczny wniosek dziś jest spekulacją, niezależnie od kierunku.

Co właściwie nowego wnosi ta dyskusja

Najistotniejsze nie jest pytanie, czy AI nas „głupieje”. To pytanie źle postawione i, według samej autorki badania MIT, nie znajduje empirycznego potwierdzenia.

Istotne są trzy rzeczy. Pierwsza: po raz pierwszy w historii narzędzia poznawczego mamy aparat pomiarowy (EEG, ankiety na dużych próbach pracowników umysłowych) zdolny obserwować efekty na bieżąco, w trakcie wdrażania technologii, a nie po dwóch pokoleniach. To zmienia status debaty z filozoficznej na empiryczną.

Druga: ekonomiczna instytucjonalizacja problemu. Kiedy McKinsey i Światowe Forum Ekonomiczne wprowadzają w styczniu 2026 roku pojęcie „kapitału mózgowego” jako kategorii inwestycyjnej z towarzyszącym wskaźnikiem (Brain Capital Dashboard prowadzony przez Euro-Mediterranean Economists Association), poznawczy stan pracownika przestaje być prywatną sprawą i staje się przedmiotem polityki publicznej oraz strategii korporacyjnej.

Trzecia: pojęcie „długu poznawczego” wprowadzone przez Kosmynę. Niezależnie od tego, czy hipoteza utrzyma się w replikacjach, sama metafora jest produktywna. Sugeruje, że koszt korzystania z AI nie jest płacony w momencie użycia, lecz odroczony i naliczany przy próbie funkcjonowania bez narzędzia. To inna logika ekonomiczna niż w przypadku starszych technologii poznawczych.

Te trzy elementy razem (mierzalność, instytucjonalizacja, metafora odroczenia) sprawiają, że dyskusja o wpływie AI na myślenie nie jest powtórzeniem lęków o GPS czy Wikipedię. Jest jakościowo inna, choć dane wciąż są wstępne.

Podsumowanie

Dwa niezależne badania z 2025 roku, neuroobrazowe z MIT Media Lab i ankietowe z Microsoft Research oraz Carnegie Mellon University, wskazują na związek między korzystaniem z dużych modeli językowych a zmianami w aktywności poznawczej użytkownika. Efekty są mierzalne tam, gdzie wcześniej nie były mierzone (aktywność mózgu podczas zadania), i zarazem szersze, niż sugerowała wcześniejsza literatura o odciążaniu poznawczym.

Żadne z tych badań nie udowadnia, że AI obniża inteligencję ani że długoterminowe efekty są negatywne. Próby są małe, dane częściowo deklaratywne, kontekst wąski. Istnieje także ważny dowód przeciwny (Iqbal i in., 2025), że w pewnych zastosowaniach edukacyjnych odciążanie poznawcze poprawia wyniki uczenia się.

Co jest nowe i godne uwagi, to równoległa instytucjonalna odpowiedź. Raport McKinsey Health Institute i Światowego Forum Ekonomicznego ze stycznia 2026 roku osadza dyskusję o stanie poznawczym pracownika w ramach kategorii ekonomicznej („kapitał mózgowy”), a Brain Capital Dashboard tworzy aparat pomiarowy dla porównań między krajami. Zjawisko, które dziesięć lat temu byłoby tematem laboratoryjnym, dzisiaj jest przedmiotem polityki gospodarczej.

Paradoks pozostaje otwarty. Generatywna AI tworzy gospodarkę, w której najwyżej wycenione są zdolności poznawcze, których codzienne korzystanie z AI może osłabiać. To nie kwestia osobistego nawyku, lecz strukturalne napięcie nowej fazy automatyzacji, którego konsekwencji jeszcze nie znamy.

Źródła

  • Coe, E., Brassey, J., Enomoto, K., Pérez, L. (2026). The human advantage: Stronger brains in the age of AI. McKinsey Health Institute, 15 stycznia 2026. link
  • Kosmyna, N., Hauptmann, E., Yuan, Y. T., Situ, J., Liao, X.-H., Beresnitzky, A. V., Braunstein, I., Maes, P. (2025). Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task. arXiv:2506.08872, czerwiec 2025. link
  • Lee, H.-P., Sarkar, A., Tankelevitch, L., Drosos, I., Rintel, S., Banks, R., Wilson, N. (2025). The Impact of Generative AI on Critical Thinking: Self-Reported Reductions in Cognitive Effort and Confidence Effects From a Survey of Knowledge Workers. CHI ’25, kwiecień 2025, Yokohama. DOI: 10.1145/3706598.3713778. link
  • World Economic Forum (2025). The Future of Jobs Report 2025. Genewa, 7 stycznia 2025.
  • Iqbal, J., Hashmi, Z. F., Asghar, M. Z., Abid, M. N. (2025). Generative AI tool use enhances academic achievement in sustainable education through shared metacognition and cognitive offloading among preservice teachers. Scientific Reports, DOI: 10.1038/s41598-025-01676-x, 13 maja 2025.
  • Risko, E. F., Gilbert, S. J. (2016). Cognitive Offloading. Trends in Cognitive Sciences, 20(9), 676-688. DOI: 10.1016/j.tics.2016.07.002.
  • Bainbridge, L. (1983). Ironies of automation. Automatica, 19(6), 775-779.
  • Hejtmánek, L., Oravcová, I., Motýl, J., Horáček, J., Fajnerová, I. (2018). Spatial knowledge impairment after GPS guided navigation: Eye-tracking study in a virtual town. Scientific Reports, 8.
  • Gazerani, P. (2025). The neuroplastic brain: Current breakthroughs and emerging frontiers. Brain Research, lipiec 2025.