Harvard-Forschung zeigt unerwartete Folgen der KI-Nutzung im Büroalltag + Die Hoffnung vieler Beschäftigter, durch künstliche Intelligenz ihre Arbeitslast zu verringern, erfüllt sich nicht. Eine aktuelle Untersuchung der Harvard Business Review zeigt: Die Technologie führt zu einer Verdichtung der Arbeit. Betroffene arbeiten schneller, übernehmen mehr Aufgaben und verlängern ihre tägliche Arbeitszeit – häufig aus eigenem Antrieb.
Die Realität hinter dem Produktivitätsversprechen
In der amerikanischen Arbeitswelt dominiert seit Jahren eine bestimmte Darstellung: KI werde Beschäftigte nicht ersetzen, sondern ihre Fähigkeiten erweitern. Die Branche kommuniziert, dass Fachkräfte durch intelligente Werkzeuge unverzichtbarer würden – ob in der Rechtsberatung, im Consulting, beim Programmieren oder in der Finanzanalyse. Die Tools arbeiteten für die Menschen, diese arbeiteten weniger hart, alle gewännen.
Eine neue wissenschaftliche Untersuchung verfolgt diese Annahme bis zu ihrem tatsächlichen Ergebnis. Das Fazit der Forscher:
Statt einer Produktivitätswende drohen Organisationen zu Strukturen zu werden, die systematisch zu Erschöpfung führen.
Das Versprechen lautet, dass KI die Arbeitsbelastung reduzieren könne, sodass sich Mitarbeitende mehr auf hochwertige und interessantere Aufgaben konzentrieren könnten. Laut der neuen Studie reduzieren KI-Tools jedoch nicht die Arbeit, sondern intensivieren sie durchweg. Diese Veränderungen können nicht tragbar sein und zu einer schleichenden Zunahme der Arbeitsbelastung, kognitiver Ermüdung, Burnout und einer Schwächung der Entscheidungsfähigkeit führen.
Entwickler arbeiten mit KI 19 Prozent langsamer
Eine weitere aktuelle Untersuchung stützt diese Erkenntnisse: Die Forschungsorganisation METR führte eine randomisierte kontrollierte Studie mit 16 erfahrenen Open-Source-Entwicklern durch. Die Teilnehmenden arbeiteten an ihren eigenen Projekten – großen Repositorys mit durchschnittlich über 22.000 Sternen und mehr als einer Million Codezeilen, zu denen sie seit mehreren Jahren beitrugen.
Das überraschende Ergebnis:
Entwickler, die KI-Tools wie Cursor Pro mit Claude 3.5/3.7 Sonnet nutzten, benötigten 19 Prozent länger für ihre Aufgaben als ohne KI-Unterstützung.
Insgesamt wurden 246 reale Probleme bearbeitet – Fehlerbehebungen, neue Funktionen und Code-Refactorings, die jeweils durchschnittlich zwei Stunden in Anspruch nahmen.
Besonders aufschlussreich: Die Kluft zwischen Wahrnehmung und Realität. Die Entwickler erwarteten, dass KI ihre Arbeit um 24 Prozent beschleunigen würde. Selbst nachdem sie die tatsächliche Verlangsamung erlebt hatten, glaubten sie weiterhin, dass KI ihre Arbeit um 20 Prozent beschleunigt hatte. Diese Diskrepanz zwischen gefühlter und gemessener Produktivität ist bedeutsam.
Die Forschenden schlossen experimentelle Fehlerquellen systematisch aus. Die Entwickler verwendeten modernste Modelle, hielten sich an ihre Aufgabenzuweisungen und reichten Pull Requests von vergleichbarer Qualität ein – unabhängig davon, ob sie KI nutzten oder nicht. Die Probleme wurden nicht unterschiedlich behandelt oder abgebrochen. Die Verlangsamung blieb über verschiedene Messmethoden, Schätzmethoden und zahlreiche Analysen hinweg konstant.
Die Forschenden untersuchten 20 potenzielle Faktoren und fanden Hinweise auf fünf, die zur Verlangsamung beitrugen: Die Systeme funktionierten bei Aufgaben mit sehr hohen Qualitätsstandards oder vielen impliziten Anforderungen – etwa bezüglich Dokumentation, Testabdeckung oder Code-Formatierung – weniger gut. Diese Anforderungen zu erlernen, nimmt für Menschen normalerweise viel Zeit in Anspruch. Auch die Einarbeitungszeit in die Tools spielte eine Rolle – die Entwickler nutzten Cursor typischerweise nur einige Dutzend Stunden vor und während der Studie, was auf mögliche Lerneffekte hindeutet, die erst nach mehreren hundert Nutzungsstunden eintreten könnten.
Die METR-Studie wirft wichtige Fragen zur Vereinbarkeit unterschiedlicher Bewertungsmethoden auf. Während KI-Benchmarks beeindruckende Ergebnisse zeigen und vereinzelte Berichte über Nützlichkeit existieren, widersprechen die kontrollierten Messungen der tatsächlichen Produktivität diesem Bild. Die Forscher betonen, dass Benchmarks häufig Realismus zugunsten von Skalierbarkeit opfern und die Fähigkeiten überschätzen können, während Selbstauskünfte von Nutzenden oft ungenau und zu optimistisch sind.
Achtmonatige Feldstudie dokumentiert Arbeitsverhalten
Zwischen April und Dezember führten Wissenschaftler eine Beobachtungsstudie in einem US-Technologieunternehmen mit rund 200 Beschäftigten durch. An zwei Wochentagen erfolgten direkte Beobachtungen vor Ort, ergänzt durch die Auswertung interner Kommunikationskanäle und über 40 ausführliche Interviews mit Mitarbeitenden aus Technik, Produktentwicklung, Design, Forschung und Betrieb.
Die zentrale Erkenntnis: Intelligente Systeme verringern das Arbeitsvolumen nicht, sondern steigern dessen Intensität kontinuierlich. Die Belegschaft arbeitete zügiger, erweiterte ihr Aufgabenspektrum und dehnte die Arbeitszeit aus – ohne Anweisung durch Vorgesetzte. Das Unternehmen hatte die Nutzung nicht vorgeschrieben, sondern lediglich Zugang zu kommerziellen Tools bereitgestellt. Die Mitarbeitenden leisteten aus eigener Initiative mehr, weil KI ihnen das Gefühl gab, dass mehr zu leisten möglich, zugänglich und in vielen Fällen intrinsisch lohnend war.
Drei Mechanismen der Arbeitsverdichtung identifiziert
Die Forschenden unterscheiden drei wesentliche Formen, wie sich die Arbeit verändert hat:
Ausweitung des Aufgabenbereichs: Mitarbeitende übernehmen zunehmend Tätigkeiten, die zuvor anderen Personen oder Abteilungen zugeordnet waren. Produktverantwortliche und Designer begannen zu programmieren, Forschende erledigten technische Arbeiten. Was früher ausgelagert, verschoben oder gemieden wurde, erschien plötzlich machbar.
Die Technologie schloss Wissenslücken und vermittelte eine Art kognitiven Zugewinn. Abhängigkeiten von Kollegen verringerten sich, sofortiges Feedback und Korrekturen während der Arbeit wurden möglich. Die Mitarbeitenden beschrieben dies als „einfach ausprobieren“ mit der KI, aber diese Experimente führten zu einer bedeutenden Erweiterung des Aufgabenbereichs. Tatsächlich übernahmen sie zunehmend Aufgaben, für die zuvor zusätzliche Hilfe oder Personal erforderlich gewesen wäre.
Die Erweiterung hatte weitere Auswirkungen: Ingenieure verbrachten beispielsweise mehr Zeit damit, von Kollegen erstellte KI-generierte oder KI-unterstützte Arbeitsergebnisse zu überprüfen, zu korrigieren und anzuleiten. Diese Anforderungen gingen über formelle Codeüberprüfungen hinaus. Ingenieure fanden sich zunehmend in der Rolle von Coaches für Kollegen wieder, die teilweise abgeschlossene Arbeiten fertigstellten. Diese Überwachung erfolgte oft informell – in Nachrichtendiensten oder kurzen Besprechungen – und erhöhte die Arbeitsbelastung.
Aufweichung von Arbeitsgrenzen: Da KI den Beginn einer Aufgabe so einfach machte – sie reduzierte die Hemmschwelle vor einem leeren Blatt oder einem unbekannten Ausgangspunkt –, schoben Beschäftigte kleine Arbeitsschritte in Momente, die zuvor Pausen gewesen waren. Viele nutzten KI während der Mittagspause, in Besprechungen oder während sie auf das Laden einer Datei warteten. Einige beschrieben, dass sie kurz vor dem Verlassen des Arbeitsplatzes eine „schnelle letzte Eingabe“ machten, damit die KI arbeiten konnte, während sie weg waren.
Diese Handlungen fühlten sich selten wie zusätzliche Arbeit an, doch mit der Zeit führten sie zu einem Arbeitstag mit weniger natürlichen Pausen und einer kontinuierlicheren Beschäftigung mit der Arbeit. Der dialogorientierte Stil der Eingabe milderte das Erlebnis zusätzlich: Das Eingeben einer Zeile in ein KI-System fühlte sich eher wie ein Chat als wie die Erledigung einer formellen Aufgabe an, sodass die Arbeit leicht und ohne bewusste Absicht in den Abend oder frühen Morgen hineinreichte.
Einige Mitarbeitende beschrieben, dass sie oft im Nachhinein feststellten, dass die Pausen nicht mehr das gleiche Gefühl der Erholung vermittelten, da das Eingeben von Befehlen während der Pausen zur Gewohnheit geworden war. Infolgedessen fühlte sich die Arbeit weniger begrenzt und eher als Teil der Umgebung an – etwas, das immer ein wenig weiter vorangetrieben werden konnte. Die Grenze zwischen Arbeit und Freizeit verschwand nicht, aber sie wurde leichter zu überschreiten.
Zunahme paralleler Aufgaben: Die KI führte einen neuen Rhythmus ein, in dem Mitarbeitende mehrere aktive Threads gleichzeitig verwalteten: Sie schrieben manuell Code, während die KI eine alternative Version generierte, sie führten mehrere Agenten parallel aus oder nahmen lange aufgeschobene Aufgaben wieder auf, weil die KI diese im Hintergrund „bearbeiten“ konnte. Sie taten dies zum Teil, weil sie das Gefühl hatten, einen „Partner“ zu haben, der ihnen bei der Bewältigung ihrer Arbeitslast helfen konnte.
Während dieses Gefühl, einen „Partner“ zu haben, für Schwung sorgte, bedeutete die Realität ein ständiges Umschalten der Aufmerksamkeit, häufiges Überprüfen der KI-Ergebnisse und eine wachsende Anzahl offener Aufgaben. Dies führte zu einer kognitiven Belastung und dem Gefühl, ständig jonglieren zu müssen, auch wenn sich die Arbeit produktiv anfühlte.
Mit der Zeit steigerte dieser Rhythmus die Erwartungen an die Geschwindigkeit – nicht unbedingt durch explizite Forderungen, sondern durch das, was in der täglichen Arbeit sichtbar und normal wurde. Viele Mitarbeitende stellten fest, dass sie mehr auf einmal erledigten – und mehr Druck verspürten – als vor dem Einsatz der KI, obwohl die Zeitersparnis durch die Automatisierung eigentlich dazu gedacht war, diesen Druck zu verringern.
Selbstverstärkender Kreislauf erhöht Erwartungen
All dies führte zu einem sich selbst verstärkenden Kreislauf. KI beschleunigte bestimmte Aufgaben, was die Erwartungen an die Geschwindigkeit erhöhte. Die höhere Geschwindigkeit machte die Mitarbeitenden abhängiger von KI. Die zunehmende Abhängigkeit erweiterte den Umfang dessen, was sie versuchten, und ein größerer Umfang führte zu einer weiteren Zunahme der Arbeitsmenge und -dichte.
Mehrere Teilnehmende merkten an, dass sie sich zwar produktiver fühlten, aber nicht weniger beschäftigt, und in einigen Fällen sogar beschäftigter als zuvor. Ein Ingenieur fasste es zusammen: „Man dachte vielleicht, dass man mit KI produktiver sein könnte, dadurch Zeit sparen und weniger arbeiten müsste. Aber in Wirklichkeit arbeitet man nicht weniger. Man arbeitet genauso viel oder sogar mehr.“
Risiken für Organisationen und Mitarbeitende
Unternehmen könnten diese freiwillige Ausweitung der Arbeit als klaren Gewinn betrachten. Wenn die Mitarbeitenden dies aus eigener Initiative tun, warum sollte das problematisch sein? Ist das nicht die Produktivitätsexplosion, die versprochen wurde?
Die Untersuchungen zeigen jedoch die Risiken einer informellen Ausweitung und Beschleunigung der Arbeit: Was kurzfristig wie eine höhere Produktivität aussieht, kann eine schleichende Zunahme der Arbeitsbelastung und eine wachsende kognitive Belastung verschleiern, da die Mitarbeitenden mehrere KI-gestützte Arbeitsabläufe unter einen Hut bringen müssen.
Da die zusätzliche Anstrengung freiwillig ist und oft als angenehmes Experiment dargestellt wird, übersehen Führungskräfte leicht, wie viel zusätzliche Belastung die Mitarbeitenden tragen. Mit der Zeit kann Überlastung das Urteilsvermögen beeinträchtigen, die Fehlerwahrscheinlichkeit erhöhen und es für Unternehmen schwieriger machen, echte Produktivitätssteigerungen von nicht nachhaltiger Intensität zu unterscheiden.
Für die Mitarbeitenden führt dies zu Ermüdung, Burnout und dem wachsenden Gefühl, dass es schwieriger wird, sich von der Arbeit zu lösen, insbesondere da die Erwartungen der Unternehmen an Geschwindigkeit und Reaktionsfähigkeit steigen.
Konzept der „KI-Praxis“ als Gegenstrategie
Anstatt passiv darauf zu reagieren, wie KI-Tools den Arbeitsplatz verändern, sollten sowohl Einzelpersonen als auch Unternehmen eine „KI-Praxis“ einführen: eine Reihe von bewussten Normen und Routinen, die festlegen, wie KI eingesetzt wird, wann es angebracht ist, damit aufzuhören, und wie die Arbeit als Reaktion auf neu gewonnene Fähigkeiten erweitert werden sollte und wie nicht.
Ohne solche Praktiken ist die natürliche Tendenz von KI-gestützter Arbeit nicht eine Verringerung, sondern eine Intensivierung, mit Auswirkungen auf Burnout, Entscheidungsqualität und langfristige Nachhaltigkeit.
Bei der Entwicklung ihrer KI-Praxis sollten Unternehmen drei Elemente in Betracht ziehen:
Bewusste Pausen: Da Aufgaben immer schneller erledigt werden müssen und Grenzen verschwimmen, könnten Arbeitnehmende von kurzen, strukturierten Momenten profitieren, die das Tempo regulieren: geschützte Intervalle, um die Ausrichtung zu überprüfen, Annahmen zu überdenken oder Informationen aufzunehmen, bevor es weitergeht.
Diese Pausen würden die Arbeit insgesamt nicht verlangsamen, sondern lediglich die stille Anhäufung von Überlastung verhindern, die entsteht, wenn die Beschleunigung ungebremst fortschreitet. Eine Entscheidungspause könnte beispielsweise erfordern, dass vor einer wichtigen Entscheidung ein Gegenargument und ein expliziter Bezug zu den Unternehmenszielen vorgebracht werden müssen – wodurch das Aufmerksamkeitsfeld gerade so weit erweitert wird, dass es vor Abdrift schützt. Die Einbindung solcher Pausen in den täglichen Arbeitsablauf ist eine Möglichkeit für Unternehmen, bessere Entscheidungen, gesündere Grenzen und nachhaltigere Formen der Produktivität in KI-gestützten Umgebungen zu fördern.
Sequenzierung: Da KI eine konstante Aktivität im Hintergrund ermöglicht, können Organisationen von Normen profitieren, die bewusst festlegen, wann die Arbeit voranschreitet, und nicht nur, wie schnell. Dazu gehören die Bündelung nicht dringender Benachrichtigungen, das Zurückhalten von Updates bis zu natürlichen Unterbrechungspunkten und der Schutz von Fokusfenstern, in denen die Mitarbeitenden vor Unterbrechungen geschützt sind.
Anstatt auf jede KI-generierte Ausgabe zu reagieren, sobald sie erscheint, fördert die Sequenzierung die Arbeit in kohärenten Phasen. Wenn die Koordination auf diese Weise gesteuert wird, erleben die Mitarbeitenden weniger Fragmentierung und weniger kostspielige Kontextwechsel, während die Teams den Gesamtdurchsatz aufrechterhalten. Durch die Regulierung der Reihenfolge und des Zeitpunkts der Arbeit – anstatt eine kontinuierliche Reaktionsfähigkeit zu verlangen – kann die Sequenzierung Unternehmen dabei helfen, die Aufmerksamkeit aufrechtzuerhalten, kognitive Überlastung zu reduzieren und eine durchdachtere Entscheidungsfindung in KI-orientierten Arbeitsumgebungen zu unterstützen.
Menschliche Verankerung: Da KI mehr eigenständige, in sich geschlossene Arbeit ermöglicht, können Unternehmen davon profitieren, Zeit und Raum für Zuhören und zwischenmenschliche Beziehungen zu schützen. Kurze Gelegenheiten, mit anderen in Kontakt zu treten – sei es durch kurze Check-ins, gemeinsame Reflexionsmomente oder strukturierte Dialoge – unterbrechen die kontinuierliche Einzelarbeit mit KI-Tools und helfen dabei, die Perspektive wiederherzustellen.
Über die Perspektive hinaus fördert der soziale Austausch die Kreativität. KI bietet eine einzige, synthetisierte Perspektive, aber kreative Einsichten hängen davon ab, dass man mit verschiedenen menschlichen Standpunkten in Berührung kommt. Durch die Institutionalisierung von Zeit und Raum für Zuhören und Dialog verankern Unternehmen die Arbeit wieder im sozialen Kontext und tragen dazu bei, den erschöpfenden, individualisierenden Effekten schneller, KI-vermittelter Arbeit entgegenzuwirken.
Aktive Gestaltung statt passive Anpassung
Das Versprechen der generativen KI liegt nicht nur darin, was sie für die Arbeit leisten kann, sondern auch darin, wie durchdacht sie in den täglichen Rhythmus integriert wird. Die Ergebnisse deuten darauf hin, dass KI ohne Absicht zwar mehr Arbeit erleichtert, es aber auch schwieriger macht, damit aufzuhören.
Eine KI-Praxis bietet ein Gegengewicht: eine Möglichkeit, Momente der Erholung und Reflexion zu bewahren, auch wenn die Arbeit immer schneller wird. Die Frage, vor der Organisationen stehen, ist nicht, ob KI die Arbeit verändern wird, sondern ob sie diese Veränderung aktiv gestalten werden – oder sich stillschweigend von ihr formen lassen.
Die umfassende Untersuchung von METR finden Sie hier.
