Es gibt zwei Lager im Gespräch über KI, und beide haben unrecht. Das eine ruft: «KI ersetzt alles, eure Berufe gibt es 2030 nicht mehr.» Das andere zuckt mit den Schultern: «Reine Statistik, lernt nichts dazu, alles Hype.» Die Forschung der letzten drei Jahre – peer-reviewed, mit grossen Datenmengen, oft an Universitäten wie MIT, Harvard und Stanford – sagt etwas Drittes: KI hat in genau definierten Tätigkeiten enorm aufgeholt, scheitert aber konsistent dort, wo Mehrdeutigkeit, Verantwortung und stillschweigendes Wissen ins Spiel kommen. Genau dort wird der Mensch wichtiger, nicht weniger wichtig.
Was KI 2026 wirklich kann – die ehrlichen Belege
Code schreiben und debuggen
Die wahrscheinlich grösste, am besten dokumentierte Produktivitätsgeschichte. Eine Feldstudie von Microsoft Research und MIT 2024 mit 1'974 Software-Entwicklerinnen und -Entwicklern bei Microsoft und Accenture zeigte, dass Teams mit GitHub-Copilot-Zugang zwischen 12,9 % und 21,8 % mehr Pull-Requests pro Woche fertigstellten. In einem separaten kontrollierten Experiment lösten Entwickler:innen mit Copilot eine HTTP-Server-Aufgabe 55,8 % schneller als die Kontrollgruppe.
Praktisch: Tools wie GitHub Copilot, Cursor, Claude Code und Windsurf gehören 2026 in vielen Schweizer Software-Teams zur Grundausstattung. Wer sie nicht nutzt, arbeitet messbar langsamer.
Texte verfassen und Dokumente bearbeiten
Eine in Science publizierte Studie von Noy & Zhang (MIT, 2023) gab 453 College-Absolvent:innen typische Büroschreibaufgaben – Pressemitteilungen, Berichte, E-Mails. Die ChatGPT-Gruppe brauchte 40 % weniger Zeit und produzierte 18 % höhere Qualität als die Kontrollgruppe. Interessant: Schwächere Schreiber:innen profitierten überproportional. Die Spitzenkräfte zogen weniger.
Kundenservice
Brynjolfsson, Li und Raymond werteten 2023 für das National Bureau of Economic Research die Daten von 5'179 Kundenservice-Mitarbeitenden aus, denen schrittweise ein generativer Assistent zur Seite gestellt wurde. Resultat: +14 % gelöste Anfragen pro Stunde im Durchschnitt, +34 % bei Berufseinsteiger:innen. Gleichzeitig stieg die Kundenzufriedenheit und sank die Fluktuation. Die Studie deutet darauf hin, dass KI das Wissen der besten Mitarbeitenden für alle verfügbar macht.
Wissenschaft und Forschung
2024 erhielten Demis Hassabis und John Jumper (DeepMind) gemeinsam mit David Baker den Chemie-Nobelpreis – für AlphaFold, ein KI-System, das die dreidimensionale Struktur von Proteinen vorhersagt. AlphaFold 2 deckte rund 200 Millionen bekannte Proteinstrukturen ab und wurde bis Oktober 2024 von über zwei Millionen Forscher:innen aus 190 Ländern genutzt. Was die Strukturbiologie seit 50 Jahren in Einzelarbeit aufbaute, leistete ein Modell in wenigen Jahren.
Bildgebende Diagnostik
Mehrere Meta-Analysen 2024–2025 zeigen für KI in der Radiologie eine ähnliche oder leicht höhere diagnostische Genauigkeit als für Fachärzt:innen – gepoolte Sensitivität 0,87 für KI vs. 0,85 für Radiolog:innen bei MRT-basierter Prostatakrebsdiagnose. Für Lungenkrebs-Screening berichten Studien KI-Genauigkeiten über 95 %.
So eindeutig diese Zahlen wirken: Es gibt eine zweite Wahrheit dazu – und sie ist der Übergang zur Schattenseite.
Wo es kippt: die unsichtbare Grenze
Der «Jagged Frontier» – warum gleiche Aufgaben unterschiedlich gut laufen
Das wichtigste Konzept der KI-Arbeitsforschung kommt von Dell'Acqua, Mollick und Kollegen (Harvard, 2023): die jagged technological frontier. Übersetzt: «zackige Technologie-Grenze». KI ist nicht gleichmässig kompetent. Sie kann eine schwere Aufgabe brillant lösen und an einer scheinbar leichteren völlig scheitern – und für die Anwenderin sieht beides gleich aus.
Im Originalpapier formulieren sie es so:
«AI assistance improves performance for some tasks but worsens it for others, even within the same knowledge workflow and with a seemingly similar level of difficulty.»
Konkret: Die BCG-Berater:innen, die GPT-4 für Aufgaben innerhalb der KI-Zone nutzten, lieferten 40 % bessere Ergebnisse. Diejenigen, die GPT-4 für Aufgaben ausserhalb der Zone nutzten, lieferten messbar schlechtere Resultate – sie übernahmen die zuversichtlich klingenden Fehler des Modells.
Halluzinationen sind nicht weg, nur besser versteckt
Eine Stanford-Studie zu juristischen Anfragen fand Halluzinationsraten zwischen 58 % und 88 % quer durch die grossen LLMs – darunter über 120 erfundene Gerichtsfälle mit realistischen Namen und plausibel klingender, aber komplett fiktiver Urteilsbegründung. Bei medizinischen Fallzusammenfassungen ohne gezielte Anti-Halluzinations-Prompts wurden 64,1 % falsche Inhalte gemessen.
Eine MIT-Studie Anfang 2025 fand zudem, dass Modelle beim Halluzinieren selbstsicherer formulieren als bei korrekten Antworten – exakt das Gegenteil von dem, was Nutzer:innen als Warnsignal lesen würden.
Die externe Validierungslücke in der Medizin
Eine Nature Medicine-Studie 2024 fand: Röntgen-Modelle, die an einer einzelnen Klinik trainiert wurden, verloren bis zu 20 % diagnostische Genauigkeit, sobald sie an anderen Datensätzen geprüft wurden. KI lernt nicht «Tumor erkennen», sondern «Tumor erkennen, wie er an der Klinik X aussieht». Sobald die Patientenpopulation, die Geräteeinstellung oder die radiologische Praxis kippt, kippt die Genauigkeit mit.
Wo der Mensch unverzichtbar bleibt – und vermutlich auch bleibt
Polanyis Paradox: wir wissen mehr, als wir sagen können
1966 schrieb der Wissenschaftsphilosoph Michael Polanyi den Satz, der die Automatisierungs-Debatte bis heute prägt:
«We can know more than we can tell.»
Der MIT-Ökonom David Autor griff das 2014 auf: Tätigkeiten, die auf stillschweigendem Wissen beruhen – ein Patient einschätzen, eine Verhandlung lesen, eine Wäsche falten, einen Hund beruhigen – widerstehen der Automatisierung, weil wir sie selbst nicht in vollständige Regeln übersetzen können. Autor schreibt:
«The tasks that have proved most vexing to automate are those demanding flexibility, judgment, and common sense – skills that we understand only tacitly.»
Generative KI hat dieses Paradox aufgeweicht, weil moderne Modelle aus Beispielen lernen statt aus Regeln. Aufgelöst hat sie es nicht. Bis heute scheitert KI an Tätigkeiten, in denen sehr viele Kontextsignale gleichzeitig zu lesen sind und in denen «richtig» nicht vorab definiert ist.
Verantwortung und Rechenschaft
Eine KI kann ein Gutachten verfassen. Sie kann es nicht verantworten. Sie kann nicht vor einem Gericht stehen, nicht mit Aktionären sprechen, nicht einem Patienten in die Augen sehen, dem sie eine Fehldiagnose erklären muss. Verantwortung setzt eine Instanz voraus, die etwas zu verlieren hat – eine ökonomische, soziale, juristische, biografische Konsequenz. KI hat das nicht.
Die OECD formuliert in ihrem Employment Outlook 2023: KI solle «scale and pattern» übernehmen, der Mensch dagegen «empathy, ethics and strategic judgment».
Ziele setzen und Bedeutung definieren
KI optimiert. Sie sagt nicht, wofür. Die strategischen Fragen – was bauen wir? Für wen? Warum? Was ist genug? – sind nicht beantwortbar mit Mustererkennung, weil es keine Vergangenheits-Daten zur Antwort gibt. Dasselbe gilt für die Frage, was «gut» bedeutet. Eine Geschäftsstrategie, ein Unternehmenswert, ein politischer Kompass, ein Ehrenkodex – das sind alles Festlegungen, keine Optimierungen.
Beziehung, Vertrauen, Verhandlung
In der Schweiz und besonders im KMU-Umfeld läuft Geschäft über Beziehungen. Ein:e Treuhänder:in, der seit zwölf Jahren die Familie kennt. Eine Schreinerin, die versteht, was der Kunde wirklich will, auch wenn er es nicht ausspricht. Ein Arzt, dem man vertraut. KI kann Termine vorbereiten, Korrespondenz entwerfen und Daten aufbereiten – sie kann das Vertrauen nicht ersetzen, das aus geteilter Geschichte entsteht.
Körper, Hand und Material
Drei Berufsfelder sind 2026 fast ungestört: Pflege, Handwerk und alles, was mit körperlicher Anwesenheit zu tun hat. Ein Sanitärinstallateur, eine Pflegefachfrau, ein Maurer – das sind Tätigkeiten, in denen Material, Körperwahrnehmung und situative Anpassung zusammenkommen. Genau das ist der Bereich, in dem laut Acemoglu und Restrepo (MIT, 2024) die «Reinstatement-Effekte» wirken: Automatisierung schafft neue Aufgaben, in denen Menschen ihren komparativen Vorteil behalten.
Erkennen, wann die KI falsch liegt
Vielleicht die zentrale Fähigkeit der KI-Ära: einer guten KI-Antwort nicht zu trauen. Wer kein Fachwissen mitbringt, kann eine Halluzination nicht von einer korrekten Aussage trennen. Daher gewinnen Expert:innen mit tiefem Domänenwissen an Wert – nicht weil sie schneller produzieren, sondern weil sie als Qualitätsfilter für KI-Output unverzichtbar werden.
Was das für ein Schweizer KMU heisst
Die Forschung lässt sich in drei pragmatische Sätze übersetzen:
1. Delegiere an KI, was klar definierbar ist. Erstellung von Standard-E-Mails, Zusammenfassen langer Dokumente, Übersetzungen, erste Klassifizierung von Eingängen, Routine-Recherche, Code-Boilerplate. In diesen Aufgaben ist die Frage «richtig oder falsch» überprüfbar – damit kann KI Verantwortung tragen, weil sie nachprüfbar bleibt.
2. Behalte beim Menschen, was Mehrdeutigkeit, Verantwortung oder Beziehung erfordert. Kundengespräche mit echtem Konflikt, Personalentscheide, strategische Weichenstellungen, alle Aussagen mit rechtlicher Tragweite, Krisenkommunikation. Nicht weil KI «nicht reicht», sondern weil hier das Problem selbst eine menschliche Instanz verlangt.
3. Baue eine doppelte Kompetenz auf. Dein Team braucht ab 2026 zwei Fähigkeiten parallel: tiefes Fachwissen in seinem Kerngeschäft und die Fähigkeit, KI-Tools sinnvoll einzusetzen. Die OECD nennt das «complementary skills» – und stellt fest, dass die meisten Weiterbildungsprogramme nur eine Seite trainieren. Wer beides aufbaut, gewinnt.
Fazit: die wichtigste Frage ist nicht «KI oder Mensch»
Sie lautet: Welche Tätigkeit gehört zu welcher Instanz, und warum? Die Forschung der letzten drei Jahre zeigt erstaunlich konsistent: KI ist in zwei Bereichen unschlagbar geworden – in Tätigkeiten mit klaren Regeln (Code, Übersetzung, Klassifizierung) und in Mustererkennung über grosse Datenmengen (Proteinstrukturen, Bildauswertung, Textgeneration). Der Mensch bleibt unschlagbar – und wird wertvoller – in Tätigkeiten mit Mehrdeutigkeit, Verantwortung, Beziehung und Sinngebung.
Das ist keine Pattsituation, sondern eine Arbeitsteilung. Wer sie sauber gestaltet, wird produktiver und seine Arbeit interessanter machen. Wer sie ignoriert, wird beides verlieren: an Konkurrenten, die KI besser delegieren, und an Mitarbeitende, die nicht mit stupiden Aufgaben verschlissen werden wollen, die längst automatisierbar wären.
Die Frage 2026 ist nicht, ob KI dich ersetzt. Sie lautet: Ersetzt dich jemand, der KI besser einsetzt als du? Die Antwort liegt darin, ob du verstehst, wo dein eigener komparativer Vorteil als Mensch tatsächlich liegt – und wo nicht.
Häufige Fragen
Selten ganze Berufe, häufiger einzelne Aufgaben innerhalb von Berufen. Der WEF Future of Jobs Report 2025 prognostiziert bis 2030 weltweit 78 Millionen neu entstehende und 92 Millionen wegfallende Stellen – netto entstehen also rund 14 Millionen Jobs zusätzlich. Was sich verändert, sind die Tätigkeiten innerhalb der Berufe: weniger Routine, mehr Urteil, mehr Beziehungsarbeit. Wer das ernst nimmt, kommt durch.
Wo trennt sich bei dir die KI-Arbeit von der Mensch-Arbeit?
In einem 30-minütigen Erstgespräch schauen wir uns konkret an, welche Prozesse in deinem Betrieb sinnvoll an KI delegierbar sind – und welche du besser bei deinem Team behältst, weil dort der eigentliche Wert entsteht.
Ähnliche Beiträge

So wirst du von ChatGPT & Co. gefunden – die ehrliche, vollständige Anleitung
ChatGPT, Perplexity und Google AI Overviews zitieren Quellen – aber nur, wenn dein Content auffindbar, strukturiert und vertrauenswürdig ist. Diese Anleitung führt dich Schritt für Schritt durch alles, was 2026 wirklich zählt – ohne Buzzwords, ohne Snake Oil.

KI im Geschäftsalltag: Ein ehrlicher Startguide für alle, die nicht wissen, wo anfangen
Du weisst, dass KI wichtig ist – aber wo beginnen? Fünf Schritte, die ohne Vorwissen, ohne Budget und ohne IT-Abteilung funktionieren.
