~/kapio.eu

Wenn die KI den Laden mitführt

In den Büros der meisten deutschen Mittelständler laufen heute zwischen dreißig und sechzig Software-Anwendungen parallel: CRM, Buchhaltung, Zeiterfassung, Online-Banking, Personal-Software, Helpdesk, Mail, dazu mehrere Tabellen, in denen zusammengetragen wird, was sonst nirgendwo zusammenkommt. Jede einzelne dieser Anwendungen funktioniert. Was nicht funktioniert, ist die Übersicht, sobald die Antwort auf eine Frage in mehreren von ihnen steckt.

Am sichtbarsten wird das beim Monatsabschluss. Der Controller eines 80-Mitarbeiter-Hauses sitzt am Monatsletzten vor vier Auszügen: das Online-Banking für die Eingänge, die Buchhaltung für die offenen Posten, das ERP für den laufenden Auftragsbestand, die Lohnabrechnung für die Personalkosten. Zusammenführen kann er sie nur in Excel. Eine Stunde, jeden Monat, für eine Zahl, die nirgendwo fertig liegt.

Es ist die Normalität im digitalisierten Mittelstand. Mehrere Anwendungen nebeneinander, Excel als Klammer, manuelle Abstimmung. Zwischen den Programmen gibt es zwar Schnittstellen, über die einzelne Daten von einem ins andere fließen. Was fehlt, ist ein Vermittler, der eine Frage versteht und die Antworten aus mehreren Programmen zusammenholt. Ein erheblicher Teil dessen, was Mitarbeiter den ganzen Tag aus ihrer Software heraus tun, ist diese Übersetzungsarbeit.

In den letzten zwei Jahren ist diese Logik in Bewegung geraten. Zwischen die Programme und die Menschen hat sich eine neue Schicht geschoben, die den fehlenden Vermittler stellt. Eine KI nimmt die Frage entgegen, holt die Antworten aus den jeweiligen Programmen, gleicht sie ab und zieht Rückschlüsse. Das technische Stichwort dafür ist MCP, Model Context Protocol. Eine Stecker-Norm zwischen einer KI und den Programmen, die sie sehen darf. Anthropic hat das Protokoll vor anderthalb Jahren offengelegt, OpenAI, Google und Microsoft sind 2025 nachgezogen, inzwischen existieren über 10.000 öffentliche MCP-Server.

Genau diese Schicht steht heute aber selten als fertiger Baustein bereit. Wer mit Pipedrive, SAP B1, DATEV oder Lexware arbeitet, findet beim Hersteller keinen MCP-Server zum Einklicken und muss selbst eine Brücke bauen. Welche Wege es dafür grundsätzlich gibt, haben wir an anderer Stelle aufgeschrieben. Wir haben uns vor zwölf Monaten für einen davon entschieden und ihn seitdem im eigenen Tagesgeschäft benutzt.

Die Schicht, die mitdenkt

Wo im Mittelstand heute mit KI gearbeitet wird, hilft sie beim Verbessern von Mails, beim Aufsetzen von PowerPoint-Folien, beim Zusammenfassen längerer Texte. Es ist die niedrig hängende Frucht, und ein guter Anfang. In vielen Häusern ist die Erwartung an KI dort hängengeblieben: ein besseres Schreib-Tool, mehr nicht.

Sobald die KI Zugang zu den eigenen Systemen bekommt, verändert sich das Bild. Sie liest dann auch die Daten, in denen die Arbeit eigentlich liegt. Das funktioniert nicht erst bei Konzerngröße. Eine solche Schicht zwischen Werkzeugen und Mitarbeitern aufzubauen, ist ein einmaliger Aufwand von einigen Wochen mit jemandem, der die Werkzeuge und ihre APIs kennt. Was danach kommt, läuft täglich.

Wir haben in den letzten zwölf Monaten genau das gemacht, im eigenen Haus und mit unseren eigenen Konten. Wir bauen solche Schichten sonst für andere; dieses Mal waren wir auch der Kunde. Was dabei entstanden ist, benutzen wir seitdem täglich.

Vom Reibungspunkt zum Server

Pipedrive ist unser CRM. Als Pipedrive Authorized Partner liegt es nahe, dass auch unsere eigenen Anfragen dort eintreffen und sich durch die Verkaufsphasen bewegen. Harvest nutzen wir für Angebotserstellung, Zeiterfassung und Rechnungsstellung. Die drei Vorgänge greifen ineinander: Was heute gebucht wird, wird am Monatsende abgerechnet und kalibriert das nächste Angebot.

n8n ist eine Plattform für Workflow-Automatisierung. Sie verbindet Programme miteinander, sodass sie Daten austauschen und auf Ereignisse reagieren können. Wir bauen darin die Integrationen, die wir für Kunden ausliefern. Dazu Todoist für Tickets und Aufgaben, Slite als interne Dokumentations-Plattform (vergleichbar mit Confluence) und Google Drive. Eine Konsole spricht mit alldem.

Wir haben den Stack in Stufen gebaut. Pipedrive und Harvest standen am Anfang, weil dort die meiste Reibung saß. Slite kam dazu, sobald die Konsole bei Fragen auch das interne Wissen einbeziehen sollte, das wir dort sammeln. Todoist folgte, sobald sie auch unsere Tickets aus Kundenanfragen sehen sollte.

Die Konsole arbeitet wie ein routinierter Mitarbeiter. Sie kennt unsere Werkzeuge und unsere Eigenheiten, weiß, in welcher Frage welches Programm die ehrlichere Antwort hat, und holt die nötigen Daten selbständig zusammen. Mit Quelle pro Posten, damit Korrekturen möglich bleiben.

Solche Auskünfte funktionieren nicht von der ersten Sekunde an. Es ist weniger Anschließen als Einarbeiten. Die KI hat über Wochen gelernt, in welchen Pipedrive-Feldern bei uns die ehrlicheren Daten stehen, welche Slite-Notizen die verlässliche Quelle sind, wann ein Harvest-Eintrag vorläufig und wann verbindlich ist. Vieles davon stand nirgendwo niedergeschrieben. Es kam aus den Korrekturen, die wir geschrieben haben, wenn sie etwas falsch gemacht hat.

Wie sich das Tagesgeschäft verändert

Forecasting war der erste Vorgang, der sich vollständig verlagert hat. Aus Harvest holen wir die offenen Rechnungen und die Aufwände, die in laufenden Projekten gebucht sind. Aus der Buchhaltung kommen die belegten, aber noch nicht ausgeglichenen Posten. Was uns dabei noch fehlt, ist die Bank-Sicht. Die ergänzen wir in den nächsten Wochen mit Qonto. Wir stellen die Frage „wo stehen wir gerade” inzwischen mehrmals die Woche, weil sie keinen halben Vormittag mehr kostet.

Der zweite Vorgang ist das Debugging unserer Kundenworkflows. Wenn in n8n etwas hängt, hieß das früher: einloggen, Execution-Log durchscrollen, Knoten suchen, Fehlermeldung lesen. Inzwischen fragen wir die Konsole, was hängt. Sie nennt die betroffenen Workflows mit Trigger-Zeitpunkt und letzter Fehlermeldung.

Der dritte Vorgang ist die monatliche Rechnungsstellung. Was wir an 1:1-Beratungssessions geleistet haben, steht im Google Kalender. Was an Projektzeiten gebucht ist, steht in Harvest. Früher hieß die Verbindung der beiden: jede Session einzeln durchgehen, gegen Buchungen abgleichen, in eine Tabelle gießen, dann die Rechnung bauen. Inzwischen fragen wir die Konsole. Sie zieht die Sessions des Monats, gleicht sie gegen Harvest ab, fasst pro Kunde zusammen und schlägt Rechnungen vor. Was bleibt, ist Durchsicht und Versand.

Eine kleine Eigenheit, die wir lieben gelernt haben, sitzt unter der Oberfläche: Bevor die Konsole etwas Kritisches tut, einen Workflow löscht zum Beispiel oder eine Rechnungsposition ändert, zeigt sie eine Vorschau und fragt nach. Das klingt selbstverständlich. Im Werkzeugbau für KI ist es bisher selten.

Auf den Anwender zugeschnitten

Ein MCP-Server liefert der KI eine Sammlung von Funktionen, die sie aufrufen kann, etwa „lies Notizen aus Pipedrive” oder „buche eine Stunde in Harvest”. Wer einen Server vom Hersteller installiert, bekommt in der Regel eine 1:1-Übersetzung der API: jede Operation, die die Schnittstelle erlaubt, wird als Tool ausgespielt.

Wir haben unsere Tools nicht so geschnitten. Statt der API folgen sie unseren Vorgängen. Ein einzelnes Tool bündelt, was sonst zwei oder drei API-Calls wären, etwa bei der Stundenbuchung Notiz, Projekt und Zeit in einem Schritt, weil das immer in dieser Reihenfolge zusammenhängt.

Dazu kommt ein Argument, das von außen oft übersehen wird: KI-Modelle können nicht beliebig viele Tools gleichzeitig sauber bedienen. Aktuelle Forschung zeigt, dass die Trefferquote bei der Werkzeug-Auswahl jenseits einer überschaubaren Zahl messbar sinkt. Deshalb haben wir unseren Stack in zwei getrennte Server aufgeteilt: einen für das Tagesgeschäft und einen für Harvest. Die Konsole lädt pro Aufgabe nur den Server, den sie braucht.

Was bleibt

Die Tätigkeit, die ein Studio wie unseres eigentlich verkauft, bleibt von alldem unberührt. Kunden zu verstehen und Architekturen zu entwerfen, die in zwei Jahren noch tragen, ist langsame, denkerische Arbeit. Sie braucht Gespräche, Hypothesen, Ausprobieren, Zuhören. Was die Konsole verkürzt, ist die Strecke zwischen der fertigen Idee und ihrer Umsetzung. Komplexere Workflows werden in deutlich kürzerer Zeit fertiggestellt. Die Qualitätskontrolle am Ende bleibt bei uns.

Was uns nach zwölf Monaten als Beobachtung geblieben ist: Der Engpass sitzt selten in einem einzelnen Programm, fast immer zwischen mehreren. Pipedrive, Harvest, die Buchhaltung tun jeweils, was sie sollen. Was nicht funktioniert, ist die manuelle Übersetzung zwischen ihnen.

Eine zweite Beobachtung folgt mit der Zeit. Sobald eine Antwort nicht mehr einen halben Vormittag kostet, stellt man die Frage häufiger. Vorgänge, die früher einmal im Monat geprüft wurden, prüft man inzwischen wöchentlich. Veränderungen werden früher sichtbar.

Wer das im eigenen Haus probieren will, fängt nicht mit der Werkzeug-Liste an, sondern mit dem Vorgang, der die meiste manuelle Übersetzung zwischen zwei Anwendungen verlangt. Mit genau diesem einen Vorgang lässt sich der erste Server bauen. Danach kommt der zweite, der dritte. Schicht für Schicht, nicht im großen Wurf.

Zum Schluss zwei Punkte, die in Gesprächen häufig auftauchen. Der Bau-Aufwand ist einmalig, der Nutzen läuft täglich. Und die Berechtigungen aus den Tools bleiben das Limit: Was ein Mitarbeiter in Pipedrive oder Harvest nicht sehen darf, sieht der Server für ihn auch nicht. Die Schicht ergänzt das System um eine Bedienart, sie hebelt nichts auf.

Häufige Fragen

Lohnt sich ein eigener MCP-Server für mittelständische Unternehmen?

Ja, wenn das eigene Tagesgeschäft auf Systemen läuft, für die es keinen fertigen MCP-Server gibt — also CRM, Workflow-Engine, Zeiterfassung, ERP, eigene Datenbanken. Der öffentliche MCP-Marktplatz deckt Slack, Notion und Microsoft 365 ab. Was er nicht abdeckt, sind die meisten Systeme, mit denen mittelständische Unternehmen wirklich arbeiten.

Welche Vorgänge im Tagesgeschäft lassen sich gut über einen MCP-Server abbilden?

Vor allem wiederkehrende Recherche- und Buchungs-Vorgänge: Deal-Notizen vor einem Telefonat lesen, Stunden während der Arbeit buchen, Workflow-Status prüfen, Performance-Reports abfragen. Alles, wo ohne MCP zwei Klicks und ein App-Wechsel zwischen einer Frage und ihrer Antwort stehen. Schwächer ist es bei komplexen Editier-Vorgängen, bei denen ein Mensch laufend dazwischenschauen will — die bleiben sinnvoller in den Anwendungen selbst.

Wie läuft ein MCP-Server im eigenen Cloud-Konto?

Der Server läuft im Cloud-Konto des Kunden, also auf seiner eigenen Infrastruktur bei AWS, Azure oder Google Cloud. Damit bleibt der gesamte Datenverkehr im eigenen Haus, auch das KI-Modell wird in einer europäischen Region des Kunden-Kontos angefragt. Es fließen keine Daten zu uns oder zu einem externen Anbieter. Den Aufbau und die laufende Betreuung übernehmen wir.

Skills

  1. Custom MCP-Server

    Eigener MCP-Server, der Claude, ChatGPT oder Gemini an interne Werkzeuge eines Mittelständlers anbindet — CRM, ERP, Datenablage, Buchhaltung.

stack

Kontakt

kapio ist ein Technologie-Studio aus Hamburg. Wir bauen Systeme, die laufen — und benutzt werden. Eine Architektur, kein Tool-Salat. Cloud oder selbst gehostet, anschlussfähig an das, was bei euch schon im Einsatz ist.

CRM · ERP · KI · Automation · Datenbanken

Pipedrive Authorized Partner · n8n · Claude · Seit 2021