Liip Blog

AI gestalten - für Menschen und den Planeten

Wed, 26 Nov 2025 00:00:00 +0100

AI und Nachhaltigkeit sind zwei widersprüchliche Elemente. LLMs und KI-Infrastruktur haben einen realen ökologischen Impact: hoher Energiebedarf, Rebound-Effekte und "climate shadows", die oft auf den ersten Blick unsichtbar bleiben. Dennoch sind wir bei Liip davon überzeugt, dass KI so gestaltet werden kann, dass sie weniger Schaden anrichtet und verantwortungsvoller wird. Wir sehen es als unsere Pflicht, dies zu tun, für unsere Kund*innen, für die Gesellschaft und für die langfristige Stabilität des digitalen Ökosystems.

Diese Verantwortung hat Liip dazu veranlasst, die Sustainability Guidelines für KI-gestützte Produkte zu veröffentlichen. Derzeit liegt eine funktionsfähige Version vor: Sie wird in ersten Projekten getestet und schrittweise finalisiert.

Warum wir diese Arbeit gestartet haben

Das ursprüngliche Ziel beschrieb die Herausforderung gut: Teams, die an KI-Produkten arbeiten, fehlt oft eine konsolidierte Checkliste, die ihnen hilft, negative Auswirkungen auf Menschen und Umwelt zu reduzieren, während gleichzeitig hochwertige Resultate geliefert werden, die den Kundenerwartungen gerecht werden.

Es war immer klar, dass wir Kreativität nicht einschränken oder die Entwicklung verlangsamen wollen. Vielmehr ging es darum, es den Expert*innen, die an einem solchen Projekt mitarbeiten, zu ermöglichen, fundierte Entscheidungen zu treffen, basierend auf:

Angebot- und Projektprozessen
User Value
Technischer Optimierung
UX Relevanz
Ethischen Überlegungen
Transparenz
Digitaler Nachhaltigkeit

Kurz gesagt: bessere Produkte für die Nutzer*innen, mit geringerem Impact und stärkerer Ausrichtung auf die Unternehmensstrategie.

Was die Richtlinien heute ermöglichen

Nach mehreren Austauschrunden und der Analyse bestehender Referenzen zu nachhaltiger KI verfügen wir nun über eine erste einsatzbereite Version. Die Richtlinien bieten:

1. Klare Kriterien für einen verantwortungsvollen KI-Einsatz

Ein strukturiertes Set von 38 Fragen und Prüfpunkten, die sich schrittweise in Projekte integrieren lassen.
Sie decken Impact-Reporting, Modellwahl, UX-Aspekte, Datenmanagement, Transparenz gegenüber Nutzer*innen und vieles mehr ab.
Einige Punkte sind offensichtlich, einige bereits umgesetzt, andere erfordern zusätzliche Anstrengungen.

2. Einen Rahmen für kontinuierliche Verbesserung

Die Idee ist einfach: Bereits ein einziger zusätzlicher erfüllter Kriterienpunkt pro Projekt ist ein Fortschritt.
Kontinuierliche Verbesserung ist seit Beginn des Projekts Bestandteil der Richtlinien.

3. Konkrete “Essentials” für KI-Projekte

Schon in der internen Entwurfsphase haben sich vier wesentliche Praktiken als nicht verhandelbar für zukünftige GenAI-Projekte herauskristallisiert:

Alternativen bei der Wahl der LLMs und des Hostings anbieten (Open-Source, energieeffizient, kleinere Modelle, …)
Unsere Designer systematischer einbeziehen, um Nutzerflüsse zu optimieren und die Erfahrung zu verbessern
Tools für Impact-Reporting und Performance Cards (wie Ecologits) einsetzen, um den Fussabdruck unserer Produkte zu verfolgen
Eine Roadmap für kontinuierliche Verbesserung bereitstellen, basierend auf den Richtlinien, für Wartung und zukünftige Releases

Wichtig: Die Initiative fügt nahtlos in die übergeordnete Nachhaltigkeitsstrategie von Liip ein.

Frühe Einführung: vom Optionalen zum Systematischen

Die Richtlinien werden zunehmend in Projekten eingesetzt, in denen der KI-Einsatz gross genug ist, um von Impact-Bewertungen und Optimierungen zu profitieren. Diese “Soft-Launch”-Phase ermöglicht es den Teams:

bereits erfüllte Kriterien zu evaluieren
Reibungspunkte zu identifizieren
Chancen zu erkennen, Kund*innen nachhaltige Zusatzservices anzubieten
Empfehlungen zu validieren, die künftig als Standardpraktiken gelten sollen

Diese schrittweise Integration ist entscheidend, um das Projekt in den Liip-Standard zu überführen.

Auf dem Weg zu Transparenz und kollektivem Fortschritt: Open-Sourcing der Richtlinien

Sobald die Richtlinien durch Feedback aus den Projekten finalisiert sind, möchten wir sie Open Source veröffentlichen.
Die KI-Branche verfügt noch immer über wenig klare und umsetzbare Standards für verantwortungsvolle Praktiken; durch das Teilen unseres Ansatzes möchten wir zu einer kollektiven Bewegung beitragen — hin zu transparenteren und ökologisch weniger belastenden KI-Systemen — und mit anderen engagierten Akteuren zusammenarbeiten.

Parallel dazu bereiten wir den Beta-Launch von Lowwwimpact vor, unserer kommenden Plattform zur Bewertung der Web-Nachhaltigkeit.
Ein eigenes Modul für nachhaltige KI-Praktiken ist geplant, und erste Nutzer*innen können sich bereits auf die Warteliste setzen lassen:
👉 Lowwwimpact.com

Unternehmen oder Einzelpersonen, die zusammenarbeiten, die Richtlinien testen oder an der nächsten Version mitwirken möchten, können sich bereits jetzt anmelden und Teil der ersten Testgruppe werden.

Wie es weitergeht

In den kommenden Monaten werden wir:

Kriterien und Dokumentation anhand der Projekterfahrungen konsolidieren
Die kontinuierliche Verbesserung weiterführen
Feedback von interessierten Partnern einholen
Die Open-Source-Veröffentlichung vorbereiten
Die Richtlinien in Lowwwimpact als eigenes KI-Kapitel integrieren

Dieses Projekt begann mit einer einfachen Idee: unseren Teams zu helfen, bewusstere Entscheidungen bei der Entwicklung KI-gestützter digitaler Produkte zu treffen. Heute ist daraus ein interdisziplinäres Vorhaben geworden — im Einklang mit unserer Nachhaltigkeitsstrategie. Die Guidelines schaffen neue Formen von Mehrwert für unsere Kund*innen: sei es durch Optimierung, Transparenz, Ethik oder neue Funktionalitäten.

Wenn Sie Teil dieser Reise sein möchten, Sprechen wir darüber !

Management statt Magie

Mon, 24 Nov 2025 00:00:00 +0100

Einleitung: Das unsichtbare Risiko

Halluzinationen – also Aussagen eines LLMs, die faktisch falsch sind – gehören zu den kritischsten Risiken beim Einsatz von generativer KI. (Zum Thema Vertrauen siehe auch meinen anderen Blogpost.)

Gerade RAG-Systeme (Retrieval Augmented Generation), die oft als Lösung gegen Halluzinationen angepriesen werden, bringen neue Fehlerquellen mit sich: Sie versprechen, Antworten auf Ihre eigenen, vertrauenswürdigen Daten zu stützen – können aber trotzdem gefährlich danebenliegen.

Die gute Nachricht: Halluzinationen sind kein Naturgesetz der Technologie. Sie sind in erster Linie ein Datenqualitäts- und Architekturproblem – und damit steuerbar.

Was sind Halluzinationen – und warum sind sie gefährlich?

Von einer Halluzination sprechen wir, wenn ein LLM Fakten generiert, die falsch sind, aber sehr selbstbewusst und überzeugend präsentiert werden. Anders als ein «normaler» Fehler sind Halluzinationen besonders heikel, weil sie:

Plausibel klingen: Die Antwort passt scheinbar perfekt zur Frage und wirkt autoritär.
Stilistisch korrekt sind: Formulierung, Tonalität und Format wirken professionell.
Schwer erkennbar sind: Auch Expert*innen übersehen sie beim flüchtigen Lesen.
Vertrauen missbrauchen: Nutzer*innen gehen davon aus, dass das System auf verifizierten Daten basiert.

Beispiele aus der Praxis gibt es zur Genüge – von erfundenen Quellen über falsche Gesetzesartikel bis zu frei ausgedachten Prozessschritten.

Wie entstehen Halluzinationen technisch?

Large Language Models (LLMs) funktionieren im Kern, indem sie das wahrscheinlichste nächste Wort basierend auf dem bisherigen Kontext vorhersagen. Das Modell ist darauf optimiert, eine Antwort zu liefern – nicht darauf, zu sagen: «Ich weiss es nicht.»

Das führt zu einem entscheidenden Problem:
Selbst wenn die zugrunde liegenden Informationen unvollständig oder gar nicht vorhanden sind, wird das Modell eine Antwort konstruieren. Genau dort entstehen Halluzinationen.

Um dem systematisch entgegenzuwirken, gibt es zwei grundlegende Strategien:

Kontext bereitstellen:
Durch die Einbindung des richtigen, relevanten Kontexts (z.B. mittels RAG) erhöhen wir die Wahrscheinlichkeit, dass das Modell auf korrekte Informationen zugreift und damit die richtige Antwort erzeugt.
Out-of-Distribution / «Ich weiss es nicht» erkennen:
Liegt eine Anfrage ausserhalb des Wissensbereichs, sollte das System dies erkennen und die Frage nicht beantworten, statt eine unsichere oder falsche Antwort zu erfinden.

RAG-Systeme: Versprechen und Realität

RAG-Systeme sollen genau dieses Problem adressieren. Die Idee:

Statt das LLM nur aus seinem «gelernten Weltwissen» antworten zu lassen,
sucht das System zuerst in einer (kundenspezifischen) Knowledge Base nach relevanten Informationen.
Basierend auf den gefundenen Dokumenten und dem Prompt formuliert das LLM dann die Antwort.

Gut gemachtes RAG kann Halluzinationen massiv reduzieren.
Schlecht gemachtes RAG fügt der Gleichung neue Fehlerquellen hinzu – und macht die Fehlersuche deutlich schwieriger.

Typische Fehlerquellen in RAG-Systemen

Problem 1: Das Retrieval versagt

Bevor das LLM überhaupt antwortet, müssen die relevanten Dokumente gefunden werden. Genau hier passieren oft die fundamentalsten Fehler:

Relevante Informationen werden nicht gefunden:

Die Suchalgorithmen erkennen wichtige Dokumente nicht als relevant an.
Wichtige Inhalte stecken in Tabellen, PDFs oder schlecht strukturierten Dateien und werden gar nicht oder nur teilweise erfasst.
Der Kontext des LLMs wird mit unwichtigen Informationen geflutet und das wirklich Relevante geht unter.

Irrelevante oder veraltete Dokumente werden verwendet:

Das System findet eine Medienmitteilung von 2019, die längst überholt ist.
Widersprüchliche Informationen aus verschiedenen Quellen landen gleichzeitig im selben Kontext.

Domänenspezifische Besonderheiten werden nicht abgebildet:

Embeddings repräsentieren zentrale Unterschiede der Domäne nicht.
Beispiel: Auf einer Behörden-Website bedeutet «Anmelden» fast immer «Wohnsitz anmelden bei der Einwohnerkontrolle», nicht «zum Salsa-Kurs im Quartierzentrum anmelden».

Das Resultat: Das LLM baut auf falschem oder unvollständigem Kontext auf – und halluziniert selbstbewusst darauf los.

Problem 2: Der «Generation»-Schritt interpretiert falsch

Selbst wenn das Retrieval gut funktioniert und die richtigen Dokumente liefert, kann das LLM die Informationen noch falsch verarbeiten:

Falsche Interpretation:

Das LLM versteht die Nuancen eines juristischen Textes nicht.
Konditionale Aussagen («Wenn X, dann Y») werden zu absoluten Regeln.
Ausnahmen werden ignoriert oder zu weit verallgemeinert.

Unzulässige Kombination von Informationen:

Das LLM kombiniert Aussagen aus verschiedenen Dokumenten auf kreative, aber falsche Weise.
Es «schliesst» von A auf B, obwohl dieser Schluss fachlich nicht zulässig ist.
Es versucht, veraltete Informationen «intelligent» zu aktualisieren und liegt dabei daneben.

Lückenfüller aus dem Weltwissen:

Das gefundene Dokument beantwortet die Frage nur teilweise.
Das LLM ergänzt fehlende Teile aus seinem allgemeinen Weltwissen.
Das Ergebnis ist eine Mischung aus verifizierten Fakten und frei Erfundenem.

Auf diesen Generationsschritt haben wir den wenigsten direkten Einfluss: Wir können nur das passende Modell wählen und den Prompt so gut wie möglich gestalten. Umso wichtiger ist alles, was davor und danach passiert.

Drei essenzielle Strategien zur Risikominimierung

Wenn Halluzinationen primär ein Architektur- und Datenqualitätsproblem sind, können wir sie auch systematisch bekämpfen. Drei Strategien sind aus unserer Erfahrung essenziell:

1. Datenqualität als Fundament

Ein RAG-System ist nur so gut wie die Daten, auf die es zugreift.
Der alte IT-Grundsatz gilt hier in Reinform: Garbage in, garbage out.

Wichtige Prinzipien:

Quellen am tatsächlichen Bedarf ausrichten:
Nicht alles, was im Intranet liegt, hilft bei echten Nutzer*innenfragen.
Die Knowledge Base sollte sich an konkrete Use Cases orientieren und nicht an die Ordnerstruktur Ihrer Organisation.
Dokumente mit zusätzlichem Kontext anreichern:
Oft müssen Dokumente «verschnitten» (gechunked) werden, damit sie in ein LLM passen.
Dabei geht leicht Kontext verloren, der muss explizit ergänzt werden (z.B. Metadaten, Überschriften, Gültigkeitsbereiche).
Aktualität sicherstellen – Once Only:
Informationen sollten, wo immer möglich, einmal zentral gepflegt werden.
Kopien in verschiedenen Systemen machen es fast unmöglich, überall konsistent und aktuell zu bleiben.
Für RAG-Systeme bedeutet das: klare «Single Sources of Truth», nicht fünf leicht unterschiedliche Versionen desselben Prozesses.

2. Fallback-Mechanismen und Unsicherheitslogik

Ein gutes System weiss, wann es nichts weiss und reagiert entsprechend.
Unser Grundsatz: Lieber ein konservatives „Ich kann Ihnen nicht helfen“ als eine erfundene Antwort.

In der Praxis heisst das:

Unsicherheits-Schwellenwerte definieren:
- Schwellen in verschiedenen Teilen des Retrievals (z.B. Vektordistanzen, Relevanzscores) festlegen.
- Unterhalb dieser Schwellen: lieber keine Antwort, sondern ein transparenter Hinweis an die Nutzer*innen.
Routing für kritische Themen:
- Bestimmen, welche Themen «kritisch» sind (z.B. Steuern, Gesundheit, rechtliche Fragen – je nach Kunde unterschiedlich).
- Für diese Themen definierte Fallbacks nutzen:
  z.B. „Ich kann Ihre Steuerbelastung nicht berechnen. Bitte nutzen Sie den offiziellen Steuerrechner.“
Out-of-Scope klar markieren:
- Wenn ein Thema ausserhalb des Wissensbereichs liegt, soll das System das deutlich sagen, statt mit Halbwissen zu antworten.

3. Nutzer:innen befähigen, nicht täuschen

Selbst wenn man Halluzinationen technisch minimieren könnte: Sprache bleibt mehrdeutig.
Beispiel: «Mein Hund brachte mir einen Ball. Ich kickte ihn.» – Wer oder was wurde gekickt? Sprache ist nie zu 100 % eindeutig. Ein (nicht ganz so ambivalentes) Beispiel aus der Praxis.

Das heisst: Niemals wird jede Frage zu 100 % «richtig» beantwortet werden. Deshalb gilt für uns:

a) Quellenangaben zu jeder Antwort

Wir zeigen, aus welchen Dokumenten die Antwort stammt.
Diese Dokumente sind direkt zugänglich und so präzise wie möglich verlinkt (Tabelle, Abschnitt, Paragraph).
Wir machen transparent, wenn eine Antwort aus mehreren Quellen kombiniert wurde.

b) «Confidence Scores» sichtbar machen

Wo möglich, kommunizieren wir – bisher noch relativ einfach – wie sicher das System ist.
Langfristig möchten wir „Confidence Scores“ deutlich besser quantifizieren und darstellen.
Bis dahin gilt: lieber einfache, ehrliche Indikatoren als falsche Präzision.

c) Ehrliche Disclaimer statt Marketing-Sprech

Die beste technische Lösung nützt nichts, wenn Nutzer*innen dem System blind vertrauen.

Schreiben Sie klar in die UI: «Dieses System kann Fehler machen.»
Erklären Sie, wofür das System geeignet ist und wofür nicht.
Vermeiden Sie Marketing-Sprache, die überzogene Erwartungen weckt.
Vermeiden Sie ebenso reines «cover your ass»-Juristendeutsch, das niemand liest.
Ziel ist: verständliche, ehrliche Kommunikation.

Verantwortungsvolle AI ist machbar

Für mich gibt es drei zentrale Punkte:

Halluzinationen sind steuerbar:
Sie sind nicht unausweichliches Schicksal, sondern Resultat von Datenqualität und Systemdesign. Beides liegt in Ihrer Hand.
Transparenz schlägt Perfektion:
Sie werden Halluzinationen nie zu 100 % vermeiden.
Aber Sie können Ihr System so gestalten, dass Nutzer*innen Fehler erkennen, einordnen und damit umgehen können.
Es ist auch ein Managementthema, kein reines Technikthema:
Die wichtigsten Entscheidungen – Datenqualität, Prozesse, Verantwortlichkeiten – müssen Sie als Führungskraft treffen, nicht Ihr IT-Team allein.

Der Einsatz von RAG-Chatbots birgt Chancen und Risiken.
Wer die Risiken versteht und systematisch adressiert, kann die Chancen nutzen – verantwortungsvoll und sicher.

Ohne Vertrauen kein Nutzen

Sun, 09 Nov 2025 00:00:00 +0100

Das zentrale Problem

Stell dir vor, du hast einen Chatbot entwickelt. Das System läuft, die ersten Demos sind vielversprechend, die Stakeholder sind begeistert. Drei Monate nach dem Launch schaust du in die Nutzungsstatistiken und sie sind ernüchternd. Die Leute nutzen den Bot kaum. Und wenn doch, dann meist nur für triviale Fragen.

Was ist passiert?

Das Problem ist nicht, dass der Bot schlechte Antworten gibt. Das Problem ist, dass niemand ihm vertraut. Ein Chatbot, dem man nicht traut, spart keine Zeit – er kostet Zeit. Nutzer:innen müssen jede Antwort prüfen, gegenchecken, nachschlagen. Da ist es einfacher, gleich selbst in den Dokumenten zu suchen.

Vertrauen ist kein «nice to have», es ist die Grundvoraussetzung für Adoption. Und Vertrauen entsteht nicht durch grosse Versprechen oder schöne Screenshots. Es entsteht durch nachweisbare, messbare Qualität – durch Evaluation.

Der Kunde muss wissen, was er will

Wenn ich mit Kunden über Chatbots spreche, höre ich oft: «Wir wollen, dass der Bot gute Antworten gibt.»

Klingt vernünftig – ist aber als Anforderung zu ungenau. Was bedeutet «gut» überhaupt?

Soll der Bot lieber eine unvollständige, aber korrekte Antwort geben – oder eine ausführliche mit 95 % Korrektheit?
Darf er sagen «Das weiss ich nicht», oder soll er immer eine Antwort versuchen?
Welcher Ton ist erwünscht: sachlich-formal oder freundlich-persönlich?
Wie geht er mit widersprüchlichen Informationen in den Quellen um?
Wie detailliert sollen Antworten sein: Zusammenfassung oder vollständige Information?

Diese Fragen klingen banal, aber ihre Antworten definieren, ob ein Chatbot «gut» ist oder nicht. Oft wissen Kund:innen selbst nicht, was sie brauchen – bis sie schlechte Beispiele sehen. Deswegen brauchen wir die menschlichen Evaluationen.

Menschliche Evaluationen: Den Kunden wirklich verstehen

Jetzt wird’s praktisch. Die Anforderungen sind geklärt, der Perimeter abgesteckt. Jetzt geht es darum, zu verstehen, was «gut» eigentlich bedeutet. Doch wie finden wir das heraus?

Die Antwort lautet: zuerst manuell.

Ich weiss – in einer Welt von KI, LLM-as-a-Judge und automatisierten Metriken klingt das altmodisch. Nur: Man kann keine automatisierte Evaluation aufbauen, wenn man nicht weiss, was überhaupt evaluiert werden soll. Und das findet man nur heraus, indem echte Menschen echte Antworten bewerten.

Ein Evaluations-Set aufbauen und Dimensionen der Qualität

Zuerst braucht es repräsentative Fragen – 50 bis 200 Stück, idealerweise echte Nutzerfragen. Nicht die einfachen Demo-Beispiele, sondern Fragen aus dem Alltag:

Häufige Standardfragen: «Wie kann ich mich Anmelden?», «Wo ist der Notfall?»
Randfälle: «Wann muss ich meine Ferien als Angestellte:r der Verwaltung eingeben?», «Gib mir ein gutes Pizzarezept»
Mehrdeutige Fragen: «Wie kann ich mich Anmelden?»
Fragen, die sich gar nicht aus den Dokumenten beantworten lassen: «Ist Bern besser als Basel?», «Wer ist Margret Thatcher?»

Zu jeder Frage wird eine Antwort generiert. Parallel dazu definiert das Kernteam (und idealerweise weitere Stakeholder) die Bewertungsdimensionen – denn nicht jede Dimension ist in jedem Kontext gleich wichtig.
Üblicherweise nutzen wir:

Korrektheit: Ist die Information korrekt? Gibt es überhaupt ein richtig/falsch?
Vollständigkeit: Ist die Information vollständig? Fehlen wichtige Aspekte?
Tonalität: Stimmt die Tonalität mit unseren Vorstellungen überein? (Da hilft übrigens auch der Textmate)

Bewerten

Jetzt kommt der mühsame Teil: Mehrere Personen bewerten jedes Frage-Antwort-Paar entlang der definierten Dimensionen.

Gut/Nicht gut: Für jede Dimension wird entschieden, ob die Antwort «gut» ist oder nicht.
Begründung: Jede Bewertung muss begründet werden. Das mag aufwendig wirken, ist aber zentral, denn nur so entsteht ein gemeinsames Verständnis von «gut».
Blind evaluieren: Die Bewertenden sollten nicht sehen, was andere vergeben haben. Weichen die Resultate stark voneinander ab, sind die Kriterien zu unklar.
Diskutieren: Bei Abweichungen hilft eine gemeinsame Diskussion. Diese Gespräche sind oft der wertvollste Teil des Prozesses.

Nach 50–100 bewerteten Beispielen ergibt sich ein klares Bild der Ausgangslage – und meistens auch, was noch zu tun ist.

Mit Tools skalieren

Doch manuelles Bewerten skaliert schlecht: 100 Fragen manuell zu evaluieren ist machbar, 1'000 sind mühsam. 10'000 im kontinuierlichen Monitoring? Unmöglich.

Hier kommen Tools ins Spiel.

LLM-as-a-Judge: Das Prinzip

Die Idee ist simpel: Ein LLM bewertet die Antworten des Chatbots anhand definierter Kriterien. Es braucht, sehr vereinfacht, dazu:

Die Frage
Die Antwort deines Systems
Den Goldstandard (wie die Antwort idealerweise aussehen sollte)

Der Evaluator liefert ein Fazit und eine Begründung.

Das grösste Risiko: Man ersetzt ein Problem (Chatbot evaluieren) durch ein anderes (Evaluator evaluieren). Deshalb muss die automatisierte Bewertung kalibriert werden. Dafür nehmen wir typischerweise 50–100 manuell bewertete Beispiele und lassen sie zusätzlich vom LLM beurteilen. Stimmen die Ergebnisse überein, funktioniert der Judge zuverlässig.

Danach beginnt die kontinuierliche Verbesserung – dazu ein andermal mehr. Am Ende der Verbesserungen steht der grosse Moment, das Go-Live.

Go-Live und kontinuierliches Monitoring

Wir empfehlen, das Go-Live zunächst ohne grosse Ankündigung zu machen. So kann der Chatbot in den ersten Tagen anhand echter Nutzerfragen weiter verbessert werden.

Im Regelbetrieb ist die Arbeit aber nicht fertig: Die kontinuierliche Evaluation ist zentral. Besonders hilfreich sind Metriken wie:

Anteil unbeantworteter Fragen
Groundedness (also: halluziniert der Bot oder stammen die Fakten aus den Quellen?)
Menschliche Stichproben, vor allem bei schwacher Bewertung oder fehlender Groundedness
Und last but not least: Das Feedback der Nutzer:innen.

Durch einfach zu verstehende Metriken lässt sich auch ein Chatbot mit 10'000 oder mehr Fragen seriös überwachen – ohne jede einzelne Frage zu prüfen.

Evaluation ist kein «Nice-to-have»

Der Unterschied zwischen einem erfolgreichen und einem gescheiterten Chatbot liegt nicht im besten Embedding-Model, dem neusten LLM oder einem cleveren Retrieval-Algorithmus.
Er liegt in der Bereitschaft, Zeit in Evaluation zu investieren.

In menschliche Bewertungen.
In automatisiertes Monitoring.
In kontinuierliche Verbesserung.

Nur so entsteht Vertrauen – die Basis für Adoption.

The Swiss eID from a developer perspective

Wed, 05 Nov 2025 00:00:00 +0100

On 28.9.2025, the laws to introduce an electronic ID in Switzerland have been accepted in a public vote. This law was a second, fixed attempt after the rejection in 2021. The first, refused, attempt proposed to let private companies run the infrastructure for the eID. The amended law now requires the government to operate that infrastructure itself.

In preparation of the law, a beta version of the proposed architecture has already been implemented. After that vote, I took a look at the beta implementation. Not only is it government operated, but it also is fully open source to allow anyone to verify the implementation. There is quite some documentation available. Some of the guides have not kept up with development - but i guess its called "beta" for a reason and development is moving fast.

The ecosystem consists of the "registry" (operated by the government) that is used to check certificates, the "wallet" app to contain IDs (called Swiyu), identity "issuers" (with the main one that issues the eID operated by the government, but the wallet can also store data from other issuers) and finally "verifiers" that ask for information.

Image: The architecture of the eID infrastructure. Source: swiyu

From a consumer perspective, the system is actually quite simple: My application specifies the fields it needs to know from an ID, my verifier service issues a QR code resp. deeplink for the eID wallet and if the wallet owner allows it, my application receives the requested values. Behind the scenes, there is quite a bit of complexity of course, which guarantees that my application can legally trust the answer just as well as in a physical interaction where I look at the customers passport.

The eID system has been built around data minimization. Rather than always giving access to the full information like with a physical passport, my application has to indicate the specific fields it requires, and the user is shown which fields they would reveil. Besides name, birthdate and other detailed facts, there are also flags like "is over 16 years old" (the minimum age to legally buy beer), "is over 18 years old" (legally adult, allowed to drive, allowed to buy strong alkohol) or "is over 65 years" (the age people usually retire in Switzerland). That way, the exchange can be restricted to the information that actually matters.

Requesting verified data

To get started, I had to set up the verifier application. The easiest way to run that application is to use their docker image. After a rather involved setup procedure of creating keys, uploading them to the base infrastructure and then getting a manual approval for Liip as a verifier in the eID infrastructure, I had the necessary credentials to configure the verifier. With that solved, the rest was quite simple: I can send web requests to my verifier, telling it which fields I want from the customer. Those requests consist of some boilerplate plus the list of fields to request, specified as paths:

"constraints": {
    "fields": [
        {
            "path": [
                "$.age_over_18"
            ]
        }
    ]
}

The response to this request is a verification URL that needs to be rendered as a QR code and presented to the wallet. (Or alternatively a deep link that opens the wallet for this verification, to be used when visiting the website on the mobile phone that has the wallet installed.) The user has to scan the code with the wallet app (or tap the deep link). The wallet app then prompts them to allow sharing this specific list of information. On confirmation, the app communicates with my verifier service to provide the information. Meanwhile, my application polls for the status of the verification. Once it succeeds, it can fetch the result, which contains a boolean for this example. I can also request texts like given name, family name or birthday, or even the portrait image. A full list of the available fields is in this catalog on admin.ch.

Image: Confirmation screen after scanning the QR code with the Swiyu App. Source: Screenshot with test profile

Conclusions

The Swiss eID provides a - from consumer perspective - simple way of asking a user to prove that they are of age, or to provide their name. The API is (once the setup is done) rather simplistic. The really spectacular part about this is that the information received is provided by the swiss government, securely validated and satisfies legal requirements. It has the same value as being shown a physical passport, but without having to show more information than necessary.

It remains to be seen if verifiers adhere to the data minimization or ask for to many details like full name or birthdate unnecessarily. As with the permissions management for mobile apps, a company could ask for too much and refuse to work with less. The swiyu app unfortunately does not offer to transfer less than the requested data. Hopefully the Swiss government consumer protection and data protection services can get companies to refrain from gathering unnecessary data.

Text-to-Template

Mon, 20 Oct 2025 00:00:00 +0200

Ein Relaunch bietet Content-Momentum: Grosse Mengen Content müssen überarbeitet werden. Um dabei auch in dezentralen Teams qualitative Ergebnisse zu erreichen, hat Liip den TextMate entwickelt.

Der TextMate vereinheitlicht Texte über folgende Dimensionen:
– Rechtschreibung & Inklusion
– Vereinfachen
– Content Guidelines
– Tonalität

TextMate haben wir als typisches MVP aufgebaut: Wenig Funktionen, dafür durchdacht und wirkungsvoll.

Für die Weiterentwicklung setzen wir auf einen komplexeren Use Case:
Wir überarbeiten bestehende Texte nicht nur sprachlich, sondern lassen sie von einem LLM an spezifische Seitentypen anpassen.

Erste Tests sind positiv. Dabei ist wichtig: Es braucht pro Seitentyp 2 bis 3 gute Textbeispiele, die ein Mensch getextet hat. Auf dieser Basis kann das System einen ersten Vorschlag entwickeln, den Editor*innen verfeinern.

Der Vorteil: Editor*innen starten nicht mit einem „weissen Blatt“, sondern haben eine erste Version, die sie verfeinern können.

Interessiert dich das Vorgehen? Hast du einen eigenen Use Case, an dem du das Vorgehen ausprobieren möchtest?
Dann melde dich gerne bei uns!

Die Details

Womit ergänzen wir unser MVP?

Wer mit einem MVP arbeitet, kennt das: Kaum ist das Produkt im Einsatz, kommen die ersten Wünsche nach zusätzlichen Funktionen. Die zentrale Frage für den Product Owner lautet: In welche Richtung entwickeln wir weiter? Wo sind unsere Ressourcen am wirkungsvollsten investiert?

Einer der häufigsten Wünsche, die wir für TextMate gehört haben: Texte automatisch kürzen.

Klingt simpel, ist es aber nicht. Denn:

Wie stark soll gekürzt werden? Dafür gibt es keine fixe Antwort.
Welche Varianten sollen angeboten werden? Und wie viele?

Je mehr Flexibilität wir geben, desto näher kommen wir ans freie Prompten. Ab einem gewissen Punkt ist es sinnvoller, wenn Editor*innen direkt mit einem KI-Chatbot wie ChatGPT arbeiten.

Ein anderer Wunsch hat uns hingegen neugierig gemacht – weil er uns Menschen viel repetitive Arbeit abnehmen kann:

Nach einem Testlauf mit TextMate hat uns Clemens Nef, stellvertretender Leiter Kommunikation des Kantons St. Gallen, differenziertes Feedback gegeben. Für ihn und sein Team reicht die sprachliche Überarbeitung nicht aus. Sie wollen eine strukturelle Optimierung von Inhalten für ihre Website.

Wie soll der Text aufgebaut sein?
Welche Zwischentitel braucht es?
Wo machen Listen Sinn?
Etc.

Ein legitimer Wunsch. Struktur ist darum so wichtig, weil User Inhalte im Web scannen – sie lesen selten linear. Struktur hilft Usern, sich schnell zurechtzufinden. Auch Suchmaschinen und LLMs bevorzugen gut strukturierte Inhalte.

Struktur ist nicht generisch – sie folgt dem Seitentyp

Doch auch diese Umsetzung ist nicht trivial. Denn: Strukturierung ist kein Standardprozess.

Websites, die User Experience optimieren, arbeiten mit fixen Seitentypen – zum Beispiel Übersichtsseiten, Produktseiten oder Teamseiten. Der spezifische Seitentyp gibt eine fixe Struktur für die Inhalte vor.

Die Arbeit mit Seitentypen ist essenziell – vor allem für Unternehmen mit vielen Produkten, Services oder Themen. Denn über Seitentypen erreichen wir Konsistenz – ein zentraler Schlüssel zu User-Zufriedenheit.

Inhalte, die für einen Seitentyp getextet werden, müssen über mehrere Beispiele hinweg konsistent sein. Design ist also nur der Anfang: Konsistente Text- und Sprachschemata zu entwickeln, ist der nächste Schritt – und aufwändig.

Vom Design zum Text

Bei Liip sieht der Arbeitsprozess folgendermassen aus:

Design und Content entwickeln gemeinsam die Seitentypen.
UX Writer texten erste Beispiele – idealerweise basierend auf bestehendem Inhalt (z. B. von der alten Website).
Aus den Erkenntnissen dieser Arbeit wird das Design iterativ geschärft.
Basierend auf den finalisierten Seitentypen entstehen dann alle weiteren Inhalte – konsistent in Aufbau, Content und Ton.
Mit jedem Beispiel, das getextet wird, verfeinern wir die Text- und Sprachmuster, bis sie final sind. Dann müssen sie auf jedes weitere Beispiel konsequent angewendet werden.

In diesem Prozess tun Menschen das, was sich Clemens Nef von TextMate wünscht:

Wir optimieren einen Seitenaufbau und sprachliche Muster.
Und wenden sie konsistent auf viele Inhalte an.

Sobald die erwähnten Muster definiert sind, ist es eine repetitive Arbeit – sehr aufwändig (und damit teuer), wenn sie vom UX Writer übernommen wird. Und damit tatsächlich interessant, um an eine KI zu übergeben. Oder: safe enough to try.

Text-to-Template

Wir arbeiten nun daran, einen Teil dieser Arbeiten über ein Prompt-Set zu automatisieren:

Der Seitentyp wird nach wie vor von Design und Content entwickelt.
Dann überführen wir den Seitentyp in ein Prompt-Set.
Unsere UX Writer texten mehrere gute Beispiele pro Seitentyp. Diese werden in das Prompt-Set integriert.
Wir geben dem System bestehenden Content als Quelle – z. B. von der alten Website.
Das System generiert den neuen Text und wendet dabei die Muster des gewählten Seitentyps an.
Das Ergebnis dient als Vorschlag, den Editor*innen nun verfeinern können.

Erste Erkenntnisse

Erste Tests sind positiv.

Folgende Erkenntnisse zeichnen sich ab:

Die Beispiele, welche UX Writer texten, sind sehr wichtig.
Die Qualität der Ergebnisse hängt ausserdem stark von der Menge des Quell-Contents ab. Gibt es auf der alten Website nur sehr wenig Text, ist es für das System natürlich schwierig bis unmöglich, ein qualitatives, ausführlicheres Ergebnis zu generieren.
Es wird Prozessoptimierung benötigen: Am Content-Momentum des Relaunchs ist wertvoll, dass alte Inhalte hinterfragt und optimiert werden. Das macht das System – im beschriebenen Aufbau – nur bedingt. Lässt sich dieser Auftrag im Prozess explizit an die Editor*innen verankern?
Wahrscheinlich lässt sich auch die Beschreibung des Seitentyps von einem LLM erstellen.
Uns interessiert für die nächsten Schritte die Anbindung an die Komponentenbibliothek in Figma.

TextMate – Einfache Texte, effiziente Prozesse, deine Tonalität

Wed, 15 Oct 2025 00:00:00 +0200

Viele Organisationen kennen das Problem: Inhalte für Websites, Social Media oder Kampagnen sollen korrekt, verständlich, inklusiv und auf die Stimme der eigenen Marke abgestimmt sein. Und das mit möglichst wenig Aufwand. Mit TextMate hat Liip ein smartes Tool entwickelt, das dein Team genau dabei unterstützt. Effizient, personalisierbar und auf konkrete Anwendungsfälle ausgerichtet.

Was ist TextMate?

TextMate ist ein KI-gestütztes Tool zum Überarbeiten von Texten – speziell für die Content-Prozesse unserer Kund:innen entwickelt. Das Tool läuft in jedem Browser und ist intuitiv zu bedienen.

Über ein einfaches Interface können Texte eingefügt und per Klick nach definierten redaktionellen Standards überarbeitet werden – automatisiert, sprachlich korrekt, konsistent und einfach verständlich.

Im Hintergrund liegt ein modulares Prompt-Set, das sich flexibel anpassen lässt: für einfache Sprache, inklusive Formulierungen, kompakte Texte und markenspezifischen Stil.

Dabei ist TextMate nicht an ein bestimmtes Sprachmodell gebunden: Aktuell machen wir gute Erfahrungen mit Modellen von ChatGPT, die Architektur erlaubt jedoch die Verbindung mit anderen LLMs.

Was ist die Herausforderung?

Bei einem grösseren Relaunch ist die Content-Produktion eine zentrale Herausforderung:

Content ist auf der aktuellen Seite organisch gewachsen, was nicht immer für die Qualität gilt.
Der Website-Relaunch birgt darum Momentum: Sämtlicher Content soll überarbeitet werden. Neuer Content muss entwickelt werden.
Ziel ist, einheitliche Standards hinsichtlich Einfachheit, Schreibweisen und Tonalität zu erreichen.
Die anstehende Aufgabe ist häufig so gross, dass es das Content-Team nicht alleine schafft. In einem dezentralen Setting werden Mitarbeitende aus anderen Unternehmensteilen zugezogen.
Da es sich bei den Kolleg:innen häufig nicht um Content-Expert:innen handelt, kommt das zentrale Content-Team nicht drum rum, alle Texte zu redigieren.
Das verursacht entweder enorme Kosten und kann den Zeitplan bedrohen – oder die Qualitätsziele für die neue Website sind gefährdet.

Diese Herausforderungen spitzen sich auf einen Relaunch zu, lösen sich danach aber nicht vollständig auf.

Die Lösung heisst TextMate

TextMate unterstützt genau an dieser Stelle:

TextMate redigiert Texte auf Basis des hinterlegten Prompt-Sets.
TextMate ist so einfach und intuitiv zu bedienen, dass alle Editor:innen selbstständig damit arbeiten können.
Im Prompt-Set werden sämtliche Content-Guidelines, Schreibregelungen und Tonalitäts-Ziele des Unternehmens abgelegt.
TextMate ist dabei transparent: Das Tool weist detailliert auf, was es auf Basis welcher Regel überarbeitet hat.

Das Tool macht dabei Prozesse effizienter, schneller und kostengünstiger. Und ermöglicht, auf ein zentrales Niveau hinsichtlich Verständlichkeit, einheitliche Schreibweisen und Tonalität hinzuarbeiten.

Es braucht keine zentrale Nachbearbeitung mehr: Auch wenn viele verschiedene Personen Inhalte erstellen, sorgt TextMate dafür, dass das Resultat wie aus einer Hand wirkt.
Die redaktionelle Qualität ist sichergestellt, selbst wenn keine professionelle Redaktion involviert ist.
Texte können in verschiedenen Sprachen verarbeitet werden.
Der Aufwand sinkt, die Time-to-Publish wird kürzer, und die Kosten reduzieren sich spürbar – insbesondere bei grossen Mengen Content.

So hilft der TextMate gleichzeitig Kosten zu sparen, interne Ressourcen zu schonen und die Qualität des resultierenden Contents sicherzustellen.

Was kann TextMate?

Der TextMate bietet – je nach Bedarf – unterschiedliche Überarbeitungsmodi. Wir können alle Prompt-Sets individuell auf Kund:innen und Anwendungsfälle zuschneiden. Standardmässig deckt das Tool folgende Funktionen ab:

Korrekturlesen: Rechtschreibung, Grammatik und Zeichensetzung.
Einheitliche Schreibweise: Ob Währungen, Zahlen, Branchen-spezifische Begriffe oder Satzzeichen. Der TextMate wird auf die Content Guidelines der Organisation ausgerichtet.
Einfache Sprache: TextMate erstellt zugängliche, verständliche Texte. Grundsätzlich zielen wir auf ein Sprachniveau zwischen A2–B1.
Inklusive Sprache: Begriffe und Formulierungen werden auf Inklusivität geprüft und angepasst.
Kompakte Sprache: Lange oder redundante Passagen werden verdichtet.
Markenspezifische Sprache: Optional kann der TextMate auf „Tone & Voice“-Guidelines der Organisation ausgerichtet werden.
Mehrsprachigkeit: Prompt-Sets lassen sich in mehreren Sprachen konfigurieren und anwenden – perfekt für mehrsprachige Organisationen.

Liip entwickelt das Prompt-Set zusammen mit der Kund:in. Danach wird der TextMate getestet und und das Ergebnis verfeinert, bis es stimmt.

Typische Use Cases aus der Praxis

Website-Relaunch mit dezentralem Autor:innen-Team

Ein Unternehmen steht vor einem umfangreichen Relaunch. Die Texte werden von verschiedenen Fachabteilungen erstellt, oft ohne professionelle Redaktionserfahrung. Mit TextMate können alle Beiträge schnell überarbeitet und vereinheitlicht werden – ohne Rücklauf, ohne zentrale Redaktion. Die Qualität ist hoch, der Stil konsistent.

Regelmässige Contentpflege mit hohen Qualitätsansprüchen

Ein Redaktionsteam betreut laufend Inhalte für eine Plattform. Jeder Text muss korrekt, zugänglich und markenkonform sein. Mit TextMate kann jeder Beitrag geprüft und optimiert werden – als schnelle Hilfe im Alltag, die Routineaufgaben übernimmt und Sicherheit gibt.

Wohin geht die Reise? Ein Ausblick

Heute überzeugt Textmate durch seine Einfachheit: reduced-to-the-max. Das Tool läuft in jedem Browser. Und die Anwendung ist so einfach, weil der TextMate genau etwas kann und das sehr gut macht.

Gleichzeitig sind die Potenziale von LLMs für die Arbeit mit Content gross. In diese Richtung kann die Weiterentwicklung des TextMate gehen:

Direkte CMS-Integrationen, z. B. für Drupal.
Automatisierte Content-Audits, um bestehende Seiten auf Optimierungspotenzial zu prüfen.
Content für Seitentemplates, um Texte nach fixen Mustern zu entwickeln.
Content-Lifecycle-Management, um nie wieder alten, doppelten oder falschen Content auf der Website zu haben.

Unser Ziel ist es, Contentproduktion neu zu denken: effizient, skalierbar, barrierearm – und dabei stets qualitativ hochwertig.

Neugierig geworden?

Gerne zeigen wir dir TextMate in einer Live-Demo und besprechen, wie das Tool in deinen Content-Workflow passt. Mit oder ohne Integration, in einer oder mehreren Sprachen – TextMate ist flexibel, leistungsstark und sofort einsatzbereit.

TextMate – für effiziente Content-Prozesse, bei denen die Qualität stimmt.

Dank

Das Spannende und Schöne an TextMate ist, dass die initiale Idee von einem Kunden kam (Christoph Zech, Digital Officer der Stadt Winterthur) und eine erste Version auf einem Innovationsprojekt mit der Stadt Winterthur entwickelt wurde. Danke für diese fruchtbare Partnerschaft <3

Mehr Mädchen in der ICT ausbilden: eine Herausforderung, die uns am Herzen liegt

Tue, 07 Oct 2025 00:00:00 +0200

Die ICT prägt unser Leben: Gesundheit, Mobilität, Bildung, Kommunikation... Wenn bei der Entwicklung dieser Lösungen nur bestimmte Stimmen vertreten sind, laufen wir Gefahr, Produkte zu schaffen, die voreingenommen sind oder nicht allen Bedürfnissen entsprechen.

Mehr Vielfalt bedeutet:

unterschiedliche Sichtweisen
kreativere Teams
gerechtere und inklusivere Produkte

Das ist kein “Nice to have”, sondern eine Notwendigkeit.

Was sind heute die Hindernisse?

Die Hindernisse beginnen schon lange vor der Ausbildung. Stereotype halten sich hartnäckig, und die Informatik wird immer noch zu oft als Männerdomäne wahrgenommen. Der Mangel an weiblichen Vorbildern erschwert die Identifikation und verhindert, dass man sich selbst in dieser Branche sieht. Diese Abwesenheit fördert die Selbstzensur, da viele junge Mädchen weiterhin glauben, dass dies nichts für sie ist. Infolgedessen erreichen zu wenige Bewerbungen von Frauen die Unternehmen, und es ist schwierig, Vielfalt zu etablieren.

Was wir bei Liip tun

Wir behaupten nicht, die Wunderlösung zu haben, aber wir tun unser Bestes. Konkret:

Tag der Zukunft: Jedes Jahr öffnen wir unsere Türen, um jungen Mädchen zu zeigen, wie der Beruf der Informatikerin wirklich aussieht. Die Idee dahinter: Klischees abbauen, Begeisterung wecken, Impulse setzen.
MINT-Studie: Wir beteiligen uns an diesem Forschungsprojekt, um herauszufinden, was weibliche Talente anzieht (oder abschreckt). Das Ergebnis? Die Bedeutung von Flexibilität, sichtbaren weiblichen Vorbildern, einer inklusiven Sprache und gutem Feedback. All diese Punkte integrieren wir in unsere Kultur und unsere Betreuung.
Unseren Auszubildenden eine Stimme geben: Ihre Erfahrungsberichte zeigen, dass man gerne programmieren kann, ohne den Klischees zu entsprechen.
Unsere Werte hervorheben: Inklusion, Autonomie und Zusammenarbeit stehen im Mittelpunkt unserer Kultur.

Und vor allem zeigen wir jeden Tag, dass es kein “typisches Profil” gibt, um in der ICT erfolgreich zu sein.

Was schwierig bleibt

Trotz unserer Bemühungen ist der Anteil von Mädchen in unseren ICT-Lehrstellen nach wie vor gering, wie überall sonst in der Branche. Und das ist normal: Es braucht Zeit, um jahrzehntelange Stereotypen und Gewohnheiten zu ändern. Aber das ist kein Grund, aufzugeben.

Und jetzt?

Wenn du ein junges Mädchen bist und noch zögerst, wage den Sprung! Informatik ist nicht nur eine Frage von Codezeilen, sondern ein Beruf, der Kreativität, Zusammenarbeit und Einfluss erfordert. Und wenn du ein Unternehmen bist, frag dich, was du ändern kannst, um mehr Vielfalt anzuziehen. Jede Geste zählt.

Bei Liip werden wir weiterhin den Weg ebnen, eine Ausbildung nach der anderen. Denn eine inklusivere ICT ist eine bessere ICT.

Und was denkst du darüber? Entdecke unsere ICT-Ausbildungsangebote.

Liip tritt dem Verein eCH bei

Mon, 06 Oct 2025 00:00:00 +0200

Ein Bekenntnis zu offenen und gemeinschaftlich entwickelten digitalen Standards

Seit diesem Sommer ist Liip Mitglied des eCH-Vereins, einer 2001 gegründeten Schweizer Standardisierungsorganisation. eCH definiert Standards für E-Government, die von Datenmodellen und -formaten bis hin zu Schnittstellenbeschreibungen und technischen Richtlinien reichen. Damit fördert der Verein die digitale Zusammenarbeit zwischen öffentlichen Institutionen sowie mit Unternehmen und Privatpersonen. Wichtige öffentliche digitale Dienste wie E-Voting, E-MwSt. und E-Move basieren auf eCH-Standards. eCH fördert auch aktiv die Umsetzung und Anpassung internationaler Standards, beispielsweise für die Veröffentlichung von offenen Regierungsdaten, um die Interoperabilität zwischen Schweizer und ausländischen digitalen Systemen sicherzustellen.

Die Entwicklung von Standards spielt sowohl aus technischer als auch aus organisatorischer Sicht eine Schlüsselrolle für die Interoperabilität. Die eCH-Standards sind frei zugänglich und tragen dazu bei, technologische Silos zu vermeiden, die Datenqualität zu verbessern und die Harmonisierung von Verwaltungsprozessen zum Nutzen der Bevölkerung und der Institutionen zu fördern. Im Kern geht es bei der Interoperabilität darum, die Zusammenarbeit zu verbessern und nahtlosere digitale Dienste für alle Beteiligten zu schaffen.

Open Source für eine nachhaltige digitale Zukunft

Wir bei Liip sind fest davon überzeugt, dass offene Standards ebenso wie Open-Source-Software eine wesentliche Grundlage für eine nachhaltige und integrative digitale Transformation bilden.

Darüber hinaus haben wir uns für den Beitritt zu eCH entschieden, weil es sich um einen gemeinschaftsorientierten Verein handelt, der sich auf die tatsächlichen Bedürfnisse seiner Mitglieder konzentriert. Diese identifizieren und priorisieren neue Standardisierungsthemen und organisieren sich bei Bedarf in neuen Fachgruppen. Ausserdem entwickeln und pflegen die Mitglieder Standards. Und sie demonstrieren die Verwendung dieser Standards und fördern deren freiwillige Anwendung. Dieser Ansatz steht in vollem Einklang mit der agilen Methode von Liip zur Produkt- und Dienstleistungsentwicklung, bei der die Bedürfnisse der Endnutzerinnen immer an erster Stelle stehen. Dazu gehören Bürgerinnen, Unternehmen und Personen im öffentlichen Dienst.

"Als aktives Mitglied des Open-Source-Ökosystems spiegelt unser Engagement bei eCH unser Bekenntnis wider, die digitale Infrastruktur von morgen auf verantwortungsvolle und partizipative Weise aufzubauen."
— Charlotte van Ooijen Falce, Data Strategist unt eCH Coordinator bei Liip

Wir schliessen uns einer Gemeinschaft von über 200 kollektiven und 60 individuellen Mitgliedern an, die sich aus Bundes-, Kantons-, Stadt- und Gemeindeverwaltungen sowie Forschungsinstituten und zivilgesellschaftlichen Organisationen zusammensetzt.

"Liip ist ein wichtiger Akteur im Bereich E-Government-Dienstleistungen und bekannt für seinen offenen und gemeinschaftsorientierten Ansatz. Diese Philosophie steht in engem Einklang mit der von eCH. Wir heissen Liip als Mitglied herzlich willkommen und freuen uns auf die Zusammenarbeit."
— Denis Morel, Alliance Manager, eCH

Beitrag zur Gemeinschaft

Wir sind bereits zwei der über 20 Fachgruppen von eCH beigetreten: Open Government Data und Political Affairs. Beide Bereiche spiegeln unsere Werte Transparenz, Wiederverwendbarkeit von Daten und digitale Souveränität wider.

Open Government Data (OGD)

Aufbauend auf ihrer umfangreichen Arbeit an wegweisenden Schweizer Open-Data-Projekten wie opendata.swiss und opentransportdata.swiss vertritt Rae Knowler, Senior Software Developer, Liip in dieser Gruppe. Die Gruppe fördert die Nutzung von Open Government Data in der Schweiz mit dem Ziel, die Transaktionskosten zwischen Datenanbietenden, Vermittelnden und Nutzenden zu senken. Sie standardisiert auch die Angabe von Datenqualität, Aktualisierungshäufigkeit und Veröffentlichungszeiträumen, um Datennutzer*innen eine effizientere Qualitätskontrolle zu ermöglichen. Die Kernarbeit der Gruppe dreht sich um die Schweizer Anpassung von DCAT-AP, dem europäischen Metadatenstandard, der zur Beschreibung von Datensätzen des öffentlichen Sektors in einem einheitlichen und maschinenlesbaren Format verwendet wird. Der DCAT-AP-CH-Standard unterstützt die Veröffentlichung von offenen Regierungsdaten öffentlicher Institutionen in der ganzen Schweiz auf dem nationalen Portal opendata.swiss und damit auch auf dem europäischen Datenportal data.europa.eu.

Politische Geschäfte

Diese jüngste Fachgruppe von eCH, die im Juli 2025 ins Leben gerufen wurde, konzentriert sich auf die Entwicklung eines technischen Standards, der es den Parlamenten auf allen föderalen Ebenen ermöglicht, ihre bereits öffentlichen Daten zu Angelegenheiten wie Petitionen, Verordnungen, Gesetzen und Konsultationen in einem technisch einheitlichen und umfassenden Format zu veröffentlichen. Im Gegensatz zur OGD-Gruppe beginnt diese Gruppe ihre Arbeit bei Null, sodass die Datenwissenschaftlerin und Metadaten-Expertin Nataliia Kovalchuk von Liip einen völlig neuen Standard in einem Bereich mit grossem Potenzial für die Schweizer Demokratie mitgestalten kann.

Ausblick

Die Mitgliedschaft bei eCH ist nicht nur eine formale Mitgliedschaft. Sie ist eine Verpflichtung, die Zukunft der digitalen öffentlichen Dienste in der Schweiz mitzugestalten. Wir sind stolz darauf, zu dieser Mission beizutragen, indem wir unser Fachwissen teilen und mit gleichgesinnten Organisationen zusammenarbeiten, die an Offenheit, Transparenz und echte Wirkung glauben. Wir stehen bereits mit mehreren anderen eCH-Fachgruppen in Kontakt, um zu erkunden, wo wir den grössten Mehrwert schaffen können, und sind bestrebt, zu besseren E-Government-Standards für die Schweiz beizutragen.

Content matters: Messbarer Erfolg beim Tierspital Zürich

Fri, 03 Oct 2025 00:00:00 +0200

Viele setzen bei ihrem Webauftritt auf ein schönes Design und technische Qualität. Doch ohne passende Inhalte bleibt der Erfolg auch mit einer modernen Website aus. Content entscheidet, ob Informationen gefunden, verstanden und genutzt werden. Das Universitäre Tierspital Zürich war bestrebt, seine Website inhaltlich zu verbessern. Ziel war es, die richtigen Informationen so einfach wie möglich bereitzustellen.

Gemeinsam entwickelten wir eine passende Content-Strategie und richteten den Webauftritt des Tierspitals neu aus.

Die Nutzer*innen befragen

Inhalte auf einer Website müssen die Bedürfnisse und Erwartungen der Nutzer*innen erfüllen. Menschen besuchen eine Website mit einem klaren Ziel. Finden sie die gesuchten Informationen nicht, entsteht schnell Frust.

Am Universitären Tierspital Zürich haben wir Nutzer*innen gefragt, was sie von der Website benötigen und wo für sie die grössten Schwierigkeiten liegen. Dabei zeigte sich unter anderem, dass im Notfall klare Handlungsanweisungen fehlten, die Kontaktaufnahme teilweise schwierig war oder Hinweise zur Anfahrt zu versteckt waren. Auch berichteten die befragten Personen, dass sie es generell schwer fanden, sich auf der Website zurechtzufinden.

Einblicke durch Befragung machen die verschiedenen Bedürfnisse greifbar und bilden die Grundlage für konkrete Content-Massnahmen.

Content prüfen, Irrwege beseitigen

Auf vielen Websites entsteht über Jahre ein Flickenteppich. Eine wachsende Zahl von Texten und unterschiedliche Strukturen erschweren die Orientierung. Ein Content-Audit hilft, Ordnung zu schaffen. Dabei prüfen wir, welche Inhalte wir überarbeiten, ergänzen oder löschen müssen. Wir schauen auch, ob der Aufbau der Informationen den Bedürfnissen der Nutzer*innen entspricht.

Beim Tierspital zeigte sich zum Beispiel, dass die Seitenstruktur internen Abläufen folgte. Kategorien wie "Kleintiermedizin", "Kleintierchirurgie" oder "Intensivmedizin" sind für Fachpersonen sinnvoll, für Nutzer*innen jedoch schwer zu unterscheiden.

Nutzer*innen suchen in der Regel aus der Sicht ihres Tieres und ihres Anliegens. Zum Beispiel möchten sie wissen, was sie vor einem Termin am Tierspital beachten müssen.

Gemeinsam entwickelten wir eine neue Struktur, die sich an diesen Bedürfnissen orientiert. Das Ergebnis ist eine übersichtliche Website, die Schritt für Schritt zu den wichtigen Informationen führt.

Neben der Struktur der Inhalte sorgt auch Konsistenz für einen professionellen Webauftritt. Die einzelnen Seiten des Tierspitals waren unterschiedlich gestaltet und ergaben kein stimmiges Bild. Ein Leitfaden mit Content Principles schafft hier Klarheit. Er definiert, wie Inhalte formuliert, aufgebaut und gestaltet werden.

Für das Tierspital haben wir einen solchen Leitfaden entwickelt. Er wird in der täglichen Arbeit eingesetzt und sorgt dafür, dass die Website trotz vieler Seiten wie aus einem Guss wirkt. Das erleichtert es Nutzer*innen, sich besser zurechtzufinden.

Zahlen sprechen lassen mit Analytics

Doch wie weiss man, ob die neue Content-Strategie funktioniert oder nicht? Hier kommen Analytics ins Spiel. Sie messen die Performance der Inhalte und machen sichtbar, wie sich Nutzer*innen auf der Website bewegen.

Für das Universitäre Tierspital war entscheidend, ob die Umstrukturierung der Inhalte das Ziel erreicht hat: die richtigen Informationen so einfach wie möglich bereitzustellen. Zudem war es ihnen ein Anliegen, ein möglichst einfaches Tool für die Auswertung zu erhalten.

Webstatistiken zu verstehen ist für Laien oft anspruchsvoll. Was wir brauchten, war eine simple Übersicht mit den Zahlen, die wirklich relevant für uns sind.

Stephanie Scharnitzki, Digitale Kommunikation & Social Media, Universitäres Tierspital Zürich

Wir haben deshalb für das Tierspital ein Dashboard erstellt, das nur die notwendigen Kennzahlen enthält – verständlich und unkompliziert. Die Zahlen zeigen: Zuvor schwer zugängliche Informationen wie Kontakt, Anfahrt oder Preise werden nun oft und gezielt angeklickt. Das beweist, dass die neue Struktur funktioniert.

Der Zugriff auf unsere Website ist signifikant gestiegen. Neu zur Verfügung gestellte Seiten und Links werden rege genutzt. Dazu gehören auch die Inhalte für Tierärztinnen und Tierärzte. Sie können jetzt leichter Tiere an uns überweisen.

Stephanie Scharnitzki, Digitale Kommunikation & Social Media, Universitäres Tierspital Zürich

Analytics helfen jedoch nicht nur, den Erfolg zu prüfen. Sie liefern auch wertvolle Hinweise für neue Massnahmen. Das Tierspital hat zum Beispiel festgestellt, dass 60 Prozent der Nutzer*innen mit dem Smartphone auf die Website zugreifen. Neue Inhalte müssen also konsequent auch für die Nutzung am Handy funktionieren.

Content & Analytics: Ein Dream-Team

Content ist mehr als nur Text auf einer Website. Content sorgt dafür, dass Informationen verständlich und leicht zu finden sind. Analytics zeigen, ob eine Content-Strategie aufgeht und wie die Inhalte weiterentwickelt werden können.

Das Projekt mit dem Universitären Tierspital Zürich verdeutlicht: Wenn relevante Inhalte und aussagekräftige Daten zusammenspielen, entsteht eine Website, die langfristig überzeugt.

Die neue Website hat sich um 180 Grad gewandelt. Sie strahlt aus, wofür wir als Tierspital stehen: Expertise und Innovation in der Tiermedizin. Ich bin stolz, dass wir das erreicht haben.

Stephanie Scharnitzki, Digitale Kommunikation & Social Media, Universitäres Tierspital Zürich

Museum für Gestaltung Zürich – digital neu erleben

Tue, 23 Sep 2025 00:00:00 +0200

Die Ausgangslage in drei Punkten zusammengefasst

Ein Museum, drei Standorte: das Museum für Gestaltung Zürich sah sich mit der Herausforderung konfrontiert, dass Nutzer*innen die einzelnen Standorte nicht klar wahrgenommen haben. Nebst dem Hauptgebäude an der Museumstrasse, kuratiert das Haus auch noch Räumlichkeiten im Toni-Areal und in den Sommermonaten den Pavillon Le Corbusier, am Zürichsee.
Veranstaltungen, aktuell, divers und vielfältig: Nutzer*innen wussten oft nicht über die Vielfältigkeit der Veranstaltungen Bescheid. Nebst den grossen, lang andauernden Ausstellungen gibt es immer auch eine Vielzahl von kleinen, spannenden und aktuellen Führungen, Exkursionen und Gesprächen.
Zielgruppen, heterogen und bedürfnisorientiert abholen: die Zugänglichkeit und Ansprache für verschiedene Zielgruppen musste genauer unter die Lupe genommen und analysiert werden. Mit UX geht’s!

Designreduktion vs. digitale Funktion
Wenn UX und UI im Einklang aufeinander abgestimmt sind, entsteht ein intelligentes und zeitloses Design System. Um das zu gewährleisten, mussten jedoch verschiedene Herausforderungen und Bedürfnisse in diesem Bereich vorgängig angeschaut und diskutiert werden: Wie viel Reduktion im UI-Design akzeptieren Nutzer*innen? Wie viel können wir weglassen, damit die Funktionen sichtbar bleiben? Wie können wir eine optimale und immer aktuelle Orientierung schaffen? Wie machen wir das Museumserlebnis digital auf eine Art und Weise erlebbar, dass die Plattform dem Inhalt nicht die Show stiehlt? Wie können wir eine gemeinsame Grundlage erarbeiten, damit bei diesem visuell ambitionierten Kunden das Verständnis für die Beweglichkeit einer Website Gehör findet? UX und UI Design zählen zu unseren Kernkompetenzen. In diesem Projekt war es entscheidend, visuelle Ansprüche und Nutzer*innen Bedürfnisse gleichwertig zu berücksichtigen – ohne eine Disziplin über die andere zu stellen: wie also bündeln wir all diese Bedürfnisse zugunsten der Nutzer*innen?

Die Sprache des anderen verstehen und übersetzen
Wir haben unser ursprünglich erlerntes Wissen aufgefrischt und mit einer analogen Recherche begonnen, waren in Bibliotheken, haben uns die charakteristischen Merkmale der Schweizer Grafik zu Herzen genommen und nach Funktionalität, klaren Rastern, Minimalismus, Präzision, der Kombination von Text und Bild gearbeitet. Zudem konnten wir anhand von Workshops mit verschiedenen Stakeholdern und Entscheidungsträgern eine gemeinsame Formensprache und ein reflektiertes Design System erarbeiten, welches zu jedem Zeitpunkt Orientierung ermöglicht.

Förderung und Sensibilisierung für die digitale Transformation
Unsere Aufgabe bestand unter anderem darin, analoge Denkmuster in eine digitale Sprache zu übersetzen und den Kunden für diesen Wandel mit all seinen Möglichkeiten, aber auch Grenzen zu sensibilisieren. Dabei haben wir darauf geachtet, die Bildgalerie konsequent an das streng definierte und minimalistische Raster anzupassen. Wir haben bewusst nur drei Schriftgrössen verwendet, um klare Hierarchien zu schaffen. Texte haben wir häufig mit ergänzenden Bildern kombiniert, um die Vielfalt des Inhalts sichtbar zu machen und sicherzustellen, dass das Museum auf unterschiedlichsten Anzeigeflächen nichts von seinem Erlebnischarakter, seiner emotionalen Wirkung und seiner Präsenz einbüsst.

(Das Headerbild gehört rechtlich dem Museum für Gestaltung Zürich)