Blog Liip

Façonner l’IA pour les personnes et la planète

Wed, 26 Nov 2025 00:00:00 +0100

IA et durabilité sont deux éléments contradictoires. Les LLM et les infrastructures d’IA ont un impact environnemental réel: forte demande énergétique, effets rebond et ombre climatique souvent invisibles au premier abord. Cependant, en tant que Liipers, nous sommes convaincus que l’IA peut être façonnée pour avoir un impact moindre et être plus responsable. Nous avons le devoir de le faire, pour nos clients, pour la société, et pour la pérennité de notre écosystème numérique.

Ce devoir a conduit Liip à publier les Lignes directrices sur la durabilité des produits intégrant l’IA. Pour l’instant, une version fonctionnelle est prête: elle sera testée dans les premiers projets et progressivement adoptée par les équipes.

Pourquoi nous avons lancé ce travail

La proposition initiale du projet posait bien le défi: les équipes travaillant sur des produits IA manquent souvent d’une checklist consolidée les aidant à limiter les impacts négatifs sur les personnes et la planète, tout en fournissant des résultats de haute qualité répondant aux attentes des clients.

L’objectif n’a jamais été de restreindre la créativité ou de ralentir la livraison. Il s’agissait plutôt de permettre aux développeurs, designers et stratèges de prendre des décisions éclairées, basées sur:

Offre et processus de projet
Valeur utilisateur
Optimisation technique
Pertinence UX
Considérations éthiques
Transparence
Durabilité numérique

En bref: de meilleurs produits pour les utilisateurs, avec un impact réduit, et un meilleur alignement avec la stratégie de l’entreprise.

Ce que les lignes directrices permettent aujourd’hui

Après plusieurs échanges et l’analyse de références existantes sur l’IA durable, nous disposons maintenant d’une première version prête à l’usage. Les lignes directrices offrent:

1. Des critères clairs pour un usage responsable de l’IA

Un ensemble structuré de 38 questions et vérifications à intégrer progressivement dans les projets.
Elles couvrent: le reporting d’impact, le choix des modèles, les considérations UX, la gestion des données, la transparence envers les utilisateurs, etc.
Certaines sont évidentes, certaines déjà appliquées, d’autres demanderont des efforts.

2. Un cadre pour l’amélioration continue

L’idée est simple: ajouter un seul nouveau critère dans un projet constitue déjà un progrès.
L’amélioration continue est intégrée aux lignes directrices depuis l’origine du projet.

3. Des actions “Essentielles” concrètes pour les projets IA

Dès la diffusion du brouillon interne, quatre pratiques essentielles se sont déjà imposées comme non négociables à court terme pour les projets GenAI:

Proposer des alternatives au niveau du choix des LLMs et de l'hébergements (open-source, efficacité énergétiques, tailles, ...)
Impliquer plus systématiquement nos designers pour affiner les parcours utilisateur et améliorer l’expérience.
Utiliser des outils de reporting d’impact et des cartes de performance (comme Ecologits) pour suivre l’empreinte de nos produits.
Fournir une feuille de route d’amélioration continue basée sur les lignes directrices pour la maintenance et les futures versions

Et en bonus, cette initiative s’inscrit pleinement dans la stratégie globale de durabilité de Liip.

Adoption précoce: du facultatif au systématique

Les lignes directrices sont progressivement utilisées dans les projets où l’usage de l’IA est suffisamment important pour bénéficier d’évaluations et d’optimisations d’impact. Cette phase de “lancement doux” permet aux équipes de:

évaluer les critères déjà remplis
identifier les points de friction
repérer des opportunités de proposer des services de durabilité aux clients
valider les recommandations destinées à devenir des pratiques standard

Cette intégration progressive est essentielle pour transformer le projet en standards pour Liip.

Vers la transparence et le progrès collectif: open-sourcer les lignes directrices

Une fois consolidées grâce aux retours de projets réels, notre objectif est d’open-sourcer les lignes directrices.
L’industrie de l’IA manque encore de standards clairs et actionnables pour des pratiques responsables; en partageant notre approche, nous voulons contribuer à un mouvement collectif vers des IA plus transparentes et moins impactantes environnementalement et collaborer avec d’autres acteurs engagés.

En parallèle, nous préparons le lancement bêta de Lowwwimpact, notre future plateforme d’évaluation de durabilité web.
Un module dédié aux pratiques durables pour l’IA est prévu, et les premiers utilisateurs peuvent déjà s’inscrire sur la liste d’attente:
👉 Lowwwimpact.com

Les entreprises ou individus souhaitant collaborer, tester les lignes directrices ou contribuer à leur prochaine version peuvent s’inscrire dès maintenant pour rejoindre le premier groupe de test.

La suite

Dans les prochains mois, nous allons:

Consolider les critères et la documentation en fonction des retours des projets
Poursuivre l’amélioration continue
Recueillir les retours de partenaires intéressés
Préparer la mise à disposition open-source
Intégrer les lignes directrices dans Lowwwimpact via un chapitre dédié à l’IA

Ce projet a commencé avec une idée simple: aider nos équipes à faire des choix plus conscients lors de la création de produits digitaux alimentés par l’IA. Aujourd’hui, il est devenu un effort inter-cercles, aligné avec notre stratégie de durabilité et générant de nouvelles formes de valeur pour les clients, qu’il s’agisse d’optimisation, de transparence, d’éthique ou d’opportunités de nouvelles fonctionnalités.

Si vous souhaitez rejoindre cette aventure, parlons-en!

De la gestion plutôt que de la magie

Mon, 24 Nov 2025 00:00:00 +0100

Introduction: le risque invisible

Les hallucinations, c’est-à-dire des affirmations générées par un LLM mais factuellement incorrectes, comptent parmi les risques les plus critiques dans l’utilisation de l’IA générative (pour le thème de la confiance, voir aussi mon autre article.)

Les systèmes RAG (Retrieval Augmented Generation), souvent présentés comme solution contre les hallucinations, introduisent en réalité de nouvelles sources d’erreurs. Ils promettent d’appuyer leurs réponses sur tes propres données fiables, mais peuvent malgré tout se tromper dangereusement.

La bonne nouvelle: les hallucinations ne sont pas une fatalité technologique. Elles sont avant tout un problème de qualité des données et d’architecture, donc un problème contrôlable

Que sont les hallucinations et pourquoi sont-elles dangereuses?

On parle d’hallucination quand un LLM génère des faits incorrects, mais les présente avec beaucoup de confiance et de conviction. Contrairement à une «simple» erreur, les hallucinations sont particulièrement problématiques, car elles:

semblent plausibles: la réponse paraît parfaitement adaptée et sonne autoritaire.
sont stylistiquement correctes: formulation, ton et structure paraissent professionnels.
sont difficiles à repérer: même des expert·e·s peuvent les manquer en lisant rapidement
abusent de la confiance: les utilisateur·rice·s supposent que le système se base sur des données vérifiées

Les exemples concrets ne manquent pas: sources inventées, articles de loi erronés ou étapes de processus entièrement imaginées.

Comment les hallucinations apparaissent-elles techniquement?

Un Large Language Model (LLM) fonctionne en prédisant le mot le plus probable à partir du contexte précédent. Son objectif est de fournir une réponse en évitant de dire «Je ne sais pas».

Cela crée un problème fondamental: Même lorsque les informations nécessaires sont incomplètes, voire inexistantes, le modèle va produire une réponse. C’est précisément là que naissent les hallucinations.

Pour contrer cela de manière systématique, deux stratégies de base existent:

Fournir du contexte:
En fournissant le bon contexte pertinent (par ex. via RAG), on augmente la probabilité que le modèle s’appuie sur des informations correctes et génère une réponse correcte.
Reconnaître les cas out-of-distribution / «Je ne sais pas»:
Quand une demande dépasse le domaine de connaissances, le système doit le reconnaître et ne pas répondre, plutôt que d’inventer quelque chose de faux ou incertain.

Systèmes RAG: promesses et réalité

Les systèmes RAG sont censés adresser exactement ce problème. Leur logique:

Au lieu de laisser le LLM répondre uniquement avec son «savoir appris du monde»,
le système cherche d’abord dans une base de connaissances (spécifique au·à la client·e) les informations pertinentes
et le LLM formule ensuite la réponse sur la base des documents trouvés et du prompt

Un RAG bien conçu peut réduire massivement les hallucinations.
Un RAG mal conçu ajoute de nouvelles sources d’erreurs et rend le débogage bien plus difficile.

Sources typiques d’erreurs dans les systèmes RAG

Problème 1: le retrieval échoue

Avant que le LLM ne réponde, il doit recevoir les documents pertinents. C’est là que beaucoup d’erreurs fondamentales se produisent:

Les informations pertinentes ne sont pas trouvées:

Les algorithmes de recherche ne reconnaissent pas certains documents pourtant essentiels
Du contenu important est caché dans des tableaux, des PDF ou des fichiers mal structurés et n’est pas ou mal capturé
Le contexte du LLM est saturé d’informations inutiles, les informations vraiment pertinentes se perdent

Des documents obsolètes ou non pertinents sont utilisés:

Le système récupère par exemple un communiqué de presse de 2019, totalement dépassé
Des informations contradictoires provenant de sources différentes se retrouvent dans le même contexte

Les particularités du domaine ne sont pas représentées:

Les embeddings ne capturent pas des distinctions essentielles du domaine
Exemple: sur un site administratif, «s’annoncer» signifie presque toujours «annoncer son domicile à l’office des habitant·e·s», pas «s’inscrire à un cours de salsa».

Résultat: le LLM utilise un contexte faux ou incomplet – et hallucine en toute confiance.

Problème 2: l’étape de génération interprète mal

Même si le retrieval fonctionne correctement et fournit les bons documents, le LLM peut mal interpréter l’information:

Mauvaise interprétation:

Le LLM ne saisit pas les nuances d’un texte juridique
Des conditions («Si X, alors Y») deviennent des règles absolues
Des exceptions sont ignorées ou trop généralisées

Combinaisons d’informations inadmissibles:

Le LLM combine des informations provenant de différents documents de manière créative, mais incorrecte
Il «déduit» B à partir de A alors que ce lien n’est pas valable
Il tente de «mettre à jour» des informations obsolètes et se trompe

Compléments issus du savoir général:

Le document trouvé ne répond qu’en partie à la question
Le LLM complète les parties manquantes avec son savoir général
Le résultat est un mélange de faits vérifiés et de contenu inventé

Nous avons très peu de contrôle direct sur cette étape de génération. Nous pouvons seulement choisir un modèle adapté et optimiser le prompt. Cela rend tout ce qui précède et suit encore plus important.

Trois stratégies essentielles pour réduire les risques

Si les hallucinations sont avant tout un problème d’architecture et de qualité des données, alors on peut aussi les combattre de manière systématique. Trois stratégies sont, selon notre expérience, essentielles:

1. La qualité des données comme fondation

Un système RAG est aussi bon que les données auxquelles il accède
L’ancien principe IT s’applique parfaitement: Garbage in, garbage out.

Principes clés:

Alignement sur les besoins réels:
Tout ce qui se trouve sur l’intranet n’aide pas à répondre aux questions des utilisateur·rice·s.
La base de connaissances doit s’aligner sur les cas d’usage, pas sur la structure de dossiers de l’organisation.
Enrichir les documents:
Les documents doivent souvent être découpés pour entrer dans un LLM.
Du contexte se perd facilement Il doit être ajouté explicitement (métadonnées, titres, champs de validité).
Assurer l’actualité – Once Only:
Les informations doivent être gérées une seule fois, de manière centralisée.
Des copies multiples rendent la cohérence quasi impossible.
Pour un système RAG, cela signifie: des «single sources of truth», pas cinq versions légèrement différentes du même processus.

2. Mécanismes de fallback et logique d’incertitude

Un bon système sait quand il ne sait pas et agit en conséquence.
Notre principe: mieux vaut un «Je ne peux pas t’aider» conservateur qu’une réponse inventée.

Concrètement:

Définir des seuils d’incertitude:
- Seuils sur différentes étapes du retrieval (distance vectorielle, score de pertinence)
- En dessous: aucune réponse, mais un message transparent pour l’utilisateur·rice
Routing pour les thèmes critiques:
- Déterminer les thèmes «critiques» (impôts, santé, droit – dépend du·de la client·e).
- Pour ces thèmes: fallbacks prédéfinis, par ex. «Je ne peux pas calculer ta charge fiscale. Merci d’utiliser le calculateur officiel.»
Marquer clairement l’out-of-scope:
- Quand un sujet dépasse la base de connaissances, le système doit le dire clairement – au lieu de répondre avec du demi-savoir.

3. Donner du pouvoir aux utilisateur·rice·s, ne pas les tromper

Même si on pouvait réduire techniquement les hallucinations, le langage reste ambigu.
Exemple: «Mon chien m’a apporté une balle. Je l’ai shootée.», quoi exactement a été shooté? Le langage n’est jamais 100 % clair.

Cela signifie: aucune question ne pourra jamais être répondue 100 % correctement. Donc:

a) Indiquer les sources pour chaque réponse

Montrer les documents utilisés
Lier précisément (tableau, section, paragraphe)
Indiquer quand une réponse combine plusieurs sources

b) Rendre visibles les confidence scores

Où possible, indiquer de manière simple le niveau de confiance du système.
À long terme: mieux quantifier et visualiser ces scores.
Entre-temps: mieux vaut un indicateur simple et honnête qu’une précision trompeuse.

c) Des disclaimers honnêtes, pas du marketing

La meilleure technologie ne sert à rien si les utilisateur·rice·s font confiance aveuglément.

Écrire clairement dans l’interface: «Ce système peut se tromper.»
Expliquer ce que le système peut faire et ce qu’il ne peut pas
Éviter un discours marketing qui crée de fausses attentes
Éviter aussi le jargon juridique que personne ne lit
L’objectif: une communication honnête et compréhensible.

Une IA responsable, c’est possible

Pour moi, trois points sont essentiels:

Les hallucinations sont contrôlables:
Elles ne sont pas un destin inévitable, mais le résultat de la qualité des données et de l’architecture. Les deux sont entre tes mains.
La transparence vaut mieux que la perfection:
Tu ne pourras jamais éviter 100 % des hallucinations.
Mais tu peux concevoir ton système pour que les utilisateur·rice·s puissent reconnaître, comprendre et gérer les erreurs.
C’est aussi un sujet de management, pas seulement d’ingénierie:
Les décisions importantes (qualité des données, processus, responsabilités) doivent être prises au niveau managérial, pas uniquement par l’équipe IT.

L’utilisation de chatbots RAG comporte chances et risques.
Celles·ceux qui comprennent les risques et les adressent systématiquement peuvent saisir les opportunités – de manière responsable et sûre.

Pas de valeur sans confiance

Sun, 09 Nov 2025 00:00:00 +0100

Le problème principal

Imagine que tu as développé un chatbot. Le système tourne, les premières démos sont prometteuses, les parties prenantes sont enthousiastes. Trois mois après le lancement, tu regardes les statistiques d’utilisation… et elles sont décevantes. Les gens utilisent à peine le bot et quand c’est le cas, surtout pour des questions triviales.

Que s’est-il passé?

Le problème n’est pas que le bot donne de mauvaises réponses, mais que personne ne lui fait confiance. Un chatbot auquel on ne fait pas confiance ne fait pas gagner du temps, il en fait perdre. Les utilisateur·rice·s doivent vérifier chaque réponse, recouper, chercher ailleurs. Dans ce cas, il est du coup plus simple de fouiller directement dans les documents.

La confiance n’est pas un «nice to have», mais la condition de base pour l’adoption. Et la confiance ne naît pas de grandes promesses ou de jolis screenshots. Elle naît d’une qualité démontrable et mesurable, par l’évaluation.

Le client doit savoir ce qu’il veut

Quand je parle de chatbots avec des client·e·s, j’entends souvent: «nous voulons que le bot donne de bonnes réponses.»

Ça paraît raisonnable, mais comme exigence, c’est beaucoup trop flou. Qu’est-ce que «bon» veut dire, au juste?

Le bot doit-il plutôt donner une réponse incomplète mais correcte, ou une réponse détaillée avec 95% de justesse?
A-t-il le droit de dire «Je ne sais pas», ou doit-il toujours essayer de répondre?
Quel ton est souhaité: factuel-formel ou plutôt chaleureux-personnel?
Comment gère-t-il des informations contradictoires dans les sources?
À quel niveau de détail les réponses doivent-elles être: simple résumé ou information complète?

Ces questions, à priori banales, définissent si un chatbot est «bon» ou non. Souvent, les client·e·s ignorent leur besoin, jusqu’au moment de voir de mauvais exemples. C’est pour ça que l’on a besoin d’évaluations humaines.

Évaluations humaines: vraiment comprendre le client

Passons au concret. Les exigences sont clarifiées, le périmètre est défini. Il s’agit maintenant de comprendre ce que «bon» veut dire dans la pratique. Mais comment le découvrir?

La réponse: d’abord manuellement.

Je sais, dans un monde d’IA, de "LLM-as-a-Judge" et de métriques automatisées, ça paraît un peu old school. Mais on ne peut pas construire une évaluation automatisée si l’on ne sait pas ce qu’il faut évaluer. Et ça, on ne le découvre qu’en laissant de vraies personnes évaluer de vraies réponses.

Constituer un jeu d’évaluation et définir les dimensions de qualité
D’abord, il faut des questions représentatives, entre 50 et 200, idéalement de vraies questions d’utilisateur·rice·s. Pas les exemples de démo faciles, mais des questions du quotidien:

Questions standard fréquentes: «comment puis-je me connecter?», «où se trouve l’urgence?»
Cas limites: «quand dois-je saisir mes vacances en tant qu’employé·e de l’administration?», «donne-moi une bonne recette de pizza»
Questions ambiguës: «comment puis-je me connecter?»
Questions qui ne peuvent pas être répondues à partir des documents: «Berne est-elle meilleure que Bâle?», «Qui est Margaret Thatcher?»

Pour chaque question, une réponse est générée. En parallèle, l’équipe principale (et idéalement d’autres parties prenantes) définit les dimensions d’évaluation, toutes les dimensions n’ayant pas la même importance dans chaque contexte.
En général, nous utilisons les critères suivants:

Exactitude: l’information est-elle correcte? Existe-t-il seulement un vrai/faux
Exhaustivité: l’information est-elle complète? Des aspects importants manquent-ils?
Tonalité: le ton correspond-il à ce que nous voulons? (Pour ça, Textmate peut aussi être très utile.)

Évaluer

Vient ensuite la partie fastidieuse: plusieurs personnes évaluent chaque paire question–réponse selon les dimensions définies.

Bon/pas bon: pour chaque dimension, on décide si la réponse est «bonne» ou non.
Justification: chaque évaluation doit être justifiée. Ça peut sembler lourd, mais c’est essentiel: c’est comme ça qu’émerge une compréhension commune de ce qui est «bon».
Évaluation à l’aveugle: les évaluateur·rice·s ne devraient pas voir ce que les autres ont noté. Si les résultats divergent fortement, c’est que les critères sont trop flous.
Discussion: en cas de divergences, une discussion commune aide. Ces échanges sont souvent la partie la plus précieuse du processus.

Après 50 à 100 exemples évalués, on obtient une image claire de la situation de départ et, la plupart du temps, aussi de ce qu’il reste à faire.

Les outils pour passer à l’échelle supérieure

Mais l’évaluation manuelle a ses limites quand il s’agit de passer à l’échelle supérieure. En effet, évaluer 100 questions à la main, c’est faisable. 1'000, c’est pénible. 10'000 en monitoring continu? Mission impossible.
C’est là que les outils entrent en jeu.

"LLM-as-a-Judge": le principe

L’idée est simple: un LLM évalue les réponses du chatbot selon des critères définis. En résumé, il lui faut:

La question
La réponse de ton système
Le gold standard (à quoi la réponse devrait idéalement ressembler)

L’«évaluateur» fournit ensuite un verdict et une justification.

Le plus gros risque: remplacer un problème (évaluer le chatbot) par un autre (évaluer l’évaluateur). C’est pour ça que l’évaluation automatisée doit être calibrée. Pour cela, nous prenons en général 50 à 100 exemples évalués manuellement et les soumettons en plus au LLM. Si les résultats concordent, le Judge fonctionne de manière fiable.

Ensuite commence l’amélioration continue, mais nous en parlerons une autre fois. Au bout de ce cycle d’améliorations vient le grand moment: le go-live.

Go-live et monitoring continu

Nous recommandons de faire le go-live sans grande annonce dans un premier temps. Ainsi, le chatbot peut être encore amélioré au cours des premiers jours, sur la base des vraies questions des utilisateur·rice·s.

Le travail n’est pour autant pas terminé: l’évaluation continue est essentielle. Des métriques particulièrement utiles sont par exemple:

La part de questions non répondues
La groundedness (en gros: le bot hallucine-t-il ou les faits proviennent-ils des sources?)
Des échantillons contrôlés par des humain·e·s, surtout en cas de mauvaise évaluation ou de manque de groundedness
Et pour finir, mais pas des moindres: le feedback des utilisateur·rice·s.

Avec des métriques faciles à comprendre, il est possible de surveiller sérieusement un chatbot, même avec 10'000 questions ou plus, sans devoir vérifier chaque question individuellement.

L’évaluation n’est pas un «nice to have»

La différence entre un chatbot qui fonctionne et un chatbot qui foire ne réside pas dans le meilleur modèle d’embedding, dans le dernier LLM ou dans l’algorithme de retrieval le plus pertinent.
Elle réside dans la volonté d’investir du temps dans l’évaluation.

Dans des évaluations humaines.
Dans du monitoring automatisé.
Dans une amélioration continue.

C’est seulement ainsi que naît la confiance, à la base de toute adoption.

The Swiss eID from a developer perspective

Wed, 05 Nov 2025 00:00:00 +0100

On 28.9.2025, the laws to introduce an electronic ID in Switzerland have been accepted in a public vote. This law was a second, fixed attempt after the rejection in 2021. The first, refused, attempt proposed to let private companies run the infrastructure for the eID. The amended law now requires the government to operate that infrastructure itself.

In preparation of the law, a beta version of the proposed architecture has already been implemented. After that vote, I took a look at the beta implementation. Not only is it government operated, but it also is fully open source to allow anyone to verify the implementation. There is quite some documentation available. Some of the guides have not kept up with development - but i guess its called "beta" for a reason and development is moving fast.

The ecosystem consists of the "registry" (operated by the government) that is used to check certificates, the "wallet" app to contain IDs (called Swiyu), identity "issuers" (with the main one that issues the eID operated by the government, but the wallet can also store data from other issuers) and finally "verifiers" that ask for information.

Image: The architecture of the eID infrastructure. Source: swiyu

From a consumer perspective, the system is actually quite simple: My application specifies the fields it needs to know from an ID, my verifier service issues a QR code resp. deeplink for the eID wallet and if the wallet owner allows it, my application receives the requested values. Behind the scenes, there is quite a bit of complexity of course, which guarantees that my application can legally trust the answer just as well as in a physical interaction where I look at the customers passport.

The eID system has been built around data minimization. Rather than always giving access to the full information like with a physical passport, my application has to indicate the specific fields it requires, and the user is shown which fields they would reveil. Besides name, birthdate and other detailed facts, there are also flags like "is over 16 years old" (the minimum age to legally buy beer), "is over 18 years old" (legally adult, allowed to drive, allowed to buy strong alkohol) or "is over 65 years" (the age people usually retire in Switzerland). That way, the exchange can be restricted to the information that actually matters.

Requesting verified data

To get started, I had to set up the verifier application. The easiest way to run that application is to use their docker image. After a rather involved setup procedure of creating keys, uploading them to the base infrastructure and then getting a manual approval for Liip as a verifier in the eID infrastructure, I had the necessary credentials to configure the verifier. With that solved, the rest was quite simple: I can send web requests to my verifier, telling it which fields I want from the customer. Those requests consist of some boilerplate plus the list of fields to request, specified as paths:

"constraints": {
    "fields": [
        {
            "path": [
                "$.age_over_18"
            ]
        }
    ]
}

The response to this request is a verification URL that needs to be rendered as a QR code and presented to the wallet. (Or alternatively a deep link that opens the wallet for this verification, to be used when visiting the website on the mobile phone that has the wallet installed.) The user has to scan the code with the wallet app (or tap the deep link). The wallet app then prompts them to allow sharing this specific list of information. On confirmation, the app communicates with my verifier service to provide the information. Meanwhile, my application polls for the status of the verification. Once it succeeds, it can fetch the result, which contains a boolean for this example. I can also request texts like given name, family name or birthday, or even the portrait image. A full list of the available fields is in this catalog on admin.ch.

Image: Confirmation screen after scanning the QR code with the Swiyu App. Source: Screenshot with test profile

Conclusions

The Swiss eID provides a - from consumer perspective - simple way of asking a user to prove that they are of age, or to provide their name. The API is (once the setup is done) rather simplistic. The really spectacular part about this is that the information received is provided by the swiss government, securely validated and satisfies legal requirements. It has the same value as being shown a physical passport, but without having to show more information than necessary.

It remains to be seen if verifiers adhere to the data minimization or ask for to many details like full name or birthdate unnecessarily. As with the permissions management for mobile apps, a company could ask for too much and refuse to work with less. The swiyu app unfortunately does not offer to transfer less than the requested data. Hopefully the Swiss government consumer protection and data protection services can get companies to refrain from gathering unnecessary data.

Text-to-Template

Mon, 20 Oct 2025 00:00:00 +0200

A relaunch offers content momentum: large amounts of content need to be revised. To ensure high-quality results even in decentralized teams, Liip developed TextMate.

TextMate standardizes texts across the following dimensions:

Spelling & inclusion
Simplification
Content guidelines
Tone of voice

We built TextMate as a typical MVP: few features, thoughtful and effective.

For further development, we’re working on a more complex use case:
We don’t just revise existing content linguistically but have an LLM adapt text to specific page types.

Initial tests are positive. It’s important, however, to have 2–3 good text examples per page type written by a human. Based on these, the system can generate an initial draft that editors can refine.

The advantage: editors don’t start with a blank page—they begin with a first version they can improve.

Are you interested in this approach? Do you have your own use case you’d like to try it on?
Then feel free to get in touch with us!

The Details

How are we developing our MVP?

Anyone who works with an MVP knows this: as soon as the product is in use, the first requests for additional features arise. The key question for the product owner is: in which direction do we develop further? Where are our resources most effectively invested?

One of the most common requests we’ve heard for TextMate: automatically shorten texts.

Sounds simple—but it’s not. Because:

How much should the text be shortened? There’s no fixed answer.
Which variations should be offered? And how many?

The more flexibility we allow, the closer we get to free prompting. At a certain point, it makes more sense for editors to work directly with an AI chatbot like ChatGPT.

Another request, however, caught our attention—because it could save humans a lot of repetitive work:

After a test run with TextMate, Clemens Nef, Deputy Head of Communications of the Canton of St. Gallen, gave us detailed feedback. For him and his team, linguistic revision alone isn’t enough. They want structural optimization of content for their website.

Questions like:

How should the text be structured?
Which subheadings are needed?
Where do lists make sense?
Etc.

A legitimate request. Structure is so important because users scan content on the web—they rarely read linearly. Structure helps users find their way quickly. Search engines and LLMs also prefer well-structured content.

Structure Follows Page Type

But implementing this isn’t trivial either. Structuring isn’t a standardized process.

Websites that optimize user experience work with fixed page types—for example, overview pages, product pages, or team pages. The specific page type defines the structure for the content.

Working with page types is essential—especially for companies with many products, services, or topics. Through page types, we achieve consistency—a key to user satisfaction.

Content written for a page type must be consistent across multiple examples. Design is only the beginning: developing consistent textual and linguistic patterns is the next step—and it’s labor-intensive.

From Design to Text

At Liip, the workflow looks like this:

Design and content teams jointly develop the page types.
UX writers create the first examples—ideally based on existing content (e.g., from the old website).
Insights from this work help iteratively refine the design.
Based on the finalized page types, all further content is created—consistent in structure, content, and tone.

With each example written, we refine text and language patterns until they’re final. Then they must be applied consistently to all further examples.

In this process, humans do exactly what Clemens Nef wants TextMate to do:

We optimize page structure and linguistic patterns.
And apply them consistently across many pieces of content.

Once these patterns are defined, the task becomes repetitive—time-consuming (and therefore expensive) if done by UX writers. That makes it truly interesting to hand over to AI—or, as we say: safe enough to try.

Text-to-Template

We’re now working on automating part of this process through a prompt set:

The page type is still developed by design and content teams.
Then we translate the page type into a prompt set.
Our UX writers create several high-quality examples per page type, which are integrated into the prompt set.
We feed the system with existing content as a source—e.g., from the old website.
The system generates new text while applying the patterns of the chosen page type.
The result serves as a draft that editors can refine.

Initial Insights

Early tests are positive—it seems to work.

Here’s what we’ve learned so far:

The examples written by UX writers are crucially important.
The quality of the results also depends heavily on the amount of source content. If there’s very little text on the old website, the system naturally struggles—or fails—to generate high-quality, more detailed results.
Process optimization will be needed: a key value of the relaunch’s content momentum is that old content is questioned and improved. The system, as currently designed, only does this to a limited extent. Can we explicitly assign this task to editors in the process?
It’s likely that the description of the page type itself could also be created by an LLM.
For our next steps, we’re particularly interested in connecting this to the component library in Figma.

TextMate – Accessible Content, Efficient Workflows, Your Tone & Voice

Wed, 15 Oct 2025 00:00:00 +0200

Many organisations face the same challenge:
Website, social media or campaign content needs to be correct, accessible, inclusive and aligned with the brand’s tone of voice – and ideally produced without long detours. With TextMate, Liip has developed a smart tool that supports exactly that. Efficient, customisable and built for real-world use cases.

What is TextMate?

TextMate is an AI-powered tool for editing and optimising content – designed specifically for our clients’ content workflows. It runs in any browser and is intuitive to use.

Through a simple interface, users can paste in their text and, with one click, have it revised according to editorial standards – automatically, correctly, consistently, and in plain language.

Behind the scenes, a modular prompt set ensures maximum flexibility. It can be configured or expanded to meet different needs: plain language, inclusive wording, proofreading, condensed content, or brand-specific tone and style.

Textmate isn’t tied to any specific language model. We currently have excellent results with ChatGPT-based models, but the architecture is open and supports the integration of other LLMs.

The solution: TextMate

In large relaunch projects, content creation becomes a key bottleneck:

There’s simply too much content to write and revise in a reasonable time.
That’s why additional people – from internal departments or external teams – are brought in to help.
The result: content created by many contributors must still meet shared standards for clarity, tone, language level, and brand voice.
In such setups, the core content team often no longer creates content themselves – they spend all their time reviewing and aligning it.
This either leads to significant costs or compromised quality goals.

TextMate automates exactly this part of the process, making content work faster, leaner and more cost-effective:

No more centralised review needed: Even with many contributors, TextMate ensures the final content feels like it came from one voice.
High quality is maintained, even without a professional editorial team.
Multilingual setup is part of TextMate’s flexible configuration options.
Time-to-publish drops, internal resources are used more efficiently – and content costs go down, especially in high-volume scenarios.

In short: TextMate saves money, frees up resources and improves quality – all at once.

What can the TextMate do?

Depending on your needs, TextMate offers a range of content transformation modes. All prompt sets can be tailored to your organisation and specific use cases. The core capabilities include:

Proofreading: spelling, grammar, punctuation.
Consistent language: e.g. currencies, numbers, industry terms or punctuation – aligned with your Content Guidelines.
Accessible language: TextMate rewrites content to be clear and accessible, typically aiming for A2–B1 language level.
Inclusive language: wording is checked and adapted for inclusivity.
Concise language: long or redundant sections are shortened.
Brand-specific tone: optionally, TextMate can reflect your tone of voice and writing style guidelines.
Multilingual prompts: prompt sets can be configured for multiple languages – ideal for multilingual organisations.

Liip co-develops the prompt set with each client. After that, the system is tested and fine-tuned until it meets your needs.

Real-world use cases

Website relaunch with decentralised authorship

A company is planning a major website relaunch. Content is written by different internal teams, many without editorial experience. With TextMate, all contributions can be standardised quickly – no back-and-forth, no central rewrite. The result is consistent quality and voice across the board.

Ongoing content maintenance with high quality standards

An editorial team manages content across a platform. Every piece needs to be correct, accessible and brand-aligned. With TextMate, each article can be checked and optimised – a practical everyday assistant that handles routine tasks and offers peace of mind.

What’s next? A look ahead

Today, TextMate shines through simplicity: reduced to the max. It runs in any browser, and the interface focuses on doing one thing – and doing it well.
But the potential of LLMs for content work is just beginning. Here’s where we see future development:

Direct CMS integrations – e.g. for Drupal.
Automated content audits to identify outdated or underperforming content.
Template-based content creation for page types with fixed structures.
Content lifecycle management, so you never have duplicate, outdated or off-brand content again.

Our goal: to rethink content production – efficient, scalable, accessible, and always high quality.

Curious to see more?

We’re happy to show you TextMate in a live demo and discuss how it could fit into your workflow. With or without integration, in one or several languages – TextMate is flexible, powerful, and ready to use.

TextMate – for efficient content workflows where quality comes standard.

Credits

The exciting – and beautiful – thing about TextMate is that the initial idea came from a client (Christoph Zech, Digital Officer of the City of Winterthur), and a first version was developed as part of an innovation project with the City of Winterthur. Thank you for this fruitful partnership <3

Former plus de filles en ICT: un défi que nous prenons à cœur

Tue, 07 Oct 2025 00:00:00 +0200

L’ICT façonne nos vies: santé, mobilité, éducation, communication… Si seules certaines voix sont représentées dans le développement de ces solutions, on prend le risque de créer des produits biaisés ou qui ne répondent pas à tous les besoins.

Plus de diversité, c’est:

des points de vue différents
des équipes plus créatives
des produits plus justes et inclusifs

Ce n’est pas un “nice to have”, c’est une nécessité.

Quels freins aujourd’hui?

Les obstacles commencent bien avant l’apprentissage. Les stéréotypes persistent et l’informatique est encore trop souvent perçue comme un domaine masculin. Le manque de modèles féminins rend l’identification difficile et empêche de se projeter. Cette absence entretient l’autocensure, car de nombreuses jeunes filles continuent de penser que ce n’est pas pour elles. En conséquence, trop peu de candidatures féminines parviennent jusqu’aux entreprises et la diversité peine à s’installer.

Ce que nous faisons chez Liip

Nous ne prétendons pas avoir la solution miracle, mais nous essayons. Concrètement:

Journée Futur en tout genre: chaque année, nous ouvrons nos portes pour montrer aux jeunes filles à quoi ressemble réellement le métier d’informaticienne. L’idée: casser les clichés, donner envie, créer des déclics.
Étude MINT: nous participons à ce projet de recherche pour identifier ce qui attire (ou freine) les talents féminins. Résultats? L’importance de la flexibilité, de rôle-modèles féminins visibles, d’un langage inclusif et d’un bon feedback. Autant de points que nous intégrons dans notre culture et notre accompagnement.
Donner la parole à nos apprenties: leurs témoignages montrent qu’on peut aimer coder ET ne pas se conformer aux clichés.
Mettre en avant nos valeurs: inclusion, autonomie et collaboration sont au cœur de notre culture.

Et surtout, montrer au quotidien qu’il n’y a pas de “profil type” pour réussir dans l’ICT.

Ce qui reste difficile

Malgré nos efforts, la proportion de filles dans nos apprentissages ICT reste faible. Comme partout ailleurs dans la branche. Et c’est normal: changer des décennies de stéréotypes et d’habitudes prend du temps. Mais ce n’est pas une raison pour baisser les bras.

Et maintenant?

Si tu es une jeune fille qui hésite, tente l’aventure! L’informatique n’est pas qu’une histoire de lignes de code, c’est un métier de créativité, de collaboration et d’impact. Et si tu es une entreprise, pose-toi la question de ce que tu peux changer pour attirer plus de diversité. Chaque geste compte.

Chez Liip, nous continuerons à ouvrir la voie, un apprentissage après l’autre. Parce qu’une ICT plus inclusive, c’est une ICT meilleure.

Et toi, tu en penses quoi? Découvre nos offres d’apprentissage ICT.

Liip rejoint l’association eCH

Mon, 06 Oct 2025 00:00:00 +0200

Un engagement pour des standards numériques ouverts et communautaires

Depuis cet été, Liip est membre de l’association eCH, une organisation suisse de standardisation fondée en 2001. eCH définit des standards pour l’e-gouvernement, allant des modèles et formats de données aux descriptions d’interfaces et directives techniques. L’association facilite ainsi la collaboration numérique entre les institutions publiques, les entreprises et les particuliers. Des services publics numériques essentiels, tels que le vote électronique (e-voting), la TVA électronique (e-VAT) et les démarches administratives en ligne (e-move), reposent sur les standards eCH. eCH encourage également l’adaptation et la mise en œuvre de standards internationaux, notamment pour la publication des données ouvertes de l’administration (Open Government Data), afin d’assurer l’interopérabilité entre les systèmes numériques suisses et étrangers.

Le développement de standards joue un rôle clé pour garantir l’interopérabilité, tant sur le plan technique qu’organisationnel. Les standards eCH sont librement accessibles et permettent d’éviter les silos technologiques, d’améliorer la qualité des données et d’harmoniser les processus administratifs, au bénéfice de la population comme des institutions. Au cœur de l’interopérabilité se trouvent une meilleure collaboration et des services numériques plus fluides pour toutes les parties prenantes.

Open Source pour un avenir numérique durable

Chez Liip, nous croyons fermement que les standards ouverts, tout comme les logiciels open source, constituent une base essentielle pour une transformation numérique durable et inclusive.

Nous avons également choisi de rejoindre eCH parce qu’il s’agit d’une association communautaire qui s’attache aux besoins réels exprimés par ses membres. Ces derniers identifient et priorisent de nouveaux thèmes de normalisation et s’organisent en groupes spécialisés selon les besoins. Ils développent et maintiennent les standards, en démontrent l’usage et en promeuvent l’application volontaire. Cette approche s’aligne pleinement sur la méthode agile de Liip pour développer des produits et services, qui place toujours les besoins des utilisateurs finaux au premier plan, qu’il s’agisse de citoyen·nes, d’entreprises ou de collaborateur·rices de l’administration.

« En tant que membre actif de l’écosystème open source, notre engagement au sein d’eCH reflète notre volonté de construire l’infrastructure numérique de demain de manière responsable et participative. »
— Charlotte van Ooijen Falce, Data Strategist et eCH Coordinator chez Liip

Nous rejoignons ainsi une communauté de plus de 200 membres collectifs et 60 membres individuels, comprenant des administrations fédérales, cantonales, communales et municipales, ainsi que des instituts de recherche et des organisations de la société civile.

« Liip est un acteur clé des services d’e-gouvernement et se distingue par son approche ouverte et communautaire. Cette philosophie s’aligne parfaitement sur celle d’eCH. Nous sommes ravis d’accueillir Liip comme membre et nous réjouissons de collaborer ensemble. »
— Denis Morel, Alliance Manager, eCH

Contribuer à la communauté

Nous participons déjà à deux des plus de vingt groupes spécialisés d’eCH: Open Government Data et Affaires politiques. Ces deux domaines reflètent nos valeurs de transparence, de réutilisation des données et de souveraineté numérique.

Open Government Data (OGD)

S’appuyant sur leur travail pionnier pour des projets suisses de données ouvertes comme opendata.swiss et opentransportdata.swiss, Rae Knowler représente Liip dans ce groupe. Il promeut l’usage des données ouvertes de l’administration en Suisse afin de réduire les coûts de transaction entre producteurs, intermédiaires et utilisateurs de données. Le groupe normalise également la façon de déclarer la qualité, la fréquence de mise à jour et les délais de publication des données, pour permettre aux utilisateurs de mieux gérer la qualité. Le cœur du travail porte sur l’adaptation suisse de DCAT-AP, le standard européen de métadonnées qui décrit les jeux de données publics de manière cohérente et lisible par machine. Ce standard DCAT-AP-CH soutient la publication des données ouvertes des institutions publiques suisses sur le portail national opendata.swiss et, par ricochet, sur le portail européen data.europa.eu.

Affaires politiques

Ce groupe spécialisé, le plus récent d’eCH, a été lancé en juillet 2025. Il vise à développer un standard technique permettant aux parlements à tous les niveaux fédéraux de publier leurs données publiques, telles que pétitions, décrets, lois et consultations, dans un format techniquement cohérent et complet. Contrairement au groupe OGD, ce groupe part de zéro, ce qui permet à Nataliia Kovalchuk, data scientist et experte en métadonnées chez Liip, de contribuer à façonner un standard entièrement nouveau, avec un fort potentiel d’impact sur la démocratie suisse.

Perspectives

Rejoindre eCH n’est pas qu’une simple adhésion formelle. C’est un engagement à contribuer à façonner l’avenir des services publics numériques en Suisse. Nous sommes fiers d’apporter notre expertise et de collaborer avec des organisations partageant les mêmes valeurs d’ouverture, de transparence et d’impact concret. Nous sommes déjà en contact avec d’autres groupes spécialisés d’eCH pour identifier les domaines où nous pouvons apporter le plus de valeur et nous réjouissons de contribuer à de meilleurs standards d’e-gouvernement pour la Suisse.

Content matters: Measurable success at the Animal Hospital

Fri, 03 Oct 2025 00:00:00 +0200

Many organizations focus on design and technology when building their websites. But without the right content, even the most modern site falls short. Content determines whether information is found, understood and used. The University Animal Hospital Zurich set out to improve its website content with one clear goal: making the right information easy to find.

Together we developed a new content strategy and realigned the hospital’s online presence.

Interviewing users

Relevant content starts with understanding user needs. People visit a website with a clear goal in mind, and if they can’t find what they’re looking for, frustration quickly sets in.

We carried out interviews to better understand what different user groups expect from the website and where they encounter problems. The results highlighted a range of issues: missing emergency instructions, challanging contact processes, directions that were hidden away, and in general a lack of orientation across the site.

Such insights provide a clear picture of user expectations and set the foundation for content improvements.

Check content, eliminate dead ends

Over time, many websites turn into patchworks: a growing number of pages and inconsistent structures make navigation difficult. A content audit helps to bring order. It shows which pages should be revised, added or removed — and whether the overall structure truly matches user needs.

It became clear that the the structure of the Animal Hospital's website reflected internal workflows rather than the way visitors search. Categories such as “Medicine”, “Surgery” or “Intensive Care” make sense to specialists, but are confusing for most visitors.

Users typically approach the site from the perspective of their animal and their immediate concern. For example, what to prepare before an appointment. We redesigned the site architecture around these needs. The result is a clear, intuitive structure that guides visitors step by step to the information they need.

Consistency was another challenge. Previously, the hospital’s pages looked and felt different from each other, which made the site as a whole appear fragmented. A set of content principles now ensures clarity. These guidelines define how content should be written, structured and presented.

We created such guidelines for the hospital team, and it is now part of their daily work. It ensures that, despite the large number of pages, the site feels coherent and reliable, making it easier for users to find their way around.

Let the numbers talk with analytics

But how do we know if a new content strategy really works? This is where analytics come in. They measure performance and show how people interact with a website.

For the University Animal Hospital the key question was simple: Has the restructuring made the right information easy to find? In addition, it was important to them to have a tool that was straightforward to use.

Understanding web statistics can be difficult for non-experts. What we needed was a simple overview with only the numbers that really matter.

Stephanie Scharnitzki, Digital Communications & Social Media, University Animal Hospital Zurich

We therefore built a dashboard that displays just the essential metrics — clear and easy to use. The results revealed: important information that was previously hard to access, such as contact details, directions or prices, is now clicked frequently and directly. Proof that the new structure works.

Visits to our website have increased significantly. New pages and links are actively used. This also includes content for veterinarians. It is now much easier to transfer animals to us.

Stephanie Scharnitzki, Digital Communications & Social Media, University Animal Hospital Zurich

Analytics, however, are not just about measuring success. They also point the way to further improvements. For example, data revealed that 60 percent of visitors access the Animal Hospital's site via smartphone. That makes it clear that all new content must be optimized for mobile.

Content & Analytics: a dream team

Content is more than just text on a website. It ensures that information is clear, relevant and easy to find. Analytics make its impact visible. Together they show whether a content strategy is working and provide guidance for further development.

The project with the University Animal Hospital Zurich illustrates this perfectly: when high-quality content and meaningful data come together, the result is a website that persists in the long term.

The new website has completely transformed. It now reflects what we stand for as a hospital: expertise and innovation in veterinary medicine. I am proud of what we have achieved.

Stephanie Scharnitzki, Digital Communications & Social Media, University Animal Hospital Zurich

Museum für Gestaltung à Zürich - Découvre le design sous une nouvelle lumière digitale

Tue, 23 Sep 2025 00:00:00 +0200

La situation initiale résumée en trois points
Un musée, trois sites : Le Museum für Gestaltung de Zürich faisait face à un défi de taille : de nombreu·x·ses visiteur·euse·s ignoraient qu’il s’étendait sur plusieurs lieux. En plus du bâtiment principal situé sur la Museumstrasse, le musée gère également des espaces au Toni-Areal ainsi que, durant les mois d’été, le Pavillon Le Corbusier au bord du lac de Zurich.

Des événements variés, actualisés en continu : Beaucoup d’utilisatrice·teur·s ne connaissaient pas la diversité de l’offre culturelle. En plus des principales expositions de longue durée, le musée propose en permanence une multitude d’événements plus modestes, mais passionnants et actuels, tels que des visites guidées, des excursions ou des discussions.

Répondre aux besoins d’un public varié : Pour mieux s’adresser à des publics multiples, il a fallu analyser et retravailler en profondeur l’accessibilité et la communication inclusive. L’UX a été un levier essentiel dans cette démarche.

Réduction du design vs fonction numérique
Lorsque l’UX et l’UI sont en parfaite harmonie, il en résulte un système de design intelligent et intemporel. Mais pour y parvenir, plusieurs questions ont dû être soulevées : jusqu’où peut-on aller dans la réduction visuelle de l’UI sans perturber l’usage ? Que peut-on éliminer sans compromettre la visibilité des fonctions essentielles ? Comment garantir une orientation fluide et constante pour tou·te·s ?
Et surtout : comment faire vivre une expérience muséale digitale qui valorise le contenu sans le détourner ? Avec un·e client·e à l’ambition visuelle affirmée, nous avons travaillé main dans la main pour construire une compréhension commune de ce que signifie la flexibilité numérique.
Le design UX et UI fait partie de nos compétences clés. Dans ce projet, il a été crucial de répondre à la fois aux attentes esthétiques et aux besoins des utilisatrice·teur·s, sans hiérarchiser l’un au détriment de l’autre. Le véritable défi était donc le suivant : comment réunir toutes ces exigences pour offrir la meilleure expérience possible à chacun·e ?

Comprendre et traduire le langage de l'autre personne
Nous avons rafraîchi notre savoir en design graphique et commencé par une recherche analogique, en explorant des bibliothèques et en replongeant dans les racines du graphisme suisse. Notre travail s’est concentré sur la fonctionnalité, les grilles strictes, le minimalisme, la précision et l’interaction réfléchie entre texte et image.
Grâce à une série d’ateliers collaboratifs avec les parties prenantes et les décisionnaires du musée, nous avons élaboré un langage visuel partagé et un système de design réfléchi, garantissant clarté et orientation à chaque étape du parcours.

Encourager et sensibiliser à la transformation numérique
L’une de nos missions principales consistait à traduire des schémas de pensée analogiques en langage digital, tout en accompagnant notre client·e dans cette transformation, en soulignant autant les opportunités que les limites.

Nous avons veillé à ce que la galerie d’images respecte rigoureusement un système de grille défini. Pour renforcer la hiérarchisation et la lisibilité, nous avons volontairement utilisé seulement trois tailles de police. Les textes ont souvent été associés à des visuels complémentaires, afin de refléter la richesse du contenu du musée, tout en s’assurant que l’expérience, l’émotion et la présence du musée restent intactes, quel que soit le format d’écran.

(L'image d'en-tête est la propriété légale du Museum für Gestaltung Zürich)