Die Herausforderung
Die Gründerinnen sahen einen Markt voller Marketingversprechen und sehr wenig objektivem Signal. Bestehende Apps bewerteten Produkte oft mit undurchsichtigen Regeln, die jeden Inhaltsstoff identisch behandelten — unabhängig von Rolle, Funktion oder Konzentration. Das Resultat: zwei sehr ähnliche Formulierungen erhielten in unterschiedlichen Diensten stark abweichende Bewertungen, was das Vertrauen in jegliche Bewertung untergrub.
Der Auftrag war, etwas wissenschaftlich Verteidigbares zu bauen: eine kuratierte Inhaltsstoff-Datenbank mit belegten Bewertungen, ein Scoring-Modell, das Rolle und typische Konzentration einbezieht, und eine Produktschicht, die daraus eine klare Note für Konsumentinnen und Konsumenten macht — ohne die Begründung zu verstecken.
Unser Vorgehen
Wir haben die Plattform als Multi-Tenant-SaaS über unsere Custom-SaaS-Entwicklung gebaut, die Analyse-Pipeline wurde von unserem Machine-Learning-Team spezifiziert. Die Datenbasis war die erste Priorität — eine Inhaltsstoff-Datenbank mit versionierten Bewertungen, Quellverweisen wo möglich und einem klaren Eskalationspfad für mehrdeutige Einträge.
Das Scoring kombinierte einen deterministischen Kern mit KI-Unterstützung. Deterministische Regeln steuern sicherheitskritische Bewertungen und bekannte Wechselwirkungen, sodass dieselbe Eingabe immer dieselbe Ausgabe liefert. KI kommt an zwei Stellen zum Einsatz: bei der Aufnahme von Etikettendaten in eine normalisierte Repräsentation, mit der die Regeln arbeiten können, und bei der Erklärungssprache, die Konsumentinnen und Konsumenten verstehen lässt, warum ein Produkt diese Note erhielt. Jeder KI-Schritt ging mit Evaluationsdaten und menschlichen Review-Queues in Produktion.
Die Roadmap wurde über unsere KI-Integrations-Beratung sequenziert, sodass das Team eine glaubwürdige v1 schnell ausliefern und Personalisierung sowie Brand-Analytik auf demselben Daten-Rückgrat ergänzen konnte.
Ergebnis
Die Plattform startete mit einer Datenbank, die den überwiegenden Teil gängiger Produkte in der Zielregion bewerten kann, und mit einem Scoring-Modell, das sich detailliert gegenüber kritischen Journalistinnen oder Markeninhabenden vertreten lässt. Frühes Konsumenten-Feedback hob konsistent die Transparenz der Begründung hervor — also genau das Vertrauenssignal, das die Gründerinnen als Erfolgskriterium gesetzt hatten.
Die Plattform ist jetzt positioniert, in B2B-Analytik für Marken zu wachsen, die ihre Formulierungen am selben Modell vergleichen wollen.
Eingesetzter Stack
Dauer
rund 7 Monate für v1