this post was submitted on 11 Sep 2024
13 points (100.0% liked)

Technik

297 readers
3 users here now

die Community für alles, was man als Technik beschreiben kann

Beiträge auf Deutsch oder Englisch

founded 4 months ago
MODERATORS
top 1 comments
sorted by: hot top controversial new old
[–] Ephera@lemmy.ml 5 points 2 months ago

Die Kollegen, die bei uns die Themen rund um generative KI bearbeiten, verbringen jetzt schon gefühlt die Hälfte ihrer Arbeitszeit damit, gruselige Optimierungen durchzuführen.

Da nimmt man irgendwelche strukturierten Daten, wie z.B. JSON, nur um dann ein Skript drüber laufen zu lassen, welches die ganzen Feldnamen rauswirft. Dann schiebt man es in die KI rein und sagt der KI, sie möge damit etwas tun, aber das Ausgabeformat soll auch wieder möglichst unlesbar sein. Dann lässt man im Anschluss nochmal ein anderes Skript drüber laufen, um wieder Feldnamen hinzuzufügen.

Die Feldnamen sind nämlich alles Tokens™. Was ein Token so wirklich ist, weiß trotzdem niemand genau. Das entscheidet Microsoft.
Aber wir bezahlen Lizenzkosten anhand von Tokens. Ein Glück, dass Microsoft da nicht in einem Interessenskonflikt steht, und die Definition von Tokens im eigenen Interesse abändern könnte.