smokeysnilas

joined 4 months ago
[–] smokeysnilas 1 points 3 weeks ago

Aber drücke ich mich denn so missverständlich aus? Die These ist Daten=Code bei KI Systemen. Untermauert durch die aufgezeigten Ähnlichkeiten bzw. ähnliche Entwicklungsmethodiken.

Und die Erweiterung von Open Source auf Daten erwächst aus Daten=Code, nicht aus dem (nicht)vorhandensein von qualitätssichernden Maßnahmen in OSS.

[–] smokeysnilas 1 points 3 weeks ago (2 children)

What? Hab ich das denn irgendwo behauptet?

Das man beides umsetzt sowohl für Code als auch für Daten sind aber Zeichen dafür, dass Code und Daten im KI Kontext eine ähnliche Funktion haben. Dann ist es doch nur konsequent auch die gleichen Maßstäbe in Hinsicht auf OSS anzulegen?

[–] smokeysnilas 2 points 3 weeks ago (5 children)

Ich denke schon dass man kompilieren können muss. Sonst landet man bei so fake OSS compliance wie bei Android wo die Hersteller ihre Modifikationen am Linux Kernel nur auf die minimalste und kryptischste Art und Weise veröffentlichen mit der keiner was anfangen kann. Das entspricht doch nicht dem Open Source Gedanken und kann doch niemanden zufrieden stellen.

Ich habe auch nicht behauptet dass überall Trainingsdaten benötigt werden oder jede Datenverarbeitung analog zum Kompilieren ist. Aber das Training von AI Modellen kann man denke ich schon vergleichen. Was das Verhalten (mit) bestimmt steht am Anfang, nämlich der Code bzw die Daten. Es folgt ein Prozess der das ganze umwandelt in etwas was im wesentlichen eine Blackbox ist und nur sehr eingeschränkt und unter großem Aufwand noch sinnvoll analysiert werden kann. In diesem Punkt sind die Vorgänge sehr analog und vergleichbar aus meiner Sicht.

Und das Recht zu teilen hängt vom Datensatz bzw. vom Code ab, Quellcode der persönliche Daten o.ä. im Klartext enthält darf ich sicherlich auch nicht einfach Open Source publizieren. Das Problem ist also nicht inhärent eines das nur auf Daten zutrifft. Und Datensätze können durchaus so angelegt werden dass sie auch geteilt werden dürfen, siehe gängige Praxis in der Wissenschaft selbst für Aufgaben wie Gesichtserkennung, Köperposen, ...

Und der Status Quo an Gesetzen und Lizenzen definiert hier evtl. anders, aber hat denn die EU mit dem AI Act hier die Deutungshoheit? Mir geht es darum wie es eigentlich und aus dem intuitiven Verständnis von Open Source her sein sollte, nicht was AI Act oder GPL usw. derzeit abdecken.

Es ist ja auch letzten Endes nichts schlimmes daran wenn man Daten nicht publiziert. Es ist dann halt bloß einfach kein Open Source, weil man die Funktionsweise nicht wirklich nachvollziehen kann und das Trainingsergebnis auch nicht selbst erzeugen kann.

[–] smokeysnilas 2 points 3 weeks ago (4 children)

Ich habe ein paar Jahre an der Uni als Wimi gearbeitet, die Wissenschaft (die du unten schon genannt hattest) wäre also ein Beispiel wo ich persönliche Erfahrung sammeln durfte.

Aber auch mit Erfahrung in der freien Wirtschaft kann man argumentieren: die Beobachtung ist das die Daten wesentlich das Verhalten des Systems beeinflussen und damit kommt ihnen eine ähnliche Rolle zu wie Code in traditioneller SW.

Daher geht man z.B. dazu über für Daten ähnliche Qualitätsstandards zu definieren. Z.B. hat man für Code Spezifikationen und Unittests die das Prüfen. Es ist in der Wirtschaft, je nach Bereich und Qualitätsanforderungen, mittlerweile Standard sowas auch für Datensätze zu machen. Man prüft also automatisch und bei jeder Änderung bestimmte statistische Eigenschaften der Daten wie Klassenverteilung, Balanciertheit, auch über Einflussgrößen die nicht explizit trainiert werden. Also z.B. für eine Gesichtserkennung prüft man die Verteilung von Geschlecht, Ethnizität, Alter, ... in den Trainingsdaten.

Auch werden Datensätze genau wie Code in versionierten Repositories vorgehalten.

De facto hat man also auch in der Wirtschaft die sehr ähnliche Bedeutung und damit auch Handhabung von Daten und Code in KI Systemen erkannt und umgesetzt. Sollten dann nicht die OSS Regeln auch genauso auf Daten übertragbar sein?

[–] smokeysnilas 5 points 3 weeks ago (7 children)

Bei OSS für iPhones gibt es diese Abhängigkeiten aber sie fehlen nicht, das ist also nicht was ich beschrieben habe.

OpenSource Code muss dich aber sehr wohl in die Lage versetzen selber aus dem Quellcode zu kompilieren und die ausführbare Binärdatei zu reproduzieren. In der Analogie wäre das trainierte Modell sowas wie die fertig kompilierte .exe . SW die nur kompiliert verteilt wird gilt auch nicht als OpenSource. Und die Wissenschaft ist doch immer schon wichtig für die ganze OSS Welt, sicherlich sollten wir die Definition nicht Vertretern "der Industrie" wie Google oder Microsoft usw. überlassen.

[–] smokeysnilas 7 points 3 weeks ago (16 children)

Reproduzierbarkeit, wie kann etwas OpenSource sein das man nicht nachbauen kann? Das wäre wie "OpenSource" Code den man nicht kompilieren kann oder wo proprietäre Abhängigkeiten fehlen.

[–] smokeysnilas 3 points 3 weeks ago* (last edited 3 weeks ago)

Früher war sie krank und schwach doch das ist vorbei. Jetzt ist sie ein Volleyass und ein kleines Wunder Wunder.

[–] smokeysnilas 4 points 3 weeks ago (1 children)

Ich freue mich euch zu berichten, dass mein Prokrastinieren der Gartenarbeit hier einen kleinen Beitrag zum Artenschutz leisten konnte!

[–] smokeysnilas 14 points 3 weeks ago (21 children)

Gefühlt und aus persönlicher Erfahrung in der täglichen Arbeit würde ich dafür plädieren, dass KI nur Open Source sein kann wenn auch die Trainingsdaten offen verfügbar sind.

[–] smokeysnilas 2 points 3 weeks ago* (last edited 3 weeks ago) (1 children)

Haben den Bosch BKS711PET Unlimited 7 ProAnimal seit ca. 2 Jahren. Sind grundsätzlich zufrieden. Mich hatte überzeugt dass man Akkus günstig und von verschiedenen Herstellern nachkaufen kann. Einiges von dem Zubehör benutzen wir aber eher selten/gar nicht, also hätte für uns wahrscheinlich auch ein kleineres Modell gereicht.

Edit: Eine Siam-Mix Katze + Frau & Tochter mit Langhaarfrisuren.

[–] smokeysnilas 5 points 4 weeks ago

Haben einiges von BSH seit 11 Jahren im Einsatz, sind unsere ersten E-Geräte. Sowohl Ofen als auch Kochfeld als auch Kühlschrank bisher ohne Probleme und haben auch schon mehrere Umzüge mitgemacht. Ist nicht ganz billig aber auch bei weitem nicht die teuerste Variante. Wenn man vielleicht Bekannte hat oder selbst an B-Ware/Für-Uns-Shop dran kommt (oft bei Corporate Benefits dabei) dann denke ich lohnt es (wenn ich mal von unserer Stichprobe n=1 extrapoliere).

[–] smokeysnilas 1 points 4 weeks ago

browsh ist die einzige korrekte Antwort

view more: ‹ prev next ›