this post was submitted on 10 Jul 2023
0 points (NaN% liked)
Haupteingang
3693 readers
1 users here now
Die Standard-Community von feddit.de
In dieser Community geht es ausschließlich um alles rund um die Instanz!
Hast du Fragen? !fragfeddit@feddit.de
matrix chat: !feddit:tilde.fun
founded 3 years ago
MODERATORS
you are viewing a single comment's thread
view the rest of the comments
view the rest of the comments
Ich glaube technisch kann man es eh nicht verhindern und illegal wäre es meines Wissens auch nicht. Aber vielleicht zielt Deine Frage auch eher auf ethische Aspekte ab? Da finde ich es schon etwas schwierig, weil die Leute, deren Posts dann benutzt würden, ja nicht wirklich um Erlaubnis gefragt wurden. Auf der anderen Seite machen Suchmaschinen auch nichts anderes (und würden sonst gar nicht funktionieren). Schwieriges Thema.
Es wäre praktisch wenn man in seinem Account ein Optin-Flag oder sowas setzen könnte, dass dann ebenfalls über die API auslesbar wäre.
Ja es geht eher um die ethischen Aspekte. Gerade als Open Source Projekt ist die Meinung von anderen ja sehr wichtig für den eigenen Erfolg. Open Assistant hat import-Scripte für eine ganze Reihe von frei zugänglichen Quellen. Aber wenn eine Website es nicht will, wird eher nicht gescrapt, selbst wenn es rechtlich möglich wäre.
Egal was ethisch dabei raus kommt und auch für andere Quellen, achte bitte beim Scraping darauf entsprechendes Rate Limiting zu machen damit die Seite nicht zu sehr belastet wird.
Ich finde so ein "Opt-In" Flag zwar keine schlechte Idee, aber fraglich, wer sich dann daran hält. Wer für möglichst viele und diverse Daten scrapen möchte, macht das in der Regel ohne Rücksicht auf Verluste.
Klar, so ein Flag wäre nur ein Hinweis für Leute, die sich schon von sich aus "ethisch" verhalten wollen, aber niemand wird dadurch von irgendwas abgehalten. Ähnlich wie die do-not-track header im Browser.