AI lernt aus dem, was Sie auf Reddit, Stack Overflow oder Facebook gesagt haben. Bist du damit einverstanden?

CAMBRIDGE, Mass. (AP) - Posten Sie einen Kommentar auf Reddit, beantworten Sie Programmierfragen auf Stack Overflow, bearbeiten Sie einen Wikipedia-Eintrag oder teilen Sie ein Babyfoto auf Ihrem öffentlichen Facebook- oder Instagram-Feed, und Sie helfen auch bei der Ausbildung der nächsten Generation von künstlicher Intelligenz.

Nicht jeder ist damit einverstanden - besonders da die gleichen Online-Foren, in denen sie jahrelang Beiträge geleistet haben, zunehmend mit KI-generierten Kommentaren überflutet werden, die nachahmen, was echte Menschen sagen würden.

Einige langjährige Benutzer haben versucht, ihre früheren Beiträge zu löschen oder in Unsinn umzuschreiben, aber die Proteste haben nicht viel bewirkt. Einige Regierungen - darunter Brasiliens Datenschutzbehörde am Dienstag - haben ebenfalls versucht, einzuschreiten.

„Ein größerer Teil der Bevölkerung fühlt sich irgendwie hilflos“, sagte Reddit-Freiwilligenmoderatorin Sarah Gilbert, die auch an der Cornell University Online-Communitys studiert. „Es gibt keinen anderen Ausweg, als komplett offline zu gehen oder nicht auf Arten beizutragen, die ihnen und anderen Wert bringen.“

Plattformen reagieren - mit gemischten Ergebnissen. Nehmen wir Stack Overflow, den beliebten Treffpunkt für Tipps zur Computerprogrammierung. Zuerst verbot es ChatGPT-geschriebene Antworten aufgrund häufiger Fehler, aber jetzt arbeitet es mit KI-Chatbot-Entwicklern zusammen und hat einige seiner eigenen Benutzer bestraft, die versucht haben, ihre früheren Beiträge aus Protest zu löschen.

Es ist einer von mehreren sozialen Medienplattformen, die mit der Skepsis der Benutzer - und gelegentlichen Aufständen - zu kämpfen haben, während sie versuchen, sich an die durch generative KI verursachten Veränderungen anzupassen.

Softwareentwickler Andy Rotering aus Bloomington, Minnesota, nutzt Stack Overflow seit 15 Jahren täglich und sagte, er befürchte, dass das Unternehmen „versehentlich seine größte Ressource schädigen könnte“ - die Gemeinschaft der Beitragenden, die Zeit gespendet haben, um anderen Programmierern zu helfen.

„Die Motivation der Mitwirkenden, Kommentare zu geben, sollte oberste Priorität haben“, sagte er.

Der CEO von Stack Overflow, Prashanth Chandrasekar, sagte, dass das Unternehmen versucht, den steigenden Bedarf an sofortiger, KI-generierter Kodierungshilfe mit dem Wunsch nach einer Community „Wissensbasis“ in Einklang zu bringen, in der die Menschen immer noch posten und „anerkannt werden“ möchten für das, was sie beigetragen haben.

„Fünf Jahre später - es wird allerlei maschinengenerierter Inhalt im Web geben“, sagte er in einem Interview. „Es wird sehr wenige Orte geben, an denen es wirklich authentisches, originäres menschliches Denken gibt. Und wir sind einer dieser Orte.“

Chandrasekar beschreibt die Herausforderungen von Stack Overflow gerne als eine der „Fallstudien“, die er an der Harvard Business School gelernt hat, wie ein Unternehmen nach einer disruptiven technologischen Veränderung überlebt - oder nicht.

Seit über einem Jahrzehnt landeten Benutzer in der Regel auf Stack Overflow, nachdem sie eine Kodierungsfrage in Google eingegeben hatten, und fanden dann die Antwort, kopierten und fügten sie ein. Die Antworten, die sie höchstwahrscheinlich sehen würden, stammten von Freiwilligen, die ihre Glaubwürdigkeit messenden Punkte aufgebaut hatten - die in einigen Fällen bei der Jobsuche helfen konnten.

Jetzt können Programmierer einfach einen KI-Chatbot fragen - von denen einige bereits alles, was jemals auf Stack Overflow gepostet wurde, trainiert haben - und er kann instantan eine Antwort ausspucken.

Das Debüt von ChatGPT Ende 2022 drohte, Stack Overflow außer Betrieb zu setzen. Deshalb richtete Chandrasekar ein spezielles 40-köpfiges Team im Unternehmen ein, um den Start seines eigenen spezialisierten KI-Chatbots, namens Overflow AI, voranzutreiben. Dann schloss das Unternehmen Deals mit Google und ChatGPT-Hersteller OpenAI ab, die es den KI-Entwicklern ermöglichen, auf das Frage-Antwort-Archiv von Stack Overflow zuzugreifen, um ihre KI-großen Sprachmodelle weiter zu verbessern.

Diese Art von Strategie ergibt Sinn, kam aber möglicherweise zu spät, sagte Maria Roche, Assistenzprofessorin an der Harvard Business School. „Ich bin überrascht, dass Stack Overflow nicht schon früher daran gearbeitet hat“, sagte sie.

Als einige Stack Overflow-Benutzer versuchten, ihre früheren Kommentare nach der Ankündigung der Open AI-Partnerschaft zu löschen, reagierte das Unternehmen, indem es ihre Konten aufgrund von Bestimmungen, die alle Beiträge „auf Dauer und unwiderruflich an Stack Overflow lizenzieren“, sperrte.

„Wir haben das schnell angesprochen und gesagt: ‚Das ist kein akzeptables Verhalten’“, sagte Chandrasekar und beschrieb die Protestierenden als eine kleine Minderheit unter den „low hundreds“ der 100 Millionen Benutzer der Plattform.

Brasiliens nationale Datenschutzbehörde hat am Dienstag Maßnahmen ergriffen, um dem Social-Media-Riesen Meta Platforms das Training seiner KI-Modelle auf den Facebook- und Instagram-Beiträgen der Brasilianer zu verbieten. Sie setzte eine tägliche Geldstrafe von 50.000 Reais (8.820 USD) bei Nichtbefolgung fest.

Meta bezeichnete es in einer Erklärung als „Rückschritt für die Innovation“ und sagte, es sei transparenter als viele Branchenkollegen, die ähnliches KI-Training auf öffentlichen Inhalten durchführen, und dass seine Praktiken mit brasilianischen Gesetzen im Einklang stehen.

Meta ist auch in Europa auf Widerstand gestoßen, wo es kürzlich seine Pläne zur Einbeziehung von öffentlichen Beiträgen der Menschen in Schulungssysteme für KI vorläufig ausgesetzt hat - was letzte Woche beginnen sollte. In den USA, wo es kein nationales Gesetz zum Schutz der Online-Privatsphäre gibt, ist ein solches Training bereits wahrscheinlich im Gange.

„Die große Mehrheit der Menschen ahnt nicht, dass ihre Daten verwendet werden“, sagte Gilbert.

Reddit hat einen anderen Ansatz gewählt - zusammenarbeitet mit KI-Entwicklern wie OpenAI und Google, während es auch klarstellt, dass Inhalte von kommerziellen Einrichtungen nicht in Bulk ohne Genehmigung der Plattform übernommen werden können „ohne Rücksicht auf Benutzerrechte oder Datenschutz“. Die Deals halfen Reddit, das Geld zu beschaffen, das es im März auf der Wall Street debütieren musste, wobei Investoren den Wert des Unternehmens auf fast 9 Milliarden US-Dollar drückten, Sekunden nachdem es an der New Yorker Börse gehandelt wurde.

Reddit hat Benutzer, die protestiert haben, nicht bestraft - noch könnte es das leicht tun, angesichts des Einflusses, den Freiwilligenmoderatoren haben, was in ihren Fachforen, den sogenannten Subreddits, passiert. Aber was Gilbert, die bei der Moderation des „AskHistorians“-Subreddits hilft, beunruhigt, ist der zunehmende Fluss von KI-generierten Kommentaren, über die Moderatoren entscheiden müssen, ob sie sie zulassen oder verbieten sollen.

„Die Leute kommen zu Reddit, weil sie mit Menschen reden möchten, nicht mit Bots“, sagte Gilbert. „Es gibt Apps, in denen sie mit Bots sprechen können, wenn sie möchten. Aber historisch gesehen war Reddit für die Kommunikation mit Menschen gedacht.“

Sie sagte, es sei ironisch, dass der Reddit bedrohende KI-generierte Inhalt aus den Kommentaren von Millionen von menschlichen Redditoren stammte und „es besteht das reale Risiko, dass es letztendlich Menschen verdrängen könnte.“

- - -

Associated Press-Autor Eléonore Hughes in Rio de Janeiro hat zu diesem Bericht beigetragen.

- - -

Die Associated Press und OpenAI haben eine Lizenz- und Technologievereinbarung, die OpenAI Zugriff auf einen Teil des Archivs der AP-Texte ermöglicht.