
Sicherheitsforscher warnen davor, dass Daten, die für einen Moment im Internet freigelegt wurden, auch nachdem sie privat gemacht wurden, in Online-generativen KI-Chatbots wie Microsoft Copilot verweilen können.
Tausende einst öffentlicher GitHub-Repositorys von einigen der größten Unternehmen der Welt sind betroffen, einschließlich Microsofts, laut neuen Erkenntnissen von Lasso, einem israelischen Cybersicherheitsunternehmen, das sich auf aufkommende generative KI-Bedrohungen konzentriert.
Lasso-Mitbegründer Ophir Dror sagte TechCrunch, dass das Unternehmen feststellte, dass Inhalte aus seinem eigenen GitHub-Repository in Copilot erschienen, weil sie von der Microsoft-Suchmaschine Bing indexiert und zwischengespeichert wurden. Dror sagte, dass das Repository, das irrtümlicherweise für einen kurzen Zeitraum öffentlich zugänglich war, seitdem auf privat gesetzt wurde und der Zugriff darauf auf GitHub einen "Seite nicht gefunden"-Fehler zurückgab.
"Auf Copilot haben wir überraschenderweise eines unserer eigenen privaten Repositories gefunden", sagte Dror. "Wenn ich durch das Web surfen würde, würde ich diese Daten nicht sehen. Aber jeder auf der Welt könnte Copilot die richtige Frage stellen und diese Daten erhalten."
Nachdem Lasso erkannt hatte, dass jegliche Daten auf GitHub, auch nur kurz, von Tools wie Copilot potenziell freigelegt werden könnten, untersuchte das Unternehmen weiter.
Lasso extrahierte eine Liste von Repositorys, die zu irgendeinem Zeitpunkt im Jahr 2024 öffentlich zugänglich waren, und identifizierte die Repositorys, die seitdem gelöscht oder auf privat gesetzt wurden. Unter Verwendung des Bing-Caching-Mechanismus fand das Unternehmen heraus, dass mehr als 20.000 seitdem private GitHub-Repositorys immer noch über Copilot zugänglich waren und mehr als 16.000 Organisationen betrafen.
Lasso teilte TechCrunch vor der Veröffentlichung seiner Forschung mit, dass von dem Problem betroffene Unternehmen Amazon Web Services, Google, IBM, PayPal, Tencent und Microsoft sind. Amazon sagte TechCrunch nach der Veröffentlichung, dass es nicht von dem Problem betroffen sei. Lasso sagte, dass es "alle Verweise auf AWS nach dem Rat unseres Rechtsteams entfernt" habe und dass "wir fest zu unserer Forschung stehen."
Für einige betroffene Unternehmen könnte Copilot aufgefordert werden, vertrauliche GitHub-Archive zurückzugeben, die geistiges Eigentum, sensitive Unternehmensdaten, Zugriffsschlüssel und Tokens enthalten, so das Unternehmen.
Lasso wies darauf hin, dass es Copilot verwendete, um den Inhalt eines GitHub-Repositorys abzurufen - das von Microsoft gelöscht wurde -, das ein Tool beherbergte, das die Erstellung von "beleidigenden und schädlichen" KI-Bildern mit Microsofts Cloud-KI-Dienst ermöglichte.
Dror sagte, dass Lasso alle betroffenen Unternehmen, die von der Datenexposition "schwerwiegend betroffen" waren, kontaktiert und sie gebeten hat, kompromittierte Schlüssel zu ändern oder zu widerrufen.
Keines der von Lasso genannten betroffenen Unternehmen reagierte auf die Fragen von TechCrunch. Auch Microsoft antwortete nicht auf die Anfrage von TechCrunch.
Lasso informierte Microsoft im November 2024 über seine Ergebnisse. Microsoft teilte Lasso mit, dass das Unternehmen das Problem als "geringe Schwere" einstufe und dass dieses Caching-Verhalten "akzeptabel" sei. Microsoft hat ab Dezember 2024 keine Links mehr auf den Bing-Cache in seinen Suchergebnissen enthalten.
Lasso sagt jedoch, dass obwohl die Caching-Funktion deaktiviert wurde, Copilot immer noch Zugriff auf die Daten hatte, obwohl sie nicht durch herkömmliche Websuchen sichtbar waren, was auf eine vorübergehende Lösung hindeutet.
Aktualisiert mit dem Kommentar von Amazon Web Services und Lasso nach der Veröffentlichung.