💎 Zie wat momenteel de gezondste bedrijven op de markt zijn.Aan de Slag

Reddit verscherpt toegang om dataschrapers te dwarsbomen

Gepubliceerd 25-06-2024, 22:58

Reddit heeft dinsdag aangekondigd dat het een webstandaard gaat herzien om geautomatiseerd dataschrapen op zijn platform te voorkomen. Deze stap is een reactie op berichten dat AI startups bestaande regels omzeilen om content te verzamelen voor hun systemen. Het sociale mediabedrijf gaat het Robots Exclusion Protocol bijwerken, beter bekend als "robots.txt", dat bepaalt welke delen van een website toegankelijk zijn voor geautomatiseerde crawlers.

De beslissing komt naar aanleiding van zorgen over kunstmatige intelligentie bedrijven die naar verluidt inhoud van uitgevers plagiëren om AI-gegenereerde samenvattingen te maken zonder de juiste naamsvermelding of toestemming. De bijgewerkte maatregelen van Reddit omvatten het handhaven van rate-limiting om het volume van verzoeken die een enkele gebruiker kan maken te controleren, evenals het blokkeren van ongeïdentificeerde bots en crawlers van het verzamelen van gegevens van de site.

Het gebruik van "robots.txt" heeft aan belang gewonnen nu uitgevers proberen te voorkomen dat hun inhoud wordt gebruikt door technologiebedrijven om AI-algoritmen te trainen en samenvattingen te genereren voor bepaalde zoekopdrachten zonder compensatie. Vorige week stuurde TollBit, een startup die licenties uitgeeft voor content, een brief naar uitgevers waarin werd onthuld dat meerdere AI-bedrijven de webstandaard hadden omzeild om content van sites van uitgevers te schrapen.

Een onderzoek door Wired eerder in juni suggereerde dat AI-zoekbedrijf Perplexity mogelijk maatregelen had omzeild om zijn webcrawler via "robots.txt" te blokkeren. In een gerelateerd incident beschuldigde Forbes eerder in juni Perplexity van het plagiëren van zijn onderzoeksverhalen voor gebruik in generatieve AI-systemen zonder creditering.

Ondanks het verscherpen van de toegang, heeft Reddit bevestigd dat onderzoekers en entiteiten zoals het Internet Archive nog steeds toegang hebben tot de inhoud, op voorwaarde dat hun gebruik niet-commercieel is. Dit zorgt ervoor dat, terwijl het bedrijf stappen onderneemt om zijn inhoud te beschermen tegen ongeautoriseerd schrapen, het legitiem onderzoek en archiefactiviteiten blijft ondersteunen.

Reuters heeft bijgedragen aan dit artikel.

Dit artikel is vertaald met behulp van kunstmatige intelligentie. Raadpleeg voor meer informatie onze gebruiksvoorwaarden.

Actuele commentaren

Risico Openbaarmaking: Handelen in financiële instrumenten en/of cryptovaluta gaat gepaard met een hoog risico, zoals de kans dat u het volledige of een deel van het geïnvesteerde bedrag verliest. Daarom is deze activiteit niet voor alle beleggers geschikt. De koersen van cryptovaluta zijn zeer veranderlijk en kunnen worden beïnvloed door externe factoren zoals financiële, regelgevings- of politieke gebeurtenissen. Als u op marge handelt, zijn de financiële risico's nog hoger.
Voordat u besluit te handelen in financiële instrumenten of cryptovaluta, moet u volledig op de hoogte zijn van de risico's en kosten die zijn geassocieerd met de handel op financiële markten. U dient hierbij rekening te houden met uw beleggingsdoelen, ervaring en bereidheid om risico te aanvaarden. Win indien nodig het advies van een expert in.
Fusion Media herinnert u eraan dat de gegevens die op deze website worden vermeld niet per definitie geheel actueel of accuraat zijn. De gegevens en koersen op de website zijn niet altijd verstrekt door een markt of beurs, maar kunnen ook afkomstig zijn van marktmakers. Daarom zullen de koersen mogelijk niet accuraat zijn en kunnen zij afwijken van de daadwerkelijke koers op een markt. Het zijn indicatieve koersen die niet geschikt zijn voor handelsdoeleinden. Fusion Media en de partijen die de op deze website vermelde gegevens verschaffen, aanvaarden geen aansprakelijkheid voor eventuele verliezen of schade als gevolg van uw handelstransacties of uw gebruik van de op deze website vermelde informatie.
Het is verboden de gegevens op deze website te gebruiken, op te slaan, te reproduceren, weer te geven, te wijzigen, versturen of verspreiden zonder expliciete schriftelijke toestemming vooraf van Fusion Media en/of de partij die de gegevens heeft verschaft. Alle intellectuele eigendomsrechten worden voorbehouden door de partijen en/of beurzen die de op deze website vermelde gegevens verschaffen.
Fusion Media zal mogelijk een vergoeding ontvangen van de adverteerders op de website op basis van uw interactie met hun advertenties.
De Engelse versie van deze overeenkomst is de leidende versie en heeft voorrang bij eventuele discrepanties tussen de Engelse versie en de Nederlandse versie.
© 2007-2024 - Fusion Media Limited. Alle rechten voorbehouden.