Connect with us

Medietrends nyhedsbreve

Se om dit medie bruges som træningsmad til AI

Missede du Perugia?

Skal bold.dk til at clickbaite?

Fire minutter med Cecilie Lange

Debat om mikrobetaling lever videre

Danske medier bruges som træningsdata til AI

Udgivet

den

Sådan endte jeg som fascistoid poster boy

Tænk sig at Medietrends er blandt verdens ti millioner mest vigtige hjemmesider.

Washington Post har netop afsløret identiteten på de ti millioner indholdsproducenter, som Google har plyndret for at bruge som træningsmad til deres kunstige intelligens.

Medietrends rangerer som nummer 9.817.726, så nu ved jeg ikke om jeg skal sagsøge Google for brud på min ophavsret, eller for at de har stjålet så lidt, at jeg placeres som det tynde øl i bunden 😉

Tjek artiklen længere nede i nyhedsbrevet og hav en god torsdag.


Jan


Danske medier bruges som træningsdata til AI

Indhold fra danske medier er i vid udstrækning anvendt til at træne Googles C-4-datasæt, der blandt andet leverer data til Googles egen sprogmodel  T5 og Facebooks LLaMA.

Det fremgår af en opsigtsvækkende analyse, som Washington Post har lavet af de 15 millioner hjemmesider, som udgør C-4-datasættet.

Af de 15 millioner hjemmesider, har Washington Post kunne identificere ti millioner og opdelt dem efter kategori.

Medier udgør den tredjestørste kategori.

  1. 16% – Erhverv og industri
  2. 15% – Teknologi
  3. 13% – Nyheder og medier
  4. 11% – Kunst og underholdning
  5. 9% – Videnskab og sundhed
  6. 8% – Hobby og fritid
  7. 7% – Job og uddannelse
  8. 6% – Hus og have
  9. 6% – Rejser
  10. 5% – Samfund
  11. 4% – Lov og regering

I analysen er der en søgefunktion, så man kan se, hvilke hjemmesider, der indgår i den ti millioner store portefølje af domæner.

Blandt andet kan man se, at Medietrends er blevet trawlet og udgør 0,0000003 procent af den samlede datamængde. 

Sammenlagt udgør de danske medier en dråbe i havet, men set med demokratiske øjne, er det et alligevel et signal om, at kvaliteten af de danskrelaterede opgaver, som Googles chatfunktion Bard kan levere, er bedre end hvis datasættet kun indeholdt udenlandske sider.

Den p.t. mest omtalte chatbot ChatGPT offentliggør ikke deres træningsdata, men så vidt vides indeholder de kun engelsksprogede hjemmesider.

Ingen af de 15 millioner hjemmesider er blevet spurgt, om de ønsker at agere træningsmateriale for Google, og afdækningen vil helt sikkert blæse vind i den ulmende debat om ophavsret.

Mange hjemmesider stilles i et vanskeligt dilemma mellem at lade sig tracke og trawle eller leve i det skjulte uden techplatformenes sultne appetit på andres indhold.


Debatten om mikrobetalingerne dør aldrig

Ideen om at betale per artikel, er blevet kaldt verdens bedste ide – for alle andre end medierne. 

Skal man være tro mod internettets natur og de digitale medievaner majoriteten har, burde man give flertallet mulighed for at betale, fremfor at “tvinge” dem til at forblive gratister.

Men set med medieøkonomiske briller, er det meget svært at se, hvordan mikrobetaling enten skulle kunne erstatte abonnementer eller supplere uden at kannibalisere abonnementerne.

Mikrobetaling er en evergreen og i denne artikel tager PressGazette en kompetent tur i minelandskabet.


Missede du Perugia?

Gik du – ligesom mig – glip af årets internationale journalistik festival i italienske Perugia, så er der hjælp at hente fra Reuters Institute for the Study of Journalism.

Her rapporterer de fra en lang række af sessionerne.


Skal Bold.dk clickbaite?

Da Ekstra Bladet for to uger siden opkøbte bold.dk, tænkte jeg, at det lignede opskriften på et ægteskabeligt clash mellem to rubrikkulturer. 

Ekstra Bladet med kærlighed til korte rubrikker med tilbageholdte informationer og bold.dk som bevidst har dyrket en informerende rubrikstil. Altså to vidt forskellige tilgange til digital mediedrift.

I princippet kunne de to praksisser godt fortsætte side om side, men efter Ekstra Bladet i går fyrede bold.dks chefredaktør med omgående virkning, fordi Ekstra Bladet vurderer “at der er behov for en ny redaktionel ledelse”, er det oplagt at spekulere i om, Ekstra Bladet også mener, at der er behov for ny redaktionel tænkning på rubrikfronten.


Fire minutter med Cecilie Lange

Foto: Walther Bølge

Kathrine Abrahamsen sendte i sidste uge stafetten videre til Cecilie Lange med disse ord:

I min karriere har jeg primært beskæftiget mig med underholdning. Derfor er jeg vant til at gå langt for den gode stemning, og nærmest være lidt bange for den dårlige. 

Derfor synes jeg, det er beundringsværdigt, når værter med kritiske, skarpe og vigtige spørgsmål går ind i en debat og interviews, og virker frygtløse. Så det er med stor respekt jeg holder af at lytte til forbilledlige Cecilie Lange, der er vært på P1 Debat. Hun skal have stafetten. 

Cecilie Lange er journalist og radiovært på P1 Debat og Ring til Regeringen på P1.

Hvad fylder mest i dit arbejde for tiden?

For tiden går jeg meget op i at invitere (de) rigtige mennesker til mine programmer. Et perfekt kombineret panel. Det kan måske lyde banalt, men jeg går og har nogle tanker om, at det bør være en primæropgave for journalister med en platform som min. Altså at sørge for at inddrage nye, upolerede, upopulære, ægte og anderledes stemmer. Som en slags fremtidssikring for at vi kan blive ved med at debattere sandheden. 

Hvad eller hvem i mediebranchen giver dig mest håb?

Journalister, der stiller spørgsmål uden for dagsordenen på dkpolske pressemøder. Det er vigtigt i en tid, hvor nogle politikere ikke har brug for O.G.-medier på samme måde som før – og derfor ikke stiller op. De bør få branchens solidaritetshyl, som de vagthunde vi skal være. Det er ikke uden konsekvenser. Man får både udenrigsministerskældud og vrede emoji-caps-lock-beskeder fra Hr. og Fru. Ukraineflag-og-vaccine-banner-på-profilbilledet.

O.G. Betyder ‘oprindelige eller originale’. Det kommer af slang ‘original gangsters

Hvad bør mediebranchen gøre anderledes?

Ansætte folk på rigtige, faste kontrakter. Ikke dem der udløber efter et år. Eller freelance-kontrakter på trods af fuld tid i vagtplan. Ændringen skulle være sket ifm. metoo, da vi blev enige om, at miljøer, hvor man kan sige fra uden risiko for at miste sit job, nok er at foretrække. Min gamle chef Simon Andersen ansatte mig fast, så snart han opdagede, jeg var på en TBA. ”Man kan bedre koncentrere sig om journalistik, hvis man ikke skal tænke på, hvornår man udløber.” Korrekt.

Hvad kan mediebranchen lære fra andre brancher?

Det er fedt at udfordre ’form’. Eks: I 2016 var min seje svigerinde Lærke Cramon nomineret til en Cavling for projektet ‘Vidnesbyrd’ – en lang række kvinders vidnesbyrd om at blive voldtaget. Altså kvinders rene ord i spil til branchens fineste pris. I år gik prisen for første gang nogensinde til en podcast. ’Det levende bevis’ af dygtige Frederik Hugo Ledegaard. Fantastisk og så fortjent. Gad sgu godt vide, hvad hr. Cavling havde sagt til journalistik via dutter i ørerne.

Hvem bør svare på disse spørgsmål i næste uge?

Jeg sender stafetten videre til en person, som både er min veninde og et forbillede. Jeg ved allerede, at jeg kommer til at grine af hendes ord. Jeg ved også, jeg får øje på noget, jeg ikke havde set før. Hun fungerer som en slags skarp, feministisk tættekam. Hun taler og skriver for dem, vi lige havde glemt. Dem, der ikke fik sagt fra. De kvinder, der larmer og er uopdragne. Hun er en slags Venus Breeze for vores kvindekampshelligdage. Ordet er dit, eminente Anne Kirstine Cramon.

Læs også