Connect with us

Original

Det er nu medierne skal reagere strategisk på robotjournalistik

Medierne er før blevet påvirket voldsomt af ny teknologi, men med robotterne er selve DNA’et på spil, skriver strategichef Kasper Lindskow og udpeger fire mulige strategier.

Udgivet

den

Dette blogindlæg er skrevet af Kasper Lindskow, som er chef for strategi- og forretningsudvikling på Ekstra Bladet. Teksten er tidligere publiceret på engelsk hos INMA (International News Media Association – bag betalingsvæg).


Robotjournalistik (eller automatiseret journalistik) er begyndt at påvirke nyhedsmedierne markant. Vi debatterer allerede grundigt, hvordan automatiseringen påvirker journalistrollen, men robotternes strategiske betydning for medierne er indtil videre kun blevet diskuteret i begrænset omfang.

Den diskussion er ellers også meget vigtig.

Automatiseret journalistik har nemlig potentiale for, at nyhedsudgiverne mister yderligere kontrol over deres værdikæde, samt at nyhedsmedierne bliver yderligere opsplittede (”debundlede”) og at nogle opgaver, som i dag kontrolleres af medierne selv, overtages af techvirksomheder.

Vi har set samme dynamik i forbindelse med andre digitale innovationer.  F.eks. har fremkomsten af digitale markedspladser medført, at næsten alle rubrikannoncer er blevet ”debundled” fra nyhedsmedierne. Ligeledes har overgangen til digital distribution medført, at udgiverne generelt har tabt kontrollen med distributionen af både deres indhold og annoncer til digitale platforme, mellemmænd og deviceproducenter.

Til forskel fra disse digitale innovationer, der udfordrer nyhedsmedierne, vil den automatiserede journalistik imidlertid udfordre nyhedsudgiverne på deres kernekompetence og aktiv – journalistikken.

Automatiseret journalistik i dag og i morgen

For at forstå den strategiske betydning af automatiseret journalistik, er det nødvendigt at skelne mellem tre forskellige tilgange til produktion af automatiseret journalistik:

1: Automatiseret journalistik baseret på simpel Natural Language Generation (simpel NLG): Den mest basale form for automatiseret journalistik består af automatisk af matche struktureret data (fx sportsresultater, trafiknyheder eller kriminalstatistikker) med små tekstbidder i en artikeltemplate via logiske regler.

Disse tekstbidder og de regler, der knytter dem til datapunkter (fx sportsresultater), er kodet ind i en database via en editor, der normalt kan styres af en journalist med lidt teknisk flair og træning.

Resultatet er nogle ret standardiserede artikler med en sproglig variation, der afhænger af mængden af timer, som journalister har brugt på at opsætte regler og skrive tekstbidder. Eksempler på artikler skrevet på denne måde kan eksempelvis ses på La Times, Aftonbladet eller flere svenske lokale medier.

2: Automatisereret journalistik baseret på Natural Language Processing (NLP)

Mens automateret journalistik baseret på simpel NLG har eksisteret i en årrække, så er automatiseret journalistik baseret på NLP først ved at nå sit gennembrud. Modsat simpel NLG, der er baseret på logik, så er NLP baseret på kunstig intelligens (maskinlæringsmetoder som BERT og ELMo), der opsummerer og syntetiserer store mængder ustruktureret tekstdata som rapporter, internetdiskussioner og nyhedsartikler, som er produceret af nyhedsudgivere.

I dag er NLP i stand til automatisk at producere tekst i et sprog, der er ligeså rigt og varieret som artikler skrevet af journalister.

Metoden kan producere falske nyhedshistorier med en skræmmende kvalitet, som demonstreret af OpenAI i februar 2019.

Snart vil metoden også kunne kuratere nyhedshistorier med rigt sprog og tiltagende unikke vinkler ved at parse og syntetisere andre nyhedshistorier, rapporter og diskussioner (se rapport) – men NLP vil fortsat ikke være i stand til automatisk at producere originale nyheder.

3: Automatisereret journalistik baseret på avanceret NLG (Natural Language Generation)

I modsætning til NLP vil avanceret NLG være i stand til automatisk at producere originale nyhedshistorier baseret på en blanding af mange forskellige datakilder inklusive nyhedsartikler, rapporter, statistikker, billeder og video.

Når avanceret NLG er fuldt realiseret, vil metoden derfor være tæt på en fuld autonom robotjournalist. For at nå dertil skal der imidlertid skabes en kombination af flere maskinlæringsmetoder som NLP, Natural Language Understanding (NLU), billedgenkendelse og objektidentifikation – samt sandsynligvis et antal andre ingredienser, som endnu ikke findes.

Derfor er realiseringen af avanceret NLG endnu langt på den anden side af vores nuværende ”begivenhedshorisont”, selvom virksomheder som Google og Facebook ”forsker” intenst på området.

Et guestimat..

Mens udviklingen af simpel NLG til brug for robotjournalistik har været drevet af nyhedsudgivere i samarbejde med producenter af regelmotorer og editorer (som Automated Insights i USA, United Robots i Sverige eller Lasso X i Danmark), så har udviklingen af NLP (og avanceret NLG) været drevet næsten eksklusivt af techvirksomheder som Google, Facebook og OpenAI.

En del af grunden til dette er, at simpel NLG kræver journalistiske kompetencer i opbygingen af templates og er mindre fleksibelt og skalerbart end andre former for automatiseret journalistik. Omvendt kræver NLP og avanceret NLP ikke journalistiske kompetencer, hvilket gør dem mere attraktive for techvirksomheder.

Figuren nedenfor opsummerer de tre forskellige tilgange til automatiseret journalistik og giver et guestimat på, hvornår det bliver alment tilgængelige. Guestimatet skal tages med et gran salt, da fremkomsten af avanceret NLG er usikker samt – mere vigtigt – da det er sandsynligt, at de tre tilgange vil ændre sig og smelte sammen efterhånden, som de udvikler sig og muliggør stadig mere brugbar automateret journalistik.

Den strategiske betydning af automatiseret journalistik

Fremkomsten af de tre forskellige slags automatiseret journalistik vil ændre den strategiske kontekst, som nyhedsudgivere befinder sig i. Selvom den præcise timing i udviklingen er svær at forudsige og dybden af konsekvenserne i en vis grad afhænger af nyhedsudgivernes egne handlinger, så må vi forvente følgende dynamikker:

Automatiseret journalistik giver konkurrencefordele for nyhedsudgivere:

Automatiseret journalistik bliver en kilde til både kvalitative og omkostningsmæssige fordele for nyhedsudgivere. De kvalitative fordele skabes af, at automatiseret journalistik gør det muligt at dække nyheder på områder og måder, som ville være økonomisk umulige, hvis menneskelige journalister skulle lave alt arbejdet.

Omkostningsfordelene stammer samtidig fra, at ”robotter” kan producere nyhedshistorier for journalister, hvilket frigør ressourcer til andre opgaver eller skaber grundlag for deciderede besparelser. Disse fordele vil gradvist blive større, efterhånden som den automatiserede journalistik udvikler sig og bliver bedre.

Nyhedsudgivere vil tabe yderligere kontrol over værdikæden til techvirksomheder:

Selvom mange nyhedsudgivere i fremtiden vil producere automatiseret journalistik, så vil de fleste nyhedsudgivere vælge at gøre det med teknologier købt fra techvirksomheder (fx NLG-editorer eller NLP-modeller).

Konsekvensen er, at ligesom nyhedsudgivere har mistet kontrol med de devices, som bruges til at tilgå nyheder og de teknologier, der distribuerer nyheder og annoncer, så vil nyhedsudgivere også gradvist miste kontrol over den teknologi, som producerer journalistikken – og dermed risikerer at kunne høste mindre af den værdi, som skabes af journalistikken.

Techvirksomheder vil bryde nyhedsudgivernes hidtidige monopol på journalistik (”debundling”)

Efterhånden som automatiseret journalistik bliver i stand til at producere stadig flere typer af historier baseret på machine learning (NLP eller avanceret NLG), så vil en stadig større del af journalistikken kunne produceres uden journalisters indblanding. Dette inviterer teknologivirksomheder (inklusive Google og Facebook) til selv at producere og udgive nyheder, hvilket bringer dem i direkte konkurrence med nyhedsudgiverne.

Højst sandsynligt vil denne konkurrence først involvere kuraterede nyheder, der ikke er beskyttet af copyright (heller ikke af det nye Copyright Directive, som blev vedtaget af EU d. 26. maj 2019), som kan distribueres direkte i eksempelvis Google News og Facebooks Newsfeed eller via taleassistenter som Alexa, Google Home og Siri. Senere vil konkurrencens intensitet stige, efterhånden som NLP-baseret-automatisk-journalistik bliver bedre og udviklingen skrider frem mod avanceret NLG.

Hvad kan nyhedsudgiverne gøre?

Hvis det ovenstående scenarie lyder skræmmende (for os nyhedsudgivere), kan vi i det mindste prise os lykkelige for, at det stadigvæk er ”early days” for automatiseret journalistik. Men hvis scenariet er rigtigt, så viser det ikke desto mindre, at nyhedsudgivere bliver nødt til at se automatiseret journalistik som et eksistentielt fænomen og vælge, hvilken position udgivere skal stræbe efter i en fremtid, hvor produktionen af journalistik i stigende grad er faciliteret af teknologi.

Når udgivere forholder sig til udviklingen i automatiseret journalistik, har de mindst fire muligheder:

  1. De kan vente og se: Det er stadig ”early days” for automatiseret journalistik, og alle beslutninger træffes derfor under usikkerhed vedrørende styrken og timingen i udviklingen. Derfor kan vi vælge at se tiden an og vælge, hvordan vi forholder os til udviklingen på et senere tidspunkt, hvor det er mere tydeligt, hvordan NLG og NLP udvikler sig, samt hvordan andre (konkurrerende) udgivere vælger at handle.
  2. De kan købe licenser til en NLG-editor og investere i af bruge den: Simpel NLG er moden nok til, at enhver nyhedsudgiver er i stand til at licensere en regelmotor og en template-editor for at begynde at producere automatiseret journalistik på de områder, hvor der findes struktureret data (fx sportsresultater, trafikstatistik eller vejrprognoser). Ad denne vej kan udgivere opbygge kompetencer indenfor automatiseret journalistik og udvikle en række templates, der matcher udgiverens specifikke ”tone of voice”. Samtidig vil nyhedsudgiveren være positioneret til at høste de fordele, som opstår efterhånden som automatiseret journalistik udvikler sig.
  3. De kan bygge en NLG-editor selv: Ulempen ved at licensere en editor er dels, at nyhedsudgiverne vil blive afhængig af en leverandør, dels af editoren ikke vil være bygget til udgiveres specifikke behov (de fleste eksisterende editorer er optimeret til business intelligence-formål). Udgiveren kan derfor vælge selv at producere en editor fra bunden, så den passer til udgiverens konkrete behov, og så udgiveren ikke bindes til en leverandørs roadmap og priser. I Danmark har Jysk-Fynske Medier (med støtte fra Google’s Digital News Initiative) eksempelvis valgt denne tilgang.
  4. De kan deltage i udviklingen af NLP-baseret automatiseret journalistik: Endeligt kan en udgiver vælge at indlede NLP baseret produktion af automatiserede nyhedshistorier. Denne tilgang vil – sandsynligvis – ikke resultere i store effekter på det helt korte sigt, da NLP endnu kun er på vej til at kunne producere publicerbare historier. Ikke desto mindre vil et engagement i udviklingen af NLP-baseret automatiseret journalistik bygge kompetencer og forberede til konkurrence på det område indenfor automatiseret journalistik, hvor de største fremskridt må forventes i den nære fremtid.

I dag har langt de fleste af de udgivere, der har engageret sig i automatiseret journalistik, valgt at licensere regelmaskiner (og nogle gange endda produktionen af templates) fra techvirksomheder som Automated Insights (fx Associated Press) og United Robots (fx MittMedia]).

Nogle udgivere har dog valgt selv at producere regelmotorer og editorer, mens nogle få har engageret sig i eksperimenter med at integrere NLP i disse værktøjer (fx The Washington Post’s Heliograf og Arc[ samt Forbes’ Bertie, mens Associated Press eksperimenterer sammen med startup-virksomheden Agola).

Samtidig har den grundlæggende udvikling af NLP og avanceret NLG været overladt til techvirksomheder, om end interessen for brugen af disse teknologier vokser netop nu blandt de udgivere, der internationalt er længst fremme i udviklingen.

Dette mønster er naturligt, eftersom det umiddelbare afkast fra automatiseret journalistik endnu er begrænset, samt fordi nyhedsudgivere generelt har begrænset erfaring med udvikling af teknologi.  Ikke desto mindre er den centrale forskel mellem det tab af kontrol med værdikæden, der kan følge af automatiseret journalistik og tidligere tab af kontrol, at det denne gang vedrører nyhedsudgivernes kerneaktiv – selve journalistikken.

Samtidig er simpel NLG og NLP faktisk ikke mere kompliceret end, at nyhedsudgiverne kan hoste dise teknologier ”in house”. Derfor vil vi se større udgivere, der vælger at engagere sig dybt i udviklingen af automatiseret journalistik – samtidig med, at det er helt sikkert, at techvirksomhederne også vil gøre det.

Data

Mette Frederiksen og rød blok vinder valgets første uge på Facebook

Partiledere fra rød blok scorer over 70 % af den opmærksomhed, der er givet til alle partiledere. Af de 10 mest populære opslag er ni røde og fem af dem fra Mette Frederiksen

Udgivet

den

Mette Frederiksen og rød blok vinder valgets første uge på Facebook

Facebook har i valgkampens første uge især summet af Mette Frederiksen og partierne i rød blok. De nye, små partier har dog også trods deres beskedne størrelse opnået betydeligt gennemslag. Det gælder ikke overraskende især Stram Kurs.

Det viser en kortlægning, Medietrends har gennemført af den politiske aktivitet på Facebook i den første uge af valgkampen.

Ser man på de 300.000 likes, delinger og kommentarer, som vælgerne har uddelt til partilederne, så har Mette Frederiksen raget mere end hver fjerde til sig. Dermed har hun skabt næsten dobbelt så meget engagement som Lars Løkke Rasmussens personlige profil.

Til sammen har de fem partiledere i rød blok høstet godt 70 procent af de likes, delinger og kommentarer, som partilederne har fået.

Og liv og aktivitet på Facebook er ikke bare gøgl og staffage. Alle partier satser massivt på Facebook i valgkampen og til sammen har de allerede brændt mellem 580.000 og 226.000 kroner af på Facebookannoncer.

Det har big data analytiker Søren Pedersen beregnet ved at have tracket hver eneste politiske annonce i valgkampen.

De mange interaktioner i Medietrends kortlægning stammer både fra almindelig, organisk rækkevidde og betalt rækkevidde.

I partiregnskabet er der bedre balance mellem rød og blå blok. Takket være de tre små partier, Kristendemokraterne, Nye Borgerlige og Stram Kurs, ender balancen i blå bloks favør. Men uden dem, ville de røde partier også have modtaget flest likes, delinger og kommentarer.

PartiInteraktioner første ugeInteraction rate
Socialdemokratiet39.2341,5
Dansk Folkeparti39.1730,93
Venstre, Danmarks Liberale Parti33.6041,31
Enhedslisten27.0811,06
Alternativet19.5991,13
Stram Kurs18.9736,4
Det Konservative Folkeparti11.9821,4
Liberal Alliance10.6880,47
SF7.5110,87
Radikale Venstre6.7670,49
Nye Borgerlige6.0922,48
Kristendemokraterne4.8194,5
Klaus Riskær Pedersen8445,41
Tabellen viser de opstillede partiers interaktioner i valgkampens første uge.
Data: CrowdTangle/Medietrends

Kigger man på den såkaldte interaction rate, som viser, hvor mange interaktioner, man får per følger, skiller Stram Kurs sig markant ud med en rate på hele 6,4 procent.

I princippet er interaction rate en målestok, der kan bruges til at sammenligne effektiviteten af små og store Facebook-sider. Men da det altid er sådan, at det er de mest engagerede mennesker, der følger en side først, vil interaction rate altid give en fordel til små sider med få følgere.

Der er dog ingen tvivl om, at Stram Kurs har solidt fat i Facebook og derfor også må anses som en af vinderne på Facebook i den første uge af valgkampen.

Som det ses af næste tabel er Stram Kurs vokset med over 1800 nye følgere på en uge og det er valgkampens stærkeste rekruttering.

Andre partier vokser også, men det mest interessante – udover Stram Kurs – er, at Dansk Folkeparti og Liberal Alliance er gået fuldstændig i stå og kun har tiltrukket cirka 10 nye følgere om dagen.

Man kan indvende, at det skyldes, at Dansk Folkeparti allerede er store på Facebook. Men det er Socialdemokraterne også, og de tiltrækker trods alt flere end 1.000 nye følgere.

PartiFølgere den 14. maj 2019Vækst siden valgudskrivelseStigning i procent
Stram Kurs14.7601.88012,7
Socialdemokratiet105.4151.0281,0
Radikale Venstre42.4598091,9
SF42.7177951,9
Enhedslisten86.7026760,8
Alternativet93.5406360,7
Nye Borgerlige26.8595682,1
Kristendemokraterne5.7565599,7
Venstre, Danmarks Liberale Parti72.9684820,7
Det Konservative Folkeparti35.9674021,1
Klaus Riskær Pedersen7.9493184,0
Dansk Folkeparti103.261810,1
Liberal Alliance94.236590,1
Tabellen viser de 13 opstillede partiers følgere.
Data: CrowdTangle/Medietrends

Kigger man på top 10 af de mest populære opslag fra partiledere i den første uge, er den røde bloks dominans næsten total med hele 9 topplaceringer.

Fem til Mette Frederiksen, to til Pia Olsen Dyhr, en til Uffe Elbæk og Pernille Skipper og endelig en niende plads til Lars Løkke Rasmussen.

Her er de ti opslag, som fik flest likes, delinger og kommentarer i valgkampens første uge:

1

2

3

4

5

6

7

8

9

10

Læs resten af artiklen

Nye job

Brief

Jysk Fynske Medier vil lave mere lyd – også selvom de taber FM4. I dag indleverer Jysk Fynske Medier sammen med seks andre mediehuse en ansøgning på over 1.000 sider om at overtage driften af FM4, der i dag drives af Radio24Syv. Men uanset om Jysk Fynske Medier vinder udbudet eller ej, vil mediehuset i fremtiden producere meget mere lyd end idag. Det siger både formand og administrerende direktør – Fyens.dk

Facebook-medstifter foreslår tvangsopdeling. ”Det er 15 år siden, jeg var med til at stifte Facebook på Harvard og jeg har ikke arbejdet i firmaet i ti år. Alligevel føler jeg mig både vred og tynget af ansvar.” Sådan skriver Chris Hughes i et debatindlæg, hvor han opfordrer til, at Instagram og Whatapp skilles fra Facebook ved tvang. Han opfordrer også til at Zuckerberg holdes mere ansvarlig for Facebooks fejltagelser – New York Times

Journalisten får ny hjemmeside. Fagbladet Journalisten lancerede onsdag eftermiddag en ny hjemmeside, der er baseret på cards ligesom for eksempel politiken.dk – Journalisten.dk

Quartz bygger betalingsmur. Qz.com har siden sin lancering været gratis, men i al stilfærdighed har de i denne uge rejst en blid betalingsvæg. Efter 10 artikler er det slut med gratis læsning og så må man betale 15 dollars om måneden – QZ.COM

Russere spreder disinformationer i EP-valget. New York Times skriver, at et netværk af russiske websites og sociale medieprofiler spreder disinformationer i den igangværende EP-valgkamp. Eksperter fra blandt andet EU oplyser, at den russiske kampagne efterlader samme digitale fingeraftryk, som tidligere kampagner. Blandt andet den, der blandede sig i den amerikanske valgkamp i 2016 – New York Times

Russerne spreder skræk om 5G. Endnu en artikel fra New York Times om russisk propaganda. Det statsejede RT America har lavet syv programmer om farlighed ved 5G. Senest har de påstået, at børn, der bor i nærheden af 5G-master får cancer, næseblod og indlæringsvanskeligheder – New York Times

Podcastlyttere er mærkelige. I en ny undersøgelse af amerikanernes brug af podcast, er der mange nyttige oplysninger. Men undersøgelsen indeholder også et par selvmodsigende pointer fra brugerne. De fremhæver nemlig, at de elsker podcast fordi de kan gøre alt muligt andet, mens de lytter og samtidig oplyser flertallet, at de ikke foretager sig noget som helst andet end at lytte – EdisonResearch

MittMedia har succes med tidslås. Den første time en artikel er publiceret hos MittMedia er den gratis og derefter klapper muren i og du er nødt til at købe et abonnement. Medietrends har længe fulgt MittMedias tidslås og den skaber et ret fascinerende pres på læserne til enten at skynde sig at læse eller at betale. Derfor ikke overraskende, at MittMedia nu oplyser, at tidslåsen har øget abonnementssalget med 20% – Digiday

Andre læser lige nu