Det er nu medierne skal reagere strategisk på robotjournalistik
Medierne er før blevet påvirket voldsomt af ny teknologi, men med robotterne er selve DNA’et på spil, skriver strategichef Kasper Lindskow og udpeger fire mulige strategier.
Dette blogindlæg er skrevet af Kasper Lindskow, som er chef for strategi- og forretningsudvikling på Ekstra Bladet. Teksten er tidligere publiceret på engelsk hos INMA (International News Media Association – bag betalingsvæg).
Robotjournalistik (eller automatiseret journalistik) er begyndt
at påvirke nyhedsmedierne markant. Vi debatterer allerede grundigt, hvordan
automatiseringen påvirker journalistrollen, men robotternes strategiske betydning
for medierne er indtil videre kun blevet diskuteret i begrænset omfang.
Den diskussion er ellers også meget vigtig.
Automatiseret journalistik har nemlig potentiale for, at
nyhedsudgiverne mister yderligere kontrol over deres værdikæde, samt at nyhedsmedierne
bliver yderligere opsplittede (”debundlede”) og at nogle opgaver, som i dag
kontrolleres af medierne selv, overtages af techvirksomheder.
Vi har set samme dynamik i forbindelse med andre digitale
innovationer. F.eks. har fremkomsten af
digitale markedspladser medført, at næsten alle rubrikannoncer er blevet
”debundled” fra nyhedsmedierne. Ligeledes har overgangen til digital
distribution medført, at udgiverne generelt har tabt kontrollen med distributionen
af både deres indhold og annoncer til digitale platforme, mellemmænd og
deviceproducenter.
Til forskel fra disse digitale innovationer, der udfordrer
nyhedsmedierne, vil den automatiserede journalistik imidlertid udfordre
nyhedsudgiverne på deres kernekompetence og aktiv – journalistikken.
Automatiseret journalistik i dag og i morgen
For at forstå den strategiske betydning af automatiseret
journalistik, er det nødvendigt at skelne mellem tre forskellige tilgange til
produktion af automatiseret journalistik:
1: Automatiseret journalistik baseret på simpel Natural Language Generation (simpel NLG): Den mest basale form for automatiseret journalistik består af automatisk af matche struktureret data (fx sportsresultater, trafiknyheder eller kriminalstatistikker) med små tekstbidder i en artikeltemplate via logiske regler.
Disse tekstbidder og de regler, der knytter dem til datapunkter
(fx sportsresultater), er kodet ind i en database via en editor, der normalt
kan styres af en journalist med lidt teknisk flair og træning.
Resultatet er nogle ret standardiserede artikler med en sproglig variation, der afhænger af mængden af timer, som journalister har brugt på at opsætte regler og skrive tekstbidder. Eksempler på artikler skrevet på denne måde kan eksempelvis ses på La Times, Aftonbladet eller flere svenske lokale medier.
2: Automatisereret journalistik baseret på Natural Language Processing (NLP)
Mens automateret journalistik baseret på simpel NLG har
eksisteret i en årrække, så er automatiseret journalistik baseret på NLP først
ved at nå sit gennembrud. Modsat simpel NLG, der er baseret på logik, så er NLP
baseret på kunstig intelligens (maskinlæringsmetoder som BERT og ELMo), der
opsummerer og syntetiserer store mængder ustruktureret tekstdata som rapporter,
internetdiskussioner og nyhedsartikler, som er produceret af nyhedsudgivere.
I dag er NLP i stand til automatisk at producere tekst i et
sprog, der er ligeså rigt og varieret som artikler skrevet af journalister.
Metoden kan producere falske nyhedshistorier med en skræmmende kvalitet, som demonstreret af OpenAI i februar 2019.
Snart vil metoden også kunne kuratere nyhedshistorier med rigt sprog og tiltagende unikke vinkler ved at parse og syntetisere andre nyhedshistorier, rapporter og diskussioner (se rapport) – men NLP vil fortsat ikke være i stand til automatisk at producere originale nyheder.
3: Automatisereret journalistik baseret på avanceret NLG (Natural Language Generation)
I modsætning til NLP vil avanceret NLG være i stand til
automatisk at producere originale nyhedshistorier baseret på en blanding af
mange forskellige datakilder inklusive nyhedsartikler, rapporter, statistikker,
billeder og video.
Når avanceret NLG er fuldt realiseret, vil metoden derfor være tæt på en fuld autonom robotjournalist. For at nå dertil skal der imidlertid skabes en kombination af flere maskinlæringsmetoder som NLP, Natural Language Understanding (NLU), billedgenkendelse og objektidentifikation – samt sandsynligvis et antal andre ingredienser, som endnu ikke findes.
Derfor er realiseringen af avanceret NLG endnu langt på den anden side af vores nuværende ”begivenhedshorisont”, selvom virksomheder som Google og Facebook ”forsker” intenst på området.
Et guestimat..
Mens udviklingen af simpel NLG til brug for
robotjournalistik har været drevet af nyhedsudgivere i samarbejde med
producenter af regelmotorer og editorer (som Automated Insights i USA, United
Robots i Sverige eller Lasso X i Danmark), så har udviklingen af NLP (og
avanceret NLG) været drevet næsten eksklusivt af techvirksomheder som Google,
Facebook og OpenAI.
En del af grunden til dette er, at simpel NLG kræver
journalistiske kompetencer i opbygingen af templates og er mindre fleksibelt og
skalerbart end andre former for automatiseret journalistik. Omvendt kræver NLP
og avanceret NLP ikke journalistiske kompetencer, hvilket gør dem mere
attraktive for techvirksomheder.
Figuren nedenfor opsummerer de tre forskellige tilgange til automatiseret
journalistik og giver et guestimat
på, hvornår det bliver alment tilgængelige. Guestimatet skal tages med et gran
salt, da fremkomsten af avanceret NLG er usikker samt – mere vigtigt – da det
er sandsynligt, at de tre tilgange vil ændre sig og smelte sammen efterhånden,
som de udvikler sig og muliggør stadig mere brugbar automateret journalistik.
Den strategiske betydning af automatiseret journalistik
Fremkomsten af de tre forskellige slags automatiseret journalistik vil ændre den strategiske kontekst, som nyhedsudgivere befinder sig i. Selvom den præcise timing i udviklingen er svær at forudsige og dybden af konsekvenserne i en vis grad afhænger af nyhedsudgivernes egne handlinger, så må vi forvente følgende dynamikker:
Automatiseret journalistik giver konkurrencefordele for nyhedsudgivere:
Automatiseret journalistik bliver en kilde til både kvalitative og omkostningsmæssige fordele for nyhedsudgivere. De kvalitative fordele skabes af, at automatiseret journalistik gør det muligt at dække nyheder på områder og måder, som ville være økonomisk umulige, hvis menneskelige journalister skulle lave alt arbejdet.
Omkostningsfordelene stammer samtidig fra, at ”robotter” kan producere nyhedshistorier for journalister, hvilket frigør ressourcer til andre opgaver eller skaber grundlag for deciderede besparelser. Disse fordele vil gradvist blive større, efterhånden som den automatiserede journalistik udvikler sig og bliver bedre.
Nyhedsudgivere vil tabe yderligere kontrol over værdikæden til techvirksomheder:
Selvom mange nyhedsudgivere i fremtiden vil producere automatiseret journalistik, så vil de fleste nyhedsudgivere vælge at gøre det med teknologier købt fra techvirksomheder (fx NLG-editorer eller NLP-modeller).
Konsekvensen er, at ligesom nyhedsudgivere har mistet kontrol med de devices, som bruges til at tilgå nyheder og de teknologier, der distribuerer nyheder og annoncer, så vil nyhedsudgivere også gradvist miste kontrol over den teknologi, som producerer journalistikken – og dermed risikerer at kunne høste mindre af den værdi, som skabes af journalistikken.
Techvirksomheder vil bryde nyhedsudgivernes hidtidige monopol på journalistik (”debundling”)
Efterhånden som automatiseret journalistik bliver i stand til at producere stadig flere typer af historier baseret på machine learning (NLP eller avanceret NLG), så vil en stadig større del af journalistikken kunne produceres uden journalisters indblanding. Dette inviterer teknologivirksomheder (inklusive Google og Facebook) til selv at producere og udgive nyheder, hvilket bringer dem i direkte konkurrence med nyhedsudgiverne.
Højst sandsynligt vil denne konkurrence først
involvere kuraterede nyheder, der ikke er beskyttet af copyright (heller ikke af
det nye Copyright Directive, som blev vedtaget af EU d. 26. maj 2019), som kan
distribueres direkte i eksempelvis Google News og Facebooks Newsfeed eller via
taleassistenter som Alexa, Google Home og Siri. Senere vil konkurrencens
intensitet stige, efterhånden som NLP-baseret-automatisk-journalistik bliver
bedre og udviklingen skrider frem mod avanceret NLG.
Hvad kan nyhedsudgiverne gøre?
Hvis det ovenstående scenarie lyder skræmmende (for os nyhedsudgivere),
kan vi i det mindste prise os lykkelige for, at det stadigvæk er ”early days”
for automatiseret journalistik. Men hvis scenariet er rigtigt, så viser det
ikke desto mindre, at nyhedsudgivere bliver nødt til at se automatiseret
journalistik som et eksistentielt fænomen og vælge, hvilken position udgivere
skal stræbe efter i en fremtid, hvor produktionen af journalistik i stigende
grad er faciliteret af teknologi.
Når udgivere forholder sig til udviklingen i automatiseret
journalistik, har de mindst fire muligheder:
De kan
vente og se: Det er stadig ”early days” for automatiseret journalistik, og
alle beslutninger træffes derfor under usikkerhed vedrørende styrken og
timingen i udviklingen. Derfor kan vi vælge at se tiden an og vælge, hvordan vi
forholder os til udviklingen på et senere tidspunkt, hvor det er mere tydeligt,
hvordan NLG og NLP udvikler sig, samt hvordan andre (konkurrerende) udgivere
vælger at handle.
De kan købe licenser til en NLG-editor og investere i af bruge den: Simpel NLG er moden nok til, at enhver nyhedsudgiver er i stand til at licensere en regelmotor og en template-editor for at begynde at producere automatiseret journalistik på de områder, hvor der findes struktureret data (fx sportsresultater, trafikstatistik eller vejrprognoser). Ad denne vej kan udgivere opbygge kompetencer indenfor automatiseret journalistik og udvikle en række templates, der matcher udgiverens specifikke ”tone of voice”. Samtidig vil nyhedsudgiveren være positioneret til at høste de fordele, som opstår efterhånden som automatiseret journalistik udvikler sig.
De kan bygge
en NLG-editor selv: Ulempen ved at licensere en editor er dels, at
nyhedsudgiverne vil blive afhængig af en leverandør, dels af editoren ikke vil
være bygget til udgiveres specifikke behov (de fleste eksisterende editorer er
optimeret til business intelligence-formål). Udgiveren kan derfor vælge selv at
producere en editor fra bunden, så den passer til udgiverens konkrete behov, og
så udgiveren ikke bindes til en leverandørs roadmap og priser. I Danmark har
Jysk-Fynske Medier (med støtte fra Google’s Digital News Initiative)
eksempelvis valgt denne tilgang.
De kan deltage
i udviklingen af NLP-baseret automatiseret journalistik: Endeligt kan en
udgiver vælge at indlede NLP baseret produktion af automatiserede
nyhedshistorier. Denne tilgang vil – sandsynligvis – ikke resultere i store
effekter på det helt korte sigt, da NLP endnu kun er på vej til at kunne
producere publicerbare historier. Ikke desto mindre vil et engagement i
udviklingen af NLP-baseret automatiseret journalistik bygge kompetencer og forberede
til konkurrence på det område indenfor automatiseret journalistik, hvor de
største fremskridt må forventes i den nære fremtid.
I dag har langt de fleste af de udgivere, der har engageret sig i automatiseret journalistik, valgt at licensere regelmaskiner (og nogle gange endda produktionen af templates) fra techvirksomheder som Automated Insights (fx Associated Press) og United Robots (fx MittMedia]).
Nogle udgivere har dog valgt selv at producere regelmotorer og editorer, mens nogle få har engageret sig i eksperimenter med at integrere NLP i disse værktøjer (fx The Washington Post’s Heliograf og Arc[ samt Forbes’ Bertie, mens Associated Press eksperimenterer sammen med startup-virksomheden Agola).
Samtidig har den grundlæggende udvikling af NLP og avanceret
NLG været overladt til techvirksomheder, om end interessen for brugen af disse
teknologier vokser netop nu blandt de udgivere, der internationalt er længst
fremme i udviklingen.
Dette mønster er naturligt, eftersom det umiddelbare afkast
fra automatiseret journalistik endnu er begrænset, samt fordi nyhedsudgivere
generelt har begrænset erfaring med udvikling af teknologi.
Ikke desto mindre er den centrale forskel mellem det
tab af kontrol med værdikæden, der kan følge af automatiseret journalistik og
tidligere tab af kontrol, at det denne gang vedrører nyhedsudgivernes
kerneaktiv – selve journalistikken.
Samtidig er simpel NLG og NLP faktisk ikke mere kompliceret end, at nyhedsudgiverne kan hoste dise teknologier ”in house”. Derfor vil vi se større udgivere, der vælger at engagere sig dybt i udviklingen af automatiseret journalistik – samtidig med, at det er helt sikkert, at techvirksomhederne også vil gøre det.