Connect with us

Original

Det er nu medierne skal reagere strategisk på robotjournalistik

Medierne er før blevet påvirket voldsomt af ny teknologi, men med robotterne er selve DNA’et på spil, skriver strategichef Kasper Lindskow og udpeger fire mulige strategier.

Udgivet

den

Dette blogindlæg er skrevet af Kasper Lindskow, som er chef for strategi- og forretningsudvikling på Ekstra Bladet. Teksten er tidligere publiceret på engelsk hos INMA (International News Media Association – bag betalingsvæg).


Robotjournalistik (eller automatiseret journalistik) er begyndt at påvirke nyhedsmedierne markant. Vi debatterer allerede grundigt, hvordan automatiseringen påvirker journalistrollen, men robotternes strategiske betydning for medierne er indtil videre kun blevet diskuteret i begrænset omfang.

Den diskussion er ellers også meget vigtig.

Automatiseret journalistik har nemlig potentiale for, at nyhedsudgiverne mister yderligere kontrol over deres værdikæde, samt at nyhedsmedierne bliver yderligere opsplittede (”debundlede”) og at nogle opgaver, som i dag kontrolleres af medierne selv, overtages af techvirksomheder.

Vi har set samme dynamik i forbindelse med andre digitale innovationer.  F.eks. har fremkomsten af digitale markedspladser medført, at næsten alle rubrikannoncer er blevet ”debundled” fra nyhedsmedierne. Ligeledes har overgangen til digital distribution medført, at udgiverne generelt har tabt kontrollen med distributionen af både deres indhold og annoncer til digitale platforme, mellemmænd og deviceproducenter.

Til forskel fra disse digitale innovationer, der udfordrer nyhedsmedierne, vil den automatiserede journalistik imidlertid udfordre nyhedsudgiverne på deres kernekompetence og aktiv – journalistikken.

Automatiseret journalistik i dag og i morgen

For at forstå den strategiske betydning af automatiseret journalistik, er det nødvendigt at skelne mellem tre forskellige tilgange til produktion af automatiseret journalistik:

1: Automatiseret journalistik baseret på simpel Natural Language Generation (simpel NLG): Den mest basale form for automatiseret journalistik består af automatisk af matche struktureret data (fx sportsresultater, trafiknyheder eller kriminalstatistikker) med små tekstbidder i en artikeltemplate via logiske regler.

Disse tekstbidder og de regler, der knytter dem til datapunkter (fx sportsresultater), er kodet ind i en database via en editor, der normalt kan styres af en journalist med lidt teknisk flair og træning.

Resultatet er nogle ret standardiserede artikler med en sproglig variation, der afhænger af mængden af timer, som journalister har brugt på at opsætte regler og skrive tekstbidder. Eksempler på artikler skrevet på denne måde kan eksempelvis ses på La Times, Aftonbladet eller flere svenske lokale medier.

2: Automatisereret journalistik baseret på Natural Language Processing (NLP)

Mens automateret journalistik baseret på simpel NLG har eksisteret i en årrække, så er automatiseret journalistik baseret på NLP først ved at nå sit gennembrud. Modsat simpel NLG, der er baseret på logik, så er NLP baseret på kunstig intelligens (maskinlæringsmetoder som BERT og ELMo), der opsummerer og syntetiserer store mængder ustruktureret tekstdata som rapporter, internetdiskussioner og nyhedsartikler, som er produceret af nyhedsudgivere.

I dag er NLP i stand til automatisk at producere tekst i et sprog, der er ligeså rigt og varieret som artikler skrevet af journalister.

Metoden kan producere falske nyhedshistorier med en skræmmende kvalitet, som demonstreret af OpenAI i februar 2019.

Snart vil metoden også kunne kuratere nyhedshistorier med rigt sprog og tiltagende unikke vinkler ved at parse og syntetisere andre nyhedshistorier, rapporter og diskussioner (se rapport) – men NLP vil fortsat ikke være i stand til automatisk at producere originale nyheder.

3: Automatisereret journalistik baseret på avanceret NLG (Natural Language Generation)

I modsætning til NLP vil avanceret NLG være i stand til automatisk at producere originale nyhedshistorier baseret på en blanding af mange forskellige datakilder inklusive nyhedsartikler, rapporter, statistikker, billeder og video.

Når avanceret NLG er fuldt realiseret, vil metoden derfor være tæt på en fuld autonom robotjournalist. For at nå dertil skal der imidlertid skabes en kombination af flere maskinlæringsmetoder som NLP, Natural Language Understanding (NLU), billedgenkendelse og objektidentifikation – samt sandsynligvis et antal andre ingredienser, som endnu ikke findes.

Derfor er realiseringen af avanceret NLG endnu langt på den anden side af vores nuværende ”begivenhedshorisont”, selvom virksomheder som Google og Facebook ”forsker” intenst på området.

Et guestimat..

Mens udviklingen af simpel NLG til brug for robotjournalistik har været drevet af nyhedsudgivere i samarbejde med producenter af regelmotorer og editorer (som Automated Insights i USA, United Robots i Sverige eller Lasso X i Danmark), så har udviklingen af NLP (og avanceret NLG) været drevet næsten eksklusivt af techvirksomheder som Google, Facebook og OpenAI.

En del af grunden til dette er, at simpel NLG kræver journalistiske kompetencer i opbygingen af templates og er mindre fleksibelt og skalerbart end andre former for automatiseret journalistik. Omvendt kræver NLP og avanceret NLP ikke journalistiske kompetencer, hvilket gør dem mere attraktive for techvirksomheder.

Figuren nedenfor opsummerer de tre forskellige tilgange til automatiseret journalistik og giver et guestimat på, hvornår det bliver alment tilgængelige. Guestimatet skal tages med et gran salt, da fremkomsten af avanceret NLG er usikker samt – mere vigtigt – da det er sandsynligt, at de tre tilgange vil ændre sig og smelte sammen efterhånden, som de udvikler sig og muliggør stadig mere brugbar automateret journalistik.

Den strategiske betydning af automatiseret journalistik

Fremkomsten af de tre forskellige slags automatiseret journalistik vil ændre den strategiske kontekst, som nyhedsudgivere befinder sig i. Selvom den præcise timing i udviklingen er svær at forudsige og dybden af konsekvenserne i en vis grad afhænger af nyhedsudgivernes egne handlinger, så må vi forvente følgende dynamikker:

Automatiseret journalistik giver konkurrencefordele for nyhedsudgivere:

Automatiseret journalistik bliver en kilde til både kvalitative og omkostningsmæssige fordele for nyhedsudgivere. De kvalitative fordele skabes af, at automatiseret journalistik gør det muligt at dække nyheder på områder og måder, som ville være økonomisk umulige, hvis menneskelige journalister skulle lave alt arbejdet.

Omkostningsfordelene stammer samtidig fra, at ”robotter” kan producere nyhedshistorier for journalister, hvilket frigør ressourcer til andre opgaver eller skaber grundlag for deciderede besparelser. Disse fordele vil gradvist blive større, efterhånden som den automatiserede journalistik udvikler sig og bliver bedre.

Nyhedsudgivere vil tabe yderligere kontrol over værdikæden til techvirksomheder:

Selvom mange nyhedsudgivere i fremtiden vil producere automatiseret journalistik, så vil de fleste nyhedsudgivere vælge at gøre det med teknologier købt fra techvirksomheder (fx NLG-editorer eller NLP-modeller).

Konsekvensen er, at ligesom nyhedsudgivere har mistet kontrol med de devices, som bruges til at tilgå nyheder og de teknologier, der distribuerer nyheder og annoncer, så vil nyhedsudgivere også gradvist miste kontrol over den teknologi, som producerer journalistikken – og dermed risikerer at kunne høste mindre af den værdi, som skabes af journalistikken.

Techvirksomheder vil bryde nyhedsudgivernes hidtidige monopol på journalistik (”debundling”)

Efterhånden som automatiseret journalistik bliver i stand til at producere stadig flere typer af historier baseret på machine learning (NLP eller avanceret NLG), så vil en stadig større del af journalistikken kunne produceres uden journalisters indblanding. Dette inviterer teknologivirksomheder (inklusive Google og Facebook) til selv at producere og udgive nyheder, hvilket bringer dem i direkte konkurrence med nyhedsudgiverne.

Højst sandsynligt vil denne konkurrence først involvere kuraterede nyheder, der ikke er beskyttet af copyright (heller ikke af det nye Copyright Directive, som blev vedtaget af EU d. 26. maj 2019), som kan distribueres direkte i eksempelvis Google News og Facebooks Newsfeed eller via taleassistenter som Alexa, Google Home og Siri. Senere vil konkurrencens intensitet stige, efterhånden som NLP-baseret-automatisk-journalistik bliver bedre og udviklingen skrider frem mod avanceret NLG.

Hvad kan nyhedsudgiverne gøre?

Hvis det ovenstående scenarie lyder skræmmende (for os nyhedsudgivere), kan vi i det mindste prise os lykkelige for, at det stadigvæk er ”early days” for automatiseret journalistik. Men hvis scenariet er rigtigt, så viser det ikke desto mindre, at nyhedsudgivere bliver nødt til at se automatiseret journalistik som et eksistentielt fænomen og vælge, hvilken position udgivere skal stræbe efter i en fremtid, hvor produktionen af journalistik i stigende grad er faciliteret af teknologi.

Når udgivere forholder sig til udviklingen i automatiseret journalistik, har de mindst fire muligheder:

  1. De kan vente og se: Det er stadig ”early days” for automatiseret journalistik, og alle beslutninger træffes derfor under usikkerhed vedrørende styrken og timingen i udviklingen. Derfor kan vi vælge at se tiden an og vælge, hvordan vi forholder os til udviklingen på et senere tidspunkt, hvor det er mere tydeligt, hvordan NLG og NLP udvikler sig, samt hvordan andre (konkurrerende) udgivere vælger at handle.
  2. De kan købe licenser til en NLG-editor og investere i af bruge den: Simpel NLG er moden nok til, at enhver nyhedsudgiver er i stand til at licensere en regelmotor og en template-editor for at begynde at producere automatiseret journalistik på de områder, hvor der findes struktureret data (fx sportsresultater, trafikstatistik eller vejrprognoser). Ad denne vej kan udgivere opbygge kompetencer indenfor automatiseret journalistik og udvikle en række templates, der matcher udgiverens specifikke ”tone of voice”. Samtidig vil nyhedsudgiveren være positioneret til at høste de fordele, som opstår efterhånden som automatiseret journalistik udvikler sig.
  3. De kan bygge en NLG-editor selv: Ulempen ved at licensere en editor er dels, at nyhedsudgiverne vil blive afhængig af en leverandør, dels af editoren ikke vil være bygget til udgiveres specifikke behov (de fleste eksisterende editorer er optimeret til business intelligence-formål). Udgiveren kan derfor vælge selv at producere en editor fra bunden, så den passer til udgiverens konkrete behov, og så udgiveren ikke bindes til en leverandørs roadmap og priser. I Danmark har Jysk-Fynske Medier (med støtte fra Google’s Digital News Initiative) eksempelvis valgt denne tilgang.
  4. De kan deltage i udviklingen af NLP-baseret automatiseret journalistik: Endeligt kan en udgiver vælge at indlede NLP baseret produktion af automatiserede nyhedshistorier. Denne tilgang vil – sandsynligvis – ikke resultere i store effekter på det helt korte sigt, da NLP endnu kun er på vej til at kunne producere publicerbare historier. Ikke desto mindre vil et engagement i udviklingen af NLP-baseret automatiseret journalistik bygge kompetencer og forberede til konkurrence på det område indenfor automatiseret journalistik, hvor de største fremskridt må forventes i den nære fremtid.

I dag har langt de fleste af de udgivere, der har engageret sig i automatiseret journalistik, valgt at licensere regelmaskiner (og nogle gange endda produktionen af templates) fra techvirksomheder som Automated Insights (fx Associated Press) og United Robots (fx MittMedia]).

Nogle udgivere har dog valgt selv at producere regelmotorer og editorer, mens nogle få har engageret sig i eksperimenter med at integrere NLP i disse værktøjer (fx The Washington Post’s Heliograf og Arc[ samt Forbes’ Bertie, mens Associated Press eksperimenterer sammen med startup-virksomheden Agola).

Samtidig har den grundlæggende udvikling af NLP og avanceret NLG været overladt til techvirksomheder, om end interessen for brugen af disse teknologier vokser netop nu blandt de udgivere, der internationalt er længst fremme i udviklingen.

Dette mønster er naturligt, eftersom det umiddelbare afkast fra automatiseret journalistik endnu er begrænset, samt fordi nyhedsudgivere generelt har begrænset erfaring med udvikling af teknologi.  Ikke desto mindre er den centrale forskel mellem det tab af kontrol med værdikæden, der kan følge af automatiseret journalistik og tidligere tab af kontrol, at det denne gang vedrører nyhedsudgivernes kerneaktiv – selve journalistikken.

Samtidig er simpel NLG og NLP faktisk ikke mere kompliceret end, at nyhedsudgiverne kan hoste dise teknologier ”in house”. Derfor vil vi se større udgivere, der vælger at engagere sig dybt i udviklingen af automatiseret journalistik – samtidig med, at det er helt sikkert, at techvirksomhederne også vil gøre det.

Læs også