What's NXT i omvärldsanalys och insiktsproduktion – åt envar en egen researchbot

I snart tio års tid har vi med digitala assistenter som Siri kunnat få svar på enkla frågor. Men länge har vi saknat de verktyg som verkligen kan hjälpa analytiker och experter att snabbt ta sig igenom stora textmassor eller automatisera researcharbete. Men den tiden är nu snart förbi. På Kairos Future har vi i över tio års tid använt de senaste AI-metoderna för att effektivisera researcharbete och skapa lösningar åt våra kunder. Nu finns de metoderna också tillgängliga för andra. Och inom kort kan vi alla ha vår egen researchbot.

När Siri kom till stan
I snart tio år har vi nu haft dem vid vår sida – Siri, Alexa och Google Assistant. Även om de är långt ifrån perfekta så kan de hjälpa oss att hitta fakta, ta reda på väder och tågtider.

De digitala assistenterna är alla exempel på en av vår tids största tekniska revolutioner, nämligen det som går under benämningen NLP – natural language processing. Eller språkteknologi och datorlingvistik som många föredrar att kalla det. Det består av en mängd olika tekniker ämnade att förstå men också generera text. Och den stora revolutionen har skett de allra senaste åren, med språkmodeller med kryptiska namn som BERT, och Open AI:s GPT-3 som kronan på verket.

Insikt handlar inte bara om nålar i höstackar
De digitala assistenterna är i praktiken mer avancerade varianter av sök, där vi ställer våra frågor muntligen i stället för med en sträng text. Men resultatet blir detsamma. Ett AI-baserat system gissar sig till vad vi är ute efter och presenterar det mest sannolika svaret. När vi söker med hjälp av digitala assistenter får vi vanligen ett svar, medan databas- eller nätsök vanligen ger en träfflista som resultat med, i bästa fall, det mest relevanta lägst upp. På så sätt är såväl Siri som vanligt Google-sök fantastiska när det gäller att snabbt hitta nålen i höstacken.

Men mycket analysarbete handlar inte om att hitta nålar. Ofta handlar det snarare om att förstå höstackens struktur eller landskapet av höstackar. Och där har det inte funnits några verkligt bra verktyg att ta hjälp av. Säg att du sitter med en forskningsdatabas och är intresserad av att få de fem största temana inom hållbarhetsforskningen listade tillsammans med de mest relevanta artiklarna och de mest citerade forskarna inom varje område. Då finns inget söksystem som kan ge dig svaren. Och du kan definitivt inte fråga Siri om det. Detsamma gäller om frågan hade varit vilka reseupplevelser och destinationer människor verkar prata om nu i slutet av pandemin och hur de skiljer sig från diskussionerna två år tidigare. De lösningar för monitorering av diskussioner i sociala medier som finns, är inte byggda för detta.

Därför har de som verkligen varit intresserade av något annat än träfflistor och sentiment fram till nu varit tvungna att bygga sina egna lösningar genom att programmera i Python eller R. Något som är extremt tidskrävande och som det stora flertalet vanliga dödliga kunskapsarbetare, experter och analytiker vare sig har tid med eller behärskar.

Revolutionen är redan här
Men detta håller på att ändras. Redan i slutet av 00-talet började vi på Kairos Future att experimentera med nya research- och analysmetoder. Det började med att vi samlade ihop blogginlägg, högg upp dem i ord och analyserade dem statistiskt. Men ganska snart hade vi skrivit programsnuttar som underlättade arbetet, byggt ett verktyg för att generera kontextuella ordmoln och mycket mer, och bloggarna hade fått sällskap av nyhetstext, rapporter, vetenskapliga artiklar, patent, platsannonser och mycket mer. Under en tioårsperiod genomförde vi säkert 300 uppdrag där textanalys var den bärande eller i varje fall central komponent.

Genom att börja tillämpa alltmer avancerade metoder för textanalys fick vi möjlighet att lösa problem som annars var mer eller mindre olösliga, vi kunde genomföra komplexa omvärldsanalyser mycket snabbare än tidigare, och inte minst, vi kunde fiska upp helt unika insikter, sådant som varken vi eller våra kunder inte visste att vi eller de inte visste. De berömda ”unknown unknowns”.

Erfarenheterna från alla dessa projekt har nu samlats i verktyget Dcipher, som sedan några år är en självständig startup. På Kairos Future använder vi, analytiker och konsulter, nu Dcipher i mängder av projekt och för en rad olika syften. Skälet är enkelt: Dcipher innehåller allt man behöver för att kunna göra ad hoc-baserade analysprojekt, som att analysera tusentals öppna svar i enkäter, nyhetsartiklar eller sociala medieinlägg, högar med kundinteraktioner eller liknande. Men den kan också användas för att automatisera arbetsflöden eller bygga lösningar som automatiskt och löpande t ex klassificerar inlägg eller artiklar, och på så sätt fungerar som en AI-sidekick till en expert eller analytiker.
Exempel på teman som diskuterats i 300 öppna svar i en innovationsenkät våren 2021. Varje topp i landskapet representerar ett kluster av likartade svar. Rubrikerna på respektive kulle är vår tolkning.

Så funkar det – några snabba exempel
Låt oss ta några exempel på vad vi på Kairos Future använt Dcipher till i närtid:

  • Kategoriserat 700 inlägg i en SWOT-analys som skrevs in i en chatkanal under en onlineworkshop. Det tog 7 minuter medan deltagarna hämtade en kopp kaffe. Resultatet presenterades när de kom tillbaka.
  • Analyserat flera öppna svar i en medarbetarenkät för ett internationellt storbolag om covid-upplevelser. Enkäten besvarades av över 3 000 personer på 4 olika språk, allt automatöversattes i plattformen till engelska.
  • Analyserat 30 000 vetenskapliga artiklar, mängder av sociala medieinlägg, hundratals hållbarhetsrapporter och policydokument i ett projekt kring hållbarhetstrender.
  • Identifierat narrativ kring telefonförsäljning genom analys av anmälningar och kommentarer, nyhetsmedia och sociala media.
  • Skapat en webbaserad lösning för att identifiera och följa startups i Kina, baserat på en lång rad olika datakällor.
  • Skapat en lösning som automatiskt klassificerar forskningsansökningar i förutbestämda kategorier, på uppdrag av ett forskningsråd.

Mycket av detta är sådant där alternativet att inte göra något alls, eller att göra det manuellt. Öppna svar i enkäter är det t ex få som längre gör något av, eller ens använder. Skälet till det är att det är så jobbigt att analysera. Har man dem gör man på sin höjd ett ordmoln med ett stort ”OCH” i mitten. Öppna svar är dock ett fantastiskt sätt att fånga vad som verkligen rör sig i människors huvuden, och en möjlighet att fånga upp de okändheterna vi tidigare talat om.

Dessutom är de rätt enkla att låta en AI analysera. I Dcipher gör man det genom att helt enkelt dra ett textfält till en arbetsbänk som automatiskt identifierar teman. Ofta får man med några teman som inte har någon mening, vilka man enkelt kan ta bort. Därefter kan man hantera temana på samma sätt som alla andra frågor i enkäten, t ex bryta dem på kön, ålder eller andra bakgrundsdata. Man kan också ”berika” dem med kompletterande information, t ex sentiment – dvs hur positiva eller negativa är de som tar upp temat i genomsnitt.

På ett väldigt snarlikt sätt kan man arbeta med alla andra typer av text. Med moderna AI-baserade metoder går det därmed att begripliggöra de enorma mängder text som genereras såväl inom företags väggar som utanför dem. Vi kan ta dessa enorma ostrukturerade, stökiga textmassor och transformera dem till något som är begripligt, och som vi kan transformera till handlingsorienterade insikter.

Automatiskt identifierade teman i drygt 3000 svar från en medborgarenkät i Austin, USA. Det största temat handlar som framgår om ”utility”-frågor. Andra stora teman är kollektivtrafik, dåliga vägar mm.

I väntan på resarchbotten – men det mesta går att göra redan nu
Det finns fortfarande några utmaningar att lösa innan vi har den perfekta researchbotten. En handlar om att tolka innebörden av t ex ett identifierat tema. Där en tränad människa direkt ser vad något handlar om har en AI oerhört svårt att utifrån en massa fragment som den själv samlat ihop generalisera detta och sätta en rubrik. Men även sådant är på gång. Och när vi väl är där, vilket sannolikt är mycket snart, kommer vi också att kunna skicka in en hög rapporter rakt in i en lösning som Dcipher och direkt få tillbaka en analys och sammanfattning av de viktigaste insikterna. Kanske rent av uppläst med hjälp av röstsyntes, precis som Alexa eller Siri. Då är vi rätt nära den svartsjuka hologramavataren Selma i 90-talsserien Time Trax.

I väntan på det får vi hålla till godo med det som finns, nämligen extremt kraftfulla plattformar som bygger på den absolut senaste frontlinjetekniken och som sparar tid, blod svett och tårar, och som samtidigt genererar både bättre och mer överraskande resultat än vad människor förmår. Och det är inte dåligt det heller.

Nyfiken på mer?
Har du en specifik fråga du skulle vilja ha svar på där du tror att AI-metoder kan vara svaret? Vill du sätta upp en skräddarsydd automatiserad omvärldsbevakning med den absolut senaste tekniken, eller kanske analysera kundinteraktioner eller omdömen? Eller är du kanske bara nyfiken och vill veta mer?

Oavsett vilket, kontakta:

Mats Lindgren
mats.lindgren@kairosfuture.com

Mer om AI-verktyget Dcipher, här: www.dcipheranalytics.com

Några fakta om Dcipher:
Fördelar med Dcipher i förhållande till andra typer av verktyg är bl a:

  • Det är designat för text. Det finns flera analysplattformar, t ex Alteryx och Rapidminer, som har textanalys som ”tillägg”. Men de är i grunden designade för strukturerade data (numeriska), vilket är betydligt enklare att hantera. När man arbetar med text får man snabbt väldigt komplexa datastrukturer vilka inte enkelt kan hanteras med traditionella verktyg.
  • Det innehåller alla verktyg man behöver, från datatvätt, via textberikning (t ex att märka upp egennamn, sentiment mm), via analys och vidare till träning av AI-modeller. Det gör att man inte behöver vandra mellan olika verktyg.
  • Det har ett enkelt visuellt gränssnitt som gör det extremt lättanvänt, jämfört med alla tänkbara alternativ. Man interagerar med datan genom drag-and-drop och har hela tiden kontroll på vad man gör och ser omedelbart resultat av varje arbetsmoment (operation).
  • Det kräver ingen programmeringskunskap (är ett så kallat no-codeverktyg), och egentligen inga förkunskaper inom NLP-området.
  • Det finns en mängd hjälpmedel i verktyget som gör att man automatiskt kan tvätta text (t ex ta bort dubbletter av sociala medieinlägg, ta bort # mm) vilket snabbar upp processen avsevärt.
  • Det är molnbaserat, vilket bl a gör att det går att bearbeta mycket stora textmängder oerhört fort, även när man gör avancerade analyser. Sådant som på en PC tar timmar, tar kanske några minuter i Dcipher.
  • Det går att spara den s k pipeline av operationer som man byggt under en analys, vilket gör att man enkelt kan repetera exakt samma analys på ett nytt dataset t ex en månad senare.
  • Man kan enkelt träna domänspecifika språkmodeller, t ex när man ska analysera eller klassificera text inom en domän där det finns en massa specifik lingo som generella språkmodeller inte hanterar (t ex fackspråk eller slang).

 

By Mats Lindgren