Rispetto agli ultimi eventi che hanno interessato il nuovo leader del Partito Democratico, cosa dicono gli utenti di Twitter?
Abbiamo lanciato una ricerca nell’ambito del microblogging (dunque escludendo, questa volta, tutte le altre fonti) ed ecco il risultato:
Nota: la ricerca è stata effettuata l’8 novembre 2009, portata a termine alle ore 17:39; la piattaforma ha selezionato 264 post pertinenti
Cinque thread riconosciuti dal sistema BR Engine; per ciascuno riportiamo una citazione.
Giustizia: dialogo tra Bersani e Berlusconi in tema giustizia NoBeLuScOnIAlfano: “Riforma della giustizia anche da soli” Berlusconi: “Dialogo con quel c******* di Bersani se non insulta”
Rosy Bindi: si discute della presidenza al PD di Rosy Bindi giuslomGià due errori da Bersani:1.la presidenza aBindi;2.sbaglia nello sminuire i dati Ocse,dimostrando miopia sulla strutturazione della crisi
Francesco Rutelli: commenti all’addio di Rutelli al PD valeriadeluca86effetto bersani: rutelli e cacciari fuori dal pd…aspetto l’uscita della binetti e poi potrò finalmente dire “GRAZIE BERSANI!”
Alternativa a Berlusconi: si parla del PD come “alternativa a” diokr1st0Bersani vuole un partito “di alternativa“. Probabilmente a un partito di sinistra
Federalismo: ci si interroga sulle dichiarazioni di Bersani in materia di federalismo fabiochiusiBersani chiede un federalismo “dei fatti”. In cosa consiste?
Quanto a tutti gli altri temi toccati nelle conversazioni online, che qui non abbiamo categorizzato essendo molti e con sottili differenze di contenuto, riportiamo le parole più usate dagli utenti:
Questa volta abbiamo sondato, archiviato, ordinato la massa di informazioni (di varia origine, dai forum ai blog, dai video ai messaggi pubblici tra utenti) presente in rete, in cerca di testi di qualunque origine nei quali è stato citato il Presidente del Consiglio Silvio Berlusconi. Abbiamo considerato le pagine pubblicate nell’arco degli ultimi 12 mesi (fino al 5/7/2009). Dal campo della ricerca sono state escluse le fonti privilegiate dell’informazione (i siti web dei maggiori quotidiani) per far emergere il più possibile le comunicazioni spontanee tra gli utenti, le opinioni diffuse autonomamente in rete.
Si deve precisare tuttavia che l’indagine effettuata non ha alcun connotato politico, il contenuto testuale viene raccolto, analizzato e catalogato automaticamente dalla piattaforma BuzzReader Engine. La scelta di approfondire alcuni temi piuttosto che altri è dettata principalmente dalla facilità a categorizzare un certo tipo di espressioni e di enunciati (alla massiccia ricorrenza, come nel caso del thread “Obama”, di talune espressioni; alla rapida ed elementare disambiguazione di certe parole, ecc).
Iniziamo con la visualizzazione dei principali temi che occorrono contestualmente al nome di Silvio Berlusconi in rete.
Rielaboriamo in una ‘torta’ gli stessi dati:
Ognuno di questi ‘thread’ consta di un certo numero di messaggi commenti abstract (19461, per “Noemi Letizia”) scaricati da BuzzReader Engine; per ciascun ‘thread’ possiamo più o meno rapidamente estrarre la sintesi dei temi collegati. Per esempio, il thread “Leggi” lo si può sezionare in questo modo:
Significa che nei documenti in cui si parla di leggi e in concomitanza con Silvio Berlusconi si trattano questi temi. Sull’asse delle ascisse si trovano le ricorrenze: questo vuol dire che in una singola pagina possono essere argomentati tutti e otto i temi, oppure uno soltanto; “legge elettorale” ad esempio corrisponde a un set di parole chiave considerate equivalenti, o sinonimi – “porcata”, “porcellum”, “proporzionale”, “maggioritario”, “referendum” ecc.
Il thread “Milan”.
Sono qui mostrati i nomi propri e di squadre italiane che più ricorrono nei documenti web in cui si discetta (o si sproloquia) di Milan, Calcio e Berlusconi.
Il thread “Obama” raggruppa 16443 documenti, commenti o abstract di video, dove le parole o le espressioni più ricorrenti adoperate dagli utenti sono:
Ora, trasversalmente, intercettiamo quali sono i nomi propri nei dintorni del nostro soggetto (”Berlusconi”, o “Silvio Berlusconi”) appartenenti al mondo politico (sono stati esclusi infatti i pur numerosi Prodi, Craxi, Gelli, etc )
Infine, un elenco delle maggiori fonti: i siti che più argomentano intorno a Silvio Berlusconi.
L’idea era partire dalla parola “Fiat”, in questo caso senza alcun setup della ricerca, di modo che BR Engine fornisse ‘da sè’ alcune linee guida (k-concept). Chiamiamo k-concept i grappoli di keywords più rilevanti rispetto ad un tema, keywords che il nostro software è in grado di aggregare. Ma è emerso molto di più.
La prima radiografia che si è presentata è la seguente:
Di questi macro-argomenti si discute in rete (Web pages, Blog e Video) secondo BR Engine.
Per intenderci, ecco alcune keywords archiviate da BR Engine e riunite sotto il macro-argomento “Attualità”:
(curioso è il verbo “sopravvivere“, tra i più pertinenti secondo l’analisi delle conversazioni)
bquery
parola
pertinenza
1,24399E+12
sciopero
5,00E+01
1,24399E+12
fiat
1,70E+01
1,24399E+12
termini
5,40E+01
1,24399E+12
napoli
3,00E+00
1,24399E+12
imerese
5,00E+00
1,24399E+12
sopravvivere
4,00E+00
1,24399E+12
operai
4,00E+00
1,24399E+12
lottare
3,00E+00
bquery
parola
pertinenza
1,24399E+12
marchionne
9,20E+02
1,24399E+12
fiat
7,68E+02
1,24399E+12
opel
8,87E+02
1,24399E+12
chrysler
8,80E+01
1,24399E+12
magna
5,20E+01
1,24399E+12
accordo
9,30E+01
bquery
parola
pertinenza
1,24399E+12
storia
4,64E+02
1,24399E+12
fiat
4,09E+02
1,24399E+12
annozero
4,40E+01
1,24399E+12
operai
3,30E+01
Invece, per quanto riguarda il secondo argomento, ”Modelli”, inseriamo qui una vista delle ricorrenze di k-concept (aggregazione di parole chiave, abbiamo detto) che ci permette di quantificare la mole di conversazioni rispetto ale k-concept stesse.
In breve: Di quali modelli di automobili si chiacchiera in rete, e quanto?
Sì ma, quando si parla di “Punto”, di cosa si sta conversando?
Si chiacchiera sicuramente della nuova Punto, della Punto Natural Power, della Punto Multijet, della Punto Elx (francamente, prima di lanciare la query non avrei mai immaginato che esistessero tante Punto).
E la keyword SPOT?
Ci sono degli spot molto popolari? Andiamo a vedere.
Ora però accantoniamo l’argomento “Punto”, e vediamo di quali SPOT FIAT si parla su internet (compresi naturalmente gli spot della Punto)
Frughiamo tra i media della rete: ovvero nelle citazioni ipertestuali (link) all’interno di quelle conversazioni che riguardano spot della fiat. E’ interessante. Nella prima colonna vedete le keyword intercettate da BR Engine, poi il numero di link e il link stesso. (Alcune keywords equivalgono all’username dell’utente youtube che ha pubblicato il video)
Si tratta di un tema vasto e complesso, ne diamo qui una prima analisi. Le informazioni sono state raccolte dalla piattaforma BuzzReader Engine, i post sono stati archiviati ed elaborati, ma non letti: questa corrisponde a parte della sezione quantitativa dei report di BuzzReader.
1.
Le fonti di raccolta
2.
Vista preliminare (non sviluppata) sulle parole ricorrenti:
3.
Sviluppo. Macrotemi: nelle pagine/siti in cui è trattato l’argomento “elettrosmog”, si parla principalmente di:
4.
Sviluppo. Quali apparecchi inquinano:
5.
Tra le “word-concept” più diffuse, quelle legate a Radio Vaticana:
Overview preliminare (non sviluppata):
6.
Sviluppo. Le soluzioni più citate (corrispondenti alle word-concept “schermature”, “schermanti” ecc.) sono:
7.
Sviluppo. Di quali forme di inquinamento si discute maggiornamente in rete:
8.
Le url in cui riccorrono in maggior numero le “word-concept” per elettrosmog
L’origine è dal latino putare e, tra le tante, è l’accezione di ‘recidere’ i rami inutili da una pianta che dà a reputazione il senso di sfoltita, delle molte opinioni su un soggetto, per estrarne, sceverando, la sintesi del giudizio. Onesto o disonesto, sincero o mendace, affidabile o meno.
Naturalmente con i mezzi di comunicazione di massa il concetto di reputazione ha forme complesse e mobili, con una differenza netta però tra media piramidali, come quello televisivo, dove l’irradiazione è vigilata dal potere politico in certa misura e dagli organi di garanzia, e media sostanzialmente orizzontali come internet, dove il singolo è cellula indipendente e dicente, difficile da identificare, raggiungere, dissuadere con gli strumenti giudiziari o con metodi assai più silenziosi. Il controllo e la consapevolezza della propria reputazione è difficile.
La complessità si traduce nella difficoltà ad operare quella ’sfoltita’ – sintesi dell’enorme, multiforme, multicanale massa di informazioni – allo scopo di recepire:
a) In che termini si parla in rete di un soggetto
b) Dove se ne parla
c) Quanti ne parlano positivamente e quanti negativamente.
d) Quali delle fonti sono poco raggiungibili dagli utenti; quali invece sono punti nodali, visibili, probabilmente oggetto di molti accessi, che diffondono dunque la reputazione del soggetto a un pubblico vasto, attivo.
B.
Andiamo dall’astrazione alle pratiche. In questi anni sono stati immessi sul mercato software e servizi di reputazione online che eseguono per l’appunto quella ’sfoltita’ e producono – spesso in modo non automatico, quindi con l’operazione tutta umana di lettura delle informazioni – un documento di sintesi (report).
Analisi quantitative dunque – per sussumere, ordinare l’informità – e analisi qualitative di singoli post, pagine, video, libri online, tutto ciò ch’è testo decifrabile, trovano il connubio ideale per raccontare ‘cosa si dice sulla rete’ di persone, temi, marchi aziendali, partiti politici ecc.
C.
Il sistema BuzzReader esplora, rileva, ordina, categorizza parole, nomi, frasi, concetti di media complessità catturati all’interno di pagine web, blog, siti di informazione, aggregatori di materiale audiovisivo (you tube ecc), libri archiviati online via google, motori di ricerca di community e forum.
La nostra piattaforma, attualmente residente su una server farm, archivia gran parte della massa testuale di informazioni online (sempre rispetto a quel criterio, o algoritmo) producendo in modo automatico una sintesi. Dopodiché i documenti segnalati come interessanti (in base a un set di parole chiave) vengono scorsi da un gruppo di lettori, per poi produrre un rapporto qualitativo, a complemento del primo automatizzato/quantitativo. Da questi due approcci viene il report finale sulla reputazione online del nostro soggetto.