Avvisi

Da Venerdì 27 Aprile le lezioni di labaoratorio inizieranno alle ore 09:30. La fascia oraria 08:45 - 09:30 viene dedicata ai progetti (domande, dubbi, etc...)

Sintesi dei progetti (link). Si invitano gli studenti controllare le informazioni riportate. Il file e' editabile in modo da completare le informazioni mancanti oppure modificare alcune imprecisioni.

09/04/2018: Sono state aggiunti i link a tre diversi repository di network nella sezione Syllabus -> Laboratorio 06/04/2018

04/04/2018: Sono state caricate le istruzioni per l'installazione di Scrapy. Si consiglia di installare Scrapy prima della lezione di laboratorio del 6 Aprile.

Programma del corso
Syllabus del corso
Teoria 26/02/2018

Presentazione del corso (slide).

Teoria 28/02/2018

Social media mining (Capitolo 1 - Zafarani).

Network science (Capitolo 1 - Barabasi).

Teoria 01/03/2018

Network e grafi - Parte 1

Laboratorio 02/03/2018

Introduzione a Python: notebook delle lezione.

Teoria 07/03/2018

Network e grafi - Parte 2

Teoria 09/03/2018

Network e grafi - Parte 3

Teoria 12/03/2018

Random Networks

Barabasi: 3.1, 3.2, 3.3, 3.4, 3.5, 3.13

Teoria 14/03/2018

Scale-free networks: 1, 2, 3.

Teoria 15/03/2018

Scale-free networks

Barabasi: 4.1, 4.2, 4.3, 4.4, 4.5, 4.11, 4.12

Laboratorio 16/03/2018

Web Scraping: Notebook e file ausiliari.

Esercitazione guidata sul web scraping. La cartella contiene il notebook dell'esercitazione e il notebook con la soluzione. Si consiglia di ricorrere alla soluzione solo dopo aver tentato molte volte di risolvere l'esercizio.

Teoria 19/03/2018

Il modello di Barabasi-Albert
Barabasi: 5.1, 5.2, 5.3, 5.6

Connettività: slide

Teoria 21/03/2018

Componenti connesse
Barabasi: 3.6, 3.7 (solo componenti connesse)
Newman: 8.1

Componenti connesse nelle reti reali: Web Graph, Facebook, Twitter.

Teoria 22/03/2018

Misure di centralità in grafi non orientati
Zafarani 3.1.1, 3.1.2, 3.1.5, 3.1.6
Newman 7.1, 7.2, 7.6, 7.7

Laboratorio 23/03/2018

Notebook sulle Twitter REST API.

Consumer key e consumer secret per Twitter REST API (link)

Teoria 26/03/2018

Misure di centralità in grafi non orientati
Zafarani 3.1.1, 3.1.2, 3.1.5, 3.1.6
Newman 7.1, 7.2, 7.6, 7.7

Teoria 28/03/2018

Misure di centralità in grafi non orientati
Zafarani 3.1.1, 3.1.2, 3.1.5, 3.1.6
Newman 7.1, 7.2, 7.6, 7.7

Teoria 04/04/2018

Misure di centralità in grafi orientati
Zafarani 3.1.3, 3.1.4
Newman 7.3, 7.4

Reciprocity
Zafarani 3.2.2
Newman 7.10

Laboratorio 06/04/2018

Note sull'installazione di Scrapy.

Repository di network

  • Network Repository (link)
  • KONECT (link)
  • Stanford Large Network Dataset Collection (link)

Esercitazione su web scraping e Twitter API.

Laboratorio 11/04/2018

Notebook su Scrapy.

Laboratorio 13/04/2018

Notebook su NetworkX e analisi di network.

Teoria 16-17-19/04/2018

Misure di similarità e assortatività
Zafarani 3.4, 8.1

Assortatività in Facebook e Twitter

Laboratorio 20/04/2018

Notebook su NetworkX e analisi di network: grado e altre misure di centralità

Laboratorio 23/04/2018

Notebook su NetworkX e analisi di network: grado e altre misure di centralità

Calendario
  • 5 Aprile: presentazione progetti
  • 9 Aprile: presentazione progetti in Aula Beta
  • 11 Aprile: lezione di laboratorio in Aula Beta (11:30 - 13:30)
  • 12 Aprile: presentazione progetti in Aula Beta
  • 23 Aprile: lezione di laboratorio in Aula Sigma
  • 26 Aprile : sospensione della lezione
  • 28 Maggio: scritto di teoria (domande aperte)
  • 30 Maggio: scritto di teoria (esercizi)
  • 4, 6, 7 Giugno: presentazione progetti in Aula Beta
Informazioni

Modalità d'esame

Teoria: scritto con esercizi e domande aperte.

Laboratorio: progetto da concordare con il docente e discussione del progetto.

Modalità Presentazione Progetti

Lo studente deve presentare il social media oggetto della sua analisi evidenziando:

  • Caratteristiche del social media
  • Modalita' di estrazione delle informazioni, evidenziando i punti critici, quali meccanismi di autenticazione, caricamento dinamico delle pagine, API mal documentate
  • Quali informazioni si utilizzeranno per la costruzione della network (nodi, archi, eventuali attributi) e quali aspetti si vogliono analizzare (community, sentiment, tags, reciprocity, assortativity, etc...)
  • Stato del progetto. Per esempio, codice gia' sviluppato, primi tentativi con le librerie, login effettuato, etc..

Orario

Giorno Aula Indirizzo Orario
Lunedì Aula Beta Via Comelico 39/41 - Dipartimento di Informatica 14:30-16:30
Mercoledì Aula Beta Via Comelico 39/41 - Dipartimento di Informatica 11:30-13:30
Giovedì Aula Beta Via Comelico 39/41 - Dipartimento di Informatica 13:45-15:30
Venerdì Aula Delta Via Comelico 39/41 - Dipartimento di Informatica 9:00-12:45

Bibliografia

Social Media Mining

Reza Zafarani, Mohammad Ali Abbasi, Huan Liu

Cambridge University Press

2014

Network Science

A.L. Barabasi

2014

Networks, Crowds, and Markets: Reasoning About a Highly Connected World

David Easley e Jon Kleinberg

Cambridge University Press

2010

Social Network Analysis: Methods and Applications

Stanley Wasserman e Katherine Faust

Cambridge University Press

1995

Networks: An Introduction

M.E.J. Newman

Oxford Press

2010

Social Media ROI

Vincenzo Cosenza

Apogeo

2014

Letture consigliate

  • Barabasi, Albert-Laszlo. "Scale-free networks: a decade and beyond."science 325, no. 5939 (2009): 412. Link
  • Reka Albert, Hawoong Jeong and Albert-Laszlo Barabasi. "Internet: Diameter of the World-Wide Web." Nature 401, 130-131 (9 September 1999).Link
  • Granovetter, Mark S. "The strength of weak ties." American journal of sociology (1973): 1360-1380.
  • Ugander, Johan, Brian Karrer, Lars Backstrom, and Cameron Marlow. "The anatomy of the facebook social graph." arXiv preprint arXiv:1111.4503(2011).
  • Kwak, Haewoon, Changhyun Lee, Hosung Park, and Sue Moon. "What is Twitter, a social network or a news media?." In Proceedings of the 19th international conference on World wide web, pp. 591-600. ACM, 2010.
  • Broder, Andrei, Ravi Kumar, Farzin Maghoul, Prabhakar Raghavan, Sridhar Rajagopalan, Raymie Stata, Andrew Tomkins, and Janet Wiener. "Graph structure in the web." Computer networks 33, no. 1 (2000): 309-320.
  • Onnela, J-P., Jari Saramaki, Jorkki Hyvonen, Gyorgy Szabo, David Lazer, Kimmo Kaski, Janos Kertesz, and A-L. Barabasi. "Structure and tie strengths in mobile communication networks." Proceedings of the National Academy of Sciences 104, no. 18 (2007): 7332-7336.
  • M Cha, H Haddadi, F Benevenuto, PK Gummadi. "Measuring User Influence in Twitter: The Million Follower Fallacy." ICWSM, 2010.

Contatti e ricevimento

Docente Mail Ufficio Orario
Sabrina Gaito sabrina.gaito@unimi.it Stanza S203 - Via Comelico 39/41 su appuntamento
Zignani Matteo (laboratorio) matteo.zignani@unimi.it Lab. S230 - Via Comelico 39/41 su appuntamento
Proposte di tesi
Eearly anomaly detection and warning - in collaborazione con Blogmeter
La tesi è mirata a comprendere come implementare meccanismi di riconoscimento di anomalie e loro segnalazione. Il contesto di riferimento è la social media analysis, dove ad ogni progetto vengono associati set di keyword di ascolto concordati che vanno a comporre il set di messaggi associati a quel progetto stesso. L'attività sarà mirata a mettere in luce eventuali variazioni rilevanti rispetto alla media (es. un picco di messaggi molto superiore all'atteso) e a segnalarlo automaticamente. Lo stesso tipo di attività potrà essere finalizzata non solo sui volumi di messaggi complessivi ma anche:
  • per segnalazioni di anomalie legate al sentiment automatico atteso (sempre su dati clienti/progetti)
  • per segnalazione di anomalie legate all'andamento di metriche base sull'andamento di singole pagine Facebook o altri profili social (es. segnalazioni di picco anomalo di crescita numero di fan o engagament)
Content Similarity - in collaborazione con Blogmeter
Sulla base di un un insieme di contenuti pubblicati sui social network sia da brand che da persone cosiddette Social Influencer la tesi sarà mirata a definire quali set di contenuti (e quindi di persone e brand che li pubblicano) possano essere definiti simili all'insieme iniziale dato.
Partendo quindi da uno specifico profilo social, lo scopo della ricerca sarà quello di segnalare quali altri persone/pagnie (facenti parte di una lista selezionata di profili di partenza) presentino caratteristiche simili, attraverso l'analisi dei contenuti prodotti sui social dalle persone stesse ma anche considerando dei parametri quanti-qualitativi pre-assegnati (es. numero di fan, tasso di engagement, nazione di provenienza)