Avvisi

Esiti dell'esame scritto del 13 Giugno 2018. Gli studenti che hanno sostenuto lo scritto e non ancora discusso il progetto possono discuterlo Martedì 19 Giugno dalle ore 09:30 presso il laboratorio di reti (s230 - Via Comelico)

Esiti delle presentazioni del 18 Giugno 2018.

La presentazione dei progetti e' stata fissata per Lunedi' 18 Giugno alle ore 09:30 in Aula Alfa.

La prova scritta si terrà il 13/06/2018 in Aula Beta (via Comelico) dalle ore 09:00 alle ore 12:00

Gli esiti dell'esame sono disponibili qui

Gli esiti delle prove in itinere sono disponibili qui.

Nella sezione "Temi d'esame" sono stati pubblicati i temi d'esame delle prove in itinere.

Iscrizione Prova in Itinere

Form Iscrizione Esame

Programma del corso
Syllabus del corso
Teoria 26/02/2018

Presentazione del corso (slide).

Teoria 28/02/2018

Social media mining (Capitolo 1 - Zafarani).

Network science (Capitolo 1 - Barabasi).

Teoria 01/03/2018

Network e grafi - Parte 1

Laboratorio 02/03/2018

Introduzione a Python: notebook delle lezione.

Teoria 07/03/2018

Network e grafi - Parte 2

Teoria 09/03/2018

Network e grafi - Parte 3

Teoria 12/03/2018

Random Networks

Barabasi: 3.1, 3.2, 3.3, 3.4, 3.5, 3.13

Teoria 14/03/2018

Scale-free networks: 1, 2, 3.

Teoria 15/03/2018

Scale-free networks

Barabasi: 4.1, 4.2, 4.3, 4.4, 4.5, 4.11, 4.12

Laboratorio 16/03/2018

Web Scraping: Notebook e file ausiliari.

Esercitazione guidata sul web scraping. La cartella contiene il notebook dell'esercitazione e il notebook con la soluzione. Si consiglia di ricorrere alla soluzione solo dopo aver tentato molte volte di risolvere l'esercizio.

Teoria 19/03/2018

Il modello di Barabasi-Albert
Barabasi: 5.1, 5.2, 5.3, 5.6

Connettività: slide

Teoria 21/03/2018

Componenti connesse
Barabasi: 3.6, 3.7 (solo componenti connesse)
Newman: 8.1

Componenti connesse nelle reti reali: Web Graph, Facebook, Twitter.

Teoria 22/03/2018

Misure di centralità in grafi non orientati
Zafarani 3.1.1, 3.1.2, 3.1.5, 3.1.6
Newman 7.1, 7.2, 7.6, 7.7

Laboratorio 23/03/2018

Notebook sulle Twitter REST API.

Consumer key e consumer secret per Twitter REST API (link)

Teoria 26/03/2018

Misure di centralità in grafi non orientati
Zafarani 3.1.1, 3.1.2, 3.1.5, 3.1.6
Newman 7.1, 7.2, 7.6, 7.7

Teoria 28/03/2018

Misure di centralità in grafi non orientati
Zafarani 3.1.1, 3.1.2, 3.1.5, 3.1.6
Newman 7.1, 7.2, 7.6, 7.7

Teoria 04/04/2018

Misure di centralità in grafi orientati
Zafarani 3.1.3, 3.1.4
Newman 7.3, 7.4

Reciprocity
Zafarani 3.2.2
Newman 7.10

Laboratorio 06/04/2018

Note sull'installazione di Scrapy.

Repository di network

  • Network Repository (link)
  • KONECT (link)
  • Stanford Large Network Dataset Collection (link)

Esercitazione su web scraping e Twitter API.

Laboratorio 11/04/2018

Notebook su Scrapy.

Laboratorio 13/04/2018

Notebook su NetworkX e analisi di network.

Teoria 16-17-19/04/2018

Misure di similarità e assortatività
Zafarani 3.4, 8.1

Assortatività in Facebook e Twitter

Laboratorio 20/04/2018

Notebook su NetworkX e analisi di network: grado e altre misure di centralità

Laboratorio 23/04/2018

Notebook su NetworkX e analisi di network: grado e altre misure di centralità

Laboratorio 27/04/2018

Notebook su Scrapy: funzionalità avanzate

Teoria 02/05/2018

Triadic closure: Zafarani 3.2.1

Laboratorio 27/04/2018

Notebook su NetworkX: centralita' basate sui cammini minimi, componenti connesse, cammini minimi, cammini di peso minimo

Teoria 07/05/2018

Strong e weak ties: Kleinberg 3.1, 3.2, 3.3 e 3.4

Teoria 09/05/2018

Community detection (Slide)

Teoria 10/05/2018

Information Diffusion: Zafarani 7.1, 7.2

Laboratorio 11/05/2018

Notebook su NetworkX: reciprocity, assortativity e community detection.

Calendario
  • 5 Aprile: presentazione progetti
  • 9 Aprile: presentazione progetti in Aula Beta
  • 11 Aprile: lezione di laboratorio in Aula Beta (11:30 - 13:30)
  • 12 Aprile: presentazione progetti in Aula Beta
  • 23 Aprile: lezione di laboratorio in Aula Sigma
  • 26 Aprile : sospensione della lezione
  • 21 Maggio: Esercitazione dalle 13.30 alle 16.30 in aula Beta
  • 23 Maggio: Esercitazione dalle 11.30 alle 13.30 in aula Beta
  • 24 Maggio: Esercitazione dalle 13.30 alle 15.30 in aula Beta
  • 28 Maggio: Prova in itinere di teoria (esercizi) dalle 13.30 alle 16.30 in aula Beta
  • 30 Maggio: Prova in itinere di teoria (domande aperte) dalle 11.30 alle 13.30 in aula Beta
  • 31 Maggio: Correzione degli esercizi dalle 13.30 alle 15.30 in aula Beta
  • 04 Giugno: Presentazione progetti dalle 13.30 alle 16.30 in aula Beta
  • 06 Giugno: Presentazione progetti dalle 11.30 alle 13.30 in aula Beta
  • 07 Giugno: Presentazione progetti dalle 13.30 alle 15.30 in aula Beta
Temi d'esame
Informazioni

Modalità d'esame

Teoria: scritto con esercizi e domande aperte.

Laboratorio: progetto da concordare con il docente e discussione del progetto.

Modalità Presentazione Progetti

Lo studente deve presentare ai docenti il progetto svolto in circa 10 minuti + 2 minuti di domande.

  • Caratteristiche del social media
  • Modalita' di estrazione delle informazioni, evidenziando i punti critici, quali meccanismi di autenticazione, caricamento dinamico delle pagine, API mal documentate
  • Quali informazioni si utilizzeranno per la costruzione della network (nodi, archi, eventuali attributi) e quali aspetti si vogliono analizzare (community, sentiment, tags, reciprocity, assortativity, etc...)
  • Stato del progetto. Per esempio, codice gia' sviluppato, primi tentativi con le librerie, login effettuato, etc..

Orario

Giorno Aula Indirizzo Orario
Lunedì Aula Beta Via Comelico 39/41 - Dipartimento di Informatica 14:30-16:30
Mercoledì Aula Beta Via Comelico 39/41 - Dipartimento di Informatica 11:30-13:30
Giovedì Aula Beta Via Comelico 39/41 - Dipartimento di Informatica 13:45-15:30
Venerdì Aula Delta Via Comelico 39/41 - Dipartimento di Informatica 9:00-12:45

Bibliografia

Social Media Mining

Reza Zafarani, Mohammad Ali Abbasi, Huan Liu

Cambridge University Press

2014

Network Science

A.L. Barabasi

2014

Networks, Crowds, and Markets: Reasoning About a Highly Connected World

David Easley e Jon Kleinberg

Cambridge University Press

2010

Social Network Analysis: Methods and Applications

Stanley Wasserman e Katherine Faust

Cambridge University Press

1995

Networks: An Introduction

M.E.J. Newman

Oxford Press

2010

Social Media ROI

Vincenzo Cosenza

Apogeo

2014

Letture consigliate

  • Barabasi, Albert-Laszlo. "Scale-free networks: a decade and beyond."science 325, no. 5939 (2009): 412. Link
  • Reka Albert, Hawoong Jeong and Albert-Laszlo Barabasi. "Internet: Diameter of the World-Wide Web." Nature 401, 130-131 (9 September 1999).Link
  • Granovetter, Mark S. "The strength of weak ties." American journal of sociology (1973): 1360-1380.
  • Ugander, Johan, Brian Karrer, Lars Backstrom, and Cameron Marlow. "The anatomy of the facebook social graph." arXiv preprint arXiv:1111.4503(2011).
  • Kwak, Haewoon, Changhyun Lee, Hosung Park, and Sue Moon. "What is Twitter, a social network or a news media?." In Proceedings of the 19th international conference on World wide web, pp. 591-600. ACM, 2010.
  • Broder, Andrei, Ravi Kumar, Farzin Maghoul, Prabhakar Raghavan, Sridhar Rajagopalan, Raymie Stata, Andrew Tomkins, and Janet Wiener. "Graph structure in the web." Computer networks 33, no. 1 (2000): 309-320.
  • Onnela, J-P., Jari Saramaki, Jorkki Hyvonen, Gyorgy Szabo, David Lazer, Kimmo Kaski, Janos Kertesz, and A-L. Barabasi. "Structure and tie strengths in mobile communication networks." Proceedings of the National Academy of Sciences 104, no. 18 (2007): 7332-7336.
  • M Cha, H Haddadi, F Benevenuto, PK Gummadi. "Measuring User Influence in Twitter: The Million Follower Fallacy." ICWSM, 2010.

Contatti e ricevimento

Docente Mail Ufficio Orario
Sabrina Gaito sabrina.gaito@unimi.it Stanza S203 - Via Comelico 39/41 su appuntamento
Zignani Matteo (laboratorio) matteo.zignani@unimi.it Lab. S230 - Via Comelico 39/41 su appuntamento
Proposte di tesi
Eearly anomaly detection and warning - in collaborazione con Blogmeter
La tesi è mirata a comprendere come implementare meccanismi di riconoscimento di anomalie e loro segnalazione. Il contesto di riferimento è la social media analysis, dove ad ogni progetto vengono associati set di keyword di ascolto concordati che vanno a comporre il set di messaggi associati a quel progetto stesso. L'attività sarà mirata a mettere in luce eventuali variazioni rilevanti rispetto alla media (es. un picco di messaggi molto superiore all'atteso) e a segnalarlo automaticamente. Lo stesso tipo di attività potrà essere finalizzata non solo sui volumi di messaggi complessivi ma anche:
  • per segnalazioni di anomalie legate al sentiment automatico atteso (sempre su dati clienti/progetti)
  • per segnalazione di anomalie legate all'andamento di metriche base sull'andamento di singole pagine Facebook o altri profili social (es. segnalazioni di picco anomalo di crescita numero di fan o engagament)
Content Similarity - in collaborazione con Blogmeter
Sulla base di un un insieme di contenuti pubblicati sui social network sia da brand che da persone cosiddette Social Influencer la tesi sarà mirata a definire quali set di contenuti (e quindi di persone e brand che li pubblicano) possano essere definiti simili all'insieme iniziale dato.
Partendo quindi da uno specifico profilo social, lo scopo della ricerca sarà quello di segnalare quali altri persone/pagnie (facenti parte di una lista selezionata di profili di partenza) presentino caratteristiche simili, attraverso l'analisi dei contenuti prodotti sui social dalle persone stesse ma anche considerando dei parametri quanti-qualitativi pre-assegnati (es. numero di fan, tasso di engagement, nazione di provenienza)