BluePink BluePink
XHost
Servere virtuale de la 20 eur / luna. Servere dedicate de la 100 eur / luna - servicii de administrare si monitorizare incluse. Colocare servere si echipamente de la 75 eur / luna. Pentru detalii accesati site-ul BluePink.

Aplicatia este realizata in limbajul Python,versiunea 2.6,folosind modulele sgmllib si urllib. Se ruleaza utilizand urmatoarea comanda: python parser.py


Aplicatia reprezinta un crawler web ce aduna informatii din paginile blog-urilor create pe blogspot.com. Informatiile sunt adresele la care se gasesc date personale ale utilizatorilor cat si datele celor care au comentat pe blogul acestora adunate pe o adancime a carei valoare este data ca parametru.


Pentru a realiza parsarea am definit clasele Myparser,MyArticleParser,MyFansParser. Acestea contin metode specifice fiecarui tag ("start_a") si extrag valorile anumitor atribute memorandu-le in liste.


Algoritmul de extragere este :

  • -parcurg lista de url-uri initializata cu url radacina
  • -pt fiecare url:
    • -extrag url profil,lista url-uri prieteni si-i adaug la sfarsitul listei curente,memorand nr de link-uri extrase astfel incat sa stiu cand ajung pe nivelul urmator.
    • -extrag url-urile celor care comenteaza pe blog pt un articol.


Downloadeaza arhiva cu tema.


Copyright Delia Adiaconitei