Results 1 to 9 of 9

Thread: Nevoie mare sa ordonez cumva o mica baza de date - un pic de ajutor va rog

  1. #1
    Irefutabil Corbu''s Avatar
    Join Date
    Apr 2005
    Location
    Canada
    Posts
    595

    Default Nevoie mare sa ordonez cumva o mica baza de date - un pic de ajutor va rog

    Am nevoie de ajutorul cuiva care sa pricepe sa lucreze cu ceva soft de baze de date pentru ca eu sunt lemn la asa ceva si in afara de luat la tranta cu ele nu pricep.

    Imi trebuie sa localizez TOATE cabinetele dentare din Halifax si am apelat la YellowPages.ca , alta sursa mai cuprinzatoare nu exista (mai este colegiul medicilor dar nu imi dau informatiile astea). Numai ca imi listeaza inapoi toti dentistii chiar daca unii dintre ei impart acelasi cabinet/clinica. Practic am un nume pe prima pagina cu o adresa si peste 5 pagini dau de alt nume dar cu aceeasi adresa. Pe mine nu ma intereseaza prea mult ca sunt X mameluci care lucreaza la adresa aia si nu vreau sa ii listeze de 10 ori, o data si e de ajuns. Si treaba e mai dureroasa cand majoritatea listingurilor de acolo sunt la fel: aceeasi adresa si numar de telefon.

    Deci ce imi trebuie exact. In linkul de AICI sunt listati toti dentistii din zona. Trebuie grupate cele 3 pagini in functie de adresa si numar de telefon, eventual unde sunt mai multe nume pentru aceeasi adresa mentionat numele clinicii si numele doctorilor. Practic vreau sa stiu cate clinici distincte exista si care e adresa lor.

    Nu am idee cum sa fac chestia asta fara sa iau efectiv la puricat fiecare adresa in parte, asa ca daca aveti idee cum se poate face mai simplu va rog ajutati-ma. Nu imi pun mari sperante ca se poate face ce vreau eu, dar fiind vorba de computere poate cineva are o solutie, mai ales aici. Multam.
    OVERCLOCKING -> The process of installing high hopes, dumb luck, and several paychecks into a rectangular box which transmits a signal to a screen that displays your fate. The outcome is usually depressing.

  2. #2
    Verii Important Papagal faraonu's Avatar
    Join Date
    Apr 2005
    Location
    in spatele tau, cand stai aplecat
    Posts
    691

    Default

    ai un linux?
    if not... ia un cygwin.
    grep kicks ass.


    cum as rezolva eu problema asta:
    as aduna toate hit-urile intr-un document text.

    altfel nu prea poti sa pleci la drum.

    apoi.. e mai dificil.
    unele linii de adresa sunt mai mari de 1 rand.
    posibil ca unii sa aiba telefoane pe 2 randuri,also sucks

    poti sa faci niste reguli simple si sa spargi fiecare find pe fisiere separate.
    dupa ce ai fisierele le bagi simplu in xls iar pt locatii generezi cap de tabel cu filtru.
    sau le poti exporta in altceva si apoi procesa/sorta informatiile.

    te folosesti ori de continutul liniei (eg "902-") ori de nr acesteia
    am vazut ca au un anumit format
    am o ..placa de baza....si 3 condensatoare...fix in sutienu tau de baie

  3. #3
    Irefutabil Corbu''s Avatar
    Join Date
    Apr 2005
    Location
    Canada
    Posts
    595

    Default

    Faraoane cu tot respectul dar nu prea pricep ce spui, ce zici tu acolo depaseste cu mult posibilitatile mele. Linux nu am si nu ma descurc cu el, iar cygwin e prima oara cand aud de el, asa ca....
    OVERCLOCKING -> The process of installing high hopes, dumb luck, and several paychecks into a rectangular box which transmits a signal to a screen that displays your fate. The outcome is usually depressing.

  4. #4
    الفتوّة sammurai's Avatar
    Join Date
    Aug 2006
    Location
    Iasi
    Posts
    876

    Default

    Hello,

    Nu stiu daca am inteles chiar foarte bine cum doresti tu datele, dar ai putea sa arunci un ochi pe imaginea de mai jos sa vezi daca te ajuta pentru ca apoi te poti juca cu formule in excel sa le aranjezi cum vrei tu si eventual sa le duci intr-o baza de date profi.

    Totul facut cu un simplu import de date din excel de pe o pagina web. Eventual te mai poti juca la setarile din import poate scoti ceva mai rafinat. Eu i-am dat pur si simplu un import default.
    Attached Thumbnails Attached Thumbnails Click image for larger version. 

Name:	import date.png 
Views:	135 
Size:	231.7 KB 
ID:	43820  
    i920 D0@testing|| True Black || DFI X58-t3eh8 || BFG 295GTX single pcb|4GB Corsair 1600mhz | 2*Velociraptor 150GB | 2*640GB AAKS | Altec Lansing VS4121 | Logitech MOMO | Case Chieftec | PSU Corsair TX750 | Logitech G9 | Razer Lycosa

  5. #5
    Irefutabil Corbu''s Avatar
    Join Date
    Apr 2005
    Location
    Canada
    Posts
    595

    Default

    Back. I-a venit vremea si la treaba asta si imi e asa de sila sa ma lupt cu sortatul la adresele astea.

    Deci in principiu mie imi trebuie sa elimin dublurile, iar prin dubluri ma refer la intrarile ce au aceeasi adresa si acelasi numar de telefon. Eventual puse numele clinicii / doctorilor unul dupa altul pe aceeasi linie despartite cu virgula ca sa imi dau seama cati sunt la adresa aia, dar adresa e in prim plan.
    Sincer imi vine destul de greu cu EXCEL, iar in afara de un tabelas simplu nu am idee cum sa introduc formule. Datele nu imi trebuiesc bagate intr-o baza de date profi, tot ce doresc e sa iasa bine listate pe hartie, nimic mai mult, eventual daca apar noutati sa le pot usor.
    Mai studiez.
    Last edited by Corbu'; 08-12-2009 at 02:35.
    OVERCLOCKING -> The process of installing high hopes, dumb luck, and several paychecks into a rectangular box which transmits a signal to a screen that displays your fate. The outcome is usually depressing.

  6. #6
    ReverseEngineer blue_led's Avatar
    Join Date
    Mar 2006
    Location
    Bucuresti
    Posts
    1,467

    Default

    lowtech style

    pentru fiecare pagina salvezi html-ul
    apoi in "command prompt" executi comanda "findstr /C:"yellowpages.ca/bus/Nova-Scotia/Halifax/" fisierul salvat >> rezultat.txt"
    unde "fisierul salvat" este html-ul salvat din explorer sau firefox.

    apoi restingi textul cu comanda

    findstr /C:"alt=" rezultat.txt >> adrese.txt
    si obtii ceva ca in poza 1

    fisierul adrese.txt il importi in excell cu separator ">" si cu citeva prelucrari text obtii .......lista ( poza 2 )

    s-ar putea sa mai ratezi cite o adresa . trebuie rafinat criteriul de cautare
    Attached Thumbnails Attached Thumbnails Click image for larger version. 

Name:	cautari1.JPG 
Views:	102 
Size:	219.2 KB 
ID:	43842   Click image for larger version. 

Name:	cautari.JPG 
Views:	118 
Size:	57.8 KB 
ID:	43843  
    Last edited by blue_led; 08-12-2009 at 05:22.
    Übertaktenmannschaftkupfermeister ; equ : Video+NB / antigel+gheata © = -15 °C ; samsung free products user ;
    KTM 400...525 EXC user
    I always put Microsoft's software in the recycle bin, I'll never throw the garbage in the environment

  7. #7
    Irefutabil Corbu''s Avatar
    Join Date
    Apr 2005
    Location
    Canada
    Posts
    595

    Default

    Multumesc ledule, dar al dracu daca imi iese. O fi metoda low-tech, dar ori e prea high-tech pentru mine ori sunt prea dobitoc ca sa ma prind. Se pare ca nu am scapare decat sa ma iau in pix cu lista aia si sa ii ordonez babeste. Oricum, ai in poza rezultatul, am incercat mai multe combinatii dar tot asta primesc > "A required privilege is not held by the client."
    Attached Thumbnails Attached Thumbnails Click image for larger version. 

Name:	Capture.JPG 
Views:	102 
Size:	77.8 KB 
ID:	43872  
    OVERCLOCKING -> The process of installing high hopes, dumb luck, and several paychecks into a rectangular box which transmits a signal to a screen that displays your fate. The outcome is usually depressing.

  8. #8
    الفتوّة sammurai's Avatar
    Join Date
    Aug 2006
    Location
    Iasi
    Posts
    876

    Default

    Raman la ideea ca excelul iti face cu brio treaba: aduce datele intr-o forma organizata pe care o poti prelucra cum vrei tu, in ce format vrei tu.
    i920 D0@testing|| True Black || DFI X58-t3eh8 || BFG 295GTX single pcb|4GB Corsair 1600mhz | 2*Velociraptor 150GB | 2*640GB AAKS | Altec Lansing VS4121 | Logitech MOMO | Case Chieftec | PSU Corsair TX750 | Logitech G9 | Razer Lycosa

  9. #9
    ReverseEngineer blue_led's Avatar
    Join Date
    Mar 2006
    Location
    Bucuresti
    Posts
    1,467

    Default

    pasi cu poze

    1 salvezi pagina !
    2 copiezi .......htm in directorul c:\halifax\ cu numele halifax.txt
    3 aplici filtrul 1 - findstr /C:"//www.yellowpages.ca/bus/Nova-Scotia/Halifax/" "C:\halifax\halifax.txt" >> "c:\halifax\"stage1.txt ( copy paste ce-i ingrosat)
    4 aplici filtrul 2 - findstr /C:"alt=" stage1.txt >> adrese.txt ( copy paste ce-i ingrosat )
    dovada in poza 1
    5 deschizi un .. open office
    6 deschizi fisierul adrese.txt ca text .csv cu singurul filtru other ">"( poza 3 )
    7 stergi prima si a treia coloana fiind inutile
    8 la coloana B aplici formula =SUBSTITUTE(REPLACE (A1;1;78;"");RIGHT(A1;38);"") pentru nume si la coloana C =SUBSTITUTE(RIGHT(A1;37) ;RIGHT(A1;25) ;"") pentru telefoane
    9 tragi in jos de cimp sa aplici forula la toate rindurile

    voila !

    P.S. am folosit XP si OO
    Attached Thumbnails Attached Thumbnails Click image for larger version. 

Name:	hali.JPG 
Views:	111 
Size:	69.9 KB 
ID:	43879   Click image for larger version. 

Name:	hali1.JPG 
Views:	95 
Size:	95.2 KB 
ID:	43880   Click image for larger version. 

Name:	hali2.JPG 
Views:	89 
Size:	99.1 KB 
ID:	43881   Click image for larger version. 

Name:	hali3.JPG 
Views:	99 
Size:	228.9 KB 
ID:	43882   Click image for larger version. 

Name:	hali4.JPG 
Views:	115 
Size:	270.5 KB 
ID:	43883  
    Last edited by blue_led; 09-12-2009 at 20:15.
    Übertaktenmannschaftkupfermeister ; equ : Video+NB / antigel+gheata © = -15 °C ; samsung free products user ;
    KTM 400...525 EXC user
    I always put Microsoft's software in the recycle bin, I'll never throw the garbage in the environment

Thread Information

Users Browsing this Thread

There are currently 1 users browsing this thread. (0 members and 1 guests)

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •