Søge robot HVordan?

Tags:    c++

<< < 12 > >>
HEy!

Nu har i et stykke tid prøvet på at lærer at kode C++ og det er også stor success. NU er jeg bar nogt til det punkt at jeg vil kode en søge maskine robot, til min hjemmeside, hvor jeg kan indtaste en hjemmeside adresse, og så finder den alle undersiderne + alle kommende link som måtte frem komme osv osv. Dernæst skal den indsætte det til en Database, jeg havd tænky mig MYsql db da det er den eneste min udbyder tilbyder...

Som i nok kan hører jeg ikke 100% sikker på at det kan lade sig gøre med en sql db....

P.S det skal foregå automatisk, altså efter jeg har klikket en del hjemmesider ind!


Http://www.gamedev.net That is a very good site, to learn all about game programming



11 svar postet i denne tråd vises herunder
0 indlæg har modtaget i alt 0 karma
Sorter efter stemmer Sorter efter dato
Det du vil få mere ud af det vist du brugte PHP eller ASP til netop det projekt, så vidt jeg ved kan du ikke køre exe filer på en webserver, men det kan være jeg tager fejl




Link!
http://eksperten.dk/spm/634885

Der indefra har jeg fået afvide at PHP ikke er egnet til dette..

Note!

Jeg forsøger at lave et program, hvor jeg kan indskrive nogle hjemmeside adresser, derefter skal min database jo så blive federe, derefter henter jeg alle dataerne ud med PHP.... Men kan man ikke kører fra sin egen Com det program og så alle dataer stadig bliver indsendt til Mysql db?

Http://www.gamedev.net That is a very good site, to learn all about game programming



Du skal lave en crawler, eller en spider - det hedder begge dele. Og det er rigtigt nok at du skal bruge C++ til det (eller et andet programmeringssprog, der kan lave almindelige applikationer. Du giver den en www adresse, loader den side, tjekker for alle de URL's du kan finde i siden og for hver af dem skal du så gøre det samme. Så må du finde ud af hvad det er du vil med dit program. Hvis den blot fortsætter så indekserer den hele internettet, og det har du ikke databaseplads nok til :-). Din applikation kunne eventuelt stoppe hvis den kom uden for det domæne du startede den på. Så har du jo muligheden for at "Rippe" et helt site, bileder og stylesheets og alt sammen...

Det er ikke noget problem... det er almindelig rekursion og så lidt Regular Expressions, så er du kørende.

(¯`·._.·[Brian Hvarregaard]·._.·´¯)
Praesto et Persto



Hehe... det godt du kan forstå mig...
hmm... kan man ikke lave sårn at den stopper med at finde URL's ved et bestemt Tal eks.. 200.000 eller et eller andet!
Og kende du nogle hjemmesider hvor jeg kan lærer det, gerne begynder artikler og vidre op efter


Http://www.gamedev.net That is a very good site, to learn all about game programming



Tror ikke man direkte kan lære at lave dette, det er noget man selv skal udtænke... det er ganske almindelig udvikling, der er ikke noget hokus pokus i det. Måske kan du et sted på nettet finde noget om hvordan men loader en side fra internettet med C++, så skal du jo bare bruge RegEx til at scanne igennem med og smide linksene i en database, og vupti

(¯`·._.·[Brian Hvarregaard]·._.·´¯)
Praesto et Persto



Jeg takker da for hjælpen, og skriver da bar en mail, hvis jeg skulle få brug for mer hjælp, til dette, nok med nogt kode!

(.\\'~[veile]~\\'.)



Hehe.. det kan du bare gøre.. men jeg kan ikke et ord C++ :-)

(¯`·._.·[Brian Hvarregaard]·._.·´¯)
Praesto et Persto



Hvis du kan vente et par dage kan jeg godt strikke et lille program sammen der kan hente nogle sider og parse disse for url's og hente disse osv.

Det største problem er nok at lave en parser der kan finde de rigtige urls.



Hvis du kan vente et par dage kan jeg godt strikke et lille program sammen der kan hente nogle sider og parse disse for url's og hente disse osv.

Det største problem er nok at lave en parser der kan finde de rigtige urls.




Jeg venter og koder på det... ja læser gør jeg oz.. da C++ ikk er min stærkeste side endnu! heh


(.\\'~[veile]~\\'.)



Jeg har lavet en meget simpel søge robot:

Fold kodeboks ind/udKode 


Parseren mangler en del, men man bør kunne få en idé til hvordan man kan gøre.



<< < 12 > >>
t