Billender genkendelse

Tags:    grafik webdesign

ok har lige et lille spørgsmål:)

Jeg er igang med at lave nogle arbejde med OCR (Optical Character Recognition) som skal kunne scanne et billede - billedet er et lille 100x100 px jpg som ligger ved en cgi addresse

Programmet skal kunne "læse" det og huske hvad der skal dermed selv kunne "læse" billedet - nok højst sandsynligt skal den læse det "pixel for pixel" og dermed kunne bestemme hvad der står

laver det sammen med en hollænder så evt feedback eller code snippets må gerne være med engelske kommentarer:), men self ikke krævet

på forhånd tak:)



Og hvad er dit spørgsmål så?

P.S. Hedder det ikke kun OCR, hvis du læser det fra et optisk medium, så som en scanner? Ellers hedder det val bare "character recognition"!






Indlæg senest redigeret d. 24.07.2006 13:23 af Bruger #2730
Og hvad er dit spørgsmål så?

P.S. Hedder det ikke kun OCR, hvis du læser det fra et optisk medium, så som en scanner? Ellers hedder det val bare "character recognition"!




Opgaven er spørgsmålet ... hvordan kunne du dog forvente andet?
Du misforstår vist helt pointen med udvikleren!

Han vil selvfølgelig gerne have kode der kan genkende bogstaver fra en billede på ca 100x100 pixels ... og helst kun hvis det er kommenteret og på engelsk da han arbejder sammen med en gut fra Holland.

Er det så svært at forstå?

:P



well kommer der en kode som kan gøre det så er det jo helt fint:)

men ellers generelt nogle hints til hvordan man skal lave et evt program som kan det



Det er langt fra nogen let process at genkende text fra en bit-map. Men hvis man ved hvor mange tegn der er, kender skrifttypen og det ikke er alt for mudret, er det ikke umuligt.

Men jeg har en svag mistanke om at netop den .jpg I vil læse teksten på netop er lavet med det formål at det ikke skal være let for programmer at genkende texten?



Det er langt fra nogen let process at genkende text fra en bit-map. Men hvis man ved hvor mange tegn der er, kender skrifttypen og det ikke er alt for mudret, er det ikke umuligt.

Men jeg har en svag mistanke om at netop den .jpg I vil læse teksten på netop er lavet med det formål at det ikke skal være let for programmer at genkende texten?



ja =/
nogle er billederne er blurret og andre kørt igennem et noise liggende filter som kan findes i photoshop andre er helt normale arial tal



t