DOCX

Tags:    php

<< < 12 > >>
Hej.
Jeg leder efter et phpscript som kan læse .docx dokumenter.
Er der nogen som kender til sådan et script? Har ikke kunne finde noget på google eller php.net.



15 svar postet i denne tråd vises herunder
4 indlæg har modtaget i alt 4 karma
Sorter efter stemmer Sorter efter dato
Altså... hvis du tager en docx fil og omdøber til .zip så kan du åbne denne zip og i xml filen word/document.xml ligger tekst indholdet af filen..

Hvis du er hardcore til php, er det bare at gå igang



Scriptet er til at tjekke et dokument igennem for navneord, tillæggesord, biord og udsagnsord.

(er doven og det er en god måde at øve min programmering på :D)

Det lyder interessant. Hvordan implementerer du det? Har du en database af ord du tjekker opad, eller noget smartere?



Per, jeg går ud fra at du mener din kommentar seriøst, for det plejer du at gøre. Der er dog en lille snert af håb tilbage om at du ikke mener det helt så alvorligt, for eller synes jeg godt nok at det er et skidt standpunkt du tager :). For det første gør det vel ikke en specifikation mindre åben at den er på mange sider? Hvis folk har lyst til at sætte sig ind i den, har de muligheden for det - er det ikke det der menes med åbne standarder? For det andet, <styg sarkasme>så føler jeg mig ikke HELT overbevist om at man SKAL læse alle 3.000 sider (eller hvor mange der nu er), for at kunne parse dokumentet igennem for simple, specifikke ting</styg sarkasme>.

Mvh.

Kasper (TSW)



Lavede lige en funktion til dig:
Fold kodeboks ind/udKode 

Den returnere den rå tekst i filen (som er det du skal bruge)

Du bruger funktionen således:
Fold kodeboks ind/udKode 



EDIT: Jeg har ikke læst 3000 linjer tekst, men bare observeret lidt... :P

EDIT2: 3000 sider?! Er du gal...



Indlæg senest redigeret d. 24.08.2008 20:08 af Bruger #11328
Hvad mener du med at læse?



Indlæg senest redigeret d. 24.08.2008 12:21 af Bruger #6559
Ligesom man kan åbne en txt fil og læse fra den eller skrive til den.

Vil gerne lave et script som kan se om der er specielle ord i et docx dokument.



.docx er et binært format... og endda et lukket format, tvivler på at der findes nogen reader til formatet... i PHP!!



Findes der så noget ala det jeg efter spørger til .DOC ?



Øhm.. Mig bekendt er .doc et binært og lukket format, hvor .docx til gengæld er et åbent XML format, så det lyder da ikke helt umuligt :)

Mvh.

Kasper (TSW)



Kasper - Great. Så skal jeg vel bare lede vidre :)



<< < 12 > >>
t