Analyse af data

Tags:    databaser

Hej,

Jeg er helt ny på datawarehouse/analysis siden og har et hurtigt spørgsmål.

Jeg har en enkelt tabel, indeholdende unikt-serienummer pr apparat, postnummer, og tilknyttet person.

Mit mål er at analysere de data og finde ud af hvor mange apparater der er pr. tilknyttede person i de forskellige postnumre osv. osv. dvs. kunne analysere den tabel på kryds og tværs.

Kan det lade sig gøre (hvilket jeg tror det kan) ? og i så fald hvordan..
Det jeg fisker efter er ikke en 100 % walkthrough men et hint i den rigtige retning.

Jeg kan alternativt lave en simpel web applikation med en masse forskellige select statements, men i den virksomhed jeg arbejder i har vi et fint grafisk værktøj (TargIT) som jeg finder spændende og gerne vil udnytte til formålet.

Ps. jeg aner ikke om 100 point er meget eller lidt, jeg er også ny på udvikleren.dk :-)





7 svar postet i denne tråd vises herunder
0 indlæg har modtaget i alt 0 karma
Sorter efter stemmer Sorter efter dato
Kører du på kuber eller på en relationel datamodel, altså med hensyn til TARGIT, eller skal du have lavet en ny datamodel?

P.S. 100 points er meget for et spørgsmål af denne slags :-)

(¯`·._.·[Brian Hvarregaard]·._.·´¯)
Praesto et Persto





[Redigeret d. 20/09-05 15:59:25 af Brian Hvarregaard]



Kører du på kuber eller på en relationel datamodel, altså med hensyn til TARGIT, eller skal du have lavet en ny datamodel?

P.S. 100 points er meget for et spørgsmål af denne slags :-)

(¯`·._.·[Brian Hvarregaard]·._.·´¯)
Praesto et Persto
[Redigeret d. 20/09-05 15:59:25 af Brian Hvarregaard]



Jeg må ærligt indrømme at jeg ikke er helt sikker på hvad du mener..

Vi har noget i forvejen som er lavet på kuber, men dette er noget andet i forhold til det vi allerede har.

mit data er som følger :

S-nummer | postnummer | person |
123456 | 2660 | kjo |
654321 | 2770 | mke |

Osv.

Det er svært at forklare da jeg ikke aner hvad og hvordan :-)
Så de 100 point er nok meget godt givet ud :-)

PFT.

Kenneth




Der er flere felter end de 3 jeg har skitseret og det kan være det giver mere mening hvis jeg informerer om dem.

Der er også en "produkt type" og en "service aftale"

Så hvis jeg kan lave det sådan så man kan se hvor mange "serienumre" der er tilknyttet person X i postnummer Y eller hvor mange Produktype X der er tilknyttet Y i postnummer X Y og Z ..






Du kan vælge at udvidde den eksisterende kube database med endnu en database eller lave en ny kube database oppe på serveren eller du kan vælge at lave en ny kube der kører lokalt på din maskine, alt efter hvilken løsning du vælger så er det du skal lave ligetil. Det du først skal gøre op med dig selv er hvor du vil bygge det (for at lave det lokalt skal du have angang til SQL Server og Analysis Services)

(¯`·._.·[Brian Hvarregaard]·._.·´¯)
Praesto et Persto



Når du har besluttet dig for hvilket scenario du vælger, så skriv i tråden igen. Så kanjeg hurtigt guide dig igennem både den ene mulighed eller den anden. Bemærk, at hvis du blot skal lave en hurtig løsning så kan du lave det direkte ovenpå en relationel datakilde, direkte udenom en kube server. Men det kræver du har administrator rettigheder, adgang til en TARGIT Enterprise Manager og en TARGIT Enterprise Licens (for at kunne køre flere datakilder)

(¯`·._.·[Brian Hvarregaard]·._.·´¯)
Praesto et Persto



Jeg har administrator adgang til både Targit og SQL (incl. analysis).

Jeg vil foretrække at lave det på serveren, og ud fra det du beskriver mht. TARGIT licensen så må vi hellere lave en overbygning, der er ikke mulighed for at trække fra flere datakilder.

LICENSETYPE = Customer

Er det info nok ?

Mvh

Kenneth





Det du skal gøre er at lave en ny kube i den eksisterende kubedatabase. I den kube skal du lave din fact tabel til at være din ene tabel (du har kun een tabel ikk?), herefter skal du lave en measure der er postnummer (eller et id på rækken, noget der kan tælles på, denne skal laves som typen count) og en dimension der er postnummer. Da disse begge kommer fra fact tabellen er der ikke mere i det. Du kan processere din kube (måske genstarte din ANTServer, alt efter hvilken build du kører) og vupti, så skulle du være kørende med en ny kube (den bliver så synlig inde i TARGIT under kildedata). Med hensyn til personer, så skal du tilføje den i din kubeløsning som en ekstra tabel (dimensionstabel) og så tilføje en dimension der er personens navn eller lignende.

Bemærk, at skal løsningen udviddes eller hvis der er andet der skal med, så ville det, rent performancemæssigt, på sigt være en god ide at lave en dimensionstabel ud fra din facttabel ved at lave en SELECT DISTINCT POSTNUMMER fra facttabellen. Men til dette er denne løsning fin nok.


Hvis det er fuldstændigt græsk for dig det her, så prøv at se om du kan bygge en simpel kube med postnummer og det unikke nummer (så vidt jeg læser er de fra samme tabel) så det skulle være lige ud af landevejen :-), ellers skriver du bare igen, så skal jeg nok guide dig gennem det...

P.S. husk at opdater din DTS pakke til også at processere denne kube hver nat, ellers er der ikke meget sjov i det :-)
(¯`·._.·[Brian Hvarregaard]·._.·´¯)
Praesto et Persto



t