Big Data og Hadoop 1 | Hadoop opplæring 1 | Big Data Tutorial 1 | Hadoop opplæring for nybegynnere - 1

Er det noen gode verktøy for å analysere klikkstrømmen til individuelle brukere i Apache webserverlogger? For eksempel vil jeg kunne klikke på en besøkendes IP-adresse og se alle sidene brukeren ba om.

+100

To av de beste open source nettanalysene er OWA og Piwik

OWA støtter click-stream og demoen er her: http://demo.openwebanalytics.com/owa

Piwik tilbyr et clickheat-plugin

demo: http://demo.piwik.org/

Verdt å nevne:

http://greensweater.wordpress.com/2006/05/01/clickstream-tracking-with-apache/

https://github.com/riivo/pwum

Det beste verktøyet jeg har brukt er Splunk (http://www.splunk.com/download/). Det er ikke billig, men veldig kult og gir den beste hastigheten og funksjonaliteten du noen gang trenger. De har også freeware-lisens for aggregering av 500 MB data per dag. Jeg brukte denne lisensen på produksjonsspillserverne mine (ca. 3m brukere) og har ikke noe problem med denne grensen

Jeg fant Follow-Me-pluginet for AWStats. Dessverre er det ganske buggy, dvs. det fungerer bare med IP-adresser, og ikke med vertsnavn. Videre viser det bare klikk fra den siste dagen, dvs. det fungerer ikke for eldre logger.

Piwik gjør det du vil (jeg har allerede prøvd dette) å ha, men ikke slik du sier. Den bruker en javascript-fil for sporing, akkurat som Google Analytics, ikke Apache-loggfiler.

Hva betyr at noen brukere ikke blir sporet, men at det er mer informasjon å samle på.

Hvis du har muligheten til å faktisk installere en sporingskode på nettstedet ditt, bør du vurdere å gjøre det i stedet.

Hvis du vil gjøre dette, bør du ta en titt på Google Analytics, som kan gi deg ekstremt spesifikke detaljer om stort sett hva som helst. Også det du vil ha, til og med clickstream (som de kaller besøkende). Her er et ganske godt eksempel, som viser det ganske bra.

Du kan også bruke en eller annen form for analysator som du må installere på serveren din, men dette føles som et problem, og det er ofte et stort irritasjonsmoment, fordi du ikke kan tilpasse det slik du vil.

Analytics har en ganske bratt læringskurve, men jeg bruker den til daglig for å analysere flyten til mine besøkende.

Hvis du har ressurser til å betale litt for statistikken din, kan det være lurt å ta en titt på CrazyEgg, siden de tilbyr ganske avansert statistikk, inkludert clickstream, men hvis det er per ip, kan jeg ikke si det, jeg har faktisk aldri brukt det før, men har blitt anbefalt det.

  • Takk for svaret, men dette hjelper meg ikke med Apache-loggene.

fungert for deg: Charles Robertson | Ønsker du å kontakte oss?