Programmering

ISBN.nu går tabt og findes i Google gaffe

Jeg troede i sidste uge, at jeg havde afsluttet min serie på ISBN.nu, en online sammenligningstjeneste med bogpriser, der får 135.000 af sine sider ind i Google.coms indeks. Men det var før forholdet mellem webtjenesten og Google blev nyheder.

En dag efter mit 21. februar-udgave afslørede, at ISBN.nu lagrer færre end 4.000 sider på sin server - de øvrige 131.000 sider genereres dynamisk, når en søgemaskinspider (eller et menneske) følger et link - næsten alle webstedets sider forsvandt pludselig fra Googles indeks. Da jeg tjekkede linket (gengivet nedenfor), der viser antallet af ISBN.nu-sider, der er i Googles indeks, var det samlede antal faldet til blot ni.

ISBN.nu Webmaster Glenn Fleishman troede oprindeligt, at en funktionær på lavere niveau hos Google havde hørt om min historie og besluttede at forbyde webstedet. Det sad ikke rigtigt med Fleishman. Han siger, at han har talt personligt med Googles topledere gennem årene. Som han beskriver det, har Google ikke noget problem med at indeksere dynamisk genererede sider, så længe det indhold, en edderkop ser, er nøjagtigt det samme som et menneske ville se. Mange databasedrevne websteder genererer legitimt sider efter behov snarere end at gemme alle tænkelige sider på en servers harddisk.

Heldigvis skyldtes afbrydelsen af ​​en fejl i en softwarerutine hos Google. Søgemaskinefirmaet forsikrer mig om, at ISBN.nu's sider vender tilbage til Google-indekset inden for få dage, hvis de ikke har gjort det, inden du læser dette.

Hvordan Fleishman håndterede problemet giver os dog en værdifuld vejledning. Samtidig afslører afbrydelsen, hvordan en relativt ny "banning" -algoritme hos Google fungerer. Her er historien:

1. ÅBEN KOMMUNIKATION. Da Fleishman den 6. marts bemærkede, at hans sider manglede i Google-indekset, sendte han høflige men bekymrede e-mails til sine kontakter i søgemaskinen, som han tidligere havde mødt.

2. PRESSEFORBINDELSER. Fleishman underrettede mig om problemet, hvorefter jeg sendte en separat e-mail til mine kontakter på Google (som jeg havde betalt et høflighedsopkald ved en tilfældighed tidligt i februar) og bad om afklaring.

3. ANALYSE. Da en talsmand fra Google svarede, at de manglende sider kun var forårsaget af en teknisk fejl, ikke en politisk beslutning, analyserede Fleishman situationen og fandt, at der ikke var behov for ændringer i hans databasedesign.

Problemet? Hver prissammenligningsside på ISBN.nu indeholder links til op til ni forskellige boghandlere. Med 135.000 sider indekseret tilføjer det mange links. Og hvert link indeholder vigtige tilknyttede kodestrenge, så ISBN.nu kan tjene en provision, hvis en bruger ender med at købe en bog.

Som Googles Nate Tyler siger: "Problemet ser ud til at have noget at gøre med det store antal tilknyttede omdirigeringer, som modregner noget af vores automatiserede teknologi." Det betyder, at en Google-software-rutine gætter på, at ISBN.nu var en "link-farm". Dette er en falsk webring, hvor hundredvis af sider opretter hundreder af links til hinanden og forsøger at narre Googles velkendte "link popularitet" -system.

Fleishman rapporterer, at blackout fra Google forårsagede et fald til 5.000 besøgende om dagen fra 9.000 (et fald på 45 procent) og et fald på 30 procent til 40 procent i hans tilknyttede indtægter. Han tilføjer, at Yahoo for nylig udeladte ISBN.nu i et par dage, hvilket skar i et par tusind henvisninger pr. Måned fra den kilde. Dette understreger vigtigheden af ​​søgemaskintrafik til nogle e-business-websteder, mens andre er langt mere afhængige af deres egen reklame- og marketingindsats.

Hvis du prøvede mit link sidste måned til antallet af ISBN.nu-sider hos Google, undskylder jeg, hvis det ikke afslørede de 135.000 sider, jeg lovede. Du kan prøve nedenstående link i et par dage for at se, hvor mange af webstedets sider, der vender tilbage til indekset, da Googles edderkop gradvist gencrawler linkene.

GLENN FLEISHMANS KOMMENTAR TIL GOOGLE OUTAGE:

//[email protected]/?4e52

EN SØGNING, DER VISER ANTALET ISBN.NU-SIDER PÅ GOOGLE

//[email protected]/?61da

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

E-BUSINESS TECH ANMELDELSE: TOM PRINGLES KAN TRÅDLØS ANTENNE

Ved hjælp af en tom Pringles kartoffelchip kan som en ekstern antenne ondsindede hackere let finde og bryde ind i mange trådløse virksomhedsnetværk ifølge en analyse foretaget af I-sec, en sikkerhedsrådgivningsgruppe.

Virksomheden kørte en bil rundt i Londons finansielle distrikt ved hjælp af en tom Pringles-dåse til at forstørre trådløse netværkssignaler. Mere end to tredjedele af de virksomheder, der bruger trådløst eller Wi-Fi, havde ikke implementeret nogen krypteringsfunktioner, sagde sikkerhedsgruppen. Sådanne netværk er sårbare over for tyveri af båndbredde eller dataindbrud.

Den rørformede Pringles-beholder danner en effektiv retningsbestemt antenne, også kendt som en Yagi-antenne. Planer om at bruge denne og andre enheder til at identificere Wi-Fi-signaler begyndte at cirkulere på Internettet sidste år.

BBC News Online siger, at det var vidne til, at I-sec opdagede næsten 60 ubeskyttede trådløse netværk på en enkelt 30-minutters rejse gennem byens kløfter. Dens rapport beskriver problemet og foreslår enkle løsninger.

TOM PRINGLER KAN HJÆLPE HACKERE AT FINDE UBESKYTTET WI-FI:

//[email protected]/?7562

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

LIVINGSTONS TOPP 10 NYHEDSBILLEDER OM UGEN

1. Netscape Navigator 6 læser søgninger, siger Newsbytes

//[email protected]/?41a

2. Miniaturer af onlinebilleder er OK, domstolsafgørelser

//[email protected]/?802

3. Streaming-musikwebsteder afviser voldgiftsrater

//[email protected]/?bea

4. Hvordan Miller Freemans papir-køb b-til-b tjener penge

//[email protected]/?fd2

5. At tilbyde gratis forsendelse over $ 99 øger ordrestørrelsen

//[email protected]/?13ba

6. Højesteret kan ophæve udvidelse af ophavsretten

//[email protected]/?17a2

7. Cool: Sådan opbygges et roterende galleri i ColdFusion

//[email protected]/?1b8a

8. Bedrageri er 19 gange mere sandsynligt online end offline

//[email protected]/?1f72

9. HTML-tip: Den rigtige måde at gøre rollovers hurtigt

//[email protected]/?235a

10. Stop hackere fra at bruge PayPal til at stjæle dit indhold

//[email protected]/?2742

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

WACKY WEB WEEK: TABLOID POP BAND SPLIT-UP GENERATOR

Måske kan dette tilfredsstille dit websteds behov for indhold. Indtast et par nøgleord i en webformular og presto: Popjustice, et ærbødigt musikindieside, spytter en perfekt tabloidartikel om det forestående opbrud af ethvert popband efter eget valg.

Lidt klip og indsæt for at kopiere det velkendte rygte, og du kan også se ud som en musikinsider. Popjustices britiske side er en slags krydsning mellem et fanzine og en af ​​de mest detaljerede blogs, du nogensinde vil se. Prøv det, men vær advaret: uartigt sprog og ungdommelig humor, blokes.

POPJUSTICE'S SPURIOUS BAND-SPLIT WEB MOTOR:

//[email protected]/?c382

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

E-FORRETNINGSHEMMELSER: Vores mission er at give dig sådanne nyttige og tankevækkende oplysninger om Internettet, at du faktisk ser frem til at læse din e-mail.

OM FORFATTEREN: E-Business Secrets er skrevet af Contributing

Redaktør Brian Livingston (//SecretsPro.com). Forskningsdirektør er Ben Livingston (ingen relation). Brian har udgivet 10 bøger, herunder:

Windows Me Secrets:

//[email protected]/?0764534939

Windows 2000-hemmeligheder:

//[email protected]/?0764534130

Vind et gavekort godt til en bog, cd eller dvd efter eget valg, hvis du er den første til at sende et tip Brian udskriver. mailto: [email protected]