Posted in Optimizacija za Pretrazivace (SEO) // Search Engine Optimization (SEO)

Kako rade web pretrazivaci

Pretrazivaci ispituju sve stranice na internetu, klasifikuju ih i prikazuju u logickom redosledu kada nesto trazite. U ovoj lekciji istrazicemo;

  • kako pretrazivaci pronalaze web stranice
  • sta pretrazivaci rade s stranicama koje su pronasli
  • kako pretrazivaci odlucju sta ce prikazati na stranicama s rezultatima pretrazivanja (SERPs)

Svaki pretrazivac koristi svoj softverski program, ali nacin na koji oni rade je prilicno slican. Svi oni obavljaju tri zadatka:

  1. pretrazivanja i indeksiranje sadrzaja
  2. vracanje i rangiranje rezultata
  3. procena sadrzaja na web stranici

Razumevanje kako pretrazivanje (en. crawling), indeksiranje i rangiranje radi je korisno, jer vam pomaze da odrediti koje akcije preduzeti kako bi zadovoljili svoje ciljeve. Fokusiracemo se na 2 najpoznatija pretrazivaca: Google i Bing.

Glavni ciljevi i funkcije pretrazivaca

  • pretrazivanje i indeksiranje milijardi dokumenata (web stranica i fajlova) dostupnih na webu
  • odgovaranje na korisnicke upite pruzajuci popise relevantnih stranica

1. Pretrazivanja i indeksiranje sadrzaja

Zamislite da je WWW (en. World Wide Web) tj. internet kao mreza izmedju gradova razlicitih zemalja. Svaki grad je vlastiti jedinstveni dokument (obicno web stranica, ali ponekad moze biti pdf dokument, jpg ili png slika ili neki drugi fajl). Pretrazivacima je potreban nacin da pretraze (en. crawl) sve zemlje i da pronadju sve gradove na putu, tako da oni koriste najbolji put na raspolaganju tj. veze (linkove) izmedju web stranica. Primer je prikazan slici dole.

Primer 1:

pretrazivanje-i-indeksiranje

U ovom primeru na slici, gradovi kao sto su Beograd, Novi Sad, Zagreb, Ljubljana, su kao web stranice, dok linije koje ih povezuju predstavljaju veze (linkove) s tim stranicama do drugih stranica na Webu (internetu). Nakon sto Google stigne do Beograda, on vidi linkove koji ukuzuju na Sarajevo, Podgoricu, Pristinu i Skoplje i moze pristupiti bilo kojim od tih gradova tj. pod stranica.

Struktura web linkova (internet veza) sluzi da se (po)vezu zajedno sve stranice koje su napravljene javno kao rezultat jer je neko linkovao ka njima. Kroz veze (linkove), pretrazivac – automatski roboti, pod nazivom puzavci (en. crawlers) i pauci (en. spiders), mogu doci do milijardi medjusobno povezanih dokumenata.

Nakon sto pretrazivaci pronadju ove stranice, njihov sledeci zadatak je da analiziraju od njih i sacuvaju odabrane delove stranica na tvrdim diskovima (en. hard drives), koje se mogu ponovo pozvati kada je to potrebno u upitu. Da bi ostvarili zadatak koji drzi milijarde stranica kojima se moze pristupiti u delicu sekunde, pretrazivaci su izgradili ogromne centre podataka za rad sa svim tim podacima.

2. Vracanje i rangiranje rezultata

Za vecinu korisnika, potraga za znanjem pocinje ukucavanjem zeljenog upita u pretrazivac. Sledeci korak nastaje kada pretrazivac vraca popis relevantnih stranice na webu prema redosledu koji ce najverovatnije zadovoljiti korisnika. Ovaj proces zahteva da pretrazivaci pretraze milijarde dokumenata i naprave dve stvari:

  • vratiti samo rezultate koji se odnose na korisnikov upit, i
  • rangirati rezultate koje su od vaznosti (uzimajuci u obzir poverenje i autoritet koji su povezani sa web sajtom).

Ovde su bitni relevantnost i vaznost kao deo SEO procesa.

Relevantnost je stepen do kojeg sadrzaj dokumenata vracenih u pretrazi odgovara korisnikovoj nameri i pojmu upita. Relevantnost dokumenta se povecava ako se pojmovi ili fraze upita od strane korisnika pojavljuju vise puta i pokazuje se u naslovu rada ili u vaznim naslovima ili podnaslovima, ili ako linkovi na stranici dolaze sa relevantnih stranice i koriste relevantan sidro tekst.

Mozete razmisljati o vaznosti kao prvi korak da budete “u igri”. Ako vase web stranice nisu relevantne za upit, pretrazivaci nece vas uzeti u obzir za ukljucivanje u rezultatima pretrazivanja za taj upit.

Vaznost ili popularnost odnosi se na relativnu vaznost, datog dokumenta koji odgovara upitu korisnika. Popularnost datog dokumenta povecava se sa svakim drugim dokumentom koji ga preporucuje.

Mozete razmisljati o vaznosti (popularnosti) kao nacin po kojem bi se utvrdilo koje stranice, iz grupe sa jednako relevantnim stranicama, pokazuju se prvi u rezultatima pretrazivanja, koji je drugi, itd. Relativni autoritet web sajta i poverenje koje pretrazivaca ima u njemu, su znacajni delovi ovog odredjivanja. Naravno, ovo je malo slozenije od toga, i nisu sve stranice jednako relevatne.

To je zapravo kombinacija relevantnosti i vaznosti koji odredjuju redosled rangiranja.

Popularnost i relevantnost ne odredjuju rucno. Umesto toga, pretrazivaci prave matematicke jednacine – algoritme za sortiranje bitnih od ne bitnih rezultata i onda rangiraju tj. prikazuju bitne rezultate po redosledu kvaliteta. Ovi algoritmi cesto sadrze stotine komponenti. Cesto se nazivaju faktori rangiranja ili algoritamski kriterijumi za rangiranje.

3. Procena sadrzaja na web stranici

Pretrazivaci stavljaju puno tezine na sadrzaj svake web stranice. To je sadrzaj koji definise o cemu je stranica, i pretrazivaci ce napraviti detaljnu analizu svake web stranice koju su pronasli tokom njihovog pretrazivanja (en. crawling) kako bi mogli da odrede rezultate..

Mozete razmisljati o tome kako pretrazivaci obavljaju detaljnu analizu svih reci i izraza koji se pojavljuju na web-stranici, a zatim prave mapu od tih podataka, da bi uzeli u obzir prikazivanje vase stranice u rezultatima, kada korisnik unese vezani upit za pretrazivanje Ova mapa, cesto se naziva i semanticka mapa, koja nastoji da definise odnose izmedju tih koncepata, tako da pretrazivaci mogu bolje razumeti kako da spoje prave web stranice s korisnickim upitima pretrazivanja.

Ako nema semantickog poklapanja sa sadrzajem web stranice sa upitom, stranica ima mnogo manju mogucnost da se prikaze. Zato, reci koje stavljate na web stranicu, i “tema” te stranice, igra veliku ulogu u rangiranju.

Navigacijski elementi web stranice su verovatno slicni kao i ostale stranice na web sajtu. Ovi elementi za navigaciju nisu zanemareni, i oni igraju vaznu ulogu, ali oni ne pomazu pt\retrazivacima da odrede sta je jedinstveni sadrzaj na stranici. Da biste to postigli, pretrazivaci su fokusirani na “Glavni sadrzaj” koji je prikazan na slici dole.

Primer 2:

procena-sadrzaja

Utvrdjivanje jedinstvenog sadrzaja na stranici je vazan deo onoga sto pretrazivaci rade. To je razumevanje jedinstvenog sadrzaja na stranici, koje pretrazivaci koriste za odredjivanje vrste upita za pretrazivanje, za koje bi web stranica mogla biti relevantna. Posto navigacija web sajta, uopsteno nije jedinstvena za jednu web stranicu, to ne pomaze pretrazivacu s tim zadatkom.

To ne znaci da navigacijski linkovi nisu vazni, jer oni sigurno jesu – medjutim, oni jednostavno se ne racunaju prilikom pokusaja da se utvrdi jedinstven sadrzaj web stranice, jer ti navigacijski linkovi su podeljeni medju mnogim web stranicama.

Jedan zadatak sa kojim se pretrazivaci suocavaju je vrednost sadrzaja. Iako se procenjuje kako zajednica reaguje na deo sadrzaja, upotreba analize veza (linkova) je deo procesa, pretrazivaci mogu izvuci neke zakljucke na osnovu onoga sto vide na stranici.

Na primer, da li je isti sadrzaj dostupan na drugoj web stranici? Da li je jedinstven sadrzaj ko pretrazivaci vide dug dve recenice ili 600+ reci? Da li se u sadrzaju ponavljaju preterano iste reci? Ovo su neki od primera stvari koje pretrazivaci mogu gledati kada pokusavaju da utvrde vrednost dela sadrzaja.

Sada znate koji su glavni ciljevi i funkcije pretrazivaca tj. kako rade pretrazivaci.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s