Alla ricerca del nome di un algoritmo (o tecnica)

1

Sto cercando un articolo in rete che non trovo più. Stava descrivendo un algoritmo per classificare le pagine web. Sto cercando di ricordare il nome di questo algoritmo o tecnica.

Il principio era il seguente:

  1. A ogni pagina viene assegnato un credito di 10 all'inizio.
  2. Ad ogni pagina viene assegnato un peso / probabilità dividendo il suo credito per la somma di tutti i crediti assegnati a tutte le pagine.
  3. Un sottoinsieme di pagine viene selezionato in modo casuale utilizzando il loro peso / probabilità.
  4. Questo sottoinsieme viene visualizzato dagli utenti.
  5. Ogni volta che un utente fa clic su una pagina, la sua il credito è aumentato di uno. Le pagine preferite hanno più credito.
  6. L'operazione 2. è stata ripetuta per aggiornare i pesi / probabilità.

Grazie

    
posta Jérôme Verstrynge 10.05.2015 - 12:19
fonte

2 risposte

1

È una variazione del problema del bandito a più braccia :

In probability theory, the multi-armed bandit problem (sometimes called the K- or N-armed bandit problem) is a problem in which a gambler at a row of slot machines (sometimes known as "one-armed bandits") has to decide which machines to play, how many times to play each machine and in which order to play them. When played, each machine provides a random reward from a distribution specific to that machine. The objective of the gambler is to maximize the sum of rewards earned through a sequence of lever pulls.

Ci sono diversi modi per risolvere questo problema, eccone uno:

  1. Ogni pagina ha due valori:

    • numero di volte in cui era shown , inizialmente 1
    • numero di volte in cui era clicked , inizialmente 1

    La forma fisica di una pagina è clicked/shown . Uso un termine dalla programmazione genetica qui, forse c'è un termine più appropriato nella teoria della probabilità.

  2. La selezione proporzionale del fitness viene utilizzata per scegliere una pagina. Per sceglierne più di uno, puoi escludere quello selezionato in precedenza da un set e ripetere la selezione.

  3. Ogni volta che viene visualizzata una pagina, il suo valore ' shown viene aumentato di uno. Se è stato anche fatto clic, anche clicked viene aumentato di uno, altrimenti rimane invariato.

  4. Vai a 2

Tuttavia, è difficile decidere quando interrompere l'esperimento. Potresti voler consultare documenti di Google Analytics sui test A / B per i dettagli.

    
risposta data 19.05.2015 - 13:26
fonte
-2

Suppongo che questo sia quello che stai cercando perché l'articolo dice

PageRank è un algoritmo di analisi dei collegamenti e assegna una ponderazione numerica a ciascun elemento di un insieme di documenti con collegamenti ipertestuali, come il World Wide Web, con lo scopo di "misurare" il suo importanza relativa all'interno del set. L'algoritmo può essere applicato a qualsiasi raccolta di entità con citazioni e riferimenti reciproci. Il peso numerico che assegna a ogni dato elemento E viene indicato come PageRank di E e indicato da PR (E). Altri fattori come il Rank autore possono contribuire all'importanza di un'entità.

    
risposta data 18.05.2015 - 23:06
fonte

Leggi altre domande sui tag