Masa de spam

Ir a: navegación, búsqueda de

Masa de spam se define como "la medida del impacto de Link spam en el ranking de una página." El concepto fue desarrollado por Zoltán Gyöngyi y Hector Garcia-Molina de La Universidad de Stanford en asociación con Pavel Berkhin y Jan Pedersen de Yahoo!. Este documento amplía su propuesta TrustRank metodología.

Los investigadores desarrollaron un buena base y un núcleo mal de seleccionados Web documentos de los cuales midieron masa de spam a través de una colección de documentos. Dos tipos de mediciones, masa absoluta y masa relativa, se utilizan para comparar grupos de documentos. Cuanto mayor sea las masas medidas, más probable los documentos deben ser equivalente al spam.

Umbrales

Un valor de umbral se utiliza para identificar grupos de documentos como spam. Si su valor masa relativa supera el umbral, los documentos se consideran spam. Un segundo umbral para el PageRank se aplica los valores de los documentos seleccionados. Sólo alto PageRank documentos están etiquetados como spam.

El propósito de la metodología es identificar spam documentos con valores de PageRank artificialmente inflados.

Enlaces externos

  • Detección de Spam de enlace basada en la estimación de masaPDF

Otras Páginas

Obtenido de"https://en.copro.org/w/index.php?title=Spam_mass&oldid=361155798"