Pues sí, para que negarlo, yo soy más del «lado oscuro«, los Jedi siempre me han parecido unos plastas con la manía esa de alcanzar la perfección. A mí me gusta lo imperfecto, es menos aburrido y mucho más humano. En este sentido a nuestro amigo Google se le puede considerar un perfecto animal imperfecto, casi humano, con toda esa falta de ética y transparencia, que los Jedi de este mundo no paran de denunciar. A algunos les cuesta entender que Google es una empresa privada que pretende ganar dinero – ¡por dios, qué egoísmo…! – , no una ONG online…
Por eso, para hacer SEO es necesario tener en cuenta ese «lado oscuro» de nuestro buscador amigo. Google es imperfecto, seguramente a propósito, así que vamos a ver con qué problemas y cosas raras nos vamos a encontrar a la hora de trabajar con este «Darth Vader» tan peculiar.
Internet invisible
Creemos que lo que no encuentra Google simplemente no existe. Craso error. En realidad todos los buscadores tienen el mismo problema: no pueden (o no quieren) indexar toda la información que existe en Internet. Es más, la información indexada por los buscadores es un porcentaje mínimo de la que existe en Internet. Flipante ¿no?. Así que llamarlo Internet invisible es muy poético pero no es cierto, se puede acceder a esta información, pero los buscadores son incapaces de indexarla.
Entonces ¿por qué hay webs que no son indexadas por Google? Hay información de la que simplemente Google pasa mogollón. Las razones para este desagravio pueden ser varias. Mejor os hago un listado que nos enteramos todos mejor.
- Límite de indexación: los buscadores no indexan todas las páginas de un sitio web, sólo las que considera más relevantes según sus misteriosos criterios.
- No trabajan en tiempo real: digamos que no hay un tio pendiente de todas las páginas web que diariamente se añaden o desaparecen.
- Número máximo de resultados visibles: muestran en los listados de resultados entre 200 y 1000 documentos. Tampoco creo que mucha gente fuera a mirar más…
- Estar enlazado: si nadie enlaza con tu web simplemente no existes para Google. Igual está por ahí perdida la fórmula de la eterna juventud…a algunas nos empieza a hacer falta.
- Web creadas con otros formatos diferentes al HTML: programas ejecutables, archivos comprimidos…, indexa PDF, flash y otros pero esto también tiene sus problemas y los veremos en próximos capítulos.
- Páginas dinámicas: las que se generan a partir de peticiones a bases de datos, y que lógicamente varían con cada consulta. De un plumazo se quitan de en medio bibliotecas online de todo tipo, catálogos de información académica y no se cuántas cosas más. Una pena.
- Páginas privadas: información para usuarios registrados, bases de datos restringidas, documentación protegida…desde tu cuenta de Gmail hasta el mismísimo Pentágono.
- Errores de servidor y de código: la de webs que no se indexan correctamente por estar mal hechas o mal alojadas. Cuidadito con eso que no es cosa de Google.
¿Y cómo accedo a ese internet invisible? Bueno amigos, no todo es Google, existen mundos paralelos llenos de aplicaciones web estupendas que te ayudan a acceder a esa información. Servicios como Infomine, Complete Planet o Biblioteca Virtual WWW llevan años dando acceso a esa información «perdida».
Límites en el cálculo de Pagerank y el dichoso sesgo por antigüedad
¿Os he contado ya qué es eso del Pagerank? Uy…qué despistada ando.
El PageRank es un valor numérico (contabilizado del 0 al 10) que representa la relevancia de una página web. Resumiendo mucho, Google contabiliza cuando una web enlaza con tu site, y cuantas más webs te hayan enlazado, más importante considera que es tu web, y por tanto mayor es tu Pagerank. Si además te enlazan webs con PageRank superior al tuyo, tendrás más posibilidades de posicionarte mejor en los resultados de las búsquedas. Si el PageRank fuera el único factor para medir si una web es importante o no, el link building tendría una religión propia.
El problema es que para Google, el PageRank suponía una ventaja para aquellas páginas que con un trabajo SEO bien hecho, podían alcanzar rápidamente los primeros resultados de las búsquedas, sin tener en cuenta la calidad de los contenidos. Entonces Google se inventó el sesgo por antigüedad: aquellas webs más viejas son las que aparecen en los primeros resultados. Toma injusticia.
Es cierto que las últimas modificaciones del algoritmo, tanto el llamado Panda como nuestro amigo Pingüino, han mitigado bastante el efecto del sesgo por antigüedad, y fundamentalmente han afectado a webs que no se actualizan nunca, pero la realidad es que todavía cuesta desbancar a ciertas webs del pleistoceno, aunque sus contenidos dejen mucho que desear.
Spam en buscadores y el SEO negativo
La listas de resultados de los buscadores no siempre están llenas de contenido relevante, útil y de calidad. Desgraciadamente nos encontramos frecuentemente con páginas que no nos aportan nada, y que dejan en evidencia al buscador. Para evitar esto Google penaliza ciertas técnicas no muy honradas que hasta hace poco te garantizaban un puesto en la cumbre en dos días.
Ejemplos de estas técnicas son:
- Keyword Stuffing: básicamente significa abusar de las palabras clave.
- Link Schemes: engloba todas las técnicas fraudulentas con enlaces, desde su compra hasta su intercambio excesivo.
- Cloaking, redirecciones y doorways: texto oculto, redirecciones extrañas y páginas de muy baja calidad pero sobre optimizadas.
- Bombing: posicionar una web con una palabra clave no relacionada con el contenido pero muy «buscada».
- Contenido intencionadamente duplicado: abusar de Google News y publicar y republicar lo mismo.
Si utilizas técnicas penalizadas por Google y te pillan, pues te fastidias. Lo malo es que últimamente ha aparecido lo que se ha dado en llamar SEO negativo, que consiste en que alguien de la competencia (o puede que un/a ex cabreado/a), se dedica a poner en marcha todas esas técnicas para que te den el palo.
Así que si te has portado bien pero tu web se pierde en el limbo de los resultados de Google de un día para otro, una de dos, o has cabreado a alguien, o tu competencia lo flipa. Pero hablaremos más adelante de todas estas técnicas y de cómo hacer que Google te reconsidere si te ha penalizado. Si ya lo decía mi abuela: todo tiene remedio menos la muerte…
Resultados dirigidos por Google
Siempre me ha molestado que la gente presuponga que es lo que quiero. Tuve un ligue que se empeñaba en pedir por mí la pizza. Me iba al baño y al final siempre me tenía que comer una Margarita…, evidentemente no es la persona con la que me he casado. Pues lo mismo pasa con Google, con el rollito de la personalización y la manía de «adivinar» que es lo que más me interesa, mi lista de resultados nunca es la misma según en qué ordenador esté o con qué usuario me conecte a Google. Y me molesta horrores no poder hacer una simple búsqueda objetiva.
Google nos muestra ahora la información teniendo en cuenta nuestras búsquedas anteriores, nuestras redes sociales (sobre todo Google +), y qué páginas visitamos más a menudo. Lo importante ya no es ofrecer los resultados que se corresponden con lo que hemos buscado, sino lo que lo que Google cree que se ajusta más a nuestras supuestas preferencias, para lo cual cotillea nuestro perfil en redes sociales. Por supuesto, detrás de todo esto sólo hay intereses comerciales de lo más evidentes.
¿Y todo este rollo en qué afecta al trabajo SEO?
Pues puede que en un proyecto mucho y en otros nada. Pero el saber no ocupa lugar, amigos, y nunca está de más que tengáis en cuenta que Google es imperfecto, injusto, egoísta, avaro incluso, pero todavía no se ha inventado nada mejor. Dejaros llevar por el «lado oscuro», jugad según las reglas de su juego aunque cambien mil veces, seguro que en el camino os divertireis tanto como yo.
Para saber más os recomiendo estos artículos:
- Internet Invisible
- Criticismo en buscadores
- Los microdatos, la web semántica y el Spam en buscadores
- Seo Negativo: mitos, realidades y precauciones
- Rebelarse contra la relevancia: cómo encontrar lo que buscamos y no lo que Google cree que buscamos
Ya conocemos al enemigo, así que la próxima semana nos metemos en materia y empezaremos a desvelar las claves para derrotarlo. ¡A que os apetece…!.
GUÍA SEO 3.0
Introducción – Objetivo: Matar al Pingüino
- Los buscadores, esos grandes desconocidos.
- Buscando búsquedas en Google Trends
- En el lado oscuro de Google
- El plan estratégico SEO: paso a paso.
- Herramientas básicas SEO: una ayudita por favor.
- El SEO también es cuestión de dominios.
- Seleccionar Palabras Clave.
- Herramientas para la selección de Palabras Clave.
- La optimización web: asegurate de que tu casa tiene buenos cimientos.
- Estrategias básicas de posicionamiento SEO: lo que hay que hacer sí o sí.
- Marketing en buscadores (SEM): a tiro hecho.
- Analítica Web y SEO: la clave está delante de ti.
- Social Media y SEO: amigos para siempre.
- Optimización de Contenidos y SEO: curando estoy.
- Estrategias avanzadas de SEO: lo que no te cuentan los gurús.
- SEO para proyectos concretos: porque el tocino no tiene nada que ver con la velocidad.
- SEO para pelis: too fast, too furious…
- Recursos SEO: no inventemos la rueda que no hace falta.
Conclusión: por qué nos gusta el SEO.
[…] En el lado oscuro de Google […]
Bueno bueno, que bien que ya salió el artículo. Aunque soy franco y este no estuvo tan bueno como los anteriores. Si bien puede que no lo encuentre tan bueno por dos razones: 1- Ya había leído un poquito sobre el tema. 2- Ya estoy loco por entrar en materia :). Pero siempre la felicito pues me gusta como escribe. Me ha despertado un gran interés por el SEO. Salu2
Gracias Pablo! Quizá este artículo sea el menos divertido o impactante pero he creido necesario hablar de esto para los que son de verdad neófitos en el tema.
La semana que viene entramos en materia…¡ay qué nervios! :). Saludos!
Muy buen artículo Gloria. Había pasado por encima de los anteriores sin prestarles atención, no me engancho el título pero el lado oscuro es lo que tiene 😉 Estaré atento a tus próximos escritos. Un saludo.
Muchas gracias Jose Miguel! Espero trabajarme más los títulos en las siguientes entregas. Se agradece siempre cualquier comentario que ayude a mejorar.
Un saludo!
Excelente Gloria!
He llegado aquí a través de un debate en el grupo Marketing en Redes Sociales de Linkedin y ya tengo en favoritos…
Deseando leer el próximo el capitulo!!
Un saludo.
Gracias Manuel! Pues esta semana que entra siguiente capítulo. Me gustaría ir más rápido pero el trabajo, un bebe y un blog es una combinación complicada. Saludos!
Una duda, entonces las páginas dinámicas no son indexadas? O es que no indexan solo el contenido dinámico?
Buena pregunta. Sí, claro que indexa páginas dinámicas, pero éstas pueden contener parámetros con caracteres especiales que se presentan como un freno importante en el trabajo de indexación de Google. Es más, muchas de estas URLs son generadas automáticamente por el sistema o bien, son tantas las páginas, que Google solo indexa las que estima más relevantes, considerando muchas de ellas como contenido duplicado. La solución es usar URL amigables, o sea, del tipo: mipagina/blog/seccion/.
Lo que no puede indexar Google es la información que hay en una base de datos, porque no puede acceder a ella. A eso me refería. Imagina el montón de datos públicos a los que no podemos acceder a través de nuestro amigo Google, no todas las bases de datos son privadas (bibliotecas, ministerios…).
Saludos!
Hola chicos, permitirme un apunte.
Claro que Google puede acceder a toda la información pública de una base de datos. ¿qué problema hay? Si la estructura de la web está correctamente y tenemos un buen sitemap, toda la información de la base de datos será accesible por googlebot.
Si Google no puede acceder a toda la información pública de una base de datos entonces habría que pensar que la página no está bien hecha.
Saludos,
Hola Israel, en primer lugar muchas gracias por comentar, pero creo que no me has entendido bien. Por supuesto si la web es mía, la base de datos la he creado yo, y tengo en mente hacer un buen SEO, pues haré todo lo que tenga que hacer para que Google me indexe la BD entera si es lo que quiero. De hecho uno de los capítulos de la Guía irá de cómo lograr esto. Pero este artículo cuenta una verdad, y es que no todo internet está preparado para que Google le encuentre. Existen multitud de bases de datos públicas que no están indexadas. Yo no digo que no se puedan indexar, digo que no están indexadas porque Google no puede acceder a ellas. Preguntas en tu comentario que qué problema hay…pues que nadie va a hacer lo necesario para que esas bases de datos queden indexadas, y toda esa información quedará en ese internet invisible. A eso me refería.
Vendría a ser el lado oscuro del programador más exactamente.
Lo que está claro es que todo lo que es público debería ser accesible, porque desde ese problema que comentas en el artículo, de resultados filtrados por parámetro, formularios o lo que sea, nos encontramos hasta webs completas deshabilitadas para indexación, por despiste o desconocimiento de quien lo desarrolla.
Saludos,
Sí, los programadores además podemos ser muy del lado oscuro…:) ¡Saludos!
Creo que Gloria se refiere a otra cosa, la teoría está muy bien y en teoría las BD abiertas pueden ser indexadas sin problema, pero lo que indexa google es una url, y si la web no ofrece ninguna url válida para que sea indexada pues da gual que esa BD sea pública o privada, es inaccesible.
Si hay que ponerle un pero al post es que se queda corto. Pero trabajoc on Gloria, sabe de esto un huevo. Espero más de las siguientes entregas. Un saludo.
A este ni caso que es del equipo ArteGB…primero me critica el post y luego me pelotea!!! Y encima manda primero el comentario usando mi usuario… Amigos, Juanjo Molxa, un crack del desarrollo web más salvaje, y un desastre en todo lo demás.
Evidentemente la WEB no es solo lo que aparece en las búsquedas de Google. Lo que me temo es que mucha gente no entiende la diferencia que hay entre la barra de direcciones y el buscador de Google.
Sino quieres búsquedas filtradas, usa los directorios de toda la vida, ahí no hay lado oscuro
Saludos,
Totalmente de acuerdo, los directorios están infravalorados. Existe ese problema extraño de que lo que no encuentras en Google no existe para nadie, y es algo que va a más me temo. Saludos!
Me parece una serie excelente. Yo también te sigo desde Linked In y estaré atento a las posteriores entregas. Soy de los que piensa que la gente se preocupa más de trampear el posicionamiento que de ofrecer contenidos y ofertas con relevancia propia.
Es verdad, Jordi, pero de eso tiene la culpa Google, porque no el fondo no sabemos 100% qué es lo que él considera contenido relevante…Si echáramos un vistazo al algoritmo seguramente nos llevaríamos más de una sorpresa, al fin y al cabo Google es una empresa privada que tendrá sus propios criterios, que pueden no coincidir con los míos. SEOs poco honrados los hay, como en todas las profesiones, pero no olvidemos que Google tiene que ganar dinero con esto, yo no me fiaría 100% de su honradez.
Saludos!
Lo publico en mi web, para mis alumnos. Gracias
Gracias Marina! Perdona, que no te había contestado…Decirte que tu web me parece muy chula y original, se agradece mucho en un mundo de plantillas wordpress…sobre todo me encanta tu versión online gráfica!. Un saludo!
[…] sí, para que negarlo, yo soy más del “lado oscuro“, los Jedi siempre me han parecido unos plastas con la manía esa de alcanzar la perfección. A mí […]
Cuando sale el próximo? 😀
Pareja + Bebe + Empresa + Crisis + Blog = OJERAS… Aún así espero que a finales de esta semana pueda publicarlo :).
Gloria, estuve leyendo sobre una nueva herramienta de google para reportar los malos links de los que hablas en tu artículo, si no haz leído al respecto aquí te dejo el link. http://googlewebmastercentral.blogspot.com.es/2012/10/a-new-tool-to-disavow-links.html Y de paso posteo una duda que aun no encuentro respuesta. Google va atener la capacidad de darse cuenta cuando alguien quiere «deslinkar» tu sitio «mal-intencionadamente»?. Saludos y esperando el próximo 😉
Sí, es una herramienta que deberían haber pensado hace tiempo, pero más vale tarde que nunca. Y en contestación a tu pregunta, decirte que no, Google no se va a dar cuenta de las intenciones de nadie nunca, es una maquinita que recopila datos pero incapaz de interpretar intenciones. Por eso ha creado esta herramienta de Disavow Links, para que seamos nosotros los que le informemos de los sitios de “mala calidad” que nos están apuntando. Me temo que seguremos siendo nosotros los que tenemos que estar atentos por si alguien nos hace SEO negativo. Saludos!
lo digo pq quizás malintecionadamente yo tb podría marcar un link, que no es malo, como malo, para que tu sitio pierda rankin, o no?
Claro que puedes, pero no eres tu el que decides si un sitio es de mala calidad, es Google…, asi que lo que dices no se puede hacer por muy mala leche que tengas :). Saludos!
🙁 que pasa!? Así perdemos el hilo!!!
Perdona Pablo, pero publicaré aproximadamente un post al mes, me temo que el trabajo y mi vida personal no me permiten un ritmo de publicación más alto. Y esto no es una obligación, me apetecía compartir mis conocimientos, ya que yo misma aprendo muchas cosas todos los días de otros profesionales del SEO y otras temáticas a los que sigo en su blog. De todas formas te invito a que si tienes necesidad de adquirir conocimientos de SEO a un ritmo mayor, consideres el apuntarte a alguno de los cursos o máster profesionales sobre posicionamiento que existen, en algunos participo sólo como profesora y otros son organizados por mi empresa (suelen ser convocados antes de navidad). Cualquiera de ellos son muy recomendables y están orientados al desarrollo profesional en este campo. Si estás interesado te mando una lista a tu correo electrónico. Un saludo.
😛
Disculpa mi desespero (espero que lejos de «cabrearte» te haya hecho sentir elogiada). Sobre los cursos, imparten cursos en Cuba?…..gratis? Bueno nada, pues a esperar la entrega mensual. Salu2
¿Cuba? ¡Invitame a ir…! Qué ganas de conocer tu tierra… No te apures, yo no me cabreo hombre, y menos con un incondicional como tu. Pero en serio te ofrecía la posibilidad de formarte profesionalmente, seguro que aprenderías más que con mi modesta Guía SEO del blog. De todas formas después de navidad vamos a lanzar un curso online profesional y práctico, con más SEO´s estupendos de profesores, que seguro te interesará. No será gratuito pero siempre damos opción a becas y descuentos muy buenos. Si aún así no puedes financiarlo, hablamos, siempre hay una solución. Ya sabes que aquí en España estamos en crisis total, y yo soy de las que piensa que hay que ayudarse o nos hundiremos sin remedio… Saludos!
Pues aqui puedes venir cuando quieras, mira que aqui vienen muchos españoles. Me encantaría seguir tu curso. mucho. Yo estudié ingeniería informática, pero de esto no nos hablaron mucho, vamos que casi nada. Y bueno, ya sabes, costear cualquier cosa de esas para nosotros es casi imposible. Cualquier ayudilla, por pequeña que sea (intelectual aclaro) pues será bien agradecida. Y bueno ya estamos conectados por linkedin, nos comunicamos. Salu2
No te preocupes, cuando convoquemos el curso online te aviso. Saludos!
[…] En el lado oscuro de Google […]
[…] En el lado oscuro de Google […]
[…] En el lado oscuro de Google. […]
[…] En el lado oscuro de Google. […]
[…] En el lado oscuro de Google. […]
[…] ¿Por qué hay webs que no son indexadas por Google? Hay información de la que simplemente Google pasa. Las razones para este desagravio pueden ser varias. […]
Muy buen articulo !!! . Yo no se que pasa con google, buscan lo imposible, pretenden que todo sea natural, que nadie compre enlaces, que el trabajo seo sea mas prolijo. Eso en un mundo capitalista es imposible. El que más dinero tiene mejor y mas rápido va a estar posicionado.
Muchas gracias por tu comentario. Ya sabes, la banca siempre gana 🙂
[…] En el lado oscuro de Google. […]
[…] En el lado oscuro de Google. […]
[…] En el lado oscuro de Google. […]